第一章、基因的结构和功能实体及基因组 1、基因定义
基因(遗传因子)是遗传的物质基础,是DNA(脱氧核糖核酸)分子上具有遗传信息的特定核苷酸序列的总称,携带有遗传信息的DNA序列,是具有遗传效应的DNA分子片段,是控制性状的基本遗传单位,通过指导蛋白质的合成来表达自己所携带的遗传信息,从而控制生物个体的性状表现。 2、DNA修复
DNA修复(DNA repairing)是细胞对DNA受损伤后的一种反应,这种反应可能使DNA结构恢复原样,重新能执行它原来的功能;但有时并非能完全消除DNA的损伤,只是使细胞能够耐受这DNA的损伤而能继续生存。也许这未能完全修复而存留下来的损伤会在适合的条件下显示出来(如细胞的癌变等),但如果细胞不具备这修复功能,就无法对付经常在发生的DNA损伤事件,就不能生存。对不同的DNA损伤,细胞可以有不同的修复反应。 3、DNA损伤
DNA损伤是复制过程中发生的DNA核苷酸序列永久性改变,并导致遗传特征改变的现象。情况分为:substitutation (替换)deletion (删除)insertion (插入)exon skipping (外显子跳跃)。
DNA损伤的改变类型:a、点突变:指DNA上单一碱基的变异。嘌呤替代嘌呤(A与G之间的相互替代)、嘧啶替代嘧啶(C与T之间的替代)称为转换(transition);嘌呤变嘧啶或嘧啶变嘌呤则称为颠换(transvertion)。b、缺失:指DNA链上一个或一段核苷酸的消失。c、插入:指一个或一段核苷酸插入到DNA链中。在为蛋白质编码的序列中如缺失及插入的核苷酸数不是3的整倍数,则发生读框移动(reading frame shift),使其后所译读的氨基酸序列全部混乱,称为移码突变(frame-shift mutaion)。d、倒位或转位:(transposition) 指DNA链重组使其中一段核苷酸链方向倒置、或从一处迁移到另一处。e、双链断裂:对单倍体细胞一个双链断裂就是致死性事件。 4、同源重组 同源重组,(Homologus Recombination)是指发生在姐妹染色单体(sister chromatin) 之间或同一染色体上含有同源序列的DNA分子之间或分子之内的重新组合。同源重组需要一系列的蛋白质催化,如原核生物细胞内的RecA、RecBCD、RecF、RecO、RecR等;以及真核生物细胞内的Rad51、Mre11-Rad50等等。同源重组反应通常根据交叉分子或holiday结构(Holiday Juncture Structure) 的形成和拆分分为三个阶段,即前联会体阶段、联会体形成和Holiday 结构的拆分。 a、基因敲除
基因敲除(geneknockout),是指对一个结构已知但功能未知的基因,从分子水平上设计实验,将该基因去除,或用其它顺序相近基因取代,然后从整体观察实验动物,推测相应基因的功能。这与早期生理学研究中常用的切除部分-观察整体-推测功能的三部曲思想相似。基因敲除除可中止某一基因的表达外,还包括引入新基因及引入定点突变。既可以是用突变基因或其它基因敲除相应的正常基因,也可以用正常基因敲除相应的突变基因。 b、因转移法
同源重组(homologousrecombination)是将外源基因定位导人受体细胞染色体上的方法,因为在该座位有与导人基因同源的序列,通过单一或双交换,新基因片段可替换有缺陷的基因片段,达到修正缺陷基因的目的。位点特异性重组是发生在两条DNA链特异位点上的重组,重组的发生需一段同源序列即特异性位点(又称附着点;attachmentsite,att)和位点特异性的蛋白因子即重组酶参与催化。重组酶仅能催化特异性位点间的重组,因而重组具有特异性和高度保守性。
5、碱基错配对修复
错配修复(mismatch repair,MMR):在含有错配碱基的DNA分子中,使正常核苷酸序列恢复的修复方式;主要用来纠正DNA双螺旋上错配的碱基对,还能修复一些因复制打滑而产生的小于4nt的核苷酸插入或缺失。MMR的过程需要区分母链和子链,做到只切除子链上错误的核苷酸,而不会切除母链上本来就正常的核苷酸。修复的过程是:识别出正确的链,切除掉不正确的部分,然后通过DNA聚合酶III和DNA连接酶的作用,合成正确配对的双链DNA。 6、基因组学
基因组学(英文genomics),研究生物基因组和如何利用基因的一门学问。用于概括涉及基因作图、测序和整个基因组功能分析的遗传学分支。该学科提供基因组信息以及相关数据系统利用,试图解决生物,医学,和工业领域的重大问题。基因组研究应该包括两方面的内容:以全基因组测序为目标的结构基因组学(structural genomics)和以基因功能鉴定为目标的功能基因组学(functional genomics),又被称为后基因组(postgenome)研究,成为系统生物学的重要方法。基因组学的主要工具和方法包括: 生物信息学,遗传分析,基因表达测量和基因功能鉴定。 第二章、基因的结构实体 1、核酸分子
核酸(Nucleic Acids)是一种主要位于细胞核内的生物大分子,其充当着生物体遗传信息的携带和传递。DNA分子含有生物物种的所有遗传信息,为双链分子,其中大多数是链状结构大分子,也有少部分呈环状结构,分子量一般都很大。RNA主要是负责DNA遗传信息的翻译和表达,为单链分子,分子量要比DNA小得多。核酸存在于所有动植物细胞、微生物和病毒、噬菌体内,是生命的最基本物质之一,对生物的生长、遗传、变异等现象起着重要的决定作用。核酸大分子可分为两类:脱氧核糖核酸(DNA)和核糖核酸(RNA),在蛋白质的复制和合成中起着储存和传递遗传信息的作用。核酸不仅是基本的遗传物质,而且在蛋白质的生物合成上也占重要位置,因而在生长、遗传、变异等一系列重大生命现象中起决定性的作用。 2、DNA的结构
DNA即脱氧核糖核酸(英文Deoxyribonucleic acid的缩写),又称去氧核糖核苷酸,是染色体主要组成成分,同时也是组成基因的材料。DNA分子的双螺旋结构是相对稳定的。这是因为在DNA分子双螺旋结构的内侧,通过氢键形成的碱基对,使两条脱氧核苷酸长链稳固地并联起来。另外,碱基对之间纵向的相互作用力也进一步加固了DNA分子的稳定性。各个碱基对之间的这种纵向的相互作用力叫做碱基堆集力,它是芳香族碱基π电子间的相互作用引起的。现在普遍认为碱基堆集力是稳定DNA结构的最重要的因素。再有,双螺旋外侧负电荷的磷酸基团同带正电荷的阳离子之间形成的离子键,可以减少双链间的静电斥力,因而对DNA双螺旋结构也有一定的稳定作用。DNA分子由于碱基对的数量不同,碱基对的排列顺序千变万化,因而构成了DNA分子的多样性。例如,一个具有4 000个碱基对的DNA分子所携带的遗传信息是4种,即10种。 不同的DNA分子由于碱基对的排列顺序存在着差异,因此,每一个DNA分子的碱基对都有其特定的排列顺序,这种特定的排列顺序包含着特定的遗传信息,从而使DNA分子具有特异性。 3、DNA的拓扑学
首先以一260 bp双链线形B-DNA为例,此DNA在松弛时,螺旋数为25(260/10.4),首尾连接成环形后,为一松弛环形DNA,并处于最稳定状态。若将此线形DNA先拧松2个连环再连成环形,则可以形成两种环形DNA,一种称为松弛解链环形DNA;另一种环形DNA称为超螺旋DNA,其螺旋周数为25,有2个负超螺旋。由此引入拓扑学参数:
1.连环数(Linking number):在双螺旋DNA中,一条链以右手螺旋绕另一条链缠绕的次数,以L 表示(或以α表示),其计数方法为处于松弛环形DNA时的螺旋周数,肯定为整数,右手螺旋为正、左手螺旋为负。 2.缠绕数(Twisting number):即DNA分子中的Watson-Crick螺旋周数,以T 表示(或以β表示),其数值可直接在处于最稳定状态下的双链环形(或超螺旋形式)DNA中的实际螺旋周数计数得到,不一定是整数,右手螺旋为正,左手螺旋为负。但必须注意T仅针对于形成双螺旋区域而言,解链部分的bp数就不涉及T的计算。对于一定长度的DNA双链,一旦出现解链T值就减少。如260bp B-DNA双链自然状态下T=25,解链20%时的T=20 。 3.超螺旋数 或 纽数(Writhing number):其数值有公式L=T+W 计算得到,以W表示(或以τ表示),不一定为整数。左手超螺旋为正,右手超螺旋为负(此点解释见后)。 4.比连环差:为双链DNA的超螺旋密度。用σ表示,由公式σ = L - T / T得到,或以σ = α - β /β 表示。
4、染色体和核小体
染色体(Chromosome ),是细胞内具有遗传性质的物体,易被碱性染料染成深色,又叫染色质。其本质是脱氧核甘酸,是细胞核内由核蛋白组成、能用碱性染料染色、有结构的线状体,是遗传物质基因的载体。在无性繁殖物种中,生物体内所有细胞的染色体数目都一样;而在有性繁殖大部分物种中,生物体的体细胞染色体成对分布,称为二倍体。性细胞如精子、卵子等是单倍体,染色体数目只是体细胞的一半。哺乳动物雄性个体细胞的性染色体对为XY,雌性则为XX。鸟类和蚕的性染色体与哺乳动物不同:雄性个体的是ZZ,雌性个体为ZW。
染色体是细胞核中载有遗传信息的物质,在显微镜下呈圆柱状或杆状,主要由脱氧核糖核酸和蛋白质组成,在细胞发生有丝分裂时期容易被碱性染料(例如龙胆紫和醋酸洋红)着色,因此而得名。在无性繁殖物种中,生物体内所有细胞的染色体数目都一样;而在有性繁殖大部分物种中,生物体的体细胞染色体成对分布,称为二倍体。性细胞如精子、卵子等是单倍体,染色体数目只是体细胞的一半。哺乳动物雄性个体细胞的性染色体对为XY,雌性则为XX。鸟类和蚕的性染色体与哺乳动物不同:雄性个体的是ZZ,雌性个体为ZW。
核小体(英语:Nucleosome,也译作核体或核仁小体等)是组成真核生物染色质(除精子染色质外)的基本单位。核小体是由DNA与四对组织蛋白(共8个)的复合物,其中有H2A和H2B的二聚体两组以及H3和H4的二聚体两组。另外还有一种H1负责连结两个核小体之间的DNA。核小体假说是在1974年,由Don Olins、Ada Olins与罗杰·科恩伯格等人首次提出的。核小体是染色体的基本结构单位,由DNA和组蛋白(histone)构成,是染色质(染色体)的基本结构单位。由4种组蛋白H2A、H2B、H3和H4,每一种组蛋白各二个分子,形成一个组蛋白八聚体,约200bp的DNA分子盘绕在组蛋白八聚体构成的核心结构外面,形成了一个核小体。 5、染色质的构象状态
(chromosome conformation capture,3C)通过一种定量手段(PCR产物的有和无、产量的高和低)对DNA之间是否存在相互作用这一定性问题进行研究。主要经过甲醛交联、限制性酶切、稀释和连接、解交联、DNA纯化与PCR鉴定。通过一对分别与选定的2段DNA配对的引物进行PCR扩增,通过PCR产物的有无、产量的高低等,就可以对是否存在相互作用进行判断。
6、常染色质和异染色质
常染色质:常染色质是指间期核内染色质纤维折叠压缩程度低,处于伸展状态,用碱性染料染色时着色浅的那些染色质。在常染色质中,DNA包装比约为1/2000-1/1000,即DNA实际长度为染色质纤维长度的1000-2000倍。构成常染色质的DNA主要是单一序列DNA和
中度重复序列DNA(如组蛋白基因和tRNA基因)。常染色质并非所有基因都具有转录活性,处于常染色质状态只是基因转录的必要条件,而不是充分条件。
异染色质:在细胞周期中,间期、早期或中、晚期,某些染色体或染色体的某些部分的固缩常较其他的染色质早些或晚些,其染色较深或较浅,具有这种固缩特性的染色体称为异染色质(heterochromatin)。具有强嗜碱性,染色深,染色质丝包装折叠紧密,与常染色质相比,异染色质是转录不活跃部分,多在晚S期复制。异染色质分为结构异染色质和功能异染色质两种类型。结构异染色质是指各类细胞在整个细胞周期内处于凝集状态的染色质,多定位于着丝粒区、端粒区,含有大量高度重复顺序的脱氧核糖核酸(DNA),称为卫星DNA(satel-lite DNA)。 第三章、基因的功能实体 1、基因的功能
基因有控制遗传性状和活性调节的功能。基因通过复制把遗传信息传递给下一代,并通过控制酶的合成来控制代谢过程,从而控制生物的个体性状表现。基因还可以通过控制结构蛋白的成分,直接控制生物性状。、 生物体细胞中的DNA分子上有很多基因,但并不是每一基因的特征都表现出来。即使是由同一受精卵发育分化而来的同一人体不同组织中的细胞,如肌肉细胞、肝脏细胞、骨细胞、神经细胞、红细胞、和胃黏膜细胞等。它们的细胞形状都是各不相同的。为什么会出现这种现象呢?原来,细胞核中的基因在细胞的一生中并非始终处于活性状态,它们有的处于转录状态,即活性状态,这时基因打开,有的处于非转录状态,即基因关闭。在生物体的不同发育期,基因的活性是不同的,而且基因的活性有严格的程序。基因活性的严格程序是生命周期稳定的基础。各种不同的生物因其细胞内的基因具有独特的活性调节而呈现不同的形态特征。 2、顺反因子
顺式作用元件(cis-acting element)能影响基因表达,但不编码RNA和蛋白质的DNA序列
反式作用因子(trans-actingfactor)能识别和结合特定的顺式作用元件,并影响基因转录的一类蛋白质或RNA 3、顺式调控元件
有顺式调控元件(cis-regulatory element),或顺式作用元件是调节位于相同的DNA分子(通常是一个染色体)的基因的表达的DNA或RNA的区域。这个词是从拉丁词顺,这意味着“在同一侧的”构建。可能有顺式元件位于控制(或什至更上游的启动子区域)的基因的编码序列的上游,在一个内含子,或该基因的编码序列的下游,无论是在非翻译或未转录区域。 4、非编码RNA分子的调控作用 非编码RNA(Non-coding RNA)是指不编码蛋白质的RNA。其中包括rRNA,tRNA,snRNA,snoRNA 和microRNA 等多种已知功能的 RNA,还包括未知功能的RNA。这些RNA的共同特点是都能从基因组上转录而来,但是不翻译成蛋白,在RNA 水平上就能行使各自的生物学功能了。非编码RNA 从长度上来划分可以分为3类:小于50 nt,包括microRNA,siRNA,piRNA;50 nt到500 nt,包括rRNA,tRNA,snRNA,snoRNA,SLRNA,SRPRNA 等等;大于500 nt,包括长的mRNA-like 的非编码RNA,长的不带polyA 尾巴的非编码RNA等等。
5、基因在细胞核内的地域分布 第四章、基因组的组织结构 1、基因组
在生物学中,一个生物体的基因组是指包含在该生物的DNA(部分病毒是RNA)中的全部
遗传信息,又称基因体(genome)。基因组包括基因和非编码DNA。1920年,德国汉堡大学植物学教授汉斯.温克勒(Hans Winkler)首次使用基因组这一名词。更精确地讲,一个生物体的基因组是指一套染色体中的完整的DNA序列。 2、原核生物基因组的特点
a、基因组较小,通常只有一个环形或线形的DNA分子。
b、基因组的大部分序列是用来编码蛋白质的,基因之间的间隔序列很短。
c、功能相关的序列常串连在一起,由共同的调控元件调控,并转录成同一mRNA分子,可指导多种蛋白质的合成,这种结构称操纵子。 3、真核生物基因组的特点 a、基因组较大。真核生物的基因组由多条线形的染色体构成,每条染色体有一个线形的DNA分子,每个DNA分子有多个复制起点。
b、不存在操纵子结构。真核生物的同一个基因簇的基因,不会像原核生物的操纵子结构那样,转录到同一个mRNA上。
c、存在大量的重复序列。真核生物的基因组里存在大量重复序列,通过其重复程度可将其分成高度重复序列、中度重复序列、低度重复序列和单一序列。
d、有断裂基因。大多数真核生物为蛋白质编码的基因都含有“居间序列”,即不为多肽编码,其转录产物在mRNA前体的加工过程中被切除的成分。 4、基因的拷贝数
拷贝数就是指某基因(可以是质粒)在某一生物的基因组中的个数. 单拷贝就是该基因在该生物基因组中只有一个,多则指有多个。
(一)在细菌细胞中,某种特定质粒的数目。根据复制特性,质粒分严紧型和松弛型两类,前者在细胞中只含1~2个,而后者含10~15个以上。恒定的拷贝数与质粒复制控制系统、宿主细胞遗传背景及生长条件有关。质粒复制控制系统首先通过调节复制的起始点来控制拷贝数,调节因素包括阻遏蛋白、反义RNA和某些顺向重复序列。有些质粒还有其他控制系统,如有分配功能的par系统和确保质粒稳定遗传的ccd系统。一旦质粒上与调控有关的基因或位点突变,可使拷贝数明显增加或减少。 (二)在细菌细胞中,某种特定基因的数目。 5、线粒体DNA
线粒体中的遗传物质,线粒体能为细胞产生能量,是在细胞线粒体内发现的脱氧核糖核酸特殊形态。线粒体DNA(mtDNA)呈双链环状,在哺乳动物中大小一般在15kb~18kb之内。一个线粒体中一般有多个DNA分子。
与核基因组相比,线粒体基因组有如下有趣的性质: 所有的基因都位于一个单一的环状DNA分子上。 遗传物质不为核膜所包被。 DNA不为蛋白质所压缩。
基因组没有包含那么多非编码区域(垃圾DNA或“内含子”)。 一些密码子与通用密码子不同。相反,与一些紫色非硫细菌相似。 一些碱基为两个不同基因的一部分:某碱基作为一个基因的末尾,同时作为下一个基因的开始。
线粒体DNA比DNA存活时间长得多,而且遗传自母亲,因此用来确认家庭关系十分理想。 第五章、基因的自身维护 1、DNA复制
DNA复制是指DNA双链在细胞分裂以前的分裂间期进行的复制过程,复制的结果是一条双链变成两条一样的双链(如果复制过程正常的话),每条双链都与原来的双链一样。这个过