好文档 - 专业文书写作范文服务资料分享网站

基因组学-总结

天下 分享 时间: 加入收藏 我要投稿 点赞

1.1.DNA顺序复杂性: 不同顺序的DNA总长称为复杂性。复杂性代表了一个物种基因组的基本特征,可通过DNA复性

动力学来表示。

1.2.基因的定义: 不同的DNA片段共同组成一个完整的表达单位,有一个特定的表达产物,可以是RNA分子,也可以是

多肽分子

1.3.反义基因: 是指与细胞内DNA或RNA序列相互补形成杂交体而阻断或减弱其转录和翻译过程的DNA或RNA片段.反义基因通常包括反义寡核苷酸(ASON)、反义RNA及核酶

1.4.假基因: 与有功能的基因在核苷酸顺序的组成上非常相似,却不具正常功能的基因。假基因是相应的正常基因在染色

体的不同位置上的复制品,由于突变积累的结果而丧失活性。假基因都是在真核生物的基因组中发现的,在原核生物中未见报道

2.1.DNA标记的类型: 限制性片段长度多态性(RFLP);简单序列长度多态性(SSLP)(小卫星序列和微卫星序列);SNP. 2.2.RFLP(限制性片段长度多态性)的特点: 限制酶识别的碱基具有位点专一性,用不同的限制酶处理同一样品时,可以产生与之对应的不同限制性片段,提供大量位点多态性信息。

2.3. 部分连锁与遗传作图:交换是随机的,两个相近的基因发生交换的概率要比两个相远发生交换的概率要大,因此通

过重组率的确定可以相对确定两个基因的位置。由此可以进行基因的遗传作图。

3.1.分子信标的结构:环 含识别序列,一般15 --33个核苷酸;茎 在两末端各接上5到8个核苷酸的互补序列,富含GC;

荧光素及猝灭剂

3.2.猝灭剂:荧光染料发射的光能,可被邻近的染料或非染料分子所吸收转成热能而不再发射荧光,也可以发射能量较

低的荧光

3.3.PRET(激光共振能量转移):受激发荧光素的能量转移到邻近的另一荧光素,并不发射荧光而使激发荧光素回复基态

时的现象。

3.4.原位杂交:靶子为完整的染色体,由杂交信号提供作图信号,DNA变性时不破坏染色体自然形态,原位杂交是指将

特定标记的已知顺序核酸为探针与细胞或组织切片中核酸进行杂交,从而对特定核酸顺序进行精确定量定位的过程。原位杂交可以在细胞标本或组织标本上进行。

3.5. 顺序标签位点或STS(sequence tagged site)为一段长度100-500BP的单一DNA顺序,易于分辨。寻找方法: 表

达序列标签(EST) ;SSLP ;随机基因组测序. 4.1 随机测序与序列组装 随机测序也称”鸟枪法”.

序列组装原理:直接从已测序的小片段中寻找彼此重叠的测序克隆,然后依次向两侧邻接的序列延伸.

优点:不需预先了解任何基因组的情况. 实例:流感嗜血杆菌基因组的测序及顺序组装

超声波打断纯化的基因组DNA--琼脂糖电泳收集1.6~2.0Kb的区段、纯化--构建到质粒载体中--随机挑选19687个克隆,进行28643次测序,得到可读顺序为11 631 485 bp--组装成140个覆盖全基因组范围的独立的顺序重叠群 4.2 限制测序:是指将一段染色体区段的DNA 顺序进行组装.

两种策略的比较

鸟枪法策略 指导测序策略 不需背景信息 构建克隆群 (遗传、物理图谱) 时间短 需要几年的时间 需要大型计算机

得到的是草图(Draft) 得到精细图谱

1) BAC末端序列(BAC-end sequenced) :一个BAC克隆插入片段两端的已测序的序列,不包括内部序列。可用于确定BAC的排列方向以及重叠群(contig)在支架(scaffold)中的排列方向。

2) 重叠群(contig) :一群相互重叠的克隆或DNA序列,可以是草图序列或精确序列, 包括连续的(内部无间隙)或不连续的(内部含间隙)DNA序列。

3) 支架(scaffold):一组已锚定在染色体上的重叠群,内部含间隙或不含间隙。

5.1寻找基因:1)计算机分析寻找与基因有关的序列。(1)根据开放读码框预测基因:a.起始密码子ATG; b. 终止密码子;终止密码子: TAA, TAG,TGA; 2)通过对DNA序列进行实验分析,看其能否表达基因产物。 (1). Northern 杂交确定DNA片段是表达序列:(2). 由EST或cDNA指认基因;(3)获取基因全长cDNA序列;(4)4.确定DNA顺序中基因的位置

5.2同源基因

查询: 通过已存入数据库中的基因序列与待查的基因组序列进行比较,从中查找可与之匹配的碱基序列及其比例,用于界定基因的方法称为同源查询。同源有如下几种情况:A. DNA序列某些片段完全相同;B. 开放读码框排列类似,如有等长外显子;C. 开放读码框翻译成的氨基酸序列的相同;D. 模拟多肽高级结构相似。 原理:主要依据同源性比较,同源性反应出进化关系。

方法:既存数据库的比较分析。分析的基础是:如果一个新测序的基因与另一个原来已测序的基因相似,那么就揭示他们可能有进化上的关系,并且新基因的功能很可能与已知基因的功能相同,或至少是相似。

5.4.同源重组不是唯一的打断基因的方法.另一种方法是用转座子标记技术,通过向基因中插入转座元件或转座子使其失活。

5.5.突变库构建

1) 利用天然的DNA转座子构建表达载体,转化受体细胞, 当转座子活化时可被动转座并随机插入受体细胞基因组引起突

变.

2) 观测突变再生植株的表型变化, 分离与克隆插入突变基因的结构与功能.

5.6. RNAi是一种完全不同的基因失活方法,它并不打断基因本身,而是破坏其mRNA

6.1结构域: 温和条件下提取真核生物中期染色体,除去大部分结合蛋白质后,可在电子显微镜下见到从致密的蛋白质骨架向外延伸的DNA环,间期DNA环的两端附着在细胞核基质上,除去组蛋白后也有DNA环从细胞核向外突出,称结构域

6.2.isochore(等高线): 指连续分布的具有相似碱基组成的DNA区域,它们在基因组中成片镶嵌排列。 6.3.密码子偏好性:在不同生物体内,同一氨基酸可能用不同的密码子 6.4.基因内的基因:基因内的一部分基因可能单独编码一个基因

6.5.CpG岛: 富含GC碱基的DNA区段,一般长度为1-2KB。大部分位于管家基因和大部分组织专一性表达基因的5侧翼区以及基因的第一个外显子区。双碱基均未甲基化,而整个基因组中约60-80%被甲基化与基因相连,可作为寻找基因的依据.

6.6. 串接重复顺序是通过某一祖先顺序在DNA复制时因测序或重组时的不等交换扩增,因此大都是首尾相连簇集在特定位置.包括卫星序列 小卫星序列 微卫星序列. 6.7.人类基因组合果蝇基因组比较

? ? ? ?

人类蛋白质基因的编码顺序仅占总DNA的1.1%-1.5%,远低于果蝇和线虫的基因密度。

人类基因的mRNA具有更多的可变剪切方式,单个基因产生的蛋白质数目约为果蝇或线虫的5倍。 编码顺序为1340BP,外显子一致性高,内含子差别大,人类一般为3300BP,可变剪切占人类基因的22% 同源性比较表明,60%可在其它物种中发现相似的成员

CRISPR-Cas:一种来源是细菌获得性免疫的由RNA指导Cas蛋白对靶向基因进行修饰的技术。结构: CRISPR 是一个特殊

的DNA重复序列家族, 广泛分布于细菌和古细菌基因组中。CRISPR 位点通常由短的高度保守的重复序列(repeats) 组成, 重复序列的长度通常 21~48 bp, 重复序列之间被 26~72 bp 间隔序列(spacer)隔开。CRISPR就是通过这些间隔序列(space)与靶基因进行识别。

Cas家族: 存在于CRISPR位点附近,是一种双链DNA核酸酶,能在guide RNA引导下对靶位点进行切割。

CRISPR-Cas系统介导基因修饰: 1 dual-RNA:Cas介导编辑模板替换; 2 sg-RNA:Cas介导基因修饰; 3 cr-RNA:Cas介导双基因修饰

CRISPR-Cas系统前景分析: 只需合成一个sgRNA就能实现对基因的特异性修饰,Cas蛋白不具特异性.编码sgRNA的序列

不超过100bp,因此比构建TALENs和ZFNs更简单方便。较短的sgRNA序列也避免了超长、高度重复的TALENs编码载体带来的并发症。

锌指结构: 一种常出现在DNA结合蛋白中的一种结构基元。是由一个含有大约30个氨基酸的环和一个与环上的4个Cys

或2个Cys和2个His配位的Zn2+构成,形成的结构像手指状。锌指结构指的是在很多蛋白中存在的一类具有指状结构的模体,这些具有锌指结构的蛋白大多都是与基因表达的调控有关的功能蛋白。

锌指核糖核酸酶: 由一个 DNA 识别域和一个非特异性核酸内切酶构成。DNA 识别域是由一系列 Cys2-His2锌指蛋白串联

组成,每个锌指蛋白识别并结合一个特异的三联体碱基。在真核生物中从酵母到人类广泛存在,形成alpha-beta-beta二级结构。其中alpha螺旋的16氨基酸残基决定锌指的DNA结合特异性,骨架结构保守。对决定DNA结合特异性的氨基酸引入序列的改变可以获得新的DNA结合特异性。

代数 具体分类 出现时间 原理和步骤 在反应体系中加入定比例的ddNTP,由于双脱氧核苷酸没有3′-OH,且D1977 NA聚合酶不能区分dNTP与ddNTP,所以当双脱氧核苷酸被聚合到链的末端,DNA链就停止延长 先对DNA末端进行放射性标记,再使用特殊的化学试剂进行降解,这些化学试剂1977 均能对1个或者2个碱基发生专一性断裂,最后通过聚丙烯酰胺凝胶电泳、放射性自显影技术读取待测的DNA片段 原理:边合成边测序 流程:(1)构建测序文库。提取基因组DNA,随机打断成100~200bp片段,末端加上接头; (2)桥式扩增。解链后的单链DNA片段两端被分别固定于Solexa测序技术 2007 芯片上,形成桥状结构,进行桥式PCR扩增;(3)测序。将荧光标记的dNTP、聚合酶、引物加入到测序通道启动测序循环。DNA合成时,伴随着碱基的加入会有焦磷酸被释放,从而发出荧光,不同碱基用不同荧光标记,读取到核苷酸发出的荧光后,将3′羟基末端切割,随后加入第2个核苷酸,重复第一个核苷酸的步骤,直到模板序列全部被合成双链DNA。 (1)构建测序文库。将基因组DNA打碎成300~800个碱基的片段后,在两端加上锚定接头; (2)乳液PCR扩增。每个含有接头的DNA片段被固定在第二代 通量焦磷酸测序技术 特定的磁珠上,进行乳液PCR扩增;(3)焦磷酸测序。将磁珠转移到PTP板上,2003 每个PTP板上的小孔只能容下1个磁珠。分别装有T、A、C、G 4种碱基的试剂瓶,依次进入PTP板,每次只进1个碱基,如果发生配对,就会释放1个焦磷酸,释放出的荧光信号会被CCD捕获到。每个碱基反应都会捕获到1个荧光信号,由此一一对应,模板的碱基序列由此获得。 (1)文库制备。将基因组DNA打断,在其两头加上接头,构建成文库;(2)乳液PCR。此过程与454测序技术类似;(3)微珠沉积;(4)连接测序。混合SOLiD测序技术 的8碱基单链荧光探针为连接反应的底物,探针的5′端用4色荧光标记,3′端2007 第1、2位碱基对应5′端荧光信号的颜色。因为只有四色荧光,而2个碱基却又16个组合情况,故4种碱基对应一种颜色的荧光。单次测序由5轮测序反应组成,反应后得到的为原始颜色序列;(5)数据分析。测序错误经SOLiD序列分析软件自动校正,最后生成原始序列。 第三代 以单分子测序为主要特征的第三代测序技术:单分子测序技术、SMRT技术、蛋白纳米孔测序技术。

SOLiD测序技术拥有第二代测序反应中最高的通量,其独特之处是其边合成边测序过程中以连接反应取代聚合反应 优:读取的链长 缺:准确率低、成本高 是目前性价比最高、应用最广泛的测序 技术 优缺点和改进 优:操作简单 缺:不能自动化,不能满足大规模测序的要求 缺:程序复杂不能自动化,不能满足大规模测序的要求 双脱氧链终止法 第一代 化学降解法

基因组学-总结

1.1.DNA顺序复杂性:不同顺序的DNA总长称为复杂性。复杂性代表了一个物种基因组的基本特征,可通过DNA复性动力学来表示。1.2.基因的定义:不同的DNA片段共同组成一个完整的表达单位,有一个特定的表达产物,可以是RNA分子,也可以是多肽分子1.3.反义基因:是指与细胞内DNA或RNA序列相互补形成杂交体而阻断或减弱其转录
推荐度:
点击下载文档文档为doc格式
681sg4oa0v9epjx24kn2
领取福利

微信扫码领取福利

微信扫码分享