文档来源为:从网络收集整理.word版本可编辑.欢迎下载支持.
---图位法和鸟枪法.
10. 流感嗜血杆菌基因鸟枪法测序无需任何关于遗传图及物理图的信息。
11. 用于测序的流感嗜血杆菌基因组文库——构建了两套基因组文库,原因是:1) 1.6-2 kb大小插入子基因组文库. ①2 kb大小插入子可减少扩增时的变异率. ②此外, 2 kb大小降低了克隆片段含有完整基因的可能性, 有些完整基因的表达产物对宿主菌是有害的. 2) 15-20 kb大小插入子文库, 用于支架搭建. 上述两套基因组文库的克隆测序均为两端测序. 12. 间隙:测序后将DNA顺序进行组装,存在不连续的区段。
13. ★间隙的类型(名解):1) 顺序间隙:因覆盖率的原因而留下的未能测序的顺序,仍存在于克隆文库中, 这类间隙称为顺序间隙。 2) 物理间隙:因克隆载体自身的限制(库中)或DNA顺序特殊的组成等原因造成某些顺序丢失或未能克隆, 这类间隙称为物理间隙。 14. 流感嗜血杆菌基因组测序结果(看看即可):1) 两端测序的结果称为读序(read), 每个读序长约400bp. 2) 在DNA顺序组装前,由自动测序仪给出的每个读序都必须经PhredII软件处理, 以确定给出的顺序质量与可靠性.这一步为顺序认可 (calling for). 3) 流感嗜血杆菌基因组测序共组装了24304个片段,建立了140个重叠群(contig).根据某些克隆跨越不同的contig, 再合并为42个支架(scaffold). 4) 整个组装的基因组顺序存在42个物理间隙, 98个顺序间隙.基因组全长1830137bp(1.8 Mb).
15. ★基因组顺序组装的概念定义(名解):1) BAC末端顺序(BAC-end sequence):一个BAC克隆插入片段两端的已测序的顺序,不包括内部顺序. 可用于确定BAC的排列方向以及重叠群(contig)在支架(scaffold)中的排列方向. 2) 重叠群(contig):一群相互重叠的克隆或DNA顺序,可以是草图顺序或精确顺序(finished), 包括连续的(内部无间隙)或不连续的(内部含间隙)DNA顺序. 3) 草图顺序(draft sequence):人类基因组测序计划定义为经Phred Q20软件认可覆盖测序克隆片段3-4倍的DNA顺序. 含间隙或无间隙, 排列方向和位置未定. 4)精确顺序(finished sequence):顺序差错率(错误碱基数)低于0.01%的DNA序列, 排列方向确定,内部不含间隙, 一般测序覆盖率在8-10个当量. 5) 支架(scaffold):一组已锚定在染色体上的重叠群, 内部含间隙或不含间隙.
16. 果蝇基因组测序:第一个采取鸟枪法完成基因组测序的真核生物,基因组总长180Mb。 17. 鸟枪法顺序组装流程图(看看即可):1) 由自动测序仪记录的测序顺序经Phred Q20软件判断采用. 2) 筛查过滤重复顺序: 如rRNA基因, 转座子等。 3) 重叠顺序组装: 两段顺序重叠的认可标准为,至少40bp的重叠,差异率小于6%. 4) Unitigger(重叠单元)建立: 一组彼此重叠的DNA顺序,其中不存在争议的或不确定的重叠关系,为独立的重叠群. 5) 支架(scaffold)
6文档来源为:从网络收集整理.word版本可编辑.欢迎下载支持.
文档来源为:从网络收集整理.word版本可编辑.欢迎下载支持.
搭建: 由一组Unitigger相互叠合以及由BAC克隆末端顺序指认彼此相邻的重叠群,内部可能有间隙.
18. 定位克隆(即图位克隆,见前):首先找到与靶基因连锁的分子标记,然后构建基因组文库。通过与靶基因连锁的分子标记筛选阳性克隆,再根据克隆插入子两端的DNA顺序查找与之连接的克隆建立重叠群,直到覆盖整个靶基因座位(染色体步移)。 17. 线虫基因组测序策略:图位法
18. ★关于基因组测序顺序的概念(名解):㈠草图顺序(前有): 1) 达到普通质量但尚未完成的基因组DNA顺序, 其精确度高于90%.所处染色体位置已知,一般长度约10kb. 2) 草图顺序可分为3个等级: Phase 0: 测序覆盖顺序一次的DNA序列; Phase 1: 测序覆盖顺序4-10次的BAC克隆, BAC及内部片段的位置和排列方向未定. Phase 2: 测序覆盖顺序4-10次的BAC克隆, BAC及内部片段的位置和排列方向已定. ㈡完成顺序:1) 完成顺序系指已测序的, 每10000 个碱基中出现一个差错, 且内部不存在间隙的DNA顺序. 2) 完成顺序也称为Phase 3期顺序.
19. 玉米基因组如何测序:1) 玉米基因组大小为2500 Mb(2.5 x 10 ), 约80% DNA顺序由逆转座子组成. 2) 虽然利用EST(expressed sequence tag)可从基因组中抽提出基因组顺序,但因表达丰度过低或组织专一性表达的原因, ESTs库会丢失50%的基因成员. 3) 绝大多数逆转座子和非基因编码区都被甲基化, 而95%的基因未甲基化. 因此采用大肠杆菌McriA和McriB系统构建玉米基因组文库, 用以富集基因顺序.
20. 玉米基因组甲基化过滤测序法:1) 大肠杆菌McriA和McriB系统可以破坏入侵的含有胞嘧啶甲基化的外源DNA, 动物和植物DNA对这一系统也很敏感. 2) 用甲基化敏感的限制酶切割玉米基因组DNA, 将克隆载体转化大肠杆菌McriA和McriB系统菌系,凡是含有胞嘧啶甲基化的克隆均被淘汰, 使基因富集7倍. 3) 采用甲基化过滤法可将玉米基因组中93%的甲基化顺序除去.经过滤后有24%的顺序与基因匹配,而未过滤的仅1.4%与基因匹配. 21. 基因组序列诠释:1) 基因注释 2) 基因功能预测 3) 基因功能检测 4) 功能基因组研究 22. 真核生物基因的一般结构:外显子和内含子。
23. 真核生物基因的组成特征:1) 外显子的组成 2) 内含子的组成 3) 碱基的分布规律 24. ★内含子的组成特点:1) 内含子具有前体mRNA加工的特征顺序。 2) 内含子含有高比例的三种读框的终止密码。
25. ★外显子的组成特点:1) CpG岛:脊椎动物 2) 摇摆密码子的使用频率或密码子偏爱 3) 5’和3’非翻译区(UTR)碱基比率, 水稻基因5’的高GC比 4) 不含或含有较少的终止密
7文档来源为:从网络收集整理.word版本可编辑.欢迎下载支持.
文档来源为:从网络收集整理.word版本可编辑.欢迎下载支持.
码。
26.密码子偏爱现象:不同生物表达同种氨基酸的密码子的使用频率不同。 27.同源查询——DNA顺序和氨基酸顺序
28. ★同源性,一致性和相似性:1) 同源性(homology):基因系指起源于同一祖先但顺序已经发生变异的基因成员, 分布在不同物种间的同源基因又称直系基因(orthologous gene). 同一物种的同源基因则称水平基因(paralogous gene), 水平基因由重复后趋异产生. 2) 基因同源性只有“是”和“非”的区别, 无所谓百分比. 3) 一致性(identity):系指同源DNA顺序的同一碱基位置的相同的碱基成员, 或者蛋白质的同一氨基酸位置的相同的氨基酸成员, 可用百分比表示. 4) 相似性(similarity):系指同源蛋白质的氨基酸顺序中一致性氨基酸和可取代氨基酸所占的比例. 可取代氨基酸系指具有相同性质如极性氨基酸或非极性氨基酸的成员, 它们之间的代换不影响蛋白质(或酶)的生物学功能.(注意区别一致性和相似性) 29. 基因注释的方法:1.目前基因注释的方法主要依赖于生物信息学方面的分析结论,它们包括以下自动注释内容: 1) ab inition 软件的预测, 依据基因结构的特点. 2) 同源性比较 3) 基序(motif)或功能域(domain)分析预测基因功能. 2. 基因功能的分类主要采用ONTOLOGY标准. 3. 人工注释系指人为检测评价程序自动注释的结果并根据其它数据进行分析与校正. 4. 实验注释系根据实验结果进行注释. 基因功能注释与调控顺序注释仍处于起始阶段. 30. 基因注释标准—人类:Known gene: 与人类已知cDNA和蛋白质顺序同源的基因. Novel gene: 与脊椎动物cDNA或其它物种蛋白质同源的基因. Novel transcripts: 与novel 基因相似,但缺少明确的ORF. Putative gene: 有同源EST支持, 但缺少cDNA或ORF. Predicted gene: 数据库中至少有一个外显子支持, 但缺少cDNA或明确的ORF. Pseudogene(假基因): 与已知蛋白质有50%的同源性,但cDNA残缺,在其它位点存在正常的同源基因的顺序. 31. 水稻注释基因类群的划分标准(3种): Homology(同源的):与某一蛋白质氨基酸顺序完全一致或相当一致的基因,有两种水平:一致的命名(same name);可能的(putative protein)或类似的(-like protein)命名. Unknown(未知的): 具有全长cDNA或EST(覆盖几乎整个基因范围)支持但没有任何同源蛋白质记录的基因. hypothetical (假定的):由一个或几个注释软件认可的蛋白质,但缺少cDNA或EST支持的基因.
32. 人类基因总数的预测有三种方法: ①cDNA和ESTs顺序 ②机算机注释 ③比较基因组学(保守的ORF)。
33. 几种模式生物注释的基因总数:大肠杆菌(E.coli):4800 酵母(yeast): 6200 线虫(nematode): 19000 果蝇(fly): 13600 拟南芥(Arabidopsis): 25000 水稻(rice): 60000 玉米(maize):59000 (估
8文档来源为:从网络收集整理.word版本可编辑.欢迎下载支持.
文档来源为:从网络收集整理.word版本可编辑.欢迎下载支持.
计数) 老鼠(mouse): 30000。
34. 功能域注释:1) 任何基因编码的蛋白质都由一些在高级结构水平具有特征性的功能域组成, 如信号肽, 受体区, 激酶区, DNA或RNA结合域等. 2) 功能域具有很强的保守性, 关键的氨基酸组成及其排列位置是相当衡定的,是鉴定功能域的主要标识. 3) 功能域是目前确定基因功能的主要依据之一. 4) 已由许多专门的功能域注释软件,可用于基因组顺序的注释. 35. 什么是功能域 (domain)?定义1:蛋白质具有独特的三级结构和特有功能的区域。定义2:具有的独特功能的蛋白质氨基酸序列的不连续的部分。定义3:蛋白质具有三级结构的部分,在更大的蛋白质中每个功能域通过短的可弯曲的多肽片段与其他功能域链接。 36. 真核生物核基因组:分子生物学的研究从单个的基因转移到整体的基因组活性研究。基因组主要的部分以染色体形式存在于细胞核中,较少的部分位于线粒体中,植物细胞还有叶绿体,也且有独立的基因组。不同真核生物核基因组均由一定数目的染色体组成,单倍体细胞所含有的全套染色体称为 ——染色体组。
37. 染色体结构:①染色体结构部件 ②染色体带型 ③人类染色体区带(带型)命名:人类染色体带型最早确定的命名方式是从着丝粒向两侧按数字编号, 短臂以p代表(p=petit),长臂以q代表。
38. 核型(Karyotype):又称染色体组型,是指用显微镜照像或描绘的方法得到的单个细胞染色体的系统排列。由体细胞中全套染色体按形态特征和大小顺序排列构成,并依次配对、分组。代表的是该个体一切细胞的染色体组成。有丝分裂中期染色体的形态较典型,所以一般分析中期染色体。主要观察染色体的长短、着丝点的位置,臂的长短、有无随体,其中以着丝点的位置最为重要。
39. 染色体核型分析(Karyotyping):是指在显微镜下对个体细胞染色体的大小,形状,数目进行检测的一种方法.根据染色体分带技术可以检测到样品细胞的染色体结构是否正常,是否发生了染色体数目的变化,结构的重排,区段缺失或重复。
40. 基因组的结构成分:1) SAR和MAR 2) CpG岛 3) 等高线4) 富基因区5)“沙漠区”。 41. ★SAR(骨架附着区,Scaffold attachment region):与染色体骨架蛋白结合的染色体DNA顺序.
42. ★MAR(基质附着区,matrix attachment region):与细胞核基质蛋白结合的染色体DNA顺序.
43. MAR和SAR的特征(区别):1) 环突的DNA基部与细胞核基质紧密结合, 将染色体DNA分成相对独立的结构区域. 2) 与细胞核基质结合的DNA顺序(基质附着区,MAR)含有
9文档来源为:从网络收集整理.word版本可编辑.欢迎下载支持.
文档来源为:从网络收集整理.word版本可编辑.欢迎下载支持.
较高比例的AT, 约占总DNA的10%. 3) 拓扑酶II可与MAR结合, 因此推测MAR成分与DNA复制有关. 4) MAR或SAR之间的距离平均为30 kb, 染色体DNA环突长约25-600 kb, 因此并非所有MAR或SAR均与基质或骨架结合.
44. SAR和MAR的应用:由于发现许多功能基因的两侧含有SAR或MAR的结构,并证实SAR和MAR(作用)具有阻止异染色质位置效应和隔离相邻基因彼此干扰的功能,因此为了提高转基因的表达水平, 在构建表达载体时可在基因两侧安装SAR或MAR顺序, 以减少转基因沉默效应(防止被干扰)。
45. 什么是CpG岛?满足CpG岛的条件为: 1) 连续200 bp的DNA顺序(已修改为500 bp); 2)C+G含量大于50%(已修改为55%); 3)观测到的CpG双碱基数目与预期的数目之比大于0.6(已修改为0.65).
46. CpG岛的一般特点:1) 主要在脊椎动物中发现,其它种属基因组中也有CpG岛, 但特征不明显. 2) 绝大多数CpG岛中很少出现胞嘧啶甲基化, 因此被认为是基因转录活跃区. 3) CpG岛主要分布在基因的启动子区和第一个外显子区. 4) 绝大多数管家基因(housekeeping gene) 含有CpG岛, 是寻找基因的一个指标.
47.脊椎动物中CpG岛的分布有如下特点:1)主要分布在基因的5‘端和第1个外显子区. 2)人类中40%的管家基因的5‘端均含CpG 岛. 3)双碱基-CpG-具回文结构,是甲基化酶作用的位点,可在回文对称的两个胞嘧啶5位碳原子上进行甲基化.CpG岛中-CpG-双碱基均无甲基化.
48. 为何会产生CpG岛? 1) 由于细胞内胞嘧啶甲基化与脱氨基事件常常发生, 导致复制时的C→A错配.在下一轮复制时原来的胞嘧啶(C)位置由胸腺嘧啶(T)取代, 即发生碱基代换. 因此基因组DNA顺序进化的总趋势是A/T 比例增加. 2) 管家基因对生物的存活极其重要, 启动子区是基因调控的主要成分, 因此很少发生可遗传的C→A的突变, 保留了较平均值更高的G/C比.
49. 植物基因组中的CpG岛:1) 植物基因组,主要是小型基因组(水稻和拟南芥)含有类似脊椎动物基因组中的CpG岛. 2) 水稻和拟南芥CpG岛的分布密度分别为4.7 kb和4.0 kb. 3) 水稻和拟南芥CpG岛的分布覆盖了整个基因,并非如脊椎动物那样局限于基因5’端. 4) 植物除-CpG-可被甲基化外, -CpNpG-回文结构的胞嘧啶也可甲基化. 5) 植物中-CpG-在CpG岛中的比例在75-80%, 与脊椎动物类似, 单子叶高于双子叶.
50. 基因组顺序组成的等高线(isochore)特点:1) ★ 等高线(isochore):系指基因组中具有较均一的相似比例碱基组成的连续的DNA顺序. 2) 脊椎动物基因组中等高线DNA顺序具有
10文档来源为:从网络收集整理.word版本可编辑.欢迎下载支持.
细胞与分子遗传学



