中国水产科学 2011年7月, 18(4: 936?943 Journal of Fishery Sciences of China 综 述
收稿日期: 2011?03?14; 修订日期: 2011?04?10.
基金项目: 国家自然基金资助项目(30730071; 30972245; 农业科技成果转化资金项目(2010GB24910700. 作者简介: 于洋(1987?, 硕士研究生. E-mail:
yuy8866@163.com 通信作者: 张晓军, 副研究员. E-mail: xjzhang@ms.qdio.ac.cn
DOI: 10.3724/SP.J.1118.2011.00935
全基因组选择育种策略及在水产动物育种中的应用前景 于洋1,2 , 张晓军1 , 李富花1 , 相建海1
1. 中国科学院 海洋研究所 实验海洋生物学重点实验室, 山东 青岛266071; 2. 中国科学院 研究生院, 北京 100049
摘要: 全基因组选择的概念自2001年由Meuwissen 等提出后便引起了动物育种工作者的广泛关注。目前, 澳大利亚、新西兰、荷兰、美国的研究小组已经应用该方法进行了优质种牛的选择育种, 并取得了很好的效果。此外在鸡和猪的选择育种中也有该方法的应用, 但在水产动物选育中尚未见该方法使用的报道。本文对 “全基因组选择育种”的概念和提出背景进行了归纳, 对全基因组选择育种的优势进行了阐述, 并详细介绍了其具体的策略, 总结了目前全基因组育种所广泛采用的方法以及取得的成果, 旨在为该方法在水产动物育种方面的应用研究提供科学参考。
关键词: 全基因组选择; 水产动物育种; SNP; QTL; 全基因组育种值估计 中图分类号: S96 文献标志码: A 文章编号: 1005?8737?(201104?0935?08 人类对于动物的选择育种由来已久, 最初所进行的只是简单的人工驯化。随着遗传学研究的发展, 尤其是“数量遗传学理论”的提出, 动物育种技术进入快速发展时
期。数量遗传学理论认为生物的若干性状如生长、抗病等是由许多的微小基因共同作用的, 这些决定数量性状的微小基因称为数量性状位点(quantitative trait locus, QTL。数量遗传学就是利用遗传学和统计学原理, 研究QTL 所决定的数量性状[1]。过去的数量遗传学方法把控制某一数量性状的多个基因作为一个整体研究, 因此无法准确定位到单个微小基因, 也无法准确估计出单个基因的效应[2] 。随着分子标记技术从第一代的限制性片段长度多态性(RFLP、随机扩增DNA 多态性(RAPD, 发展到第二代微卫星DNA 和新一代单核苷酸多态性(single nu-cleotide
polymorphisms, SNP, 标记辅助选育(marker assisted selection, MAS研究也取得了更
大的进步, 人们已经能够对于某些性状的QTL 位点进行精确定位, Grisart 等在2002年发现了控制牛奶乳脂含量和其他牛奶特性的QTL 位点以及该位点处的关键基因DGAT1, 并鉴定了起决定作用的关键位点K232A 。相对于陆生生物, 水产动物遗传育种起步较晚, 目前已有较多分子标记开发和QTL 定位[4-7]以及基因定位方面的报道[8-9], 但是要实际应用仍需要更加深入的研究。
虽然标记辅助选育已经在陆生生物育种中得到广泛应用, 在水产动物中也有相关分子标记开发的报道, 但是现行的标记辅助选育仍然有很大的局限性: 从深度上看, 它所研究的某一个性状的QTL 不够精密, 仍有许多与性状相关的sub-QTL 未能被发现[10], 同时目前已被证实具有显著效应的基因或标记非常有限, 而所找到的数量性状基因或标记仅能解释有限的遗传变异[11]; 从广度上看, 由于利用MAS 方法的工作量极为
第4期 于洋等: 全基因组选择育种策略及在水产动物育种中的应用前景 937 巨大, 发现并证实一个有效的基因需要很长的时间和很高的成本, 因此一次只能研究一个或少量性状的QTL, 很难涉及不同性状QTLs 间的相互作用。近年来, 随着越来越多的生物基因组得到破译, 科学家提出了全基因组选择育种的概念。本文通过对 “全基因组选择育种”的概念和提出背景进行归纳, 并总结目前全基因组育种所广泛采用的方法以及取得的成果, 旨在为该方法在水产动物育种方面的应用研究提供科学参考。
1 全基因组选择概念的提出
全基因组选择的概念是由Meuwissen 等[12]在2001年提出的, 当时是基于一种理想的假设, 即所有性状的QTLs 都对应一个与之紧密连锁的SNP 位点并可用该标记来代表; 通过性状测定获得全基因组育种值, 结合该个体所带的分子标记, 应用统计学方法计算出每一个分子标记所对应的染色体片段的育种值大小; 然后再对所要选择的个体进行全基因组育种值估计(genomic estimated breeding value, GEBV, 并进行选择。由此可见, 全基因组选择是在传统MAS 基础上的创新和改进, 是用覆盖全基因组的标记进行的辅助选育
[13] 。 Seidel [14]
通过一个简单的例子对全基因组选
择中统计方法的应用进行了阐述。如表1所示, 假设生物是二倍体, 每个位点有两个等位基因, 每个等位基因存在两种基因型, 分别用AB 、CD 、EF 代表位点1、2、3(SNP-1、SNP-2、SNP-3 。表中列出了3个位点的27种组合, 并给出了每种组合所对应的两个生物性状, 例如牛奶中蛋白(milk protein含量和生产周期(productive herd life 。由表可以看出, 最佳的组合是BBDDEE 和BBDDEF, 当SNP-3的基因型为EE 或EF 时, B或D 这种基因型出现的越多, 奶中蛋白的含量越高, 当SNP-3的基因型是FF 时, SNP-1和SNP-2的基因型对于牛奶蛋白的含量没有影响; 同时可以看出, SNP-3的基因型对生产周期没有影响, 而SNP-1和SNP-2中的B 和D 基因型越多, 生产周期越短, A和C 基因型越多, 生产周期越长。这是对于简单的3个位点, 每个位点只有两种基因型
的情况; 如果是进行全基因组选择, 进行选择的SNP 位点多达成千上万个, 而进行分析的参考群体的个体数目又不可能达到这么多, 由此会造成自由度不够的问题[2]。因此, 科学家研究了多种方法进行全基因组选择的估计, 具体的估计方法将在后面进行介绍。
表1 3个SNP 决定的单倍型的组合以及对应的表型性状[14] Tab.1 Illustration of the 27 combinations of three single nucleotide polymorphisms with phenotype[14] SNP-1 SNP-2 SNP-3
% milk protein productive herd life (months
AA CC EE 3.0 5.0 AB CC EE 3.1 4.5 BB CC EE 3.2 4.0 AA CD EE 3.3 3.5 AB CD EE 3.4 3.0 BB CD EE 3.5 2.5 AA DD EE 3.6 2.0 AB DD EE 3.7 1.5 BB DD EE 3.8 1.0 AA CC EF 3.0 5.0 AB CC EF 3.1 4.5 BB CC EF 3.2 4.0 AA CD EF 3.3 3.5 AB CD EF 3.4 3.0 BB CD EF 3.5 2.5 AA DD EF 3.6 2.0 AB DD EF 3.7 1.5 BB DD EF 3.8 1.0 AA CC FF 3.4 5.0 AB CC FF 3.4 4.5 BB CC FF 3.4 4.0 AA CD FF 3.4 3.5 AB CD FF 3.4 3.0 BB CD FF 3.4 2.5 AA DD FF 3.4 2.0 AB DD FF 3.4 1.5 BB DD FF
3.4 1.0
2 全基因组选择育种的优势 2.1 增加选择的准确性
通过精确的全基因组范围的SNP 标记可以有效地提高选择的准确性[14]。由于全基因组选择选用覆盖整个基因组的分子标记, 这样可以将每个
938 中国水产科学 第18卷
起作用基因的效应包括在内, 增加了选择的准确性。De Ross 等对全基因组选择(genomic selec-tion 、传统选择(BLUP法 和基因辅助选择(gene assisted selection3种方法的准确性进行了比较, 发现在乳脂率(fat percentage这一性状的预测准确率方面, 全基因组选择能够达到75%, 而BLUP 法的准确性只有51%[15]。 2.2 提高选择的效率
该方法可以同时对多个性状进行选择, 并显著地提高选择的效率。Illumina 公司推出的50K 的牛基因组SNP 芯片可以同时对50 000个SNP 位点进行检测, 分析多个性状相关的SNP 位点。VanRaden 等应用全基因组选择的方法, 同时考虑5种生产性状(yield traits、5种健康性状(fitness traits 和16种体型性状, 对北美荷尔斯坦因公牛进行了选择[11]。
2.3 缩短代与代的间隔, 降低生产成本