中国动物药材DNA条形码数据库
[摘要]课题组联合相关研究者开展动物药材DNA条形码分子鉴定研究,并结合分析GenBank序列,采用BLAST分析防错、系统树分析防错和Barcoding Gap检验防错等方法核验序列的可靠性,构建了中国动物药材DNA条形码数据库。该库由样品数据库、序列数据库和文献数据库组成,包含800余种动物药材和大量动物药材混伪品及密切相关物种。中国动物药材DNA条形码数据库可以通过中药材DNA条形码鉴定系统(www.tcmbarcode.cn)进行网络访问并实现未知动物样本的DNA条形码鉴定。该研究首次构建统一的中国动物药材DNA条形码数据库,对动物药材鉴定、资源可持续利用和濒危物种保护均有重要意义。
[关键词]动物药材;数据库;COI;鉴定
DNA条形码技术是动物药材鉴定的新工具[1],国家药典委员会已讨论通过在《中国药典》增补本中列入中药材DNA条形码分子鉴定指导原则[2]。本课题组联合相关研究者开展了大量的动物药材DNA条形码分子鉴定研究工作。鄢丹等对包含羚羊角、鹿角的传统角类药材进行DNA条形码研究[3],并以此为基础提出了濒危动物药材的贸易监控和替代品寻找策略[4]。张辉等对《中国药典》45种动物药材及
其混伪品进行DNA条形码研究,结果表明45种动物药材的正品来源与其混伪品均可相互区分[5]。崔丽娜等利用COI序列对金钱白花蛇及其常见混伪品进行DNA条形码鉴别研究,结果表明,金钱白花蛇COI序列可以明确地与混伪品区分开[6]。胡嵘等对海马、海龙及其混伪品共14个种20份样品的COI条形码序列进行研究,结果表明运用COI序列能够准确鉴定海马、海龙的基原动物及其混伪品[7]。此外,还开展了龟甲、鳖甲、鹿茸以及蛤壳等的DNA条形码研究工作[8-11]。动物DNA条形码分子鉴定研究工作的大量开展,为构建中国动物药材DNA条形码数据库奠定了基础。 DNA条形码数据库不仅是存储样品信息和DNA条形码序列的工具,而且是DNA条形码研究和物种鉴定分析的生物信息学平台,对推动DNA条形码研究发展具有重要意义[12]。第一个国际DNA条形码数据系统(BOLD)由国际生命条形码联盟(CBOL)于2007年建立[13]。此外,国际上还有多个针对特定动物类群的条形码数据库,如:Fish Barcode of Life Campaign (FISH-BOL,http://www.fishbol.org/),Lepidoptera Barcode of Life(http://lepbarcoding.org/),Mammalia Barcode of Life Campaign(http://www.mammaliabol.org/)。此外,邵鹏柱等初步构建了传统药物DNA条形码数据库(http:
//137.189.42.34/mherbsdb/),包含1 661个物种,36 679条序
列[14]。当前,我国尚未构建统一的动物药材DNA条形码数据库,制约了DNA条形码技术在动物药材鉴定、资源可持续利用和濒危物种保护中的进一步应用。 1 材料
中国动物药材DNA条形码数据库中的序列来自于课题组联合相关研究者所开展的动物药材DNA条形码分子鉴定研究及GenBank,包含800余种动物药材和大量动物药材混伪品及密切相关物种(表1)。 2 方法
对包含测序峰图的样品,根据Q值进行单碱基和序列质量检测。对不包含测序峰图的样品,使用EMBOSS Transeq将核酸序列翻译为蛋白序列,利用隐马尔可夫模型(hidden Markov model,HMM)进行COI条形码区域核验[13]。采用BLAST分析防错、系统树分析防错和Barcoding Gap检验防错等核验COI序列的可靠性[2],使用Muscle 3.8 进行多序列比对[15],使用Paup 4.0进行遗传距离计算[16],使用MEGA 6.0构建NJ(邻接法)系统聚类树[17]。使用BLAST方法进行物种鉴定分析,使用MySQL进行数据库管理,通过MySQLdb连接MySQL数据库。 3 结果与讨论
3.1 数据库构成 中国动物药材DNA条形码数据库由样品数据库、序列数据库和文献数据库构成。样品数据库包含
完整的样品采集和鉴定信息,即:样品编号、分类信息、凭证信息、采集者、采集地、鉴定者、1张到数张样品及生境照片等。从GenBank中下载GB格式文件,利用BioPython进行解析。仅保留物种分类地位清晰,拉丁名不包含“sp.”,“spp.”等字符的Record。提取Record注释中基因名称为“COI”或“CO1”区域的序列,如Record来自于已发表的文献,收集该文献的PubMed ID、题目、作者、期刊、摘要等信息构成文献数据库。此外,文献数据库还包含本课题组联合相关研究者所开展的动物药材DNA条形码分子鉴定研究文献。中国动物药材DNA条形码数据库包含2010年版《中国药典》[18]和《中国药用动物志》(第2版)[19]所载800余种动物药材和大量动物药材的混伪品和密切相关物种的COI序列。此外,中国动物药材DNA条形码数据库还包含样品采集、样品处理、DNA提取、PCR 扩增、测序、序列拼接及结果判定等的标准操作方法和技术流程(图1)。 3.2 数据库动态管理 中国动物药材DNA条形码数据库每6个月更新1次。新增加样品如包含测序峰图,则依照中药材DNA条形码分子鉴定指导原则去除测序峰图两端的低质量区域[2],即:以20 bp的窗口分别从序列5′端和3′端进行滑动,如果窗口内有多于2个碱基的Q值 3.3 物种鉴定系统 未知样品可以通过中药材DNA条形码鉴定系统进行鉴定,其访问地址为www.tcmbarcode.cn。任何对中国
动物药材DNA条形码鉴定感兴趣的单位和个人,均可将获得的未知样品COI条形码序列粘贴到物种鉴定模块的查询框,然后点击提交进行鉴定。查询COI序列的长度须大于300 bp,且序列所含不确定碱基(Ns)的数目应小于1%。当前,该系统支持Fasta(含“>”号)格式和纯序列格式(不含“>”号)查询。物种鉴定系统可以很快查询到数据库中与未知样品序列最相似的序列,并给出数据库中该序列的物种信息。为便于使用者对鉴定结果进行核对,物种鉴定系统同时列出了数据库中与查询序列相似性最高的前20条序列,并列出序列相似性、分值、E值及比对信息(图2)。 4 结论
动物药材是我国传统医药的重要组成部分,在我国已有两三千年的应用历史,从秦汉时期的《神农本草经》,到历版《中国药典》都收载有动物药材,据第三次中药资源普查结果,我国药用动物有11门,415科,861属,1 581种。我国动物药材多数来自野生,资源有限,部分药材的基原动物如穿山甲、赛加羚羊、梅花鹿等已被列入《国家重点保护野生动物名录》(http://sts.mep.gov.cn)和《濒危野生动植物种国际贸易公约》附录 (http://www.cites.org.cn)。此外,除使用动物全体的药材外,动物药材多取自动物的不同组织或器官,例如:角、甲、壳、骨、皮等,形态鉴定特征不完整,给动物药材的性状鉴定带来较大困难[20]。DNA 条形码
中国动物药材DNA条形码数据库



