好文档 - 专业文书写作范文服务资料分享网站

食源性致病菌基因组数据平台建设与展望

天下 分享 时间: 加入收藏 我要投稿 点赞

Data Management and Utilization数据管理与利用食源性致病菌基因组数据平台建设与展望刘冬梅① 亓合媛① 刘杨② 肖革新*【摘要】 在信息科学飞速发展、测序技术不断完善的今天,食源性致病菌溯源研究有了全新的基于全基因组测序的技术方法和分析手段,从食源性致病菌基因组序列中可以获得更多的遗传信息来支持科研人员做研究,进而辅助管理人员做决策。在食品安全管控方面,系统性地整合基因组数据、元数据和配套模型,搭建食源性致病菌基因组数据平台是十分有必要的。以食源性致病菌基因组数据平台建设的需求与发展方向出发,细致梳理数据集成和关联模型中可能存在的问题与部署方向,能够为平台建设提供详细的实施蓝图。【关键词】 食源性致病菌 分型 溯源 基因组数据平台Doi:10.3969/j.issn.1673-7571.2021.01.019【中图分类号】 R319 【文献标识码】 AThe Status and Development of Foodborne Pathogens Genome Data Platform / LIU Dong-mei, QI He-yuan, LIU Yang, et al.Abstract: With the rapid development of information and sequencing technology, there are some new approaches provided in the study on bacterial pathogens, which is the main role in foodborne disease. As the whole genome data can be used to illustrate the epidemiology of the outbreak and to compare variant loci of pathogen genomes between di?erent groups. Then, the administrative department can make a better decision on the early warning and real-time control. Therefore, a bacterial pathogens genomic data platform, which integrates high-quality data including genomic data, sample metadata, and food chain network data, related models and analysis tools, is necessary for food safety control. Here, based on the review of the bacterial pathogens typing method, existing bacterial pathogens databases and associated analysis model, this paper illuminates the di?culties on data integration and the development of data platform.Keywords: foodborne bacterial pathogens, typing, traceability, genome data platformFund project: Research and Application Demonstration Project of the Information Technology for Food Safety and Social Co-governance of National Key R&D Plan-Research on the Multi-dimensional Dynamic Correlation Analysis Technology for Food Safety Control (No. 2017YFC1602002)Corresponding author: National Institute of Hospital Administration, NHC, Beijing 100044, P.R.C1 食源性致病菌概述物为媒介进入人体而造成的感染性性疾病均高于其他致病因素所引起食源性疾病泛指包含化学物和中毒性疾病。其中,食源性致病的食源性疾病[1-3]。食源性致病菌质、病毒、细菌、真菌、寄生虫、菌(致病性细菌)是最主要的一大会在食品的生产、加工和运输的过动植物在内的各种致病因子,以食类食源性疾病病原,所引起的食源程中被引入,可导致集中性和地区基金项目:国家重点研发计划食品安全社会共治信息技术研究与应用示范项目-食品安全管控多维动态关联分析技术研究(编号:2017YFC1602002)*通信作者:国家卫生健康委医院管理研究所,100044,北京市海淀区首都体育馆南路6号院3号楼①中国科学院微生物研究所,100101,北京市朝阳区北辰西路1号院3号②贵州科学院,550001,贵州省贵阳市延安东路40号《中国数字医学》2021第16卷 第1期 ·83数据管理与利用Data Management and Utilization性的食源性疾病的暴发,对人类生随着二代测序技术的普及,测命健康可产生广泛的不良影响[3]。序能力的不断提高和测序价格的因此,对食源性致病菌的监测,可大幅降低,全基因组测序(whole 以有效地对食源性疾病的暴发进行genome sequencing,WGS)渐渐预警和防控。成为食源性致病菌研究的主流方对食源性致病菌的监测首先对法,基于全基因组测序的分型方法各类致病菌进行分类,进而可以结有:利用多个保守基因位点差异的合包含样本采集信息、样本病理信全基因组多位点序列分型(whole 息等元数据进行溯源分析。根据传genome multilocus sequence 统的生物分类学,食源性致病菌可typing,wgMLST);利用物种共以按照七级分类阶元体系划分,常有的核心基因位点差异的核心基因见的食源性病原菌涉及9个属,27组多位点序列分型(core genome 个种(表1),如若对其进行种下multilocus sequence typing,水平的区分,还需要进行食源性致cgMLST);利用单核苷酸多态性病菌分型。差异的全基因组单核苷酸多态性分传统的分型包括血清型分型、型(whole genome single nucleotide 生化特征分型、噬菌体分型、耐药polymorphism typing,wgSNP-谱分型在内的表型分型,由于操作typing);利用短回文重复序列簇繁琐、检测通量极低、分辨率低、(Clustered Regularly Interspaced 无法同时检测多种致病菌,仅在特Short Palindromic Repeats typing,定的场景下使用。与之不同的分子CRISPR typing)差异的分型。利分型技术由于其高灵敏度、可重复用二代测序技术或三代测序技术获性强、易于标准化等特点使其成为取全基因组序列,不仅可以对食源目前主要的分型手段。性致病菌进行最高精度的分型,分子分型手段可分为两类,一其流程的标准化是对分析方法进类是通过分子生物学手段对基因组行控制,易于操作;还可以对基特定特征进行提取的方法,比较成因组数据做变异分析、基因差异熟的有:①基于核糖体的分型;②分析、进化来源分析等等,数据基于细菌染色体酶切位点间距多应用前景更广。态性差异,利用脉冲场凝胶电泳(pulsed field gel electrophoresis,2 食源性致病菌监测网络与PFGE)对酶切后的DNA片段进行数据平台概述分离的分型方法;③基于多管家基以上提及的方法,几乎都需要因点突变差异的多位点序列的分型对大量数据进行梳理、统计与分方法(multilocus sequence typing,析,积累数据,用于做对比,确定MLST);④基于多位点可变数分型并进行溯源研究。这就需要多量串联重复序列分析的分型方法个实验室沟通配合,统一检测方(multiple locus variable number 法,建立数据库。因此,食源性致tandem repeat analysis typing,病菌分子监测网络应运而生[4]。其MLVA typing)。对于标准化体系建立、食源性致病84·China Digital Medicine. 2021,Vol.16,No.1表1 根据GenBank数据库收录的基因组数据结合历年文献整理的常见食源性病原菌科学名称分类名称Staphylococcus aureusEscherichia coliSalmonella entericaListeria monocytogenesVibrio choleraeBacillus cereusCampylobacter jejuniVibrio parahaemolyticusBacillus anthracisCampylobacter coliClostridium botulinumShigella ?exneriVibrio vulni?cus种Clostridium perfringensShigella sonneiShigella boydiiCampylobacter fetusShigella dysenteriaeCampylobacter lariCampylobacter concisusSalmonella bongoriCampylobacter upsaliensisCampylobacter rectusStaphylococcus argenteusStaphylococcus epidermidisCampylobacter mucosalisVibrio albensis-EscherichiaCampylobacterVibrioStaphylococcus属ListeriaClostridiumSalmonellaBacillusShigella-菌溯源和国家级乃至世界级的食品安全管控都有绝对的必要性。在食源性致病菌的分子监测网络和数据建设方面,美国疾病控制与预防中心(Centers for Disease Control and Prevention,CDC)于1995年联合多家州立公共卫生实验室建立了国家级的分子分型监测网,即为PulseNet的前身[5]。随后,多个国家的实验室相继加入PulseNet,使其成为一个世界级的食源性致病菌分子检测网络。PulseNet建立了食源性致病菌的PFGE和WGS标准化流程,收集各个来源的样本分析数据,为加入PulseNet的成员组织共享使用[5-6]。随着技术手段的更替,WGS逐渐取代PFGE等方法,完整基因组序列对于认知微生物至关重要。美国食品药品监督管理局(Food and Drug Administration,FDA)于2012年建立了以全基因组序列为基础,集成各种样本分离得到的细菌病原体数据的食源性病原体数据库GenomeTrakr[7],以供科学家和管理工作者对病原体进行基因组研究和制定食品安全管理方案。PulseNet和GenomeTrakr对美国乃至全世界的食品安全管控起到了至关重要的作用,在多次重大食源性疫情的防治防控中扮演着重要角色,如在2017—2018年,美国FDA对佛罗里达州一家冰淇淋厂进行环境取样,通过WGS的分析方法检测到了李斯特氏菌,随即卫生署对该工厂生产的所有冰淇淋产品进行了召回,防止了潜在疾病暴发[8]。我国的国家食源性疾病分子监测网络[9](national foodborne disease molecular tracing network,Data Management and Utilization数据管理与利用TraNet)自2013年启动,国家食F或某类环境C的关联程度,提示品安全风险评估中心(National 加强对F类食品中对B致病菌的监Center for Food Safety Risk 测或加强对某类环境C出产的食品Assessment,CFSA)管理数据的监测。如2010年,芬兰暴发肠胃库、从整体上分析递交数据、设计疾病,Jacks等[12]使用随机效用模风险评估体系、制定标准化流程,型发现可食用甜菜根中检测到的32个省级和107个市级疾病预防控β-溶血性荧光假单胞菌与胃肠道制中心实验室维护本地数据库、从疾病密切相关,芬兰食品安全局随哨点医院获取样本、向国家数据库后制定了相关检测政策。②估计某提交PFGE数据。随着全基因组测类食源性致病菌B在暴发性疾病D序数据分析在病原分型、疫情溯源中的地位,估计致病菌B的风险因等各个方面展示出其强大的应用价子,提示提高或降低致病菌B的监值,CFSA、中国农业大学和某公测门槛。③从食品供应链估计某司联合建立了基于全基因组测序的类食源性致病菌B的传播来源可能食源性疾病分子溯源网络[10],不仅性,提示加强对食品供应链S的某建立了wgMLST和cgMLST分析标环节的监测。准化方法,同时加入了流行病学信上述这些模型大部分基于局部息,建立了基于全基因组分型之有效数据进行建模,没有加入大上的溯源知识库。不仅如此,毒尺度大范围的整体数据分析。目力基因分析、耐药基因分析等基前引入整体数据进行建模的大多因组分析功能模块亦被整合入其使用了地理信息系统(geographic 配套软件中。information system,GIS)的统计食源性致病菌监测与溯源网络模型来做地域与食品安全风险等级是否能够有效地对食源性疾病进行的关联性,取得了一定的风险预警预警主要取决于积累数据的质量和效果。如Leila等[13]利用GIS对加拿相关分析模型可靠程度。大农产品分销系统的地图,分析消对于食源性致病菌的溯源与预费者对受污染农产品的可获得性,警,上报的数据质量是溯源网络的并估计随着时间的推移与污染相关基础。它涉及两方面:①漏报情况的风险水平。Daniel等[14]利用GIS是否严重。在多项报告性研究和和广义线性模型、逻辑回归等方法综述中提及,世界各地食源性疾对纽约州农场中的李特斯特菌的流病的漏报很普遍且漏报比例非常行情况进行预测,对收获前农产品高[11]。②元数据是否规范完整。如污染的风险进行了有效控制。果元数据或数据大量缺失,则通现有的监测网络与数据平台集过依赖于先验数据或分布的统计中在数据的集成和可视化上,如模型、机器学习模型无法得到可Gopinath等[15]开发了集数据收集、靠的预测结果。分析和交流需求的病原体注释跟踪对于食源性致病菌的相关分析资源网络系统,汇总了描述元数据模型,总结起来有以下几种:①估的标准词汇表和高质量的数据集构计某类食源性致病菌B对某类食品建方法。现有食源性致病菌基因组《中国数字医学》2021第16卷 第1期 ·85

食源性致病菌基因组数据平台建设与展望

DataManagementandUtilization数据管理与利用食源性致病菌基因组数据平台建设与展望刘冬梅①亓合媛①刘杨②肖革新*【摘要】在信息科学飞速发展、测序技术不断完善的今天,食源性致病菌溯源研究有了全新的基于全基因组测序的技术方法和分析手段,从食源性致病菌基因组序列中可以获得更多的遗传信息来支持科研人员做研究,进而辅助管理人员做决策。在食品安全管控方面,系统
推荐度:
点击下载文档文档为doc格式
99bvy1e0ub8c83h0epna2cg5h8inz6016db
领取福利

微信扫码领取福利

微信扫码分享