好文档 - 专业文书写作范文服务资料分享网站

探究中药信息学研究进展

天下 分享 时间: 加入收藏 我要投稿 点赞

探究中药信息学研究进展

为推进中药现代化的发展,科技部、国家计委、国家经贸委、卫生部、国家药品监督管理局、知识产权局、国家中医药管理局、中国科学院在2002 年11 月制定了中国第一部中药现代化发展的纲领性文件《中药现代化发展纲要(2002 年至2010年)》。此纲要明确提出了一系列中药现代化发展的重点任务,其中包括建立中药数据库和种质资源库,收集中药品种、产地、药效等相关的数据;同时要求加强多学科交叉配合,深入进行中药药效物质基础、作用机理、方剂配伍规律等研究,积极开展中药基因组学、蛋白质组学等的研究。要求重视中医药基础理论的研究与创新,特别是与中药现代化发展密切相关的理论研究,如证候理论、组方理论、药性理论,探索其科学内涵,为中药现代化提供发展源泉。经过5 年的实践,科技部、卫生部、国家中医药管理局、国家食品药品监督管理局等16 个部门在2007 年3 月又联合发布了《中医药创新发展规划纲要(2006-2024 年)》,确定了继承,创新,现代化,国际化作为中医药创新发展的基本任务。新纲要明确定义了中医药泛指中华民族传统医药,包括中医药和民族医药。首次提出了在借鉴现代医药和其他国家传统医药经验的基础上,争取使中医药标准规范成为国际传统医药标准规范的战略目标,并且强调中医药基础数据库和国际化信息库的建设,为适应中医药现代化和国际化发展需求建立创新体系,提高科技支撑能力。 在这样的政策背景下,中药信息学研究取得了飞速的发展。中药信息学是以计算机为主要工具,首先对蕴藏着大量中药学、化学、药理学和生物医学信息的文献资料进行分析、归类和整编。这包括将中药的原植物、化学成分、药理作用和传统中医药经验理论中的药材性味、方剂配伍、适应症和药效等信息进行数字化处理,再整合大量随机的生物实验和色谱、光谱数据,然后根据研究课题的需要采用适当的数据挖掘方法分析这些数据,从而迅速提取隐含的有价值信息并挖掘出有逻辑性和规律性的知识。这是新的历史条件下中药信息学(TCMinformatics)的主要研究内容,也是现代中医药研究的重要组成部分。 1 中药信息学发展的新阶段

中药是一个高度复杂的化学物质体系,其复杂性不仅表现在组成方剂的化学成分的复杂性,也体现在方剂与人体相互关系的复杂性。中药通过多途径、多靶

1

点、整体调节的机制发挥药效作用,因此具有系统性特点。长期以来,中药药效物质基础和作用机制研究未能获得根本性突破的重要原因之一是缺乏对中药高度复杂性及系统性进行研究的手段,故如何揭示并系统阐明中药化学物质组成与药效间的复杂关系,是当今中药信息学所面对的严峻挑战。

早期建立的中药数据库大多属于功能相对简单的信息查询系统,即通过对疾病、药理作用、中药方剂等数据的互相关联对中药信息进行管理。当用户输入关键字后系统显示出相关的中药复方、功能主治、组成成分等信息,同时能按相关度和功效权重进行量化排序。这样的系统设计实现了中医药信息的存储与共享。实际上,近几年中药信息学研究已经从知识共享阶段来到了知识发现(Knowledge Discovery in Database)阶段,而这个提升过程又是由数据挖掘技术(Data Mining)的应用来实现的。在国家重点基础研究发展计划(973)和国家高技术研究发展计划(863)项目资金的支持下,新建的药学数据库在虚拟筛选和数据分析结果的可视化处理方面有了长足的发展。新的中药学数据库与这些先进的技术平台相结合的数据发掘研究,不仅实现了传统中药学的现代化发展,也使中药继续成为国际天然药学研究与新药开发的热点。

数据挖掘本身是一门跨学科的技术。事实上,统计学、数据库技术、机器学习、模式识别、人工智能和可视化等技术都在数据挖掘中起着作用。因此,很难定义这些学科和数据挖掘间的界限。这些技术在各自的学科领域内有大量的专著可供参考,此处不再赘述,笔者仅针对数据挖掘技术在中药信息学中的应用作一些介绍。先进分析模型的应用提高了对中医理论、药理作用、植物化学、生物实验数据等不同领域的信息进行多维分析的效率,有助于研究人员准确地进行中药研究选题,从而有效地避免低水平的重复性研究。目前,最常用的数据挖掘方法有:决策树、神经网络、粗糙集、模糊集和遗传算法等。每一种算法都有各自的特点和应用领域,不可能完成所有不同类型的数据挖掘任务。所以,在实际应用中常常采用多种算法相结合对数据进行分析。 2 中药信息学研究的新技术、新成果 2.1 中药生物活性的虚拟筛选

随机森林模型(random forest)是决策树(decision trees)的集成,当作为预测模型使用时它是一种计算条件概率的描述方法。对于处理和组织大量文献数据

2

具有较强的文本分类性能。自组织映射(self-organizing map)是一种类似大脑思维的人工神经网络模型,它通过无监督学习将高维度的数据进行处理后再以低维(通常是二维)视图表达分析结果,而且映射图上保留原输入样本空间的拓扑性质。于是,在它输出的语义映射图上性质相似的样本是彼此靠近的,反之则位置相对较远。它的突出优点在于适合任何类型的数据,并能够算出数据样本之间的配对间距,特别是那些非矢量数据。例如,符号序列和有机化学分子结构片段序列等。 利用以上算法的特性,Thomas Ehrman 等人在英国的Kings College London 新建了一个收录240 味常用中药的中药信息数据库,并针对这些药材中已知的8 411 个化合物通过随机森林模型构建中药学特征档案。所构建的28 个随机森林模型各自包含500 棵决策树,它们描述了这些化合物在清热、补气、止血等28 个功能与主治分类中的附属关系。再使用自组织映射模型将化合物根据中药学特征档案划归入生物碱、多酚、单萜、二萜等10 大植物化学分类中,同时采用Ward 聚类法生成自组织映射彩色图谱。由此清晰地将10 大类天然成分在中药功能与主治分类中的分布直观地表现出来。例如:甾体类生物碱主要在催吐和治痰热的分区中显示阳性信号,原小檗碱(protoberberine)类生物碱在治湿热分区中显示出强相关性,在该分类项中的中药通常用来治疗黄疸、痢疾和皮肤病。由Peter Hylands 教授领导的位于伦敦的CNMR 天然药物研究中心还利用此中药数据库进行了基于小分子结构相似性的虚拟筛选(Virtual Screening)。采用随机森林模型对具有相同生物活性的小分子进行分析,其中针对HIV-1 病毒的剪接酶、蛋白酶和反转录酶3 个靶标蛋白的虚拟筛选结果预测多味中药具有对HIV-1 病毒的多靶点抑制活性。例如,富含单宁酸类成分的山茱萸、石榴、丁香、地榆以及富含黄酮类化合物的银杏、黄芩、桑叶等。

基于分子对接(molecular docking)的虚拟筛选是针对重要疾病的特定靶标生物大分子的三维结构或定量构效关系quantitative structure-activity relationship (QSAR)模型,从现有的小分子数据库中(包括天然药物成分、半合成以及全合成化合物)搜寻可与靶标生物大分子结合或符合QSAR 模型的化合物进行计算机虚拟筛选研究。其目的是快速地从多达上百万个分子中,发现有潜在生物活性的化合物。用计算机进行的虚拟筛选大大减少了生物实验筛选的化合物数量,既缩短研究周期,又节约研究经费。虚拟筛选方法主要分为基于配体小分子

3

探究中药信息学研究进展

探究中药信息学研究进展为推进中药现代化的发展,科技部、国家计委、国家经贸委、卫生部、国家药品监督管理局、知识产权局、国家中医药管理局、中国科学院在2002年11月制定了中国第一部中药现代化发展的纲领性文件《中药现代化发展纲要(2002年至2010年)》。此纲要明确提出了一系列中药现代化发展的重点任务,其中包括建立中药数据库和种质资源库,收集中药品种
推荐度:
点击下载文档文档为doc格式
6ku1a07j7b79c964hjsm5kaxd91bwp00kv6
领取福利

微信扫码领取福利

微信扫码分享