好文档 - 专业文书写作范文服务资料分享网站

基于组织特异性基因的药物新用途研究

天下 分享 时间: 加入收藏 我要投稿 点赞

基于组织特异性基因的药物新用途研究

随着后基因组时代的到来,高通量生物技术的不断完善以及生物信息学的发展,传统的生物化学与分子生物学研究单个基因或蛋白的方法已经不再适用,取而代之的是将整个系统作为研究对象的系统生物学方法。随着基因组学、蛋白质组学、转录组学、相互作用组学、疾病组学研究以及药物组学的深入开展,产生了海量的生物学数据。

丰富的数据信息为全面理解生物学本质提供了机遇与挑战。只有进行整合研究才能反映出生物系统的真实性。

具有相同遗传信息的同一个体的体细胞其所利用的基因并不相同,有的基因是维持细胞基本代谢所必须的,而有的基因则在一些分化细胞中活动,这正是细胞分化、生物发育的基础。而组织特异性基因是在不同的细胞类型中进行特异性表达的基因,其产物赋予各种类型细胞特异的形态结构以及生理功能。

这些基因的表达与否,决定了生命历程中细胞的发育、分化、细胞周期的调控、体内平衡、细胞衰老、甚至于程序化死亡。近期有研究报道,结合组织特异性、基因的关联性以及疾病的相关性的分析结果显示,疾病(非癌症)相关的基因通常在疾病发生的组织中表现出组织特异性。

此外,已有许多研究将组织特异性作为诊断标记物以及药物靶点的一个基本特征。在组织工程、基因工程、再生医学等方面,组织特异性以及组织特异性基因的研究正深入开展。

目前对人类正常组织的组织特异性基因筛选工作已有许多的报道,并构建了许多相关的数据库,例如BioGPS, TiGER, COXPRESdb以及TiSGeD等。这些人类组织特异性基因数据库收录了许多种组织中特异性表达的基因。

但是这些研究大都只关注组织特异性基因的表达分布,而忽略了包括生物学通路在内的一系列生物学特性。如能将这些基因与其所属功能,表达产物的亚细胞定位,相关的疾病,以及其靶向药物信息结合起来,组合一个多因素网络模型并构建综合性的数据集,从系统生物学角度进行分析,必将能充分挖掘其中有用的生物学价值,产生有价值的生物学以及医学假说,为实验研究提供指导与帮助。

本研究通过对近130种人类正常组织表达谱芯片的分析,筛选得到组织特异性基因,同时系统整合包括亚细胞定位,Gene Ontology的细胞组分、分子功能、生物学过程注释,生物学通路,哺乳动物(小鼠)表型,相关疾病以及靶向药物在内的生物学信息。这使得本研究构建的数据集既可以作为一个组织特异性基因的查询工具,又可以充当一个分析平台,对于一个未知的基因集进行分析,挖掘有价值的信息。

组织特异性基因的筛选涉及到一个多重比较问题,即要判定一个基因是否具有组织特异性,要对这个基因在多种组织中的表达值进行比较。对于组织特异性基因进行筛选的表达谱芯片数据尽管已有不少,但是因为这些芯片数据的组织种类较少,同时样本量偏低,因此无法保证筛选得到的组织特异性基因的特异性。

2004年Novartis研究中心的Andrew Su课题组对79种人类组织(其中正常组织73种)的mRNA表达的组织特异性进行了芯片分析。2006年Wyeth制药集团生物信息研究中心的Shuang Liang等人利用Affymetrix表达谱芯片对97种人类正常组织进行了组织特异性基因的筛选。

本研究整合了这两组芯片数据,使得总样本量超过4000例,组织类型达130多种(去除冗余后),以期通过大样本量以及全面的组织类型保证筛选得到基因的组织特异性。使用自主开发的R语言脚本进行组织特异性基因的筛选分析。

针对同一基因在不同组织中特异性的比较,以及不同基因在同一组织中特异性的比较这两个问题,计算特异性指数τ。Affymetrix芯片的探针通过在线工具转化为EntrezGene ID。

组织名称根据标准的解剖学定义进行统一,对于两组芯片数据中冗余的记录,取其τ值的平均值。结果显示通过R语言程序筛选得到了3,960种组织特异性基因,共覆盖127种人类正常组织与细胞类型。

平均每一个组织特异性基因在2种组织中特异性表达。对筛选得到的这3,960个组织特异性基因,通过可靠的数据源进行亚细胞定位、基因本体、生物学通路、哺乳动物表型、相关疾病以及靶向药物等六个方面的注释。

基因-疾病关系通过整合以下三部分数据:通过自主开发的文献挖掘程序对NCIBI的Gene2MeSH数据库调取与整理的结果,Comparative Toxicogenomics Database中Gene-OMIM关联信息,以及瑞典Swiss-Prot数据库蛋白质-疾病关系数据集。组织特异性基因表达产物的亚细胞定位数据收集自LOCATE数据库。

同时以Gene Ontology注释中的Cellular component为补充。另收集GO注解中的Molecular function与Biological process作为功能的注释。

生物学通路数据包括了KEGG的通路信息和Reactome的相互作用数据。哺乳动物表型数据选自Mouse Genome Informatics数据库。

靶向药物信息来自于Drugbank数据库的Drugcard数据集。对注释结果统计显示,一共收集到基因-疾病关系记录5,684条,基因-药物关系2,148条,另有Gene Ontology注释40,058条,亚细胞定位信息3,687条,生物学通路注释6,359条以及哺乳动物表型注释32,397条。

结合其特异性表达组织信息,这3,960个组织特异性基因得到了全面详实的

基于组织特异性基因的药物新用途研究

基于组织特异性基因的药物新用途研究随着后基因组时代的到来,高通量生物技术的不断完善以及生物信息学的发展,传统的生物化学与分子生物学研究单个基因或蛋白的方法已经不再适用,取而代之的是将整个系统作为研究对象的系统生物学方法。随着基因组学、蛋白质组学、转录组学、相互作用组学、疾病组学研究以及药物组学的深入开展,产生了海量的生物学数据。丰富的数据信息为全面理解生物学本
推荐度:
点击下载文档文档为doc格式
2xniu4ik1i4uc568cqjj1x2cx44ea901a95
领取福利

微信扫码领取福利

微信扫码分享