好文档 - 专业文书写作范文服务资料分享网站

采用生物信息学方法筛选与肺腺癌患者预后相关的LncRNAs

天下 分享 时间: 加入收藏 我要投稿 点赞

采用生物信息学方法筛选与肺腺癌患者预后相关的

LncRNAs*

陶 冶1,李云慧2,黄俊杰1,梁 彬1△

【摘 要】摘 要:目的 采用生物信息学的方法探讨差异表达长链非编码RNA(lncRNAs)与肺腺癌患者预后的关系。方法 从国际肿瘤数据库(TCGA)下载肺腺癌组织及癌旁组织的RNA测序数据和患者的临床信息,采用R语言程序包筛选差异表达的lncRNAs。应用Kaplan-Meier生存曲线(Log-Rank检验)及Cox回归模型进行预后分析。结果 筛选出差异表达lncRNAs共计168个,其中上调的lncRNAs有128个,下调的lncRNAs有40个。单因素和多因素回归分析结果显示:RP11-490M8.1(P=0.047)、RP11-132A1.4(P=0.049)、DRAIC(P=0.023)、LINC00942(P=0.033)、TMPO-AS1(P=0.006)、Z83851.4(P=0.032)和LINC01133(P=0.035)是肺腺癌患者的独立预后因素。结论 该研究筛选出7个lncRNAs,可作为肺腺癌患者预后的独立标志物,为临床医生对肺腺癌患者的预后判断提供帮助。 【期刊名称】国际检验医学杂志 【年(卷),期】2019(040)013 【总页数】4

【关键词】关键词:肺腺癌; 长链非编码RNA; 生物信息学; 国际肿瘤数据库 论著·基础研究

*基金项目:国家自然科学基金项目(81301835)。

本文引用格式:陶冶,李云慧,黄俊杰,等.采用生物信息学方法筛选与肺腺癌患者预后相关的LncRNAs[J].国际检验医学杂志,2019,40(13):1541-1544.

中图法分类号:R734.2

据2018年185个国家的统计结果显示,肺癌占所有癌症病例的11.6%,占癌症总死亡人数的18.4%,位列我国癌症发病率之首[1]。非小细胞肺癌是肺癌常见形式,包括3种组织病理学亚型:腺癌、鳞状细胞癌和大细胞癌。肺腺癌是最常见的变异型,约占肺癌病例的40.0%[2-3]。目前,虽然在肺癌手术、化疗和分子靶向治疗技术方面取得了进展,但肺癌仍然是全球癌症死亡的主要原因[3-4]。长链非编码RNA(lncRNAs)是大于200 bp的非编码RNA,主要通过表观遗传学、转录及转录后水平调控基因表达[5]。研究结果显示,lncRNAs是重要的调控因子,调控细胞增殖、分化、侵袭以及转移[6]。本研究利用TCGA中肺腺癌患者的RNA测序数据,采用生物信息学技术手段,筛选肺腺癌患者差异表达的lncRNAs,探讨差异表达的lncRNAs与肺腺癌临床参数的相关性及与肺腺癌患者预后的关系。

1 资料与方法

1.1 数据下载 从TCGA数据库(https://cancergenome.nih.gov/)下载肺腺癌患者癌组织和癌旁组织的lncRNAs测序数据,cBioPortal数据库(http://www.cbioportal.org/)下载相应的临床资料。其中男219例,年龄38~88 岁,平均(65.66±9.77)岁;女259例,年龄40~87岁,平均(65.75±9.72)岁。样本的纳入标准:(1)经病理证实为原发性肺腺癌,术前未经过任何放化疗;(2)具有完整的临床分期资料及预后信息。共计478例肺腺癌患者纳入分析,临床特点见表1。本研究中肺腺癌的分期采用TNM分期方法,其中T分期与肿瘤浸润深度相关,分期越高,浸润深度越大;N分期与淋巴结转移情况相关,分期越高,转移淋巴结越多;M分期与肿瘤远处转移相关。肺

腺癌患者在年龄和性别上差异无统计学意义,具有可比性。

1.2 数据处理 应用R语言程序包对TCGA数据库下载的lncRNAs数据信息进行差异分析,筛选肺腺癌组织和癌旁组织中差异表达的lncRNAs。筛选标准:log2|差异倍数(FC)≥1,P<0.05。

1.3 筛选与肺腺癌患者预后相关的lncRNAs 对肺腺癌患者癌组织中多个差异表达的lncRNAs进行分组,根据每个lncRNA的测序数据中值分成高表达组和低表达组。应用Kaplan-Meier生存曲线和Log-Rank检验方法分别对高表达和低表达的lncRNA与总体生存期(OS)的相关性进行分析,筛选出与总体生存期显著相关的lncRNAs。应用单因素和多因素Cox回归模型对与OS相关的lncRNAs行进一步分析。

1.4 差异表达lncRNAs与临床参数的关系 根据患者年龄、TNM分期、总体生存状态进行分组,分析与OS相关的lncRNAs与各临床参数的关系。

1.5 统计学处理 采用SPSS20.0统计学软件包进行统计学分析。计数资料采用率(%)表示。应用Kaplan-Meier曲线法进行生存分析,Log-Rank方法检验各lncRNA高表达和低表达组生存率差异是否具有统计学意义。多因素预后分析采用Cox比例风险回归模型。lncRNA表达和临床参数之间的关系采用χ2检验。P<0.05表示差异有统计学意义。

2 结 果

2.1 差异表达lncRNAs的筛选 应用R语言程序包筛选出癌组织和癌旁组织差异表达的lncRNAs有168个,其中上调的lncRNA有128个,下调的lncRNAs有40个。癌组织和癌旁组织中差异表达lncRNAs的分布见图1。 2.2 与OS相关的lncRNAs筛选 根据每个lncRNA的表达中值,分成高表达组

采用生物信息学方法筛选与肺腺癌患者预后相关的LncRNAs

采用生物信息学方法筛选与肺腺癌患者预后相关的LncRNAs*陶冶1,李云慧2,黄俊杰1,梁彬1△【摘要】摘要:目的采用生物信息学的方法探讨差异表达长链非编码RNA(lncRNAs)与肺腺癌患者预后的关系。方法从国际肿瘤数据库(TCGA)下载肺腺癌组织及癌旁组织的RNA测序数据和患者的临床信息,采用R语言程序包筛选差异表达的lncRNAs
推荐度:
点击下载文档文档为doc格式
4jb5x2foiy8qp2012imx4yj364q360011nc
领取福利

微信扫码领取福利

微信扫码分享