北京诺禾致源生物信息科技有限公司 5.SNP分析
图7
11 北京诺禾致源生物信息科技有限公司 6. 新转录本预测
对所分析的物种在已知的基因模型的基础上,用所有测序的数据对新转录区域进行预测,并对新转录区域的表达水平进行统计分析,项目结果见图8,9,10。
图8 新转录本的RPKM累积分布图
12 北京诺禾致源生物信息科技有限公司
图9 新转录本的RPKM盒形图
13 北京诺禾致源生物信息科技有限公司
图10 新转录本的RPKM密度分布图
14 北京诺禾致源生物信息科技有限公司 7. 基因表达水平分析
在RNA-技术中,RPKM(Reads Per Kilo bases per Million mapped Reads)是一种表示基因表达水平的通用方法,代表每百万reads中来自于某基因每千碱基长度的reads数。项目结果见表3,4,表4详细内容见 ./Results/DEseq/readcount.rpkm.xls。
表3 不同表达水平区间的基因数量统计表
RPKM Interval
0 - 0.01 0.1 - 0.3 0.3 - 3.57 3.57 - 15 15 - 60 > 60
Gene Counts
TS1 13724 (36.73%) 2032 (5.44%) 9783(26.18%) 7641 (20.45%) 3041 (8.14%) 1143 (3.06%)
Gene Counts
TS2 13459 (36.02%) 1909 (5.11%) 9786 (26.19%) 7981 (21.36%) 3116 (8.34%) 1113 (2.98%)
Gene Counts
TR3 14515 (38.85%) 2101 (5.62%) 9984 (26.72%) 7075 (18.94%) 2668 (7.14%) 1021 (2.73%)
Gene Counts
TR5 13728 (36.74%) 1982 (5.30%) 10379 (27.78%) 7424 (19.87%) 2800 (7.49%) 1051 (2.81%)
表4 基因表达水平统计表 (部分)
chromosome SL2.40ch00 SL2.40ch00 SL2.40ch00 SL2.40ch00 SL2.40ch00 SL2.40ch00
gene_id Novo_00001 Novo_00002 Novo_00003 Novo_00004 Novo_00005 Novo_00006
start 876120 1146195 1230237 4277120 4641283 4640465
end 876253 1147157 1234310 4277288 4642496 4641341
RPKM (TS1) 0.965 0.282 0.387 17.526 1.332 0.546
RPKM (TS2) 3.255 0.440 0.493 20.280 1.365 1.108
RPKM (TR3) 0.985 0.000 0.142 22.794 0.000 0.000
RPKM (TR5) 0.403 0.000 0.351 27.304 0.000 0.000
15