如何看懂NCBIBLAST
输出结果
公司内部档案编码:[OPPTR-OPPT28-OPPTL98-OPPNN08]
如何看懂NCBI BLAST输出结果??
2010-11-13 10:38:11|??分类: 生物信息分析 |??标签:blast?? |字号大中小?订阅
本文转自:???? 写在解读报告之前的,首先就使用Blast最终的目的是什么达成一致,Blast是通过两两比对,找到数据库中与输入序列最相似的序列,或者说是最 相似的序列片段。那么我们看比对结果就是看Blast从数据库中找到哪些相似的序列,然后就是如何相似,这些相似又可以告诉我们哪些信息 等。当然Blast可以衍生出许多的用途,但都是建立在找到相似性序列(片段)的基础上的。
最新的BLAST结果报告解读,本文以BLASTP为例子,说明如何来解读BLAST结果。
示例 BLAST地址:
&BLAST_PROGRAMS=blastp&PAGE_TYPE=BlastSearch&SHOW_DEFAULTS=on&LINK_LOC=blasthome
比对用的例子:
>gi||ref|| ribosomal protein L21 [Rattus norvegicus]
MTNTKGKRRGTRYMFSRPFRKHGVVPLATYMRIYKKGDIVDIKGMGTVQKGMPHKCYHGKTGRVYNVTQH
AVGIIVNKQVKGKILAKRINVRIEHIKHSKSRDSFLKRVKENDQKKKEAKEKGTWVQLNGQPAPPREAHF
VRTNGKEPELLEPIPYEFMA 数据选择:nr
比对时间:2009年9月9日12:46:23
解读报告前需要掌握的概念: alignments 代表比对上的两个序列 hits 表示两个序列比对上的片段
Score 比对得分,如果序列匹配上得分,不一样,减分,分值越高,两个序列相似性越高
E Value 值越小,越可信,相对的一个统计值。 Length 输入序列的长度
Identities 一致性,就是两个序列有多少是一样的 Query 代表输入序列 Sbjct 代表数据库中的序列
结果详细说明 菜单与基本信息
NCBI Blast结果-菜单与基本信息
1.下一步操作的菜单,你可以调整参数,重新比对、保存你的搜索条件以便下次比对、调整报告显示的参数,以更符合你的要求、下载你比对的结果;
2.此次比对的标题,优先是你填写的,如果没有填写可能是你输入fasta序列头(大于号后面的),如果这个也没有找到,NCBI会自动生成一个;
3.你输入序列的信息,包括标识号、描述信息、类型、长度; 4.数据库的信息以及你选择的Blast程序;
5.查看其他报告,比如摘要、分类、距离树、结构、多重比对等。
Graphic Summary
Graphic Summary
1.保守域,Blastp时,如果与保守域数据库比对有结果时,方显示; of 100 Blast Hits on the Query Sequence,图的说明,仔细研读,是hits在输入序列上的分布;
3.这里是消息显示框,当鼠标放在坐标下的横线上,会显示代表的hit的信息;
4.颜色比例尺,代表hit的得分(score)区间,可以简单的理解为红色的线表示有较好的比对结果; 5.输入序列的坐标;
6.每一条线段代表一个hit,在线段上点击,会链接到该hit详细的比对信息部分。
深入理解:由于blast是区段比对,对于给定的两个序列,blast会把具有相识性的片段(hit)找出来,显示的是hit的信息,所以要 判断两个序列的相似性,不但要看比对上的片段(hit)的得分,还要看hit覆盖你输入序列的范围,正因为此,这部分图形显示部分就像 整个报告的鸟瞰图一样,hit在你输入序列上的分布。本例是一个较短的蛋白质序列,所以不具有代表性,试想如果输入的是M级的核酸序列,你就知道意味着什 么了。这里要记住仅仅高分的hit不能说明问题,还要关注hit在输入序列中的位置。
Descriptions