序列比对库的构建教程
如何将大量的基因序列或基因组序列文件建成一个属于自己的系列比对库,方便我们随时进行本地Blast比对呢?
构建本地Blast比对库的好处是: 1. 不用再担心停电而导致无法比对。 2. 不用再担心打不开基因组序列的窘境了。 3. 可以实现对批量序列进行比对。
4. 如果NCBI里没有某物种的基因组,恰恰你手中有,可以建库进行基因比对。 5. 能够快速知道序列与基因组里哪些部位有匹配,且匹配率有多大。 6. 通过与基因组库比对,能帮我们验证所扩增的基因是否是正确的,而不是其它基因。
7. 能够将收集到的对自己研究方向有用的大量序列构建成库,针对性更强,方便随时进行序列比对。
基于以上原因,我们知道构建本地Blast序列比对库的好处会很多,接下来的教程将教大家如何构建本地Blast序列比对数据库,为我们的研究营造更多方便。
本教程以构建基因序列的比对库为例(注:蛋白序列比对库构建方法与此相同)
建库及使用的前提:如需要将本地比对库建在D盘,我们应先在D盘下载并安
装一下BLAST软件,下载地址可以点击如下链接(也可在NCBI点击BLAST下载): https://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/2.9.0/
然后下载界面如下图,我们需要根据自己的电脑版本来下载,Windows 64位系统下载下图圈出来的那个(注:切记不要下载ncbi-blast-2.10.1+-win64,这个新版本在建库时会出现磁盘空间不足的现象)。
安装好BLAST软件后接下来开始建库:
1. 首先我们需要准备用于建库的基因序列,比如自己下载的某个类群的大量基因序列或基因组序列(需为fasta文件),或自己手里测得的基因组序列等,本教程演示一个基因组序列建库。
2. 准备好序列以后,我们将建库序列fasta文件放到电脑的非系统盘,如D盘内建一个名为“dna”的文件夹,以后所有的文件都在这个名为dna的文件夹内。接下来就可以构建库了。
3. 先点击电脑桌面最左下角的Windows图标,再在搜索框中输入“cmd”然后按键盘上的“Enter”键,操作如下图
4. 进入后的界面如下图
5. 因为我们的建库序列在D盘内,所以我们要先进到这个盘内的dna这个文件夹内,操作是先输入“D:”再加键盘的Enter键,这样就进入到D盘了,如下图。