基因序列测序峰图拼接教程
小编发现自己身边的很多同学都直接通过邮箱接收来自公司的序列拼接结果。这样的结果准确吗?(有时会出现很多问题,其中最大的一个问题就是序列峰图的问题)
殊不知这样的结果会面临诸多的不足或错误。如,在序列峰图部分有杂带或套峰的情况下,他们的拼接结果在很大程度上是有错误的;另外很多时候发给咱们的或许是反向的序列,一般情况下咱们不会注意到这一点,所以这样的序列也是不行的.......
下面就给大家演示一下怎样才能自己获得一条完整可信的基因序列。如何最测序原始序列进行拼接。
1. 首先我们需要安装DNAMAN和BioEdit这两个软件
2. 每个测序样品我们会获得4个测序文件其中分别包括正向序列的ab1文件和seq文件;以及反向序列的ab1文件和seq文件 注:BioEdit打开ab1类型的文件;DNAMAN打开seq类型的文件。
3. BioEdit打开ab1类型的文件需看测序的峰图是否有套峰和杂带,如果比较好就可以进行后续的拼接,否则该序列不能使用,需要重新扩增。如下为高质量的峰图:
4. 打开DNAMAN软件分别载入seq类型的正向序列和反向序列;我一般将正向序列载入到1频道,反向序列载入到2频道。载入方法依次点击:菜单栏中Sequence >Load sequence >From sequence file 结果如下图:
5. 需要将反向序列反向互补,步骤:鼠标点击Channel 2(因为
该频道载入的是反向序列)然后依次点击Sequence >Display sequence >Reverse Complement Seq (切记只需勾选Reverse Complement Seq)如下图:
6. 点击ok后选中碱基序列如下图蓝色区域:
7. 用鼠标点击Channel 3, 然后依次点击Sequence >Load Sequence >From Selection。那么刚才我们选中的碱基序列就被载入到Channel 3了。如下图:
8. 然后依次点击Sequence >Two Sequence Alignment,选择CH.3(频道3)和CH.1 (频道1)b比对,如下图:
注:CH.3中是反向序列的反向互补序列,它理论上应该和CH.1中的正向序列碱基一模一样。
9. 点击ok后我们能看到这两条序列的alignment。上面是向序列的反向互补序列,下面是正向序列。如下图:
10. 上面的序列是最常见的ITS序列,我以它为例。正向引物ITS5: GGAAGTAAAAGTCGTAACAAGG;反向引物
ITS4: