Hans Journal of Computational Biology 计算生物学, 2020, 10(3), 41-47
Published Online September 2020 in Hans. http://www.hanspub.org/journal/hjcb https://doi.org/10.12677/hjcb.2020.103005
靶向小核RNA基因构建PCR教学实验的 生物信息学分析
刘 妍1,钟柳英1,徐嘉琪2,何震宇2*
1
广东药科大学药学院,广东 广州 2
广东药科大学生命科学与生物制药学院,广东 广州
收稿日期:2020年8月27日;录用日期:2020年9月4日;发布日期:2020年9月11日
摘 要
目的:探讨针对小核RNA基因,构建本科聚合酶链反应(PCR)教学实验的可行性。方法:调取NCBI数据库中小核RNA基因U1、U2、U4、U5及U6的序列,分别截取5’端和3’端部分序列作为上、下游引物,进行电子PCR,分析其靶点情况和引物效率。结果:电子PCR能清楚显示每对引物潜在的靶位点及相应PCR产物的大小。针对U1、U2、U4、U5、U6基因的引物,对应的靶位点数目分别为18、16、4、1、61,对应的PCR产物大小分别为164~166、187~188、144、117、95~108 bp。结论:针对U1、U2、U6基因的引物,其潜在的靶位点数量较多,且绝大部分靶位点的引物结合效率较好,相应的PCR扩增子长度较短,PCR容易实现,PCR连同电泳检测有望在2个小时内完成,比较适合构建本科PCR教学实验。
关键词
小核RNA,聚合酶链反应,教学实验
Bioinformatics Analysis of Establishment of PCR Teaching Experiments Targeting Small Nuclear RNA Genes
Yan Liu1, Liuying Zhong1, Jiaqi Xu2, Zhenyu He2*
12
ththth
Received: Aug. 27, 2020; accepted: Sep. 4, 2020; published: Sep. 11, 2020
School of Pharmacy, Guangdong Pharmaceutical University, Guangzhou Guangdong
School of Life Science and Biopharmaceutics, Guangdong Pharmaceutical University, Guangzhou Guangdong
*
通讯作者。
文章引用: 刘妍, 钟柳英, 徐嘉琪, 何震宇. 靶向小核RNA基因构建PCR教学实验的生物信息学分析[J]. 计算生物学, 2020, 10(3): 41-47. DOI: 10.12677/hjcb.2020.103005
刘妍 等
Abstract
Objective: To establish PCR experiments targeting small nuclear RNA genes, which is expected to be used in undergraduate teaching. Methods: The sequences of snRNA coding genes U1, U2, U4, U5 and U6 in NCBI database were obtained, and the 5’ and 3’ end partial sequences were intercepted as upstream and downstream primers for In-Silico PCR. The targets and primer efficiency were analyzed. Results: The potential target sites of each pair of primers and the size of corresponding PCR products could be clearly displayed by In-Silico PCR. The corresponding target number of primers for U1, U2, U4, U5 and U6 genes were 18, 16, 4, 1, 61, and the corresponding PCR product sizes were 164 - 166, 187 - 188, 144, 117 and 95 - 108 bp. Conclusion: For the primers of U1, U2, U6 gene, there are many potential target binding sites, and most of them have good binding efficiency. The corresponding length of PCR amplicons is short, and the PCR is easy to realize. PCR together with electrophoresis detection is expected to be completed in two hours, which is suitable for the establishment of undergraduate PCR teaching experiment.
Keywords
Small Nuclear RNA, Polymerase Chain Reaction, Teaching Experiment
Copyright ? 2020 by author(s) and Hans Publishers Inc.
This work is licensed under the Creative Commons Attribution International License (CC BY 4.0). http://creativecommons.org/licenses/by/4.0/
Open Access 1. 引言
PCR作为经典的分子生物学技术,很有必要纳入相关专业的本科实验教学体系,但目前使用市面上的教学用PCR试剂盒开展实验教学,时程长、成本高,且试剂盒提供的模板、引物背景不清楚,不太利于教学,亟需加以改进。
本研究旨在自主构建一个更贴近教学实际的PCR实验体系,其核心要素即模板(靶标)、引物的背景必须清晰,且能在较短时间内完成实验流程。我们选择小核RNA (snRNA)基因作为靶标,设计引物,通过电子PCR分析其可行性。
2. 方法
从GenBank中调取snRNA基因组DNA序列,找出编码区序列,再根据实际情况分别截取5’端和3’端部分序列作为上、下游引物进行电子PCR (见表1),使用的在线分析程序为UCSC Genome Browser的In-Silico PCR [1]和NCBI的primer-blast [2]。使用Primer Premier 5.0软件分析引物与模板的结合效率。
Table 1. Sequence information of snRNA coding genes and primer sequences for In-Silico PCR 表1. snRNA编码基因序列信息及电子PCR所用引物序列
基因 U1 U2
GenBank登录号
J00318.1 U57614.1
编码区域 433~596 4882~5069
引物序列(5’→3’)
F1: ATACTTACCTGGCAGGGGAGATACCATGA R1: CAGGGGAAAGCGCGAACGC F2: ATCGCTTCTCGGCCTTTTGGCTAAG R2: GGGTGCACCGTTCCTGGAGGTACTG
DOI: 10.12677/hjcb.2020.103005
42
计算生物学
刘妍 等
Continued
U4 U5 U6
NR_003925.1 NR_002756.2 M14486.1
1~144 1~117 329~434
F4: AGCTTTGCGCAGTGGCAGTATCGT
R4: CAGTCTCCGTAGAGACTGTCAAAAATTGCC F5: ATACTCTGGTTTCTCTTCAGATCGCATAAATC R5: TAGCCTTGCCAAAGCAAGGCC
F6: GTGCTCGCTTCGGCAGCACATATAC
R6: AAAATATGGAACGCTTCACGAATTTGCG
3. 结果
针对不同snRNA编码基因相应引物的配对情况、结合效率、潜在的靶位点数量及PCR产物的大小分别见表2~5。
Table 2. In-Silico PCR results of U1 gene primers F1, R1 表2. U1基因引物F1、R1电子PCR结果
序号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
靶序列所 在染色体
1 1 1 1 1 1 1 1 1 1 1 4 7 14 14 15 15 X
所在染色体的区域 16514122~16514285 16666785~16666948 16740516~16740679 16895980~16896143 143729407~143729570 146376807~146376970 144412576~144412740 144560666~144560829 145465617~145465780 148038753~148038916 148522601~148522765 135995929~135996092 141727984~141728148 34546714~34546877 34556226~34556389 44884616~44884781 45002863~45003028 119423742~119423905
PCR产物大小(bp)
164 164 164 164 164 164 165 164 164 164 165 164 165 164 164 166 166 164
与参考序列的 碱基差异数目(bp)
0 0 0 0 0 0 18 1 2 1 15 5 13 0 0 20 18 8
引物F1错 配碱基数
0 0 0 0 0 0 2 0 0 0 0 0 1 0 0 2 2 2
引物R1错 配碱基数
0 0 0 0 0 0 0 0 0 1 1 1 1 0 0 2 2 2
引物结 合效率 72 72 72 72 72 72 56 72 72 72 53 72 72 72 72 72 72 72
Table 3. In-Silico PCR results of U2 gene primers F2, R2 表3. U2基因引物F2、R2电子PCR结果
序号 1 2 3
靶序列所 在染色体
1 10 11
所在染色体的区域 150236967~150237153 101364848~101365035 62841622~62841809
PCR产物大小(bp)
187 188 188
与参考序列的 碱基差异数目(bp)
21 8 6
引物F2错 配碱基数
1 1 1
引物R2错 配碱基数
1 1 2
引物结 合效率 76 76 76
DOI: 10.12677/hjcb.2020.103005
43
计算生物学
刘妍 等
Continued
4 5 6 7 8 9 10 11 12 13 14 15 16
17 17 17 17 17 17 17 17 17 17 17 17 18
43296428~43296615 43300044~43300231 43284142~43284329 43277981~43278168 43271372~43271559 43266636~43266823 43251832~43252019 43245677~43245864 43239924~43240111 43241183~43241370 43233790~43233977 43290294~43290481 41467956~41468143
188 188 188 188 188 188 188 188 188 188 188 188 188
0 0 0 0 0 0 0 0 0 0 0 1 19
0 0 0 0 0 0 0 0 0 0 0 0 2
0 0 0 0 0 0 0 0 0 0 0 1 2
76 76 76 76 76 76 76 76 76 76 76 76 76
Table 4. In-Silico PCR results of U4 gene primers F4, R4 and U5 gene primers F5, R5 表4. U4基因引物F4、R4及U5基因引物F5、R5电子PCR结果
序号 1 2 3 4 5
使用引物 F4、R4 F4、R4 F4、R4 F4、R4 F5、R5
靶序列所 在染色体 12 12 12 12 15
所在染色体的区域 120293094~120293237 120291760~120291903 25404285~25404428 59537356~59537499 65296051~65296167
PCR产物 大小(bp) 144 144 144 144 117
与参考序列的 碱基差异数目(bp)
0 4 14 13 0
引物错配 碱基数
0 0 2 1 0
引物错配 碱基数
0 0 1 1 0
引物结 合效率 65 65 65 65 66
Table 5. In-Silico PCR results of U6 gene primers F6, R6 表5. U6基因引物F6、R6电子PCR结果
序号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
靶序列所 在染色体
1 1 1 1 1 1 2 2 2 3 3 3 3 3 3
所在染色体的区域 31497578~31497683 10298966~10299071 182982213~182982318 180758722~180758816 235915415~235915520 27675604~27675709 174557967~174558072 200830009~200830115 32214457~32214562 181231737~181231842 195214787~195214892 196784981~196785086 98804979~98805084 169720188~169720293 57512450~57512554
PCR产物 大小(bp) 106 106 106 95 106 106 106 107 106 106 106 106 106 106 105
与参考序列的碱 基差异数目(bp)
4 1 3 17 8 8 0 4 9 0 1 3 5 7 11
引物F6错 配碱基数
1 0 0 0 2 2 0 1 2 0 0 1 1 1 2
引物R6错 配碱基数
0 1 2 2 1 2 0 0 2 0 1 0 1 1 2
引物结 合效率 67 67 67 67 67 67 67 67 67 67 67 67 67 67 67
DOI: 10.12677/hjcb.2020.103005
44
计算生物学
刘妍 等
Continued
16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61
3 4 4 4 4 4 4 5 5 6 7 7 7 8 8 8 8 8 10 10 10 11 11 12 13 13 14 14 15 15 15 15 16 16 16 18 18 19 19 19 22 X X X X X
100952627~100952732 108652150~108652255 39297606~39297711 76532223~76532327 88684849~88684954 109992325~109992430 96152298~96152403 51055354~51055459 32309662~32309767 23124982~23125087 123790606~123790711 92701709~92701814 98794719~98794824 56917084~56917189 118976513~118976618 13044350~13044455 124260646~124260751 137105352~137105457 13217269~13217374 21321961~21322066 30299570~30299673 63970470~63970575 67895631~67895736 97721716~97721821 75109587~75109692 27828763~27828868 32202045~32202150 32203164~32203269 32284152~32284257 30254403~30254508 67839940~67840045 65553082~65553187 69175672~69175777 62187541~62187646 57830537~57830642 68858934~68859039 61391595~61391702 893484~893589 1021522~1021627 53653685~53653790 20416798~20416899 141118031~141118136 101634007~101634112 48776966~48777071 37870109~37870214 42174280~42174385
106 106 106 105 106 106 106 106 106 106 106 106 106 106 106 106 106 106 106 106 104 106 106 106 106 106 106 106 106 106 106 106 106 106 106 106 108 106 106 106 102 106 106 106 106 106
14 7 1 8 1 4 5 7 6 6 0 3 6 1 1 7 11 6 0 2 18 4 5 1 5 7 0 0 1 1 0 4 4 5 4 2 11 0 0 6 14 0 4 3 5 7
2 0 0 1 1 1 1 1 2 2 0 1 2 0 0 2 2 2 0 1 2 2 2 1 1 2 0 0 0 0 0 1 1 1 2 1 2 0 0 1 0 0 0 2 1 2
2 0 0 0 0 1 1 2 2 1 1 1 2 0 0 2 2 2 0 1 2 0 0 0 2 1 0 0 0 0 0 0 0 2 1 0 1 0 0 2 2 0 2 1 2 2
67 67 67 67 67 67 67 67 67 67 67 67 67 67 67 67 67 67 67 67 67 67 67 67 67 67 67 67 67 67 67 67 67 67 67 67 52 67 67 67 67 67 67 67 67 67
DOI: 10.12677/hjcb.2020.103005
45
计算生物学