外源基因在宿主细胞中的高效表达- I
影响外源基因表达的因素
有效的转录起始
? 主要的限速步骤
? 选择强的可调控的启动子及相关的调控序列,是组建一个高效表达载体的首要问题
启动子:位于结构基因5’端上游区的DNA序列,活化RNA聚合酶 启动子的特征: 序列特异性、方向性、位置特性、种属特异性 举例说明原核生物的启动子和真核生物的启动子。
启动子根据作用方式及功能分类:
? 组成型启动子(constitutive promoter) :在个体的任何细胞中均有表达活性的启动子
? 诱导型启动子 ? 组织特异型启动子
最理想的强的可调控的启动子应该是:在发酵的早期阶段表达载体的启动子被紧紧地阻遏,这样可以避免出现表达载体不稳定,细胞生长缓慢或者由于产物表达而引起细胞死亡等问题。当细胞达到一定的密度,通过多种诱导使阻遏物失活,RNA聚合酶快速启动转录。
原核细胞的启动子:lac, trp, tac, phoA, ?PL , ?PR都是这一类启动子(诱导型启动子,inducible promoters))。
T7噬菌体启动子则是另一种类型的启动子,即组成型启动子(constitutive promoters)。T7噬菌体启动子只为T7噬菌体的RNA聚合酶所识别,而被T7RNA聚合酶所起始的转录非常活跃,使得由宿主细胞的RNA聚合酶所进行的转录根本无法与之竞争,这样使细胞中几乎所有的转录都是由T7RNA聚合酶所操纵,在1-3小时内,目标基因的RNA转录水平可以达到rRNA水平。
由于T7RNA聚合酶几乎能完整地转录在T7启动子控制下的所有DNA序列,所以近年来许多实验室开始选用T7噬菌体启动子进行外源基因的高效表达。
T7启动子调控下的表达载体已经形成一个系列,根据外源基因的插入位点可以分别获得直接表达和融合表达。举例: ? pET, pRSET
? 真核基因的表达调控要比原核复杂得多,然而启动子和增强子作为两个重要的转录调控序列,为外源基因在真核细胞中高效表达所必需 ? 真核启动子也分为:组成型和诱导型两大类
? 组成型启动子如:SV40、腺病毒、人巨细胞病毒(CMV)、Rous肉瘤病毒 ? 诱导型启动子如:干扰素β启动子、热休克启动子、激素诱导的启动子
mRNA的有效延伸和转录终止与基因的高效表达
? 外源基因的转录一旦被起始,接下来的问题就是如何保证mRNA有效的延伸、终止和稳定的积累,尤其在真核细胞中
? 在转录物内的衰减(attenuation)和非特异性终止可以诱发转录中的mRNA分子的提前终止(premature termination)
? 衰减子(attenuators)具有简单终止子的特性,在原核细胞中处于生物合成的操纵子的启动子和第一个结构基因之间
? 由于衰减子序列是负调控元件,为了保证mRNA转录完全,在表达载体的构建中要尽量避免其存在
? 色氨酸操纵子中的衰减子(attenuator)
? 正常的转录终止子的存在也是外源基因高效表达的一个因素,其作用是防止不必要的转录,使mRNA的长度限制到最小,增加表达质粒的稳定性
? 为了防止mRNA在转录中的非特异性终止,抗终止序列元件(antitermination elements)可以加入到表达载体上
? 对于真核细胞而言,表达载体上含有转录终止序列和poly A加入位点,是外源基因高水平表达的重要因素
mRNA的稳定性与基因的高效表达
? mRNA的稳定性直接关系到翻译产物的多少,提高其稳定性能提高基因表达效率
? 相关报道很少
? 对于原核细胞,利用RNase缺失的受体菌是一个可供选择的方案
? 对于真核细胞,可以按照基因表达调控中的原则,使mRNA 5’端和 3’端正确加工,提高成熟mRNA的稳定性 ?
有效的翻译起始与基因的高效表达
? 翻译是mRNA指导的多肽链合成的过程
? 翻译起始是多种成分协同作用的过程,其中包括: mRNA、16SrRNA 、fMet-tRNA之间的碱基配对,同时,还有核糖体S1蛋白和蛋白合成起始因子的相互作用
? 在原核细胞中,影响翻译起始的因素有:起始密码子、核糖体结合位点(SD)、起始密码与SD序列之间的距离、核苷酸组成、 mRNA的二级结构以及mRNA上游的5’ 端非翻译序列和蛋白编码区的5’ 端序列等。
SD序列也即核糖体结合位点(RBS)的序列(是指原核细胞mRNA 5’ 端非翻译区同16SrRNA 3’端的互补序列)
作为翻译起始,可以达到最大效率的一般原则是: (1)AUG(ATG)是首选的起始密码子
(GUG、UUG、AUU、AUA有时也可用,但非最佳选择)
(2)SD序列也即核糖体结合位点(RBS)的序列(是指原核细胞mRNA 5’ 端非翻译区同16SrRNA 3’端的互补序列)按照统计学的原则,一般的SD序列至少含AGGAGG序列中的4个碱基。SD序列的存在对原核细胞mRNA的转译起始非常重要
(3)SD与起始密码之间的距离以9±3为适宜。也有报道指出如果SD序列同16SrRNA3’端的互补碱基大于8时,上述二者之间的距离不重要 (4)除SD序列外,处于起始密码5’端的核苷酸应该是A和U
(5)如果在起始密码AUG后的序列是GCAU或AAAA序列,能使翻译效率提高 (6)在翻译起始区周围的序列应不形成明显的二级结构,使翻译起始调控元件如AUG、SD序列易被核糖体识别和结合。
遗传密码应用的偏倚性与基因的高效表达
遗传密码应用的偏倚性(codon usage bias):
遗传密码的简并性决定了一个氨基酸可以有不止一个密码子为其编码,然而,在蛋白质的生物合成时对简并密码子使用的频率是不同的,对于一个给定的氨基酸,有的密码子使用的频率明显高于其他密码子,这就是所谓的遗传密码应用的偏倚性。
? 知道了遗传密码使用的偏倚性,在基因的化学合成过程中,可以选择地使用“高频”密码,改善基因在宿主细胞中的表达水平;
? 对于在大肠杆菌中表达的外源基因,如果其mRNA中所含的密码子的分布情况或者外源蛋白质中所含有的氨基酸组成的分布情况同大肠杆菌细胞中正常情况一致,那么大肠杆菌能够使相应的tRNA氨酰化,保持翻译的正常进行;
? 如果外源基因的mRNA中含有罕用密码子,或者其氨基酸组成的分布不正常地偏离典型大肠杆菌蛋白质的氨基酸组成分布,那么其蛋白质合成的质和量都会受到影响,出现表达方面的问题。
mRNA的二级结构与基因的高效表达
? 翻译起始的速率决定于翻译起始复合物能否有效的形成,而这种复合物的有效形成,在一定程度上取决于翻译起始区的二级结构
? 无论是原核还是真核基因的表达,翻译的起始常被mRNA不适当的二级结构所影响
? 对于二级结构的分析已经有现成的软件,可以将要分析的序列输入计算机,计算出序列各部分的二级结构及自由能大小
RNA的加工与基因的高效表达
? 绝大多数较高等的真核基因含有内含子
? 这些内含子在mRNA成熟过程中,在细胞核中被加工去除而产生成熟的mRNA
? 有些基因的mRNA的形成非常需要内含子的存在,但机制不清
mRNA序列上终止密码的选择
? 合成的多肽链的释放是通过释放因子识别终止密码子实现的 ? 三个终止密码子的翻译终止效率是不一样的,其中UAA在基因的高水平表达中终止效率最好(因为它被两个释放因子所识别)
表达质粒(或载体)的拷贝数及稳定性与基因的高效表达
? 多数情况下,目标基因的扩增程度同基因表达成正比 ? 对于原核和酵母表达体系而言,选择高拷贝数的质粒,以其为基础组建外源基因的表达载体 ? 对于其他表达系统,如哺乳类细胞表达体系,可以通过对标记基因加选择压力等方法,提高外源基因的表达水平
? 表达载体的稳定性是维持基因表达的必需条件,而表达载体的稳定性不但与表达载体自身特性有关,而且与受体细胞的特性密切相关
外源蛋白的稳定性与基因的高效表达
如何避免克隆的蛋白质被受体细胞选择性地降解? (1)构建融合基因,产生融合蛋白
(2)产生可分泌的蛋白。但是不是所有的外源蛋白都可以通过基因操作成为可分泌蛋白
(3)外源蛋白可以在宿主细胞中以包涵体的形式表达,这种不溶性的沉淀复合物可以抵抗宿主细胞中蛋白水解酶的降解,也便于纯化
(4)选择合适的受体表达系统,如选择蛋白水解酶基因缺陷型的受体细胞,但