基于质谱分析的蛋白质组学
在21世纪,生命科学的研究进入了后基因组时代,蛋白质组学作为其中的一个重要分支于20世纪90年代中期应运而生。由于蛋白质的复杂性,传统的蛋白质鉴定方法如末端测序等已无法满足蛋白质组学研究中的一系列需要。因此,质谱技术作为蛋白质组学研究的一项强有力的工具日趋成熟,并作为样品制备和数据分析的信息学工具被广泛地应用。质谱技术具有灵敏度、准确度、自动化程度高的优点,能准确测量肽和蛋白质的相对分子质量,氨基酸序列及翻译后修饰、蛋白质间相互作用的检测[1],因此质谱分析无可争议地成为蛋白质组学研究的必然选择。
1. 蛋白质组学
蛋白质组学(proteomics)是从整体水平上研究细胞内蛋白质的组成、活动规律及蛋白质与蛋白质的相互作用,是功能基因组学时代一门新的科学。包括鉴定蛋白质的表达、修饰形式、结构、功能和相互作用等。根据研究目的,蛋白质组学可以分为表达蛋白质组学、结构蛋白质组学和功能蛋白质组学。表达蛋白质组学用于细胞内蛋白样品表达的定量研究。以绘制出蛋白复合物的结构或存在于一个特殊的细胞器中的蛋白为研究目的的蛋白质组学称为结构蛋白质组学,用于建立细胞内信号转导的网络图谱并解释某些特定蛋白的表达对细胞的作用[2]。功能蛋白质组学以细胞内蛋白质的功能及蛋白质之间的相互作用为研究目的,通过对选定的蛋白质组进行研究和分析,能够提供有关蛋白质的磷酸化、糖基化等重要信息。
蛋白质组学研究的核心就是能够系地的鉴定一个细胞或组织中表达的每一个蛋白质及蛋白质的性能。蛋白质组学的主要相关技术有双向凝胶电泳、双向荧光差异凝胶电泳、质谱分析等[2]。由于蛋白质的高度复杂性和大量低丰度蛋白质的存在,对分析技术提出了巨大挑战,生物质谱技术则是适应这一挑战的必然选择。
2. 生物质谱技术
质谱是带电原子、分子或分子碎片按质量的大小顺序排列的图像。质谱仪是一类能使物质离子化并通过适当的电场、磁场将它们按空间位置、时间先后或轨道稳定与否实现质量比分离,并检测强度后进行物质分析的仪器。质谱仪主要由
分析系统、电学系统和真空系统组成。
质谱技术的基本原理是:使用电离技术将经酶切后的蛋白质肽段或完整蛋白质带上电荷,然后通过它们质荷比的差异使其得到分离并检测出其质量。生物质谱仪通常包含三个部分,即离子源、测定离子的质荷比的质量分析器和检测器。传统的有机质谱仅用于小分子挥发物质的分析,近年来生物质谱技术取得了飞速发展,其中最为显著的莫过于基质辅助激光解吸离子化质谱(matrix-assisted laser desorption ionization MS,MALDI-MS)和电喷雾离子化质谱(electrospray ionization MS,ESI-MS)。
基质辅助激光解吸电离技术(MALDI-MS)[3]是将分析物分散在机制分子中并形成晶体,当用激光照射晶体时,由于基质分子经辐射所吸收的能量,导致能量蓄积并迅速产热,从而使基质晶体升华,致使基质和分析物膨胀并进入气相。MALDI所产生的质谱图多为单电荷离子,因而质谱图中的离子与多肽和蛋白质中的质量有一一对应的关系。使用基质的目的是为了保护待分析物不会因过强的激光能量导致化合物被破坏。研究表明不同的基质对分析物的解吸效果不同,基质的选择对分析物的离子化作用起着至关重要的作用。一般认为好的基质应具备下述条件[4]:①强烈吸收入射的激光②较低的气化温度③与待测物可找到共同的溶剂④在固相体系中能分离和包围被分析分子而不形成共价键。MALDI-MS操作简便,灵敏度高,检测限度达到飞摩尔级(10-15),同许多蛋白分离方法相匹配。
同MADLI-MS在固态下完成不同,ESI-MS是在液态下完成的,其通过在毛细管的出口处施加一高电压,所产生的高电场使从毛细管流出的液体雾化成细小的液滴,随着溶剂蒸发,液滴表面的电荷强度逐渐增大,最后液滴崩解为大量带一个或多个电荷的离子,致使分析物以单电荷或多电荷离子的形式进入气相。电喷雾离子化的特点是产生高电荷离子而不是碎片离子,使质量电荷比降低到多数质量分析仪器都可以检测的范围,故而极大扩展分子量的分析范围。电喷雾质谱的优势在于它可以和多种分离技术联用,如在用ESI-MS离子化前使用高效液相色谱(high performance liquid chromatography,HPLC)和气象色谱(gas chromatography,GC)将待测样品去除杂质和分离。
质量分析器是质谱的核心元件,决定着生物质谱的灵敏度、分辨率、质量准确度和生成含大量信息的碎片离子谱图的能力。目前应用于蛋白质组研究的质量分析器主要有四种[4],即离子阱(IT)、飞行时间(TOF)、四级杆(Q)和傅里叶变换离子回旋共振(FTICR)。它们的设计和构造各不相同,因此各有优势和劣势。
这些分析器可以独立使用,也可以串联起来使用以充分发挥各自的优点。TOF分析器通常和MALDI连接用以测定肽段质量数,通常飞行时间越长,获得肽段的分辨率和准确度就越高。三级四级杆分析器通常和ESI相连以选择离子并产生被选择前体地碎片离子谱图(碰撞诱导解离谱图CID)。另外一种较常用的分析器为IT,在IT中,离子以一定的时间间隔被捕获,然后进行MS和多级MS分析。在蛋白质组研究中获得应用的FTICR-MS也是一类捕捉式质谱仪[5],它是在高真空和强磁场中俘获粒子。
3. 生物质谱在蛋白质组学中的研究利用
目前,生物质谱以其无可比拟的优越性成为蛋白质组学研究中必不可少的技术平台。随着质谱的灵敏度、精确度和高通量的不断发展,质谱在蛋白质组学研究中扮演者越来越重要的角色。它在蛋白质鉴定、序列分析、定量、翻译后加工及蛋白质的相互作用等方面已得到了较广泛的应用。 3.1蛋白质的鉴定
实现对复杂蛋白质的分离、鉴定和定量是蛋白质组学研究首先要解决的问题。目前,有两种主要的蛋白质鉴定体系[6],一种是基于二维凝胶电泳(2DE)和生物质谱的鉴定方法,其优点是二维凝胶电泳可以提供通过其他技术所不能得到的分辨率,能够有效地呈现出蛋白质的等电点和相对分子质量等信息;但由于二维凝胶电泳所固有的局限性,如检测的线性范围窄,难以分离相对分子质量高于十万的蛋白质、极酸、极碱及疏水性高的蛋白质,虽然也有很好的2DE前的样本预处理和分离技术等,但仍很难改善2DE/MS技术体系在分析上述蛋白质时存在的缺陷。第二种方法是多维液相色谱与质谱的连接,常用的多维分离模式为离线或在线强阳离子交换与反向色谱连接。
基于生物质谱的鉴定方法主要有MALDI-TOF-PMF,串联质谱的肽序列标签(peptide sequence tag,PST)以及肽段的从头测序(de novo sequencing)。MALDI-TOF-PMF仅需要少量的酶解肽段溶液即可,由于采用了离子反射器和延迟提取技术,MALDI-TOF-PMF的质量误差可达到10~30ppm[5]。目前,样品的制备、PMF分析和数据库的搜索已经实现了高度自动化。肽质量指纹图谱[6](PMF)即用特异性地酶解或化学水解的方法将蛋白切成小的片段,然后用质谱检测各产物肽的相对分子质量,将所得到的蛋白酶解肽段质量数在相应数据库中检索,寻找相似肽指纹谱,从而绘制“肽图”。MALDI-TOF-PMF只有在得到四个或五个肽段质量并且数据库中存在这种蛋白质时才能得到成功鉴定,因此对有些蛋白点用PMF
法得不到可靠的鉴定结果,这时就需要用PST。肽序列标签(PST)即在鉴定蛋白质时需要将读出的部分氨基酸序列与其前后的离子质量和肽段母质量相结合的鉴定方法。PST的优点是数据库搜索的专一性更高,得到的肽段的相对分子质量和序列搜索信息结果更可靠。对于那些数据库中不存在的蛋白质,则需要对其酶解片段进行从头测序,根据肽离子谱直接明确地读取肽序列称为从头测序。从头测序通常使用MALDI和ESI的串联质谱,该方法结合C端核素标记,能克服CID高质量谱难以判断的困难。 3.2蛋白质的定量分析
随着蛋白质组学研究的深入发展,人们已不再满足对一个混合物中蛋白质的定性分析,要求更加准确的定量分析。为此,定量蛋白质组学的概念应运而生。定量蛋白质组学,就是把一个基因组表达的全部蛋白质或一个复杂体系中的所有蛋白质进行精确地定量和鉴定。由于不同蛋白质和多肽在质谱仪中离子化能力不同,从质谱图中不能得到量的信息;而对于具有相同离子化能力的蛋白质或多肽可以通过比较质谱峰的强度或峰面积得到待比较蛋白质的相对量。根据这一原理发展了基于生物质谱的分析方法,包括荧光染色差异显示双向电泳、稳定同位素代谢标记、氨基酸化学标记和肽质谱图谱差异性比较等。
3.2.1荧光染色差异显示双向电泳
该法首先将待比较的两个样本的总蛋白分别用两种不同的荧光标记试剂(Cy2、Cy3或Cy5)进行标记,然后将不同荧光染料标记的两种待比较蛋白质进行等量混合,上样进行双向电泳,2-D凝胶在成像仪上用两种不同的波长激发,分别将两样品的荧光图谱成像,用2D分析软件进行定量分析,对差异的蛋白质点用MALDI-TOF-MS或ESI-MS进行鉴定。该法的优点是可以在同一块凝胶上比较两种不同来源或处理样本的蛋白质表达谱。
3.2.2同位素代谢标记
将一组细胞在正常的培养基中培养,另一组样品在含有一个或多个同位素标记的氨基酸的培养基中培养,经过一段时间培养后,破碎细胞提取蛋白,然后等量混合,通过凝胶电泳分离和染色,从胶上切下差异性蛋白,酶解后进行质谱分析。以上同位素标记的两种蛋白质或多肽仅在分子量上不同,而化学性质基本相同。具有相同的离子化能力,等量混合后它们会成对并相邻的出现在质谱图上,根据其质谱图的强度(峰高度或峰面积),就可以计算这种蛋白在不同状态下的表达差异。
[6]
3.2.3氨基酸化学标记
为了在质谱分析的过程中实现对蛋白质的准确定量分析Gugi[7]等引入了同位素编码亲和标签技术(isotope-coded affinity tag,ICAT)。ICAT是一种人工合成的化学试剂,其结构包括专一的化学反应基团(与蛋白质的半胱氨酸反应)、核素标记的连接子和亲核反应基团。其原理是首先利用一对含重元素和轻元素的试剂特异性标记成对蛋白质样品中的半胱氨酸,两种标记试剂的相对分子质量相差8[7]。当两种蛋白样品混合并酶切后,利用亲和色谱提取标记肽段,由于两种同位素标记状态的肽段在化学结构上完全相同,在色谱分离时的保留行为也类似,使得成对肽段在质谱上以大小为8的形式共同出现;比较两个肽段长度,可以实现差异蛋白质组分析。
3.2.4肽质图谱差异比较
肽质图谱差异比较就是对表达的、酶解的或者天然衍生的多肽片段用质谱仪分析得到的肽质图谱,运用生物信息学软件,利用质谱峰强度或者是质谱峰强度结合色谱图进行差别分析。 3.3蛋白质的翻译后加工
大多数真核生物所表达的蛋白质需经一系列的翻译后加工和修饰才能形成最终复杂的功能执行体,所以蛋白质的翻译后修饰成为蛋白质组学研究的重要方面。蛋白质的修饰类型主要有磷酸化、糖基化等,其中蛋白质的磷酸化和去磷酸化几乎调节着生命活动的整个过程[8]。蛋白质磷酸化是增加了HPO3基团,可通过增加80u的氨基酸残基质量数来检测,便可识别蛋白质翻译后修饰信息。
蛋白质磷酸化的质谱分析[9]主要集中在两个方面:一是磷酸化肽段的寻找;二是磷酸化位点和磷酸化数量的确定。其中磷酸化位点的确定是其难点,用质谱来确定蛋白质的磷酸化位点有以下方法:①用磷酸酯酶处理和MALDI-TOF-MS-PME相结合找出肽段中哪一个肽段被磷酸化了②采用三级四级杆串联质谱的前体离子扫描技术进行检测③用傅里叶变换离子回旋质谱的电子捕获解离技术(electron capture dissociation,EDC)鉴定肽片段的磷酸化位点。磷酸化蛋白质是一些低丰度蛋白质,近来富集磷酸化蛋白技术的发展为磷酸化蛋白质组学研究提供了更广泛的研究前景。蛋白质糖基化修饰的通量研究最近也有报道,主要是利用蛋白质组结合生物质谱技术,通过核素标记研究N-糖基化蛋白。
3.4蛋白质的相互作用