摘 要: 随着科学的不断发展,运用质谱法进行蛋白质的分析日益增多,本文简要综述了肽和蛋白质等生物大分子质谱分析的特点、方法及蛋白质质谱分析的原理、方式和应用,并对其发展前景作出展望。
关键词: 蛋白质,质谱分析,应用
前言:
蛋白质是生物体中含量最高,功能最重要的生物大分子,存在于所有生物细胞,约占细胞干质量的50%以上, 作为生命的物质基础之一,蛋白质在催化生命体内各种反应进行、调节代谢、抵御外来物质入侵及控制遗传信息等方面都起着至关重要的作用,因此蛋白质也是生命科学中极为重要的研究对象。关于蛋白质的分析研究,一直是化学家及生物学家极为关注的问题,其研究的内容主要包括分子量测定,氨基酸鉴定,蛋白质序列分析及立体化学分析等。随着生命科学的发展,仪器分析手段的更新,尤其是质谱分析技术的不断成熟,使这一领域的研究发展迅速。
自约翰.芬恩(JohnB.Fenn)和田中耕一(Koichi.Tanaka)发明了对生物大分子进行确认和结构分析的方法及发明了对生物大分子的质谱分析法以来,随着生命科学及生物技术的迅速发展,生物质谱目前已成为有机质谱中最活跃、最富生命力的前沿研究领域之一[1]。它的发展强有力地推动了人类基因组计划及其后基因组计划的提前完成和有力实施。质谱法已成为研究生物大分子特别是蛋白质研究的主要支撑技术之一,在对蛋白质结构分析的研究中占据了重要地位[2]。
1.质谱分析的特点
质谱分析用于蛋白质等生物活性分子的研究具有如下优点:很高的灵敏度能为亚微克级试样提供信息,能最有效地与色谱联用,适用于复杂体系中痕量物质的鉴定或结构测定,同时具有准确性、易操作性、快速性及很好的普适性。
2.质谱分析的方法
近年来涌现出较成功地用于生物大分子质谱分析的软电离技术主要有下列几种:1)电喷雾电离质谱;2)基质辅助激光解吸电离质谱;3)快原子轰击质谱;4)离子喷雾电离质谱;5)大气压电离质谱。在这些软电离技术中,以前面三种近年来研究得最多,应用得也最广泛[3]。
3.蛋白质的质谱分析
蛋自质是一条或多条肽链以特殊方式组合的生物大分子,复杂结构主要包括以肽链为基础的肽链线型序列[称为一级结构]及由肽链卷曲折叠而形成三维[称为二级,三级或四级]结构。目前质谱主要测定蛋自质一级结构包括分子量、肽链氨基酸排序及多肽或二硫键数目和位置。
3.1蛋白质的质谱分析原理
以往质谱(MS)仅用于小分子挥发物质的分析,由于新的离子化技术的出现,如介质辅助的激光解析/离子化、电喷雾离子化,各种新的质谱技术开始用于生物大分子的分析。其原理是:通过电离源将蛋白质分子转化为气相离子,然后利用质谱分析仪的电场、磁场将具有特定质量与电荷比值(M/Z值)的蛋白质离子分离开来,经过离子检测器收集分离的离子,确定离子的M/Z值,分析鉴定未知蛋白质。
3.2蛋白质和肽的序列分析
现代研究结果发现越来越多的小肽同蛋白质一样具有生物功能,建立具有特殊、高效的生物功能肽的肽库是现在的研究热点之一。因此需要高效率、高灵敏度的肽和蛋白质序列测定方法支持这些研究的进行。现有的肽和蛋白质测序方法包括N末端序列测定的化学方法Edman法、C末端酶解方法、C末端化学降解法等,这些方法都存在一些缺陷。例如作为肽和蛋白质序列测定标准方法的N末端氨基酸苯异硫氰酸酯(phenylisothiocyanate)PITC分析法(即Edman法,又称PTH法),测序速度较慢(50个氨基酸残基/天);样品用量较大(nmol级或几十pmol级);对样品纯度要求很高;对于修饰氨基酸残基往往会错误识别,而对N末端保护的肽链则无法测序[4]。C末端化学降解测序法则由于无法找到PITC这样理想的化学探针,其发展仍面临着很大的困难。在这种背景下,质谱由于很高的灵敏度、准确性、易操作性、快速性及很好的普适性而倍受科学家的广泛注意。在质谱测序中,灵敏度及准确性随分子量增大有明显降低,所以肽的序列分析比蛋白容易许多,许多研究也都是以肽作为分析对象进行的。近年来随着电喷雾电离质谱(electrospray ionisation,ESI)及基质辅助激光解吸质谱(matrix assisted laser desorption/ionization,MALDI)等质谱软电离技术的发展与完善,极性肽分子的分析成为可能,检测限下降到fmol级别,可测定分子量范围则高达100000Da,目前基质辅助的激光解吸电离飞行时间质谱法(MALDI TOF MS)已成为测定生物大分子尤其是蛋白质、多肽分子量和一级结构的有效工具,也是当今生命科学领域中重大课题——蛋白质组研究所必不可缺的关键技术之一 [5] 。目前在欧洲分子生物实验室(EMBL)及美国、瑞士等国的一些高校已建立了MALDI TOF MS蛋白质一级结构(序列)谱库,能为解析FAST谱图提供极大的帮助,并为确证分析结果提供可靠的依据[6]。
3.3蛋白质的质谱分析方式
质谱用于肽和蛋白质的序列测定主要可以分为三种方法:一种方法叫蛋白图谱(proteinmapping),即用特异性的酶解或化学水解的方法将蛋白切成小的片段,然后用质谱检测各产物肽分子量,将所得到的肽谱数据输入数据库,搜索与之相对应的已知蛋白,从而获取待测蛋白序列。将蛋白质绘制“肽图”是一重要测列方法。第二种方法是利用待测分子在电离及飞行过程中产生的亚稳离子,通过分析相邻同组类型峰的质量差,识别相应的氨基酸残基,其中亚稳离子碎裂包括“自身”碎裂及外界作用诱导碎裂.第三种方法与Edman法有相似之处,即用化学探针或酶解使蛋白或肽从N端或C端逐一降解下氨基酸残基,形成相互间差一个氨基酸残基的系列肽,名为梯状测序(laddersequencing),经质谱检测,由相邻峰的质量差知道相应氨基酸残基。
3.3.1蛋白消化
蛋白的基团越大,质谱检测的准确率越低。因此,在质谱检测之前,须将蛋白消化成小分子的多肽,以提高质谱检测的准确率。一般而言,6-20个氨基酸的多肽最适合质谱仪的检测。现今最常用的酶为胰蛋白酶(trypsin),它于蛋白的赖氨酸(lysine)和精氨酸(arginine)处将其切断。因此,同一蛋白经胰蛋白酶消化后,会产生相同的多肽。
3.3.2基质辅助激光解吸电离/飞行时间质谱测量法(MALDI-TOF MS) [7]
简而言之,基质辅助激光解吸电离/飞行时间质谱测量仪是将多肽成分转换成离子信号,并依据质量/电荷之比(mass/charge,m/z)来对该多肽进行分析,以判断该多肽源自哪一个蛋白。待检样品与含有在特定波长下吸光的发光团的化学基质(matrix)混合,此样品混合物随即滴于一平板或载玻片上进行挥发,样品混合物残余水份和溶剂的挥发使样品整合于格状晶体中,样品然后置于激光离子发生器(lasersource)。激光作用于样品混合物,使化学基质吸收光子而被激活。此激活产生的能量作用于多肽,使之由固态样品混合物变成气态。由于多肽分子倾向于吸收单一光子,故多肽离子带单一电荷.这些形成的多肽离子直接进入飞行时间质量分析仪(TOFmassanalyzer)。飞行时间质量分析仪用于测量多肽离子由分析仪的一端飞抵另一端探测器所需要的时间。而此飞行时间同多肽离子的质量/电荷的比值成反比,即质量/电荷之比越高,飞行时间越短。最后,由电脑软件将探测器录得的多肽质量/电荷比值同数据库中不同蛋白经蛋白酶消化后所形成的特定多肽的质量/电荷比值进行比较,以鉴定该多肽源自何种蛋白.此法称为多肽质量指纹分析(peptidemassfin-gerprinting)。基质辅助激光解吸电离/飞行时间质谱测量法操作简便,敏感度高,同许多蛋白分离方法相匹配,而且,现有数据库中有充足的关于多肽质量/电荷比值的数据,因此成为许多实验室的首选蛋白质谱鉴定方法。
3.3.3电子喷雾电离质谱测量法(electrosprayion-izationmassspectrometry,ESI-MS)[8 ]
同基质辅助激光解吸电离/飞行时间质谱测量法在固态下完成不同,电子喷雾电离质谱测量法是在液态下完成,而且多肽离子带有多个电荷,由高效液相层析等方法分离的液体多肽混合物,在高压下经过一细针孔。当样本由针孔射出时,喷射成雾状的细小液滴,这些细小液滴包含多肽离子及水份等其他杂质成分。去除这些杂质成分后,多肽离子进入连续质量分析仪(tan- demmassanalyzer),连续质量分析仪选取某一特定质量/电荷比值的多肽离子,并以碰撞解离的方式将多肽离子碎裂成不同电离或非电离片段。随后,依质量/电荷比值对电离片段进行分析并汇集成离子谱(ionspectrum),通过数据库检索,由这些离子谱得到该多肽的氨基酸序列。依据氨基酸序列进行的蛋白鉴定较依据多肽质量指纹进行的蛋白鉴定更准确、可靠。而且,氨基酸序列信息即可通过蛋白氨基酸序列数据库检索,也可通过核糖核酸数据库检索来进行蛋白鉴定。
4.蛋白质质谱分析的应用
1981年首先采用FAB双聚焦质谱测定肽分子量,分析十一肽(Mr=1318),质谱中出现准分子离子[M+1]+=1319强峰。分子量小于6kDa肽或小蛋白质合适用FAB质谱分析,更大分子量的多肽和蛋自质可用MALDI质谱或ESI质谱分析。用MALDI-TOF质谱分析蛋自质最早一例是Hillen Kramp等[9]于1988年提出用紫外激光以烟酸为基质在TOF谱仪上测出质量数高达60kDa蛋白质,精确度开始只有0.5%,后改进到0.1-0.2%。质谱技术主要用于检测双向凝胶电泳或“双向”高效柱层析分离所得的蛋白质及酶解所得的多肽的质量,也可用于蛋白质高级结构及蛋白质间相互作用等方面的研究[10,11],三条肽段的精确质量数便可鉴定蛋白质。近年来,串联质谱分析仪发展迅猛,其数据采集方面的自动化程度、检测的敏感性及效率都大大提高,大规模数据库和一些分析软件(如:SEQUEST)的应用使得串联质谱分析仪可以进行更大规模的测序工作。目前,利用2D电泳及MS技术对整个酵母细胞裂解产物进行分析,已经鉴定出1484种蛋白质,包括完整的膜蛋白和低丰度的蛋白质[12];分析肝细胞癌患者血清蛋白质组成分[13],并利用质谱进行鉴定磷酸化蛋白研究工作[14]及采用质谱技术研究许旺细胞源神经营养蛋白(SDNP)的分子结构[15]等。
结束语:
在蛋白质的质谱分析中,质谱的准确性(accuracy)对测定结果有很大影响,因此质谱测序现在仍很难被应用于未知蛋白的序列测定。肽和蛋白的质谱序列测定方法具有快速、用量少、易操作等优点,这些都非常适合于现在科学研究的需要。我们相信,随着各种衍生化方法和酶解方法的不断改进,蛋白双向电泳的应用[16]以及质谱技术的不断完善,质谱将会成为多肽和蛋白质分析最有威力的工具之一。
参考文献
1. 吴世容, 李志良, 李根容, 等. 生物质谱的研究及其应用. 重庆大学学报, 2004, 27(1):123-127.
2. 成海平, 钱小红. 蛋白质组研究的技术体系及其进展. 生物化学与生物物理进展, 2000, 27:584 588.
3. 陈绍农, 潘远江, 陈耀祖. 多肽及蛋白质质谱分析新进展. 质谱学报, 1995, 16(3):15-21.
4. 陈晶, 付华, 陈益. 质谱在肽和蛋白质序列分析中的应用. 有机化学, 2002, 22(2): 81~90.
5. 解建勋, 蒲小平, 李玉珍, 等. 蛋白质组分析技术进展. 生物物理学报, 2001, 17:19 -26.
6. 刘慧敏, 赖志辉, 黎军, 等. 碎片结构分析在MALDIT OF MS法测定多肽序列中的应用. 生物化学与生物物理学报, 2000, 32:179-182.
7. Lay. JOJr.MALDI-TOF mass spectrometry of bacteria. [J].MassSpectromRev, 2001; 20(4):172-194.
8. HarveyDJ. Identification of protein-bound carbohydrates by masss pectrometry [J]. Proteomic, 2001; 1(2):311-328.
9. KARASM, HILLENKAMPF. Laser desorption ionization of proteins with molecular masses exceeding 10000 daltons [J]. Anal.Chem, 1988, 60:2299-2301.
10. 龚海霞, 陈荣华, 郭锡熔. 蛋白质组技术及其在临床医学领域的运用. 国外医学儿科学分册, 2001; 28(6):287-289.
11. 魏开华, 杨松成, 王红霞, 等. 转印到膜上的蛋白质的质谱分析. 质谱学报, 2000; 20(3,4):89-90.
12. 司英健. 蛋白质组学研究的内容、方法及意义. 国外医学临床生物化学与检验学分册, 2003; 24(3):167-168.
13. 王征, 阮幼冰, 官阳. 肝细胞癌患者血清蛋白质组成分的双向凝胶电泳-飞行时间质谱分析. 中华病理学杂志, 2003; 32(4):333-336.
14. 黄珍玉, 于雁灵, 方彩云, 等. 质谱鉴定磷酸化蛋白研究进展. 质谱学报, 2003; 24(4):494-500.
15. 邬江, 朱家恺, 许扬滨, 等. 许旺细胞源神经营养蛋白的质谱分析. 中华显微外科杂志, 2002; 25(4):271-273.
16. 许克新, 王云川. 双向电泳及质谱分析与蛋白组研究. 第四军医大学学报, 2002; 23(22):2017-2022.