基于质谱的蛋白质组学初学者指南

    基因是遗传的基本单位,但只有当它们被翻译成蛋白质时才会有生命。蛋白质是生物学主要功能的参与者,参与着从生化反应、信号转导到结构支持的整个过程。蛋白质组是生物体液、细胞和组织中存在的所有蛋白质的集合,它反映了生物系统的功能状态。蛋白质组学是对蛋白质组的定性定量研究,常用于比较不同细胞状态之间的差异,被广泛应用学生物医学领域。比如我们可以通过对病毒感染和未感染细胞之间的蛋白组进行差异分析,揭示病毒感染和复制所需的细胞通路和蛋白质。进而针对这些蛋白质开发药物,减缓感染进程。蛋白质组学因其能一次性直接表征所有蛋白质,特别适用于揭示潜在的生化机制。在本篇文章中,我们重点关注利用质谱(MS)对蛋白质组系统表征,更准确地说是自下而上的蛋白质组学(即先将蛋白质酶解成肽段,再通过MS进行分析)。

     

    一、质谱的基础知识

    质谱仪发明于1912年,经过不断的发展,现如今检测限值,检测速度和适用性都有了极大的提升。质谱仪的原理是利用分子的基本特性(如质量和净电荷)来检测肽(或其他生物分子,如代谢物、脂质和蛋白质)的存在和丰度。当肽获得净电荷时(通常是通过获得质子),它们被称为肽离子。

     

    所有的质谱仪都有三个基本组成部分:离子源、质量分析仪和检测器(图1A)。由于质谱仪只能分析气态离子,因此需要使用电喷雾电离(ESI)等方法将肽从液相转化为气态离子。含有肽的液体被泵送通过一个微米大小的高压孔(2-4千伏)。在到达这个发射器后,稳定的液体流被分解成极小的、高电荷的、快速蒸发的带电液滴,在气相中留下肽离子。气态肽离子的丰度直接反映了原始蛋白质的浓度,因此,采用尽可能低的流速能更有效地提升检测灵敏度。在蛋白质组学研究中,高效液相色谱(HPLC)常被用于肽混合物的分离,其流速精细控制在每分钟几百纳升,远优于传统HPLC的流速,从而确保更精准的检测结果。

     

    image.png

    图1. 基于MS的蛋白质组学中使用的样品制备和仪器概述

     

    质谱仪中质量分析器的主要作用是依据离子的质荷比(m/z)分离离子。从根本上来说,所有离子都是通过调节它们在电场中的轨迹来分离的。质量分析器在分离离子时采用的原理各不相同,这决定了它们各自的应用领域。在蛋白质组学中,四极杆质量分析器是常见的分析设备,它通常与时间飞行(TOF)或Orbitrap分析器结合使用。四极杆质量分析器的工作原理基于在四根平行排列的圆柱形杆之间施加振荡电场,每对杆都会产生一个具有相位偏移的射频电场。这些电场共同塑造了一个伪势表面,该表面经过配置后能够允许所有离子通过,或者选择性地仅让特定质荷比窗口内的离子通过,从而实现离子的有效分离。

     

    TOF质量分析器通过加速离子至约20千伏的电压,并根据离子到达检测器的时间差异来分离离子。TOF能够检测到亚微秒级的时间差异,从而测量出百万分之一(ppm)级别的质量差异。相比之下,Orbitrap质量分析器则是根据离子的振荡频率来区分离子的。离子被切向注入随后被捕获在Orbitrap中,沿着中央金属主轴的长度轴移动(图1B)。虽然Orbitrap只有几厘米长,但离子可以在其中迅速移动数公里,从而实现非常高的分辨率(通常达到数万级别)和低至ppm级别的质量准确性。

     

    在蛋白质组学研究中,四极杆元件后通常衔接一个“碰撞室”,这是一个专门用于离子碎片化的四极杆装置。完整的肽离子或碎片离子会进入包含检测器的最后阶段,此时产生的谱图在前者情况下被称为MS1或前体离子谱图,后者则为MS2或产物离子谱图,又称为MS/MS谱图。TOF仪器采用微通道板(MCP)检测器来捕捉离子,每当一个离子接触到其表面,都会释放出电子,这些电子随后被放大,从而实现对单个离子的精确测量。然而,这种超高的灵敏度也伴随着一个挑战:即在高信号情况下,检测器可能会因为离子数量过多而达到饱和状态。相比之下,Orbitrap分析器则是测量由快速振荡的离子产生的“图像电流”,这种电流直接反映了单个离子包的强度。电流在时域中被记录,并通过傅里叶变换转换为频域。虽然信号处理算法的不断进步使得在给定的信号瞬态时间内,可实现的分辨率得到了成倍的提升。但遗憾的是,这些算法的处理速度仍然远远落后于TOF分析器。具体来说,单次TOF脉冲的时间仅为100微秒,而Orbitrap分析器完成整个分析过程则需要几十到几百毫秒。

     

    质谱仪是如何对肽进行测序或鉴定的呢?首先,质谱仪会利用四极杆或其他离子分离装置,将具有特定质荷比(m/z)的前体离子进行分离。随后,这些离子会在碰撞室中与惰性气体(如N2、He或Ar)发生碰撞,进而破碎。在碰撞过程中,离子主要在最低能量键上断裂,通常是连接氨基酸残基的一些酰胺键(肽键)。这一过程会使MS/MS光谱产生不同的峰梯,峰之间的差异反映了氨基酸的质量。这些峰梯信息具有极高的特异性,是肽序列鉴定的关键所在。通过深入分析这些氨基酸的序列以及它们两侧的质量(肽序列标签),我们就能够从人类蛋白质组中识别出特定的肽。在实际应用中,更常见的是借助数据库识别,数据库中包含了所有可能生成的碎片谱图,将其与实验谱图进行对比进行统计评分,从而实现肽的准确鉴定。

     

    色谱保留时间是数据集与先前测量结果匹配时的重要信息,也是“靶向蛋白质组学”技术的关键。此外,离子迁移率分析作为肽离子分离的另一个维度,近年来逐渐被广泛应用最。离子可以根据其横截面进行过滤(FAIMS,场不对称离子迁移率谱法),或在分析过程中实际分离(T-Wave或TIMS,阱离子迁移率谱法)。TIMS是并行累积-串行碎片化(PASEF)技术的基础,该技术在提高灵敏度的同时将测序速度提高了10倍。

     

    二、样品制备和特异性富集

    基于质谱的蛋白质组学可以分析任何样品的蛋白质含量。除了细胞等主要样品外,还能分析福尔马林固定石蜡包埋(FFPE)活检组织,甚至数十万年前的化石。这是因为蛋白质的性质十分稳定,其稳定性显著优于RNA。通常,蛋白质会根据实验目的,在经过合适的生物化学富集程序后,如细胞分级分离、亲和富集或邻近分析法后被分离出来。

     

    蛋白质组学样本制备既需要精妙的技巧,又需要科学的严谨。其最终结果是将蛋白质酶解成肽段(图1A)。在此过程中常用到的酶是胰蛋白酶,它能够对精氨酸和赖氨酸的C端进行特异性切割,这一特性使得新形成的C端肽段带有正电荷,从而增强了肽离子的电离和碎片化效果。在整个样本制备过程中,需要避免使用聚合物和洗涤剂,因为这些物质会干扰肽离子的电离过程。样本制备结束时,数万个蛋白质将被转化为数十万个纯化肽段,而这些肽段的浓度差异可能高达百万倍甚至更多。

     

    三、监测翻译后修饰

    蛋白质的一级结构氨基酸序列常常带有修饰,这些翻译后修饰(PTMs)是一种高效且精细的调控机制,能够显著影响蛋白质的活性甚至功能。PTMs通常是亚化学计量的,即只有特定蛋白质会受到修饰,因此捕获和检测这些修饰具有一定挑战性。大多数策略使用针对PTM的抗体,或利用PTM基团的独特化学性质来富集携带修饰的肽。其中,磷酸化作为研究最多的PTM,常使用基于二氧化钛的磁珠进行高特异性富集磷肽。值得一提的是,基于质谱的蛋白质组学兴起后,能够在短短2小时内检测超过10,000个具有单个氨基酸分辨率的修饰位点,以及细胞内广泛的信号转导网络,这在之前是难以做到的。如今,蛋白质组学已成为常规研究手段,用于揭示泛素化、SUMO化、乙酰化和糖基化等生物过程中的重要作用。然而,对于那些不太常见的PTMs,尤其是那些缺乏高度特异性抗体的PTMs,其分析仍面临一定的挑战。

     

    四、数据采集和量化策略

    在质谱仪进行数据采集的任何特定时刻,都有成百上千的肽被电离并同时进入质谱仪。过去,这些肽主要通过数据依赖采集(DDA)方式进行分析,即用户通过设置一定的规则(例如质荷比、电荷、强度和横截面),有选择性的捕获肽离子,以获取MS/MS光谱(图2A)。然而,由于肽的数量远远超出了分析时间的限制,这种选择过程不可避免地带有一定的随机性,导致部分数据成为缺失值。相比之下,数据非依赖性采集(DIA)方法则采取了不同的策略。在这种方法中,四级杆会在整个质量范围内持续循环,并选择相对较大的质荷比范围(20-40 m/z)(图2B),能够对所有离子进行检测和碎裂,确保无遗漏、无差异地获取样本中所有离子的信息。但这就会导致MS/MS谱图非常复杂。现代软件可以通过与之前获取的“肽库”进行比较来解析光谱,从而识别多个肽,但越来越多的情况下也可以不进行比较。新的扫描模式仍在研发之中,旨在解决“动态范围问题”——即在存在高丰度蛋白质的情况下,如何有效检测极低丰度蛋白质。以血液中的细胞因子与白蛋白为例,两者的丰度差异可能高达12个数量级,这使得低丰度蛋白质的检测变得尤为困难。

     

    image.png

    图2. 两种常见的数据采集策略(DDA和DIA)

     

    肽的定量分析包括无标记定量和标记定量两大类。在无标记定量(LFQ)中,研究人员会从原始数据中提取肽的质谱信号(通常在MS1级别),随后进行归一化处理,并在感兴趣的蛋白质组条件下进行比较。这种方法直观且经济,为项目设计提供了极大的灵活性。不过,该策略的定量方差相对较高,如果不够小心,肽的纯度和仪器性能的差异都可能对单个样本之间的比较产生影响,从而影响结果的准确性。

     

    基于标记的方法是利用稳定同位素来标记不同状态的蛋白质组。其优势在于,这些同位素标记的肽具有相同的物理化学特性,但在质量上却存在可预测的差异。同位素可以通过代谢途径自然引入,也可以进行化学标记和“读取”。后者被称为等质量标签,其检测原理是标签的质量不会变,但标签中同位素的分布会在碎片化后会显现,从而实现对不同样本的区分。在一组包含6到16个不同标签的样本中,如果样本能够被一致且可重复地标记和组合,那么其定量方差通常低于LFQ。然而,像TMT(串联质谱标签)这样的等质量标记方法也存在一定的局限性,即共同碎片化的肽可能会抑制定量差异,这种现象被称为“比率压缩”,它可能在一定程度上影响定量结果的准确性。

     

    无论采用何种定量和扫描模式,质谱仪的输出始终包含MS1和MS/MS光谱。大量的软件程序被开发出来处理这些数据,这些程序首先会查找信号,即进行“特征发现”,然后利用搜索引擎将MS/MS谱图与数据库中的肽序列进行精准匹配。接下来,程序会运用复杂的算法将肽重新组装成蛋白质,解决“蛋白质推断问题”。最后,在肽或蛋白质水平上进行精确的定量分析(图2C)。

     

    简单的来说,输出是一个矩阵,其中包含一系列蛋白质及其在各自样本中的对应丰度,这些输出通过错误发现率(FDR)阈值来筛选获取。随着科研的深入,人们已不再满足于简单的数据分析。如今,科学家们正努力通过整合标准或蛋白质组学特有的生物信息学流程(包括机器学习技术)以及将蛋白质组学数据与其他组学类型的数据(如各种下一代测序(NGS)方法)相结合,进一步扩展该功能。

     

    五、功能细胞状态的多维读数

    质谱技术的发展已经步入了一个崭新的阶段,为蛋白质组的鉴定和定量、蛋白质-蛋白质相互作用(互作组学)、细胞器蛋白质组学以及翻译后修饰检测等众多前沿应用提供了强有力的支持(图3)。如今,这一技术在医学领域中被广泛应用,尤其是在生物标志物的识别的常规使用中。尽管基于质谱的蛋白质组学技术相较于基于抗体的方法而言,操作过程可能更为复杂,但其卓越的检测特异性和全局性完全能够弥补这一不足。

     

    image.png

    图3. 基于MS的蛋白质组学在生物学中的一些常见应用

     

    蛋白质组学在生物学研究中扮演着至关重要的角色,它像一座桥梁,连接着基因型和表型之间的鸿沟。因为即使遗传信息出现异常,也并不一定意味着会对细胞功能产生直接的影响。而蛋白质组学能够评估这些基因组异常对蛋白质功能的具体影响,从而能够为疾病亚型提供更具体的生物标志物或新的治疗靶点。

     

    近年来,质谱技术的灵敏度的巨大提升为单细胞蛋白质组学的研究开辟了新的视野。这种方法的优势在于,它能够在保留细胞环境全部空间信息的同时,对单个细胞进行深入研究。相较于mRNA,蛋白质的数量更为丰富,这使得单细胞蛋白质组学的研究更加稳健可靠。基于质谱的单细胞蛋白质组学可以直接揭示细胞间的动态变化(如细胞与其微环境之间的受体—配体相互作用),为我们理解细胞间通信和细胞行为的复杂性提供新的视角。

     

    总之,我们希望通过这篇文章阐明一些基于质谱的蛋白质组学的基本概念。蛋白质是一种多功能的生物分子,其功能不仅仅取决于其丰度。而基于质谱的蛋白质组学同样具备丰富的多样性,能够灵活适应并深入研究涉及生物功能的蛋白质的各个方面。无论是蛋白质的鉴定、定量,还是蛋白质-蛋白质相互作用的解析,质谱技术都能为我们提供有力的支持,帮助我们更深入地探索生命的奥秘。

     

    文献来源:

    Ankit Sinha; Matthias Mann. A beginner’s guide to mass spectrometry–based proteomics[J], Biochem (Lond) (2020) 42 (5): 64–69.

     

    百泰派克生物科技--生物制品表征,多组学生物质谱检测优质服务商

     

    相关服务:

    蛋白质质谱鉴定

    蛋白质组学分析

    蛋白分子量测定

    蛋白胶点、胶条、IP样品蛋白质鉴定

    多肽质谱鉴定

    Shotgun鸟枪法蛋白质鉴定

    膜蛋白鉴定服务

    Pull-down靶蛋白质谱鉴定

    蛋白质相互作用质谱分析

    翻译后修饰蛋白组分析

    蛋白测序

    蛋白质N/C端测序

    蛋白质全谱分析

    蛋白质串联质谱鉴定

    互作蛋白质谱鉴定

提交需求
姓名 *
联系类型 *
联系方式 *
项目描述
咨询项目 *

 

How to order?


/assets/images/icon/icon-rc2.png

客服咨询

/assets/images/icon/icon-message.png

提交需求

https://file.biotech-pack.com/static/btpk/assets/images/icon/icon-wx-2.png

https://file.biotech-pack.com/pro/bt-btpk/image/head/config/20240104-5618-企业微信销售二维码.jpg

联系销售人员

/assets/images/icon/icon-tag-sale.png

促销活动

/assets/images/icon/icon-return.png