蛋白质质谱测序:酶切与 LC-MS/MS 怎么拼序列,和 Edman、从头测序各管哪一段
-
质谱测序在蛋白组语境里,多半指 bottom-up:酶解成肽段,再靠 MS/MS 的碎片系列(如 b/y 离子思路)推断肽段序列,再拼蛋白。
-
想拿到全序列或高置信拼接,通常要关心纯度、酶切位点分布、多重酶切带来的肽段覆盖率,而不是只看仪器型号。
-
数据库里有可靠条目时,搜库往往更省力;序列未知或库不全时,从头(de novo) 比例会上去,对谱图质量和后续人工校验要求也更高。
-
N/C 端测序、全序列验证、从头测序可以落在同一大类质谱路线里,但实验设计不同;有时还会和 Edman 等化学 N 端读序并用,用来互相卡住疑点。
-
覆盖与修饰语境:质谱路线天然带着肽段质量 + 碎裂证据,和只读 N 端顺序的化学路线关注点不完全一样;讨论覆盖度、翻译后修饰位点、突变位点时,质谱往往更顺手。
-
全序列或大范围验证:在酶切设计合理、谱图够硬的前提下,可以把多个肽段拼成一条链这件事做成可复核的证据链;抗体、重组蛋白这类项目里很常见。
-
和数据库协同:库里已有高质量条目时,搜库 + 手工抽查高置信肽段,交付节奏通常比纯 de novo 稳。
-
纯度不是空话:混合物里各蛋白酶切肽段叠在一起,鉴定和拼接难度会陡增;简报里写纯的蛋白样品不是客套,是后面一切解释的前提。
-
酶切方案决定覆盖率:单一酶切位点稀疏时,长肽段或难离子化区段可能长期扫不到;多重酶切(不同特异性蛋白酶组合)就是为了把网织密一点。
-
数据库稀疏时 de novo 变重:没有可靠条目可参考,算法就要在噪声里硬推序列;这时项目预算里要留足重复实验 + 人工谱图复核 的空间。
-
测序不等于自动给全长:尤其当蛋白很大、或存在复杂修饰时,任何路线都要在合同里把交付粒度(肽段级、全长级、端点级)说清楚。
实验室里说的蛋白质质谱测序,多数时候不是把整条蛋白 intact 丢进仪器读出一条磁带式序列,而是先把蛋白切成肽段,再用 LC 分离 + 串联质谱(MS/MS) 拿到碎片离子信息,最后靠数据库匹配或 de novo 拼接把肽段序列拼回去。分辨率、灵敏度和质量精度上来以后,这条路在蛋白序列分析里用得最广,和 Edman 那种从 N 端一轮轮化学反应读序,其实是两套不同读法。
关键要点
蛋白质质谱测序是什么?
从样品流上看,常见骨架很直白:拿到尽量纯、尽量单一条带(或主峰) 的蛋白,选好蛋白酶做酶解,肽段混合物进液相色谱分级,进入高分辨质谱做 MS1 选母离子 + MS/MS 碎裂,得到每张谱图对应的碎片模式。后面一步才是测序:把碎片模式解释成氨基酸序列,再把肽段按重叠关系拼成整条链。
业内常把 nano LC-MS/MS(纳升流速色谱接串联质谱)挂在嘴边,是因为它适合复杂混合物里尽量多扫到肽段。读文献时看到蛋白序列质谱分析、基于质谱的蛋白测序,多半都在描述这条技术栈上的某一截,而不是单一按钮功能。
相关服务
主要收益:这条路适合证明什么?
主要限制:样品和「库」会先卡人
和 Edman、从头测序怎么分工
FAQ
1、蛋白质质谱测序和蛋白鉴定是一回事吗?
不完全是。鉴定回答你是谁,偏搜库匹配;测序(或序列级解析)还要回答顺序怎么连、置信度到哪一段。实践里两者会重叠,但交付表述别混在一起,省得验收时对不上。
2、只做一次 trypsin 酶切够吗?
看蛋白长度、位点分布和你要的覆盖深度。短肽、目标区段短,有时够;要全长或难点区段,实验室里更常见的是多酶切或加分级把动态范围拉开。具体组合没有万能表,得按序列和样品状态谈。
3、MS/MS 图谱到底在提供什么?
直观理解:肽段母离子被碎裂后,会形成一系列质量差接近某个氨基酸残基质量的离子系列;算法和人类都在利用这种阶梯感往回推顺序。谱图糊、电荷态乱、共碎裂多,推理就会变难。这也是前面一直强调纯度与色谱的原因。
4、有了质谱还需要 Edman 吗?
看命题。质谱很强,但不是所有问题都用同一把锤子更省时间。Edman 在 N 端顺序读序、工艺端点这类叙事上仍然好讲;质谱在覆盖、修饰、复杂样品上更灵活。并联常常是工程上最稳的写法,不是谁淘汰谁。
结论
把蛋白质质谱测序想成一条工厂线会更贴切:酶解把大分子拆成可测量的肽段,LC-MS/MS 负责在复杂背景里尽量多地抓到高质量碎裂谱,informatics 再把谱解释成序列并拼回蛋白。它能做全序列、端点、或未知序列下的 de novo,但每一档对样品和谱图的要求不同。立项前先写清你要证明的是 端点、全长验证还是无库推导,再谈酶切与仪器组合,比纠结名词更接近省钱省时的做法。
How to order?

