De novo 从头测序:未知蛋白和多肽序列如何用质谱解析?
-
Leu/Ile 等同分异构氨基酸在常规 MS/MS 中难以直接区分。
-
低丰度肽段、碎片不连续或谱图噪声会影响序列推断。
-
翻译后修饰、二硫键和糖基化可能增加质量解释复杂度。
-
单一酶切容易产生覆盖缺口,完整序列解析通常需要多酶切策略。
-
De novo 结果需要反向验证,不能只依赖软件输出的最高分序列。

De novo 从头测序是一种不依赖已知参考序列的序列解析方法。在蛋白和多肽分析中,它通常利用 LC-MS/MS 获取肽段碎片谱,再根据 b/y 离子系列、质量差和生物信息学算法推导氨基酸顺序。它适合未知蛋白测序、多肽序列确认、抗体序列解析、突变检测以及数据库不完整或无法直接匹配的样品。
关键要点
|
关键问题 |
简短结论 |
|---|---|
|
De novo 测序是什么意思? |
不依赖参考序列,直接从实验碎片数据推导序列。 |
|
蛋白 De novo 测序主要依赖什么数据? |
依赖高质量 MS/MS 碎片谱、多酶切覆盖和序列拼接验证。 |
|
为什么要做多重酶切? |
不同酶切产生互补肽段,可提高序列覆盖度并降低拼接错误。 |
|
适合哪些样品? |
未知蛋白、多肽、单克隆抗体、重组蛋白突变体和数据库缺失样品。 |
|
最大挑战是什么? |
同分异构氨基酸、低质量谱图、覆盖缺口、修饰干扰和片段拼接错误。 |
它是什么?
De novo 从头测序最早常用于基因组或转录组组装语境,在蛋白质谱中则指不直接依赖数据库匹配,而是从肽段碎片离子的质量差推断氨基酸顺序。对于没有参考序列、参考序列不完整、存在未知突变或需要确认抗体可变区序列的样品,De novo 分析能提供比常规数据库检索更灵活的序列证据。
蛋白 De novo 测序通常不是一次实验直接给出完整蛋白序列,而是先通过蛋白酶切产生多个重叠肽段,再采集 MS/MS 谱图,最后将可信肽段进行拼接、组装和反向验证。覆盖越完整、重叠片段越充分、谱图质量越高,最终序列解释越可靠。

相关服务
De novo 从头测序的基本流程
第一步是样品准备和纯度确认。复杂混合样品会显著增加拼接难度,因此未知蛋白或抗体样品通常需要先纯化、胶切或分级。第二步是多酶切设计,例如 Trypsin、Chymotrypsin、Glu-C、Asp-N 等可产生互补肽段,帮助覆盖单一酶切难以覆盖的区域。
第三步是 LC-MS/MS 数据采集,通过高分辨质谱获得母离子质量、碎片离子和谱图强度。第四步是 De novo 算法解析肽段序列,并结合质量准确度、离子连续性、修饰可能性和重叠区域进行筛选。最后,需要用反向验证、理论谱图匹配、完整分子量或相邻肽段证据检查拼接结果。

主要收益或优势
1、不依赖完整数据库
当目标蛋白来源物种缺少数据库、序列发生突变或样品为未知多肽时,传统数据库检索可能无法给出结果。De novo 测序可直接从谱图推断序列,为后续数据库搜索、同源比对或功能分析提供线索。
2、适合未知蛋白、抗体和突变分析
抗体可变区、重组蛋白突变体、天然来源多肽和未知蛋白都可能存在参考信息不足的问题。从头测序可以帮助解析候选序列、识别突变位点,并辅助确认序列是否与预期一致。
3、可与常规质谱鉴定互补
De novo 结果可作为数据库检索的补充证据。对于部分匹配、低同源蛋白、变异肽段或修饰肽段,结合 De novo 片段解释与数据库检索通常比单一方法更稳妥。
主要限制或权衡
如何选择 De novo 测序方案?
如果目标是短多肽序列确认,重点是获得高质量 MS/MS 谱图并确认端基和修饰;如果目标是未知蛋白全序列分析,应优先进行高纯度样品制备、多酶切和重叠片段拼接;如果目标是单克隆抗体序列解析,需要结合轻链、重链、可变区覆盖和抗体特异性数据库策略;如果目标是突变检测,则应围绕理论序列和候选突变区域设计验证。
|
项目目标 |
推荐方向 |
重点关注 |
|---|---|---|
|
多肽序列确认 |
高分辨 MS/MS + De novo |
谱图质量、端基、修饰 |
|
未知蛋白测序 |
多酶切 + 重叠拼接 |
序列覆盖度、反向验证 |
|
抗体从头测序 |
多酶切 + 可变区解析 |
轻重链分离、CDR 覆盖 |
|
突变分析 |
数据库检索 + De novo 辅助 |
质量偏移、突变肽段证据 |
|
低同源蛋白鉴定 |
De novo + 同源比对 |
候选片段、物种数据库 |
|
完整序列确认 |
分子量检测 + 肽段覆盖 |
完整质量、覆盖缺口 |

FAQ
1、De novo 测序完全不需要数据库吗?
De novo 推断本身不依赖数据库,但结果解释常常需要数据库、同源序列或理论分子量辅助验证。对于蛋白全序列项目,数据库和同源比对能帮助判断拼接结果是否合理。
2、De novo 测序能保证得到 100% 覆盖吗?
不能保证。覆盖度受蛋白酶切位点、肽段理化性质、修饰、样品量、仪器灵敏度和谱图质量影响。多酶切和反向验证可以提高覆盖度,但仍可能存在难以覆盖的区域。
3、Leu 和 Ile 能通过 De novo 测序区分吗?
常规 MS/MS 中 Leu 和 Ile 质量相同,通常难以直接区分。需要结合酶切特异性、同源序列、特殊碎裂方式或其他实验信息辅助判断。
4、抗体可以做 De novo 从头测序吗?
可以。单克隆抗体从头测序常用于可变区序列解析、抗体一致性确认和生物药研发支持。由于抗体结构复杂,通常需要多酶切、多维数据和严格的轻重链归属。
5、De novo 结果为什么需要反向验证?
从头测序依赖碎片谱推断,若谱图质量不足或片段拼接错误,可能出现看似合理但实际错误的序列。反向验证可通过理论谱图、重叠肽段、分子量和重复实验提高结果可信度。
结论
De novo 从头测序适合解决未知蛋白、多肽、抗体、突变体和数据库不完整样品的序列解析问题。可靠的从头测序不只依赖软件算法,更依赖样品纯度、多酶切覆盖、高质量 MS/MS 数据和反向验证。对于需要获得完整序列或关键突变信息的项目,应将 De novo 分析与常规质谱鉴定、分子量检测、同源比对和多轮验证结合使用,才能降低拼接错误并提高序列结论的可信度。
How to order?

