De novo 从头测序:未知蛋白和多肽序列如何用质谱解析?

    封面:De novo 从头测序与质谱片段拼接

    De novo 从头测序是一种不依赖已知参考序列的序列解析方法。在蛋白和多肽分析中,它通常利用 LC-MS/MS 获取肽段碎片谱,再根据 b/y 离子系列、质量差和生物信息学算法推导氨基酸顺序。它适合未知蛋白测序、多肽序列确认、抗体序列解析、突变检测以及数据库不完整或无法直接匹配的样品。

    关键要点

    关键问题

    简短结论

    De novo 测序是什么意思?

    不依赖参考序列,直接从实验碎片数据推导序列。

    蛋白 De novo 测序主要依赖什么数据?

    依赖高质量 MS/MS 碎片谱、多酶切覆盖和序列拼接验证。

    为什么要做多重酶切?

    不同酶切产生互补肽段,可提高序列覆盖度并降低拼接错误。

    适合哪些样品?

    未知蛋白、多肽、单克隆抗体、重组蛋白突变体和数据库缺失样品。

    最大挑战是什么?

    同分异构氨基酸、低质量谱图、覆盖缺口、修饰干扰和片段拼接错误。

    它是什么?

    De novo 从头测序最早常用于基因组或转录组组装语境,在蛋白质谱中则指不直接依赖数据库匹配,而是从肽段碎片离子的质量差推断氨基酸顺序。对于没有参考序列、参考序列不完整、存在未知突变或需要确认抗体可变区序列的样品,De novo 分析能提供比常规数据库检索更灵活的序列证据。

    蛋白 De novo 测序通常不是一次实验直接给出完整蛋白序列,而是先通过蛋白酶切产生多个重叠肽段,再采集 MS/MS 谱图,最后将可信肽段进行拼接、组装和反向验证。覆盖越完整、重叠片段越充分、谱图质量越高,最终序列解释越可靠。

    De novo 测序通过碎片离子质量差推导氨基酸序列

    图 1. De novo 测序根据 MS/MS 碎片离子之间的质量差推导肽段序列。

    相关服务

    从头测序

    蛋白从头测序和突变分析

    多肽从头测序

    单克隆抗体从头测序

    蛋白测序

     

    De novo 从头测序的基本流程

    第一步是样品准备和纯度确认。复杂混合样品会显著增加拼接难度,因此未知蛋白或抗体样品通常需要先纯化、胶切或分级。第二步是多酶切设计,例如 Trypsin、Chymotrypsin、Glu-C、Asp-N 等可产生互补肽段,帮助覆盖单一酶切难以覆盖的区域。

    第三步是 LC-MS/MS 数据采集,通过高分辨质谱获得母离子质量、碎片离子和谱图强度。第四步是 De novo 算法解析肽段序列,并结合质量准确度、离子连续性、修饰可能性和重叠区域进行筛选。最后,需要用反向验证、理论谱图匹配、完整分子量或相邻肽段证据检查拼接结果。

    蛋白 De novo 从头测序从多酶切到序列拼接的流程

    图 2. 多酶切、MS/MS 采集和重叠肽段拼接是从头测序可靠性的关键。

    主要收益或优势

    1、不依赖完整数据库

    当目标蛋白来源物种缺少数据库、序列发生突变或样品为未知多肽时,传统数据库检索可能无法给出结果。De novo 测序可直接从谱图推断序列,为后续数据库搜索、同源比对或功能分析提供线索。

    2、适合未知蛋白、抗体和突变分析

    抗体可变区、重组蛋白突变体、天然来源多肽和未知蛋白都可能存在参考信息不足的问题。从头测序可以帮助解析候选序列、识别突变位点,并辅助确认序列是否与预期一致。

    3、可与常规质谱鉴定互补

    De novo 结果可作为数据库检索的补充证据。对于部分匹配、低同源蛋白、变异肽段或修饰肽段,结合 De novo 片段解释与数据库检索通常比单一方法更稳妥。

     

    主要限制或权衡

     

    • Leu/Ile 等同分异构氨基酸在常规 MS/MS 中难以直接区分。

    • 低丰度肽段、碎片不连续或谱图噪声会影响序列推断。

    • 翻译后修饰、二硫键和糖基化可能增加质量解释复杂度。

    • 单一酶切容易产生覆盖缺口,完整序列解析通常需要多酶切策略。

    • De novo 结果需要反向验证,不能只依赖软件输出的最高分序列。

     

    如何选择 De novo 测序方案?

     

    如果目标是短多肽序列确认,重点是获得高质量 MS/MS 谱图并确认端基和修饰;如果目标是未知蛋白全序列分析,应优先进行高纯度样品制备、多酶切和重叠片段拼接;如果目标是单克隆抗体序列解析,需要结合轻链、重链、可变区覆盖和抗体特异性数据库策略;如果目标是突变检测,则应围绕理论序列和候选突变区域设计验证。

    项目目标

    推荐方向

    重点关注

    多肽序列确认

    高分辨 MS/MS + De novo

    谱图质量、端基、修饰

    未知蛋白测序

    多酶切 + 重叠拼接

    序列覆盖度、反向验证

    抗体从头测序

    多酶切 + 可变区解析

    轻重链分离、CDR 覆盖

    突变分析

    数据库检索 + De novo 辅助

    质量偏移、突变肽段证据

    低同源蛋白鉴定

    De novo + 同源比对

    候选片段、物种数据库

    完整序列确认

    分子量检测 + 肽段覆盖

    完整质量、覆盖缺口

    按样品和目标选择 De novo 测序方案

    图 3. De novo 测序方案应根据样品类型、是否有参考序列和目标问题设计。

    FAQ

    1、De novo 测序完全不需要数据库吗?

    De novo 推断本身不依赖数据库,但结果解释常常需要数据库、同源序列或理论分子量辅助验证。对于蛋白全序列项目,数据库和同源比对能帮助判断拼接结果是否合理。

    2、De novo 测序能保证得到 100% 覆盖吗?

    不能保证。覆盖度受蛋白酶切位点、肽段理化性质、修饰、样品量、仪器灵敏度和谱图质量影响。多酶切和反向验证可以提高覆盖度,但仍可能存在难以覆盖的区域。

    3、Leu 和 Ile 能通过 De novo 测序区分吗?

    常规 MS/MS 中 Leu 和 Ile 质量相同,通常难以直接区分。需要结合酶切特异性、同源序列、特殊碎裂方式或其他实验信息辅助判断。

    4、抗体可以做 De novo 从头测序吗?

    可以。单克隆抗体从头测序常用于可变区序列解析、抗体一致性确认和生物药研发支持。由于抗体结构复杂,通常需要多酶切、多维数据和严格的轻重链归属。

    5、De novo 结果为什么需要反向验证?

     

    从头测序依赖碎片谱推断,若谱图质量不足或片段拼接错误,可能出现看似合理但实际错误的序列。反向验证可通过理论谱图、重叠肽段、分子量和重复实验提高结果可信度。

     

    结论 

    De novo 从头测序适合解决未知蛋白、多肽、抗体、突变体和数据库不完整样品的序列解析问题。可靠的从头测序不只依赖软件算法,更依赖样品纯度、多酶切覆盖、高质量 MS/MS 数据和反向验证。对于需要获得完整序列或关键突变信息的项目,应将 De novo 分析与常规质谱鉴定、分子量检测、同源比对和多轮验证结合使用,才能降低拼接错误并提高序列结论的可信度。

提交需求
姓名 *
联系类型 *
联系方式 *
项目描述
咨询项目 *

 

How to order?


/assets/images/icon/icon-rc2.png

客服咨询

/assets/images/icon/icon-message.png

提交需求

https://file.biotech-pack.com/static/btpk/assets/images/icon/icon-wx-2.png

https://file.biotech-pack.com/pro//bt-btpk/20241231/config/1874015350579343360-WX-20241231.jpg

联系销售人员

/assets/images/icon/icon-tag-sale.png

促销活动

/assets/images/icon/icon-return.png