请问肽段测序怎么知道用数据库对比数据还是de novo数据呢?
-
鉴定的蛋白/肽段序列
-
Score、PEP、FDR 等统计指标
-
通常可看到蛋白名称和来源
-
带有不确定性的序列(如“L/I”、“K/Q”模糊位点)
-
每个氨基酸位点的得分或置信度(local confidence)
-
无蛋白名称、无注释信息
-
使用的搜索引擎名称(如 PEAKS、Mascot、MaxQuant)
-
是否提及参考数据库(如 Uniprot、SwissProt)
-
序列是否带有模糊位点(如“X”、“I/L”)
-
是否有蛋白注释信息
这个问题的核心在于:如何区分肽段鉴定的方式是基于数据库搜索(database search)还是基于 de novo 测序。请看以下几点判断逻辑:
一、从数据源头判断
1、数据库搜索(Database Search)
(1)原始质谱数据(MS/MS)通过搜索算法(如 Sequest、Mascot、Andromeda、pFind 等)与已知蛋白数据库中的理论肽段碎片谱进行匹配。
(2)要求提供物种信息或参考蛋白数据库(如Uniprot)。
(3)输出结果包含:
2、de novo 测序
(1)不依赖任何数据库,直接从碎片离子谱图中推断肽段序列。
(2)常用算法如 PEAKS de novo、Novor、pNovo、DeepNovo 等。
(3)适用于:无数据库样本(如新物种、抗体类蛋白、修饰多样性极高样本等)。
(4)输出结果中往往包含:
二、从结果特征判断
| 特征 | Database Search | de novo Sequencing |
|---|---|---|
| 是否依赖参考数据库 | 是 | 否 |
| 是否提供蛋白名称 | 是 | 否 |
| 序列是否完全明确 | 是 | 否,可能有模糊位点 |
| 是否提供位点置信度 | 否(常为整体打分) | 是(逐位点) |
| 结果中是否含 FDR | 是 | 一般无(但可能有局部置信度) |
| 适用场景 | 已知物种、标准蛋白质组 | 新物种、未知蛋白、抗体等 |
三、实际操作建议
若你已获得分析结果但不清楚使用的是哪种方法,请检查分析报告中是否有:
百泰派克生物科技--生物制品表征,多组学生物质谱检测优质服务商
相关服务:
How to order?

