如何解读 kegg 结果中的数值?
KEGG(Kyoto Encyclopedia of Genes and Genomes)是一个包含基因、蛋白质、代谢途径等多种生物信息的数据库。在进行富集分析(例如,基因富集分析或代谢物富集分析)时,我们经常使用KEGG路径来帮助解释实验结果。
使用KEGG进行富集分析后,结果通常包含以下几个主要参数:
1.Term或ID:
这是KEGG路径的名称或标识符。
2.Count:
这是输入列表(例如,显著改变的基因或代谢物)中属于特定KEGG路径的项目数量。
3.%:
这是输入列表中属于特定KEGG路径的项目占输入列表总项目的百分比。
4.P-value:
这是假设检验的结果,表示观察到的富集程度(或更极端的富集程度)在零假设(随机)下出现的概率。P值越小,表示在随机的情况下观察到当前结果的可能性越小,因此我们有更多的理由拒绝零假设,认为观察到的富集程度不是随机的,即输入列表与特定KEGG路径有显著关联。
5.Adjusted P-value或Q-value:
这是矫正后的P值,用来控制假阳性发现率(FDR)。在多重假设检验中,原始的P值可能过于乐观,因此需要进行矫正。常见的矫正方法包括Bonferroni校正、Benjamini-Hochberg校正等。矫正后的P值越小,表示输入列表与特定KEGG路径的关联程度越显著。
6.Enrichment:
这是富集程度的度量,通常是观察到的富集程度与随机期望的富集程度的比值。富集程度越高,表示输入列表与特定KEGG路径的关联程度越显著。
对于解读KEGG结果,一般来说,我们关注的是调整后的P值小(例如<0.05)且富集程度高的路径,因为这些路径很可能是实验条件下发生显著改变的生物过程。
百泰派克生物科技--生物药物表征,多组学生物质谱检测优质服务商
相关服务:
How to order?