置换验证截距没有小于0可以吗?有参考文献吗?

    在进行OPLS-DA分析时,置换验证是确保模型的有效性并避免过拟合而进行一种常用的模型验证方法。在置换验证中,会随机改变样本的类别标签,然后重新训练模型并计算模型的预测能力。理论上,如果模型是有效的,那么在正确的类别标签下,模型的预测能力应该明显优于随机标签。


    在许多文献中,人们使用置换验证的截距(intercept)作为模型验证的一个指标。在2008年的一篇文章中,Eriksson等人提出,对于一个有效的模型,其置换验证截距应该在(0, 0.3)范围内。这是因为,如果模型在随机标签下的预测能力(即截距)太高,那么可能是出现了过拟合。因此,他们建议,如果截距大于0.3,那么应该对模型进行进一步的调整或验证。


    然而,也有一些研究表明,截距小于0并不总是必须的。例如,Westerhuis等人在2008年的一篇文章中指出,截距小于0只是一个参考标准,而不是一个硬性要求。他们的理由是,有时即使截距大于0,模型也可能是有效的,只要模型的预测能力在正确的标签下明显优于随机标签。


    因此,对于截距是否需要小于0的问题,目前并没有一个统一的标准。在实际分析中,应该综合考虑其他的模型验证指标,如Q2、R2等,以及实验背景和其他数据信息。


    参考文献:


    1.Eriksson, L., Trygg, J., & Wold, S. (2008). CV-ANOVA for significance testing of PLS and OPLS® models. Journal of chemometrics, 22(11-12), 594-600.


    2.Westerhuis, J. A., Hoefsloot, H. C., Smit, S., Vis, D. J., Smilde, A. K., van Velzen, E. J., ... & Hendriks, M. M. (2008). Assessment of PLSDA cross validation. Metabolomics, 4(1), 81-89.


    百泰派克生物科技--生物制品表征,多组学生物质谱检测优质服务商


    相关服务:

    代谢组学

    代谢组学数据质量评估

    代谢组学生物信息学分析

    主成分分析(PCA)

    PLS-DA/OPLS-DA二维图

    数据归一化分析

    单变量统计分析

    差异代谢产物聚类分析


提交需求
姓名 *
联系类型 *
联系方式 *
项目描述
咨询项目 *

 

How to order?


/assets/images/icon/icon-rc2.png

客服咨询

/assets/images/icon/icon-message.png

提交需求

https://file.biotech-pack.com/static/btpk/assets/images/icon/icon-wx-2.png

https://file.biotech-pack.com/pro//bt-btpk/20241231/config/1874015350579343360-WX-20241231.jpg

联系销售人员

/assets/images/icon/icon-tag-sale.png

促销活动

/assets/images/icon/icon-return.png