【1115.】PCA、PLS-DA、OPLS-DA到底啥关系?
代谢组学是一门十分火热的研究领域,在代谢组学的数据分析中,下图你一定不陌生。
主成分分析(PCA)
PLS-DA
OPLS-DA
PLS-DA和OPLS-DA中涉及到两个矩阵:X矩阵为样本-变量观测矩阵,Y矩阵为样本类别归属矩阵。通过X和Y矩阵进行建模,即通过样本-变量关系确立样本关系。
OPLS-DA是在PLS-DA的基础上,进行了正交变换的矫正,可以滤除与分类信息无关的噪音,提高了模型的解析能力和有效性。
正交偏最小二乘法(OPLS)是一种新型的多元统计方法,它由Johan Tryggde等人于2002年提出,近十年来,这种方法在理论和应用方面得到了迅速的发展,并在计量化学中有大量的应用。OPLS是一种多因变量对多自变量的回归建模方法,其大的特点是可以去除自变量X中与分类变量Y无关的数据变异。使分类信息主要集中在一个主成分中,从而模型变得简单和易于解释,其判别效果及主成分得分图的可视化效果更加明显。
松哥统计说
S-plot图
图:OPLS-DA S-plot
Permutation Test图
松哥统计说
---统计思维与理论系列---
【1113.】医学论文中常用回归分析方法的审核要点[松哥荐读]及对策
【1105.】统计问诊:松哥为什么我回归模型无法计算可信区间
[1103.]CNKI升级了,即使撤稿也还能下载,如此留下痕迹,侥幸者要注意啦!
【1090.】中英文期刊分类(SCI分区和中文核心),一文秒懂!
【1086.】为啥20分以上SCI论文如此钟情P-interaction!
【1084.】哎呦妈呀!几何均数还有标准差呀?书中从来没说过呀!
【1075.】很有意思的一个统计问题,并发症到底该如何分析?
【1072.】单因素Logistic回归变量筛选,你还在用表表达,看看人家如何可视化的,审稿人看了能不开心吗?
【1070.】性别和吸烟是专业公认的危险因素,为啥多因素分析性别没意义了?
【1061.】这篇SCI的诊断试验结果看不懂,他到底是咋比的
【1055.】单因素是危险因素,多因素却保护因素了,想逆天吗?
【1054.】这种文章统计套路您一定要学,不管你什么专业通杀
【1052.】同一肝癌患者,同时接受CT、超声和磁共振,如何分析?
【1050.】知道两组数据的样本量均数标准差,怎么算合并统计量呢?
【1049.】meta分析软件Revman5.3卡死解决方案
【1047.】两因素方差分析,如何判断哪个因素对结果影响较大?
【1044.】松哥为啥我318样本量统计分析出来确实400样本量?
【1038.】SCI论文中Logistic回归模型“门当户对”原则,松哥心得推荐给您
【1036.】Logistic回归文章的SCI审稿人意见解读
【1034.】正态分布的3个基因密码,聆听大自然心跳的代码!
【1033.】生存分析K-M法与COX回归结论不一致怎么办?
【1031.】没有比较就没有伤害,让咱们互相伤害吧,教你4大类统计伤害方法
【1022.】听完四个小故事,你就明白主成分分析是啥意思了!
【1021.】方差分析P>0.05,两两比较LSD法P<0.05,这可咋整?
【1017.】倾向性评分后数据,应该采用配对设计还是成组设计?
【1009】P<0.05也别理直气壮,统计也会犯错,还分犯I类和II类错误?
【1008】文章鉴析:这篇文章或许有10处不适!
【1007】R×C卡方的Fisher确切概率法为什么会有卡方值
【1002】连续变量变成等级变量后,原来有意义的变量变得没意义了?
【1001】SCI论文中的P for trend是什么鬼?为什么高分文章经常采用呢
------------------------------