R语言分层线性模型案例

2024-08-07 12:12:45

原文 http://tecdat.cn/?p=3740

有许多分层数据的例子。例如，地理数据通常按层次分组，可能是全球数据，然后按国家和地区分组。一个生物学的例子是按物种分组的动物或植物的属性，或者属于一个级别的属性，然后是家族。一个商业例子可能是业务部门和细分的员工满意度。每个学科都有许多例子，其中观察以某种形式的层次结构进行分组。

在这里，我想解释使用一个简单的例子，如何使用R来构建分层线性模型。我在整个三组中使用简单的一维数据集。在每个组内，自变量x和因变量y之间存在强正相关关系。

geom_smooth(aes(x=x,y=y,group=group),method=lm,se=FALSE) +

theme_bw() + theme(legend.position="null")

g + geom_smooth(aes(x=x,y=y),method=lm,se=TRUE)

这些组有不同的颜色。在本文的其余部分，我将展示如何使用层次模型来模拟这种情况，该模型确实考虑了组信息。

建议的分层线性模型的一个包是arm，它具有与lm（）函数非常相似的函数lmer（）。

lmer.both <- lmer(y~1+x+(1+x|group),data=df)

summary(lmer.both) # 固定效应是顶层截距和斜率# (Intercept) x# 1.978652 1.144952# 截距组随机效应#> ranef(lmer.alpha)

# $group

# (Intercept)

# 1 3.4386106

# 2 -0.8360106

# 3 -2.6026000

# > group.alpha

# [1] 4.2883814 1.2134493 -0.5410049

# > ranef(lmer.alpha)$group[,1] + fixef(lmer.alpha)[1]

# [1] 5.4172624 1.1426413 -0.6239482

group.alpha

# 固定效果是顶层截距

# (Intercept)

# 5.788223

# 对截距和斜率进行分组随机影响

# (Intercept) x

# 1 -1.740225 0.518047

# 2 -4.564296 1.415710

# 3 -6.354477 1.231584

# > group.alpha

# [1] 4.2883814 1.2134493 -0.5410049

# > ranef(lmer.beta)$group + fixef(lmer.beta)[2]

# [1] 4.0479981 1.2239268 -0.5662542

fixef(lmer.beta)

ranef(lmer.beta)

group.beta

# > fixef(lmer.both)

# (Intercept) x

# 1.578741 1.059370

# > ranef(lmer.both)

# $group

# (Intercept) x

# 1 2.500014 -0.5272426

# 2 -0.355365 0.3545068

# 3 -2.144649 0.1727358

fixef(lmer.both)

ranef(lmer.both)

#我们简单地运行3个回归，每组一个

coef(lm(y~x,data=df[group==1,]))

coef(lm(y~x,data=df[group==2,]))

coef(lm(y~x,data=df[group==3,]))

# (Intercept) x

# 4.0653645 0.5259707

# 1.227969 1.428500

# -0.570280 1.225905

# true values for group.alpha are

# 4.2883814 1.2134493 -0.5410049

(ranef(lmer.alpha)$group[,1]) + fixef(lmer.alpha)[1]

(ranef(lmer.beta)$group[,1]) + fixef(lmer.beta)[1]

# Alpha随机效应图

fit.lines <- data.frame(cbind(intercept=(ranef(lmer.alpha)$group[,1])+fixef(lmer.alpha)[[1]]

g.alpha

# beta随机效应图

fit.lin

iplot(g.alpha

结果显示有三个图，第一个是截距（alpha）依赖于组，第二个是斜率（β）依赖于组，第三个是截距和斜率依赖组。你可能在想为什么不是做三个单独的线性回归，因为第三个例子产生的系数非常接近于此。原因是基于这样的假设：alphas和beta是从顶层分布中提取的，因此是相关的。这意味着我们可以在组之间汇集信息，如果我们为其中一个组提供的数据非常少。

术语回归系数是“固定效应”，组别称为“随机效应”。

fit.lines.both$group <- factor(rep(1:3,each=nsamples))

# 现在执行3个单独的线性回归（每组一个）lm.mcmc.1 <- MCMCglm(y~1+x,data=df2[df2$group=="1",]

fit.lines.mcmc <- data.frame(rbind(lg.sim.mcmc <- g2 + ta=fit.lines.mcmc,alpha=.2) +

结果如下所示。每组只有一个单独的线性回归。对于蓝色和红色组，线条在大多数情况下非常适合数据，但对于只有三个数据点的绿色组，线条遍布整个地方，因为没有任何先验信息，估计数据的斜率和偏移量非常不确定。右侧的图表显示因为该模型假设所有三组的斜率和偏移都是从一个分布中得出的，所以可以合理地假设斜率是正的。我们知道这适用于这个例子，因为我们设计了数据生成过程。

R数据分析：嵌套数据分析为什么要用加随机效应？终于解释清楚了

自己已经写了好几篇关于随机效应模型的文章了,今天换个角度,从传统回归和随机效应模型的对比中模拟出两模型真正的差异,让你明白加上随机效应到底对模型会有什么样的改变. 回顾在传统的回归中,我们有如下式子 ...
浅析R语言单因素方差分析中的多重比较

浅析单因素方差分析中的多重比较本脚本侧重于单因素方差分析中多重比较方法的运用; 就不展示数据正态性及齐次性的运算了(默认都符合,一般理化数据是都符合的); 有的人喜欢用Tukey检验,但会遇到一些不 ...
技术贴 | R语言：线性回归、geom_text添加回归方程

本文由阿童木根据实践经验而整理,希望对大家有帮助. 原创微文,欢迎转发转载. 导读线性回归是利用数理统计中的回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法,运用十分广泛.回 ...
浅析R语言非参数检验的多组比较及分面与分组的图形艺术

浅析R语言多组定量资料非参数检验的多组比较及簇状柱形图显著性字母标记之分面与分组的图形艺术 R语言多组定量资料非参数检验的多组比较非参数检验的应用本流程是在刘永鑫老师提供的代码资料指导下完成先简 ...
免费Python机器学习课程一：线性回归算法

学习线性回归的概念并从头开始在python中开发完整的线性回归算法最基本的机器学习算法必须是具有单个变量的线性回归算法.如今,可用的高级机器学习算法,库和技术如此之多,以至于线性回归似乎并不重要.但 ...
SPSS与R语言分层卡方检验案例教程集锦

卡方检验-分层卡方主要内容: 1)病因研究中的混杂因素 2)混杂因素的调整和校正 3)CMH统计检验概念 4)CMH统计检验步骤 5)SPSS案例操作 6)结果解读,做出统计推断 7)CMH统计检验 ...
R语言用线性模型进行臭氧预测：加权泊松回归，普通最小二乘，加权负二项式模型，多重插补缺失值

原文链接:http://tecdat.cn/?p=11386 在这篇文章中,我将从一个基本的线性模型开始,然后尝试找到一个更合适的线性模型. 数据预处理由于空气质量数据集包含一些缺失值,因此我们将在 ...
R语言混合线性模型、多层次模型、回归模型分析学生平均成绩GPA和可视化

原文链接:http://tecdat.cn/?p=23159 混合模型在统计学领域已经存在了很长时间.例如,标准的方差分析方法可以被看作是混合模型的特殊情况.最近,混合模型有多种应用和扩展,使其能够涵 ...
R语言多项式线性模型：最大似然估计二次曲线

原文链接:http://tecdat.cn/?p=18348 "应用线性模型"中,我们打算将一种理论(线性模型理论)应用于具体案例.通常,我会介绍理论的主要观点:假设,主要结果,并 ...
R语言广义线性模型GLM、多项式回归和广义可加模型GAM预测泰坦尼克号幸存者

原文链接:http://tecdat.cn/?p=18266 本文通过R语言建立广义线性模型(GLM).多项式回归和广义可加模型(GAM)来预测谁在1912年的泰坦尼克号沉没中幸存下来. str(ti ...
R语言社区主题检测算法应用案例

原文链接:http://tecdat.cn/?p=5658 使用R检测相关主题的社区创建主题网络我通过分析抽象文本和共同作者社交网络来研究社会科学.计算机和信息学方面的出版物. 我遇到的一个问题是 ...
R语言配对检验分析案例

原文链接 :http://tecdat.cn/?p=3424 什么是检验对? 检验对的形式 (x1,x2) 出现在两种情况中: 对同一实体执行两次测量.例如,一项评估新型胰岛素疗效的临床研究将为每位患 ...
R语言线性混合效应模型实战案例

原文链接:http://tecdat.cn/?p=3015 介绍首先,请注意,围绕多层次模型的术语有很大的不一致性.例如,多层次模型本身可能被称为分层线性模型.随机效应模型.多层次模型.随机截距模型 ...
R语言单一样本t检验案例实现，练习随机数、条形图制作

今天学习R语言实现单一样本t检验过程. 某个医生检测40名从事铅作业工人的血红蛋白含量,其均数为130.83g/L,标准差为25.74g/L,试分析从事铅作业的工人血红蛋白含量是否不同于正常成年人平均 ...

R语言分层线性模型案例

原文 http://tecdat.cn/?p=3740

相关推荐