R数据分析：混合效应模型的可视化解释，再不懂就真没办法

2024-08-03 05:30:39

好多同学咨询我混合效应模型，有些问题自己需要讲很多遍，想想就再开一贴，争取这一篇文章给大家写清楚。

混合效应模型名字很多，Hierarchical Modeling, also known as Mixed Effects Modeling，有叫分层模型的，分层回归的，随机模型的等等，你要知道它都是指的是一个东西。

这个东西就是用来分析嵌套数据的！---------nested data

嵌套数据

这个时候有人就问，啥是嵌套数据啊？

These are instances in which each observation is a member of a group, and you believe that group membership has an important effect on your outcome of interest.

嵌套数据就是套着的数据，你就这么理解，就是比如说我要分析学生学习对收入的影响，我调查了好多学校，我是不是可以很有理由的认为学校水平上的特征也会影响学生收入？

这个时候学生就是嵌套在学校水平上的。

再来一个例子，比如我要调查焦虑和抑郁的关系，我调查了30个人，每个人调查了5次，我得到了150个数据，那么这些数据是不是嵌套在个人水平上的？

理解没？

还没有，好吧，继续

我们收集的数据先做个散点图：

我们假设上面的数据是员工的收入数据，横轴是工作年限，纵轴是收入，我调查了整个公司的员工，员工分布在不同部门吧，我说部门的不同会影响员工收入没问题吧，上图中颜色不同代表部门不同。

其实数据就是嵌套的，它是这样的：

每个人嵌套在不同部门种，好，现在你要看收入和工作时间的关系，你如果不考虑嵌套，会怎么做？

是不是你直接做个以工作时间为自变量，以收入为因变量的回归？

做出来就长这样：

看着还行？

错！

你这个系数根本就不准，你没有考虑嵌套，没有考虑部门间也就是更高水平的变异!

混合效应模型

那么，告诉我到底怎么做嘛，

接着看，你肯定听过随机斜率和随机截距。

我们一个个来看，我刚刚说了你没有考虑更高水平的变异，那么这个变异情况有什么可能，你自己想嘛，是不是有可能部门间的起薪不一样？有可能部门间薪资增长率不一样？或者两个都不一样嘛。

那么随机截距就是描述不同部门起薪的，加上随机截距就意味着我们认为不同的部门起薪不一样，可以变化，这个时候就是有随机截距的混合效应模型：

在上面的描述中，个体水平上斜率是一定的，是固定效应，部门水平上可以有不同的起薪，是随机效应。

再看随机斜率，

就是说，有可能员工起薪都一样只是薪资增长斜率在不同部门不一样，要拟合这样一个混合效应模型我们就要给模型的高水平，也就是部门水平加上随机斜率：

此时我们的模型可以拟合不同部门的斜率，这个叫做随机斜率模型。此时我们认为，个人薪资受到个人水平上的工作年限的影响和不同部门薪资增长的影响，工作年限是主效应，部门薪资增长是随机效应。

但是我们看到，对于我们这个例子来说，只有随机斜率似乎不太理想。

继续看，

随机斜率+随机截距

也就是说更合理的情况就是每个部门的起薪和每个部门的薪资增长都是不一样的，这种情况就是随机截距+随机斜率：

这种情况下，我们就认为每个人的薪资受到部门起薪的影响，还受到部门薪资增长的影响，此时工作年限是主效应，部门起薪，部门薪资增长都是随机效应。

如何选择

你明白上面三种模型后，又出现问题了

那我咋知道我到底该加随机截距还是随机斜率啊

问的好，此时要么你就更具理论经验，比如我就确定部门起薪就是一样的，那我就只加随机斜率；还有你可以一个一个试错，因为模型拟合出来都有拟合优度指数，你去看哪个模型的拟合优度最好你就选哪个。

小结

用SPSS估计HLM多层（层次）线性模型模型

原文:http://tecdat.cn/?p=3230 作为第一步,从一个不包含协变量的空模型开始. 每所学校的截距,β 0J,然后设置为平均,γ 00,和随机误差ü 0J. 将(2)代入(1)产生 ...
R语言线性混合效应模型（固定效应&随机效应）和交互可视化3案例

原文链接:http://tecdat.cn/?p=23050 在本文中,我们将用R语言对数据进行线性混合效应模型的拟合,然后可视化你的结果. 线性混合效应模型是在有随机效应时使用的,随机效应发生在对随 ...
R语言混合线性模型、多层次模型、回归模型分析学生平均成绩GPA和可视化

原文链接:http://tecdat.cn/?p=23159 混合模型在统计学领域已经存在了很长时间.例如,标准的方差分析方法可以被看作是混合模型的特殊情况.最近,混合模型有多种应用和扩展,使其能够涵 ...
混合OLS模型、固定效应模型、随机效应模型的区别是什么

混合OLS模型.固定效应模型.随机效应模型的区别是什么关键词:混合ols 固定效应,固定效应还是混合ols,stata随机效应模型,面板数据随机效应模型混合OLS模型.固定效应模型.随机效应模型的 ...
R语言用线性混合效应（多水平/层次/嵌套）模型分析声调高低与礼貌态度的关系

原文链接:http://tecdat.cn/?p=23681 定义线性混合效应模型与我们已经知道的线性模型有什么不同? 线性混合模型(有时被称为 "多层次模型 "或 " ...
matlab用马尔可夫链蒙特卡罗 (MCMC) 的Logistic逻辑回归模型分析汽车实验数据

原文链接:http://tecdat.cn/?p=24103 此示例说明如何使用逻辑回归模型进行贝叶斯推断. 统计推断通常基于最大似然估计 (MLE).MLE 选择能够使数据似然最大化的参数, ...
R语言分层线性模型案例

原文 http://tecdat.cn/?p=3740 有许多分层数据的例子.例如,地理数据通常按层次分组,可能是全球数据,然后按国家和地区分组 .一个生物学的例子是按物种分组的动物或植物的属性,或者 ...
R语言混合效应逻辑回归（mixed effects logistic）模型分析肺癌数据

原文链接:http://tecdat.cn/?p=22302 混合效应逻辑回归用于建立二元结果变量的模型,其中,当数据被分组或同时存在固定和随机效应时,结果的对数几率被建模为预测变量的线性组合. 混合 ...
R数据分析：用lme4包拟合线性和非线性混合效应模型

快一个月没更新文章啦,今天收到好几个粉丝的催更私信,好的吧,实在对不住大家期待的眼神,看样子不能再拖啦,想想写啥好呢,大家咨询比较多的,混合模型算一个,今天就继续给大家写写混合模型如何做吧. 混合模型 ...
R语言建立和可视化混合效应模型mixed effect model

原文链接:http://tecdat.cn/?p=20631 我们已经学习了如何处理混合效应模型.本文的重点是如何建立和_可视化_ 混合效应模型的结果. 设置本文使用数据集,用于探索草食动物种群对珊 ...
R数据分析：混合效应模型实例

上篇文章有写多水平模型,这篇文章接着写,肯定好多人没搞懂,因为我自己也迷迷糊糊的,哈哈,很尴尬. 传统的回归需要满足的假设之一就是测量之间是相互独立的,然而有一种实验设计叫做重复测量设计,或者叫做被试 ...
R语言如何用潜类别混合效应模型（LCMM）分析抑郁症状

原文链接:http://tecdat.cn/?p=22206 模型背景每一个动态现象都可以用一个潜过程(Λ(t)来描述,这个潜过程在连续的时间t内演化.当对重复测量的标志变量进行建模时,我们通常不会 ...
R语言线性混合效应模型实战案例

原文链接:http://tecdat.cn/?p=3015 介绍首先,请注意,围绕多层次模型的术语有很大的不一致性.例如,多层次模型本身可能被称为分层线性模型.随机效应模型.多层次模型.随机截距模型 ...
R语言LME4混合效应模型研究教师的受欢迎程度

原文链接:http://tecdat.cn/?p=11724 介绍本教程对多层回归模型进行了基本介绍 . 本教程期望: 多层回归模型的基础知识 . R中编码的基础知识. 安装R软件包 lme4,和 ...
R数据分析：列线图的做法及解释

我们经常做的研究就是建立预测模型,我常常问自己,建的模型有啥实际应用价值? 直到我了解到列线图这个东西,才知道模型可以通过列线图转化为实际的应用工具. 列线图也叫Nomogram,中文常称为诺莫图: ...

R数据分析：混合效应模型的可视化解释，再不懂就真没办法

嵌套数据

混合效应模型

随机斜率+随机截距

如何选择

小结

相关推荐