SAS系列36:Logistic回归实战(一)

导读

上一期Logistic回归的数学模型、基本原理、分析步骤。今天就开始介绍Logistic回归的SAS实现。

三、Logistic回归模型的SAS实现

(一)Logistic回归模型的SAS语句
Logistic回归模型可以通过PROC LOGISTIC和PROC PHREG过程步实现,其中PROC PHREG过程步是基于COX比例危险模型对生存数据进行回归分析,也可以用于配对设计的条件Logistic回归分析,因此,此过程步简单介绍与Logistic回归分析相关的主要语句。两个过程步中与Logistic模型拟合相关的语句详见表11—4。

表11-4 PROC LOGISTIC和PROC PHREG过程步常用语句介绍

(二)Logistic回归分析的实例
1. 非条件Logistic回归模型
为了研究少年儿童肥胖症与胆固醇、甘油三酯等因素之间的关系,在一次现况研究中对某地7~18岁年龄段的1352名中小学生的身体做了有关检查(数据来源于孙振球主编《医学统计学》第四版)。具体赋值详见表11-5

表11-5 数据中各变量命名及赋值

(1)单因素Logistic回归模型初步分析各因素与肥胖症的关系
为了节省篇幅,单因素分析结果仅呈现模型参数估计与OR值估计结果。
PROCLOGISTICDATA=FAT DES;   MODEL FAT=GENDER;   WEIGHT FREQ;RUN; 
PROCLOGISTICDATA=FAT DES;   CLASS AGE (PARAM=REFERENCE REF=FIRST);   MODEL FAT=AGE;   WEIGHT FREQ;RUN;
PROCLOGISTICDATA=FAT DES;   MODEL FAT=CHOL;   WEIGHT FREQ;RUN;
PROCLOGISTICDATA=FAT DES; MODEL FAT=TG;   WEIGHT FREQ;RUN;

图11-13 性别回归模型的参数估计结果

图11-14 年龄回归模型的参数估计结果

图11-15 胆固醇回归模型的参数估计结果

图11-16 甘油三酯回归模型的参数估计结果

单因素Logistic回归模型对各个自变量的初步分析结果显示:4个自变量均有统计学意义。因此在进行多因素分析时考虑将4个自变量纳入到模型中。
(2)多因素Logistic回归模型
PROCLOGISTICDATA=FAT;   CLASS AGE(PARAM=REFERENCE REF=FIRST);   MODEL FAT=GENDER AGE CHOL TG/ AGGREGATESCALE=DEVIANCE RSQ;   WEIGHT FREQ;RUN;

图11-17 4个自变量回归模型拟合优度结果

图11-18 4个自变量回归模型最大似然估计结果

图11-19 4个自变量回归模型OR估计结果

图11-17模型拟合优度结果显示:模型拟合较好;图11-18最大似然估计结果显示:自变量胆固醇和性别无统计学意义,但自变量性别的P=0.0582接近于0.05,考虑先剔除胆固醇后再拟合模型。另外:应用PROC REG过程步对模型的多重共线性进行了共线性诊断,自变量间不存在多重共线性问题(具体结果此处省略)。
PROCLOGISTICDATA=FAT DES;   CLASS AGE(PARAM=REFERENCE REF=FIRST);   MODEL FAT=GENDER TG /AGGREGATESCALE=DEVIANCE RSQ;   WEIGHT FREQ;RUN;

图11-20 3个自变量回归模型拟合优度结果

图11-21 3个自变量回归模型最大似然估计结果

图11-22 3个自变量回归模型OR估计结果

剔除胆固醇后的模型拟合优度结果显示:模型拟合较好。参数估计结果显示:性别和年龄无统计学意义,但是性别的P=0.1048;10岁年龄组与7岁年龄组比较其P值=0.0529,P值均不太大。在尝试剔除自变量性别保留年龄后模型虽有意义但其自变量均无统计学意义;尝试剔除年龄保留性别后模型有意义,参数估计均有统计学意义,但其模型拟合优度与其他模型比较并不理想(详见表11-6),MODEL2的拟合优度指标最小。综上分析:选用自变量为性别、年龄和甘油三酯的模型。目前数据有限不能进一步的分析,如果数据允许可以对自变量年龄考虑重新分组,或者还有重要的自变量未纳入模型中。
(一)Logistic回归的数学模型及其基本原理

上两期介绍的多元线性回归模型在定量数据分析中是最常用的多因素统计分析方法,但是当因变量是分类变量时,多元线性回归就不适用了。我们先

二、Logistic回归分析的步骤

(一)Logistic回归模型分析的参数估计

(1)参数估计

在Logistic回归分析中,回归系数的估计方法通常是最大似然法,最大似

整理不易,欢迎点亮再看哦!

参考文献:

[1] 高惠璇. SAS系统SAS/STAT软件使用手册[M]. 北京:中国统计出版社, 1997.

[2] 孙振球, 徐勇勇. 医学统计学[M].北京:人民卫生出版社, 2014.

[3] 张家放. 医用多元统计方法[M]. 武汉:华中科技大学出版社, 2002.

[4] 武松. SPSS实战与统计思维[M]. 北京:清华大学出版社, 2017.

[5]冯国双, 刘德平. 医学研究中的logistic回归分析及SAS实现. 北京: 北京大学医学出版社,2011.

[6]缪佳, 译. Logistic回归中的交互效应. 上海: 格致出版社, 2014.

[6]赵亮员, 译. 定序因变量的Logistic回归模型. 上海: 格致出版社, 2018.

.

SAS系列推文

【赠人玫瑰,手留余香】

----------------------------------------------

SAS系列35:Logistic回归模型理论

SAS系列34:多元线性回归SAS实践

SAS系列33:SAS高级统计(二)多元线性回归

SAS系列32:SAS高级统计(一)

SAS系列31:SAS宏语言(四)

SAS系列30:SAS宏语言(三)

SAS系列29:SAS宏语言(二)

SAS系列28:SAS宏语言(一)

SAS系列27:线性回归

SAS系列26:双变量数据假设检验

SAS系列25:双向有序列联表检验

SAS系列24:单向有序列联表资料的假设检验

SAS系列23:列联表资料假设检验方法

SAS系列22:定性数据假设检验

SAS系列21:SAS统计推断(六)

SAS系列20:SAS统计推断(五)

SAS系列19:SAS统计推断(四)

SAS系列18:SAS统计推断(三)

SAS系列17:SAS统计推断(二)

SAS系列16:SAS统计推断(一)

SAS系列15:SAS数据可视化结果输出

SAS系列14:SAS数据可视化(三)

SAS系列13:SAS数据可视化(二)

SAS系列12:SAS数据可视化(一)

SAS系列11:SAS基础统计过程(三)

SAS系列10:SAS基础统计过程(二)

SAS系列09:SAS 基础统计计算过程

SAS系列08:SAS函数

SAS系列07:SAS数据整理(三)

SAS系列06:SAS数据整理(二)

SAS系列05:SAS数据整理(一)

SAS系列04:SAS数据导入

SAS系列03:SAS入门(二)之SAS编程语言基础

SAS系列02:SAS入门(一)

SAS系列01:统计分析航空母舰-SAS简介

----------------------------------------------

精鼎特邀

(0)

相关推荐

  • 心塞!样本量不够多,还能开展logistic回归吗?

    对于样本量问题,头大的事情不是一箩筐.有人问我: "郑老师,论文审稿人认为,我的文章样本量只有56,自变量有15个,做logistic回归的结果不行" 灵魂拷问:样本量过小,就不能 ...

  • SAS系列35:Logistic回归模型理论

    导读 上一期介绍了多元线性回归分析的SAS实现,本打算介绍多元线性相关分析,有读者留言期待Logistic回归,那我们今天就开始介绍Logistic回归的数学模型.基本原理.分析步骤. 一.Logis ...

  • SAS系列39:Logistic回归的交互效应(二)

    导读     在这个复杂的世界,因素与因素之间往往不是单独的,割裂的对因变量发生着作用,往往变量间发生着相互掺杂的关系,我们称之为交互作用.今天我们继续介绍Logistic回归的交互效应. 五.Log ...

  • SAS系列38:Logistic回归的交互效应(一)

    导读       最近阅读了一本<Logistic回归中的交互效应>的书,觉得有必要讲一讲Logistic回归的交互效应.上一期介绍了Logistic回归分析的SAS实现,今天我们继续介绍 ...

  • SAS系列37:Logistic回归模型与SAS实现(二)

    导读 上一期介绍了非条件Logistic回归的SAS实现,今天介绍条件Logistic回归的SAS实现. 三.Logistic回归模型的SAS实现 (一)Logistic回归模型的SAS语句     ...

  • R语言统计系列第11篇-Logistic回归

    [科研绘图点我][付费精品合集][SEER点我] 今天是各类统计方法R语言实现的第11期,我们主要介绍Logistic回归.Logistic回归属于广义线性回归,因此我们从广义线性回归讲起. 广义线性 ...

  • 轻教具系列|36种交通工具认知与分类操作板

    袋鼠姐姐说 写在前面的话 本期的轻教具在群内多次分享过,但后来不断有人问起,又有很多朋友加入,所以今天特别发布,链接永久有效.不过,这一期的教具体量并不"轻",虽然目标聚焦,但内容 ...

  • 逻辑回归实战应用——铸造缺陷改善案例解析

    [编者按]这是一个真实的质量改善案例.要改善的指标是废品率,数据是离散型的,而且不良现象有很多种,有10个因子可能会对废品率有影响,其中包括6个连续型因子和4个离散型因子.如何通过对这些因子的取值进行 ...

  • Logistic 回归简明教程 | 30天学会医学统计与SPSS公益课(Day20)

    30天学会医学统计与SPSS 本课程是高校医学统计学教授的公益.免费公开课!如假包换!我将每天推送视频和文字教程,讲授基于医学数据的各种统计分析策略.如果你能跟得上节奏,我相信在一个月后,您将会掌握医 ...

  • R语言逻辑回归(Logistic回归)模型分类预测病人冠心病风险

    原文链接:http://tecdat.cn/?p=22410 本文的目的是完成一个逻辑回归分析.使你对分析步骤和思维过程有一个基本概念. library(tidyverse) library(broo ...