哈哈哈,辣眼睛!一篇造假粗劣的学术论文是怎么样的?

我截取该文章的logistic回归分析结果来给诸位看一看:
请大家回答两个问题:
(1) 为什么说这篇文章的logistic回归统计结果是造假的?
(2) 如果不谈造假,只谈规范,回归分析结果有多少处表达不规范?
特别是第二个问题,是值得所有初学者思考的。
我们应如何撰写规范性的logistic回归报告?

我首先来说说规范性的问题。logistic回归是医学研究最常见的回归分析方法,凡是分类结局都可能应用logistic回归,但我发现基本上统计报告在logistic回归的规范性方面,绝大多数作者都有所取欠缺。
规范性表现在图、表和文字,主要是表和文字。上面这一段文字和表有哪些规范性问题呢?
据本人不严谨的统计,有8处需要订正,我在截图上标注了①②③④⑤⑥⑦⑧。

①当结局是二分类结局时,不叫二元logistic回归,可以说二分类logistic回归或者就是logistic回归
②一般的logistic回归根据其分析结果,很难判定那个自变量影响最大,OR值很大不代表该因素影响更大。因为不同变量度量方式不同,不好直接比较。
③这里不叫标准化偏回归系数,是OR值,或者优势比。
④如果自变量对结局有影响,一般情况下文字描述为“某某因素对营养风险的影响存在统计学意义”,或者“某某因素与英有风险存在着统计学关联”。比如,本例可以写为:肿瘤类型与营养风险存在着统计学关联(OR=0.63,95%CI 0.49-0.82,P=0.02)。千万不要因为OR值,写成“肿瘤类型将提升或减少风险多少倍”,这是错误的说法;或者说“肿瘤类型是独立影响因素”(这句话是论文结论而不是统计结果);同时,OR值,95%CI和P值应全部写在文字中。
⑤表格中,如果自变量是分类变量,特别是无序二分类或者多分类,一定要列出各个类别,标明对照组(详细看下面范本)。没有标明对照组的现象是目前回归分析结果统计表规范最大的问题。
⑥P值一般小数位保留3位为妥,且当SPSS给出P=0.000,表格应写成<0.001。
⑦logistic回归给出的是OR值,称之为优势比或者比值比,不是相对危险度;相对危险度是RR值。
⑧一般来说,统计表格中,除了P值,其它值最多保留2位小数。
下面的统计表,相对还凑合,可以参考:
这篇文章的logistic回归结果怎么是造假的呢?
这话应该应该和期刊审稿人说得!logistic回归分析各个指标是是相互联系的。其它不说,就说b值、P值和OR值。
(1)logistic回归的b值(回归系数都很小),但这篇文章的OR值都几十近百了。实在太离谱!
(2)b值和OR值关系非常直接:e^b=OR值,也就是e的b次方就是OR值。您看看,它们是对应的么?

(3) P值和OR值的置信区间是紧密联系的。一般置信区间包括1,P>0.05;置信区间不包括1,则P<0.05;而置信区间上下限越远离1,则P值越小,本篇的置信区间上限远远地离开了1,但P值却还在0.05附近,这是不可能的!
综上所述,这个结果是假的,非常粗劣的假。
在这里,我奉劝一句,诸位,请您尊重数据,尊重学术,不要造假凭你们对统计的认识,造的假一眼会被统计审稿人识破。
也希望大家能够从本推文学到logistic写作规范的要点,这非常重要!

谨以此文,写给坚持学习医学统计学与SPSS的朋友们。

更多信息

本公众号作为医学数据分析公众号,提供一些免费医学统计学学习资源下载,欢迎点击下载。
1.免费下载!统计初学者的福音!《妙趣横生统计学》视频,生动有趣的统计学!
2.医学研究样本量如何计算?原创高清教程视频来了,完全免费下载!
3.绝对值得收藏!原创高清SPSS 操作视频免费下载
4.推荐!这个流行病大神制作的公共卫生研究小工具,可以计算标准化率及置信区间
5.全网最简单的SPSS教程,160页PPT学会SPSS统计分析!免费下载!
6.【免费】精制原创11讲短视频下载!零基础者2小时掌握医学统计学基本原理
特别提醒:上述资源每天限分享和下载一个。
如果您觉得文章不错,
为我们打“call”,
点击“分享”吧
(0)

相关推荐