JAMA Surgery统计编辑教你分析临床数据库Tips
大数据研究背景
随着管理数据库和患者登记的出现,研究人员越来越容易获得大数据。这些数据集的大样本量使对罕见结果的研究更加容易,并提供了确定国家估算值和地区差异的潜力。因此,JAMA外科的编辑和审稿人已经看到使用大数据回答临床和政策相关问题的更多意见。但是,没有数据库完全没有偏差和测量错误。对于更大的数据,随机信号可能表示统计意义,并且由于窄的置信区间可能会错误地推断出精度。尽管许多研究都应用了许多原理,但是这些方法论问题的重要性却在庞大而复杂的数据集中得到了放大。
Study Population Considerations
对读者而言,重要的是要了解研究者是如何到获得研究人群的。通常,它来自已应用了纳入标准的较大来源人群。应当清楚地描述包括和不包括参与者的流程图,其中包括排除的人数和原因。同样,如果研究是纵向的,则应报告随访失败。这将帮助读者理解存在的任何选择偏倚。
方法和样本量注意事项
研究的目的和结果应在数据收集和分析之前确定。如果作者正在寻找两个队列之间某个变量的差异,则该差异及其置信区间也应预先计划。除了统计结果(例如回归系数,P值)外,效果估计值的差异还应报告为以患者为中心,具有临床意义且可解释的差异。不幸的是,在没有预先计划的情况下挖掘大型数据集会导致无意的,常常是错误的结论。统计显着性与样本量有关,并且如果样本量足够大,则组之间的统计显着性可能会出现很小的差异,这些差异在临床上没有意义。
在报告观察性研究结果时,作者应考虑遵循《加强流行病学观察性研究报告》(STROBE)报告指南。研究设计应清晰描述,并与数据的收集和分析方式保持一致,并且研究结果应以简洁而完整的方式呈现。应该有一些陈述说这项研究是在机构审查委员会批准或获得豁免后进行的。作者还应说明是否进行了任何中期分析以及是否存在违反协议的情况。应报告局限性以促进结论的科学完整性和有效性,数据分析应充分支持其结论。观察性研究的解释应仅导致变量之间的关联的描述,而不是因果关系的结论。
Although insufficient power would not seem to be a problem with large databases, this is simply not true. Study samples may be inadequate to answer questions about rare outcomes. Thus, regardless of the size of the database, the sample size and power analysis should have been calculated a priori. A power analysis is particularly helpful in interpreting the study findings when statistically significant effects are not found.2 If a post hoc subgroup or power analysis is performed, then this should be stated in the Methods section of the resulting article. Consideration should also be given to adjusting for multiple comparisons and/or multiple testing, especially if these were not preplanned. If there are more than 20 tests performed, then by chance, one will be statistically significant. One strategy is to employ methods of correction (eg, Bonferroni correction, Hochberg sequential procedure) when the number of tests or comparisons exceeds 20.3
Data Elements and Presentation
作者应提供足够详细的数据,以使读者可以计算和复制结果。与其简单地报告汇总数据或比例,不如让作者提供细粒度的原始数据。应当清楚地描述缺失数据对于感兴趣的变量和结果的比例。当缺失数据的比例很大(> 30%)时,作者应描述数据中的缺失模式,并应考虑用于使用多种插补等技术。除了降低功耗外,执行仅包含完整数据参与者的分析也会导致偏差。例如,如果没有保险但被认为病了的人更有可能缺少收入数据,那么分析社会经济状况对手术结局的影响可能会存在问题。
考虑到注册表数据的观察性,一个考虑是创建有向无环图,这将使读者理解潜在的混杂因素和中间体的作用。如果有大量表格,是主要研究目标的辅助表格,则应考虑提交在线补充文件。如果可以在表格或图中描绘数据,则无需在手稿文本中描述结果。饼图和条形图对文本中已说明的内容几乎没有增加,除非存在多个复杂的内容。如果要使用条形图,则还应标出95%CI条形图(有时称为晶须)。
如果使用病历摘要,则应详细记录病历审查的方法,例如描述谁是摘要,他们的背景,如何接受培训以及是否有标准化的数据收集工具。6理想情况下,病历摘要应该对研究假设和目标不了解,并且至少应有2个独立的病历摘要。还应该描述抽象者的评分者间可靠性
分析和统计考虑
由于根据大数据集的二次分析进行的研究从定义上讲是观察性的,因此,如果较少强调统计假设检验和P值的报告,则将是首选方法。根据美国统计协会,对效果评估(赔率,风险比等)和95%CI的描述比报告P值更有意义。如果要比较两个队列的连续变量(例如手术时间,住院时间),则应报告平均差异(或中位数,如果数据不是正态分布的话)及其95%CI。
提出多变量模型时,应描述模型的理论基础。模型的类型(例如,逻辑模型,线性模型,泊松模型)和基于模型的假设应该明确(例如,模型假设数据的分布呈线性或正态性)。作者应证明没有违反模型假设,从而支持模型的有效性。此外,应明确说明为什么某些预测变量以及为模型选择了哪些变量。
理想情况下,不会简单地使用具有统计意义的标准来选择具有其预测变量的模型。相反,应基于背景文献和/或生物学和临床合理性选择预测变量。如果仅基于统计显着性进行模型选择,则应将模型呈现为假设,而不是结论性的模型。
为了进行多变量Logistic回归分析的样本量计算,对于每个附加的预测变量,都应有至少有10到15名参与者具有感兴趣的结果。因此,如果研究样本中有20例死亡,则最多只能评估2个变量作为预测变量,例如多变量模型中的年龄和糖尿病。
多变量建模中的另一个考虑因素是在一组参与者之间进行关联的可能性。举例来说,如果正在评估疝修补术后的伤口感染区域差异,则可以期望外科医生的结果具有相关性。在这种情况下,应使用使用广义估计方程的聚类分析。同样,如果一项研究正在评估同一位患者随时间变化的重复测量(例如,手术后3个月和9个月的生活质量评分),则应使用混合模型方法。9最后,模型,作者应描述他们如何评估模型拟合,多重共线性和效果修正
结论
大型数据集具有许多独特的优势,包括广泛的表示能力,有效的采样设计以及数据结构中的一致性。但是,大数据集并非没有偏差和测量误差,因此重要的是要尊重和承认数据的局限性。大数据的挑战在于它需要一个经过深思熟虑的研究问题和一个透明的分析策略。所得的文章应具有足够的信息,表明已使用适当的设计和统计方法。但是,在提供的信息量和期刊空间限制之间需要保持平衡;因此,如果需要,可以将相关的方法学信息放入补充资料中。
作为JAMA Surgery的编辑,我们鼓励研究人员继续提出这些关键的研究问题,这些问题最好通过大数据集来回答。在完成修订和重新提交的请求时,我们鼓励研究人员对每个评论做出回应,无论请求的更改是否已实施。对于研究小组选择不实施的意见,包含详细的原因说明更改不适当是有帮助的。