文献精读|基于SEER数据库的回顾性分析
欢迎来到医科研,这里是白介素2的读书笔记,跟我一起聊临床与科研的故事, 生物医学数据挖掘,R语言,TCGA、GEO数据挖掘。
文献标题
文献解读:通过应用 SEER数据库的公共数据回顾性分析,文献题为Association between Primary Tumor Location andPrognostic Survival in Synchronous Colorectal Liver Metastases after Surgical Treatment: A Retrospective Analysis of SEER Data
文章在2019年2月发表于 Journal of Cancer 杂志,影响因子3分+
摘要
从摘要可以了解到文章研究对象是结直肠癌,关键词有 PTL(原发肿瘤位置),sCRLM(同时发生结直肠癌肝转移) 应用到的数据全部来源于 SEER数据库,经过了作者的统计分析,得出了结论即 PTL是影响 sCTLM的重要预后因素。
研究方法介绍
研究数据全部来源于 SEER数据库,SEER中的数据部分免费开放,作者是应用 SEER*stat软件提取数据后进行后续分析的,我们可以看到后续的都是一些常规的分析,SPSS软件即可完成。
主要研究内容
临床病理资料
首先展示的是最终纳入的病人临床病理资料,这个表格非常常见,基本上是报告中必须的。
预后分析
接下来就到了文章的核心内容:预后分析,作者比较了 PTL左侧与右侧的生存曲线,说明预后相关,图中展示的是CSS,应用的统计学方法是 Kaplan Meier法, log-rank test检验差异,这个也是很常规的方法了。
接下来,进一步就是对临床病理参数进行一个多因素的Cox回归分析,然后得到一个表格,进一步确认 PTL是独立预后因素,而其中某些参数其实并不是独立的预后因素,然后文章的基本上到此结束了。
总结讨论
可以看到其实文章的工作量并不大,而且完全是应用公共数据进行数据挖掘,做了一些统计工作就完成了一篇3分的文章。值得我们去思考的应该是本文有什么值得学习的地方,笔者认为可能文章的亮点应该是在临床问题的提出上,其数据分析手段其实都是常规分析,工作量也不大。临床问题就决定了我们的数据筛选方式,选择哪些数据进入到后续分析,选用什么方法。另本文的一个疑点是,把大量临床参数全部去纳入进入多因素分析了,为何不限进行单因素做筛选?
关于本文的分享就到这里,希望对大家有帮助。
参考文献
Association between Primary Tumor Location andPrognostic Survival in Synchronous Colorectal Liver Metastases after Surgical Treatment: A Retrospective Analysis of SEER Data. Journal of Cancer.2019