【文献检索】新兴领域文献检索策略实战-以新型冠状病毒文献为例

01

写在前面

文献检索是一门必修课,掌握一定的检索技巧,找到自己想要的文献对于科研工作者来说尤为重要,前期我们实例讲解了如何从查全和查准的两个方面检索肺癌Meta分析的文献【Meta分析】查准与查全文献的实操分析,今天我们将为大家介绍如何检索新兴领域的文献,同时为针对疫情研究贡献一份自己的力量,我们选取新型冠状病毒作为检索词。

02

检索策略

我们在课程中提到文献检索的步骤主要包括:
针对本次的检索课题,我们的目的和需求是检索并收集关于新型冠状病毒的所有研究文献并且不对文献类型作限制,即病例报告、Letter和评述等也可纳入。而针对于检索系统和检索数据库的选择,有一点需要注意的是目前很多论文以预印本的形式进行发表需要明确这一部分内容是否需要检索,与医学相关的预印平台包括:
  • biorxiv是一个免费的在线存档和分发(论文的)服务(平台),用于生命科学领域中未发布的预印本的预印。它由冷泉港实验室经营,冷泉港实验室是一个非营利的研究和教育机构。通过在Biorxiv上发布预印本,作者可以立即向科学界提供他们的研究结果,并在提交给期刊之前收到草稿手稿的反馈。
  • medRxiv是由美国冷泉港实验室、BMJ和耶鲁大学联合运营的免费的、非营利性服务平台。所有医学研究论文初始版本都可以以预印本方式在该平台免费发布,从而能实现科研成果及时地传播,并获得及时的反馈用以改进研究
而针对于文献数据库的选择,虽然我们在课程中介绍过四大数据库,但是针对本次检索目的而言,由于PubMed是目前生物医学领域最权威也是最全面的数据库,所以仅检索PubMed足以。
当然以上仅针对于不能使用谷歌学术而言,如果能使用谷歌学术那么上述数据库根本不需要选择直接使用谷歌学术搜索检索词就可以了
那么如何确定检索词呢?
我们在课程中为大家介绍过常规确定检索词的技巧和方法,
而针对新型冠状病毒这一新领域而言,肯定不存在系统评价或者PubMed主题词(虽然有冠状病毒的主题词,但是目前发表的文献还未进行主题词归类,无法被检索到),因此确定检索词的主要途径依靠知识积累。
新型冠状病毒的表述从刚开始的2019-nCoV到卫健委命名的NCP,再到最近出现的病毒名SARS-COV-2和病名COVID-19,随着命名的改变,文献的表述也会同步发生更新,因此为了避免遗漏文献,这些检索词在检索时都应该被包括。同时在检索时除了缩写之外,还应考虑全称以及美式英语和中式英语的差异,另外19或者-2在检索时是否需要添加确保查准也需要平衡。
因此我们初步确定检索词:2019-nCoV、2019 novel coronavirus、Novel coronavirus pneumonia、SARS-COV-2、Severe acute respiratory syndrome coronavirus 2、COVID-19、Coronavirus disease 2019,并通过OR连接,检索途径可直接选择All Field检索。
确定好检索方案以后就是在数据库中实施检索调整检索策略,我们以PubMed数据库为例依次检索,遇到的问题与思考如下:
以2019-CoV进行检索
1. 在结果展示界面出现了新的表述方式2019-new coronavirus,通过查询发现这两篇文献目前都能通过2019-nCov检索到,因此这时有两种考虑,1.这种表达方式不规范,后续不会再出现,同时由于这个词的检索结果已包含在2019-CoV中,增加这个检索词对于结果没有影响所以不进行添加,2. 这种表达方式在后续文献中可能会出现同时目前的检索策略检索不到,需要以这个词作为补充,可以考虑将这个词添加到检索策略中。由于检索结果数目较小影响不大,为了保证查全率,个人倾向于进行添加。
2. 在检索结果中2019-nCoV并没有显示为2019 novel coronavirus,而直接忽略了年份,针对这样的表述则需要将我们的第二个检索词简化为novel coronavirus,那么有什么影响呢?

可以看到文献数量发生了明显的变化,同时包含了很多2020年以前的文献,说明这并不是特指这一次的新型冠状病毒,这时则有两种情况,1.如果某一种病是特定时间点出现的,则可以通过过滤发表年份的方法实现文献的查准平衡,例如本次的检索可以将检索限定在2020年,2.如果对于发表年份不确定,则这个检索词会无端引入不相关的结果,不能够作为检索词。因此我们的检索词修改为novel coronavirus,那么2019 novel coronavirus、Novel coronavirus pneumonia则不需要了
以novel coronavirus进行检索
进行词组检索时需要注意加入双引号特指限定检索,避免出现由于All Field进行自动匹配出现误检索的情况【文献检索】PubMed截词检索结果更少,到底是谁在搞鬼?
以SARS-COV-2、COVID 19进行检索比较简单不再详述,需要注意的是以Severe acute respiratory syndrome coronavirus 2、Coronavirus disease 2019检索,通过比较我们发现该检索词并未带来检索结果的进展,应该予以舍去。
因此最终的检索策略为
2019-nCoV OR novel coronavirus、SARS-COV-2、COVID-19并将年份限定为2020。
而检索结果也比我们单纯使用2019-nCoV多了71篇,有兴趣的同学可以去看下这71篇是否都符合我们的标准。
预印平台的搜索比较简单,直接在medRxiv检索两个平台,可以看到medRxiv和bioRxiv发表了3523篇,但是由于很多内容不相关,我们采用相关度排序,并统计不相关的文献之前的数量,发现一共有120篇左右。
追踪前沿热点的研究论文是比较好接收的,短短两个月时间,目前论文已经有200余篇,也希望在众多学术研究的攻克下,疫情能够早日结束并不再重来。
本文针对检索思路做了一一说明和梳理,不当之处还请各位批评指正。
(0)

相关推荐