GRADE分级:临床研究必经之路

临床研究中,寻找证据是医生头痛的事儿!其实,从我们前期介绍的RCT、CCT,或观察性研究等原始研究,以及meta分析等二次研究中得出的结果和结论就是证据。但是,这些临床证据从小规模实验室研究或病例报告到设计严谨、偏倚最小的大规模临床研究,不一而足。在临床应用中,根据低质量证据作出的推荐可能并不符合患者的最佳利益,所以我们有必要了解某一推荐是强还是弱,以便我们可以确信还是不信这一推荐。对于证据质量评价,今天,小编就给大家介绍下GRADE系统。

GRADE(Grade of Recommendations Assessment,Development and Evaluation)系统,即推荐分级的评估、制定与评价。2004年正式推出,是当前对研究证据进行分类分级的国际最高水平,现已被WHO 和Cochrane 协作网等58个国际组织、协会采纳。GRADE也适用于制作系统评价、卫生技术评估及指南。世界卫生组织已经采用GRADE制定甲型流感H1N1指南。

我们为什么要用GRADE分级呢?它到底有什么优势呢?

  • 由一个具有广泛代表性的国际指南制定小组制定

  • 明确定义了证据质量和推荐强度

  • 清楚评价了不同治疗方案的重要结局

  • 对不同级别证据的升级与降级有明确、综合的标准

  • 从证据到推荐全过程透明

  • 明确考虑患者价值观和意愿

  • 就推荐意见的强弱,分别从临床医生、患者、政策制定者角度做了明确实用的诠释

  • 适用于制作系统评价、卫生技术评估及指南

评价证据,并不是简单的基于RCT就是高质量证据,观察性研究就是低质量证据。GRADE把证据分为四个等级,并根据研究的特征,对其证据等级进行调整。先默认RCT研究证据等级高,观察性研究证据等级低,然后在RCT研究中需找降低其质量的因素,在观察性研究中寻找增加其证据质量的因素,最后做出综合判断。如下图:

推荐强度涉及患者、临床医生、政策制定者三方面,分强推荐和弱推荐两个等级。基于可得证据,如果临床医生非常确定获益大于,或小于风险和负担,他们则为强推荐;基于可得的证据,如果临床医生认为获益、风险和负担相当平衡,或获益、风险的程度存在明显的不确定,他们则为弱推荐。具体见下图:

其实,GRADE分级方法也始于研究设计,影响证据质量的因素有降低和增加之分。

可能降低证据质量的因素:

  • 研究的局限性:

-对于各种研究类型的局限性,我们已在前期介绍,这里就不详述,建议大家再回顾下;

-对研究局限性的评价,与原始研究的质量评价一致,大家可参考LinkLab 12月6日文章“一文搞定Meta分析”,已详细介绍各研究类型的质量评价方法。

  • 结果不一致:

评价结果不一致性主要通过以下四个标准:

-点估计值在不同研究间变异很大

-各研究的可信区间很窄或无重叠

-异质性检验p值很小

-I2值很大

  • 间接性

-人群差异

-干预措施差异

-结果测量差异

-间接证据比较

  • 不准确性

  • 发表偏倚

-推荐采用漏斗图判定发表偏倚

增加证据质量的因素:

  • 效应量大

  • 可能的混杂因素会改变疗效

  • 剂量-效应关系

例如:观察性研究,如队列研究和病例对照研究,一开始被认为低质量,但若干预措施疗效显著(如髋关节置换术治疗严重的髋关节炎),证据显示存在剂量-效应关系,存在各种可能导致疗效显著性降低的偏倚时,观察性研究证据的等级将提高。

(0)

相关推荐