如何解读临床研究的阴性研究结果?

如题所述

在科学的道路上,我们并非总能得到预期的结果,失望与沮丧也时常来扰。本来满心欢喜地期待某项药物试验可以得出有效的研究结果,然而经过统计分析后却发现P>0.05,心情瞬间低落。这就是我们通常所说的阴性结果。

可能导致假阴性结果的原因

当得到一个阴性结果时,研究者的第一反应通常是:哪里出错了?治疗措施是否真的无效?其实,主要结局的P值大于0.05时,试验结果是否一定无意义,还需要根据具体情况来区别对待。除试验结果确为阴性的情况以外,还有两种与研究本身相关的情况可能导致出现阴性结果。

研究的设计或实施存在问题

研究的设计和实施过程对结局的影响至关重要,如果不合理,很有可能造成药物的真实疗效被稀释、甚至被完全掩盖。研究对象的纳入标准不合适、治疗方案不合理(如剂量过低或过高)、患者依从性较差、主要结局指标定义不合理或不准确等,这些都可能造成主要结局的阴性结果(案例1)。

案例1

CHAMPION PLATFORM试验比较了坎格雷洛和氯吡格雷对于接受经皮冠状动脉介入治疗(PCI)患者术后缺血性并发症的预防效果,主要结局为48小时内死亡、心肌梗死或因缺血行血管重建。中期分析显示两组差异无统计学意义,试验因无效而被提前终止。

然而,对于生物标志物阳性的急性冠脉综合征患者,围手术期心肌梗死的定义并不能有效识别PCI后不久发生的心肌梗死。因此,在随后的CHAMPION PHOENIX试验中,研究者将主要结局事件定义为48小时内死亡、心肌梗死、支架内血栓形成或缺血导致的血管重建。结果坎格雷洛组的主要结局事件发生率下降了22%(风险比0.78,P = 0.005),最终促成了美国与欧洲药品管理机构批准该药物的临床使用。

样本量不足

研究者通常基于前人研究结果进行样本量估计,所以对于阴性结果,首先要看其是否有样本量估计依据,并根据实际结果计算研究的把握度(又称为检验效能)是否足够。如果未达到足够的把握度,则该结果可能只是假阴性结果,将样本量增至足够大时,可能会出现阳性结果。

一般来说,当试验样本量太小而不能检验出治疗效果时,宜将结果描述为不确定而不是否定。此时,可以通过招募更多高风险患者、延长随访时间、定义发生数较多的结局(如使用复合结局指标来代替单一结局指标、使用中间结局指标代替临床硬终点结局等),或将以上几种方式组合,来满足达到把握度所需要的样本量。当然,还需要考虑大型试验发现的有统计学意义的疗效是否真的有临床意义。

研究主要结局阴性、亚组分析阳性的情况

我们经常会看到一些研究的主要结局显示为阴性,但亚组分析却为阳性。例如,在所有入组的研究对象中,干预措施较对照措施统计学并无显著性差异,但干预措施在某些亚组人群(如某种基因突变、某个种族、某些病情较重、伴有某些并发症)中却呈现显著效果。

亚组分析真的有化腐朽为神奇的功能吗?一种可能的情况是亚组分析的结果为真阳性,即干预措施并非适用于所有人,确实只对具有某些特征的人有效;但更多的情况是亚组分析的结果为假阳性,由于亚组分析通常经过多次比较,从而增大了Ⅰ型错误(即假阳性错误)概率。因此,即使亚组分析中出现了阳性结果,这些发现仍然仅能用于提出假设,而不能作为确证性结论。

利用亚组分析在一项结果为阴性的试验中发现某一阳性结果,并在随后试验中得到证实,虽然并不多见,但还是会发生的(案例2)。

案例2

SYNTAX研究比较了冠状动脉旁路移植术(CABG)和PCI对于冠状动脉三支病变和(或)左主干病变患者的治疗效果,结果显示两组全因死亡率和卒中发生率无显著差异;然而亚组分析发现,对于左主干病变亚组(解剖结构低至中度复杂的患者)而言,PCI似乎可以成为CABG的替代方法,且疗效可能更佳。

在SYNTAX试验亚组分析发现的线索的基础上,研究者设计了EXCEL试验进行验证,结果显示PCI组患者术后3年主要结局(全因死亡率、卒中或心肌梗死的复合终点)的发生率与CABG组的发生率相当(非劣效性P =0.02),且PCI组次要结局(术后30天围手术期死亡、卒中或心肌梗死的复合终点)发生率更低。据此,研究者得出结论:对于上述特征的患者,PCI可作为CABG的首选替代方案。

正确运用荟萃分析

在伦理和经济层面都不允许开展大规模临床试验的情况下,系统综述和荟萃分析不失为一种较好的方法。荟萃分析可以通过对符合纳入标准原始研究的合并分析来回答干预措施是否有效,大大增加样本量,因而增加了研究的把握度,也增加了结果的精确性和稳定性。

但需要注意的是,在未达到足够样本量的情况下,不断更新原始研究而进行反复、多次统计学检验同样会增加Ⅰ类错误的风险,即假阳性概率明显升高,造成疗效的夸大;而对于已经有确切疗效的干预措施,或已被证实无效的干预措施,如不及时停止试验则会造成医疗资源的浪费,也不符合伦理学要求。

为解决此类问题,波格(Pogue)等首次提出将序贯分析的方法引入荟萃分析,即试验序贯分析法(Trial Sequential Analysis,TSA)。该方法一方面保证了在不增加Ⅰ类错误的前提下,可以更早得出确切的结论;另一方面提供了接受无效假设的终止标准,可以告诉我们某项干预措施究竟是确实无效(evidence of absence effect),还是因把握度不够尚不能得出确切结论(absence of evidence)。

总之,当主要结局为阴性结果时,研究者需要谨慎解读。《新英格兰医学杂志》也于2016年发表了一篇综述(The Primary Outcome Fails-What Next?),列举了试验的主要结局为阴性时,应该考虑的12个问题,希望可以对大家有所启发。

■链接 主要结局为阴性时,应考虑的12个问题

是否有潜在获益的迹象?

把握度是否足够?

主要结局的定义是否合理、准确?

研究对象是否合适?

治疗方案是否合理?

研究实施过程中有无缺陷?

是否可以得到非劣效的结论?

亚组分析的结果是否阳性?

次要结局是否阳性?

选用其他的分析方法是否有帮助?

是否存在其他外部阳性的证据?

是否有强有力的生物学理论支持干预措施是有效的?
温馨提示:答案为网友推荐,仅供参考
相似回答