重新分析数据,研究结论可能完全不同

36大数据

斯坦福大学医学院的研究者发现,在对以往临床研究进行的数据重分析中,大约有1/3得出了与原始研究不同的结论,而这可能会直接影响到临床决策。这项新研究于今天发表在《美国医学会期刊》(JAMA)上。

研究者称,目前大多数研究机构都不愿意共享数据,从而造成数据的二次分析非常少见。他们在过去30多年内所发表的文献中检索,最终只纳入了37项发表的二次分析研究,而其中只有5项是由与原作者无关的独立研究者进行的。

“研究者提供他们的原始数据给其他人进行分析,这确实是非常必要的。” 斯坦福预防研究中心的负责人,医学教授约翰?伊奥尼迪斯(John Ioannidis)提到,“如果不能获得原始数据,分析工作也就难以进行。现在,对已发表研究的‘信任危机’愈演愈烈,我们搞不清发表的研究结果是否真的可信并可以用于临床问题的决策。而近期对于奥司他韦是否有用的争论只是其中的冰山一角。”

奥司他韦即“达菲”,是市场上的一种抗病毒药物。虽然奥司他韦已经获得了用于治疗甲型流感及乙型流感的许可,但一些随后进行的分析和研究发现,它所带来的收益似乎并不足以盖过副作用的风险。

伊奥尼迪斯是这项研究的资深作者,他也是近期启动的斯坦福荟萃研究创新中心(Meta-Research Innovation Center,METRICS)的负责人之一。这个组织旨在评估及优化科学实践,并以此方法来推动科学研究更好地发展。在这方面,加强数据的再现以及数据共享会是非常有益的。

论文第一作者易卜拉欣(Ebrahim)和他的同事采用MEDLINE数据库来进行他们的研究。MEDLINE是一个书目数据库,它是由美国国立医学图书馆运营的,其中包括从全球约5600个期刊中引用的超过2500万条生物医学参考文献。研究者们搜索了对此前论文数据进行二次分析的英文文献。其中不包括荟萃分析,以及与原文研究目的不同的研究。

研究者们筛选了将近3000篇备选论文,并阅读了其中226篇的全文。在这当中,38篇论文被纳入此研究中,其中一篇包括两项二次分析。其中2项分析随后被剔除,因为这些论文所针对的原始研究文献无法获得。在本研究评估的37项二次分析中,有32项的论文作者与原始研究存在重叠。

研究者们发现,对于“哪些患者可以从治疗中获益”这个问题,有13篇二次分析数据的论文(35%)都得出了与原始研究不同的结论:其中3篇论文中得出的治疗适用人群不同于之前的结论,1篇文章认为更少的患者需要得到治疗,而另外9篇则指出应该让更多的患者得到治疗。

原始研究与二次分析结论不同,是由于二次分析中采用了不同于之前的统计和数据处理方法。一些二次分析的研究也发现了此前原始研究中的错误,比如纳入了本应该从研究中排除的患者。

例如,一项研究是有关食管静脉扩张合并出血治疗的,原研究发现血管硬化治疗不能预防再出血,但可以减少死亡率。而二次分析采用了不同的危险因素统计模型,总结出这项治疗确实可以预防再出血,但是它并不能减少死亡率。这个新的结论提示,这项治疗手段最好用于存在再出血风险的患者当中,而不是要首先考虑那些高死亡风险的患者。

另外一项研究中比较了贫血患者的不同治疗方案:刺激红细胞生成的药物采用固定剂量每3周给药一次,或是根据体重计算每周的剂量。在二次分析当中,研究者采用了最新更新的标准来判断何时需要开始治疗,结果推翻了原始研究的结论。

伊奥尼迪斯提到:“在二次分析的论文中,有很高比例得出了与原文不同的结果,这可能有一部分要归结为人为因素。我的意思是,在目前的科研环境中,假设进行二次分析而又得到与原文相同的结果,那么论文会很难发表。然而,将原始数据进行共享依然十分重要,这不但使研究人员可以对原论文的假设进行检验,同时也为更多的研究和数据合并分析提供了条件。”用这种方式,已知的原始数据可以用来探索新的临床问题,甚至还可以减少人们耗费在新临床研究上的精力。

伊奥尼迪斯补充道,研究者进行二次分析时得到不同的结论,这并不一定意味着原始研究存在偏倚或是造假。相反,这一结果向我们显示了进行原始数据共享的重要性,因为这样可以促进交流和共识达成,同时减少科学研究只注重“出乎意料结果”的风气。