大样本·随机.双盲.分组测试科学方法的由来

如题所述

第1个回答  2022-07-02
你也许听说过,一种新药能不能用于临床投入市场,有一套完整的实验方法,叫做“大样本随机双盲分组对照试验”,这是现代医学判断疗效的“金标准”。

这套方法是鉴别真伪对错的利器,不但医学用,各学科也都在用,甚至刑侦上的测谎,揭穿伪气功骗子之类,也都可以用,我后面会讲到。

其实古代西方医学也跟古代中医一样,主要靠经验,甚至免不了瞎猜胡扯,比如西方的所谓“放血疗法”就是胡扯,扯了千百年,从华盛顿到斯大林,都是放血给放死的。自从有了那套分组对照实验的“金标准”,才告别了胡扯,产生了真正的现代医学。那么这套科学的好方法是谁发明的?怎么来的?

一、分组对照实验

它最初源自航海中的坏血病,这种病从牙龈出血直到全身溃烂而死。现在我们都知道,这是因为水手们长期漂流在海上,没有新鲜蔬菜水果,缺乏维生素C导致的,但当时不知道,只好胡乱实验,有喝稀硫酸的,有喝海水的,但基本都没用,有时碰巧好了,但闹不清究竟是喝什么好的。几百年过去,一直找不到真正合适的药。

到了1747年,英国军舰上有一位医生林德,忽然灵机一动,想出一个“分组对照实验”的方法,把12位生病的海员分成6组,每组两人,分别用不同的验方,比如第一组吃橘子、柠檬,第二组喝稀硫酸,第三组喝海水……结果六天之后奇迹发生了,第一组吃橘子、柠檬的好了,其他组都没好,反复试都是这个结果,于是真正对症的药找到了,就是吃水果。

虽然因为当时科学还不够发达,背后的病因(缺乏维生素C)并不知道,但确切有效的疗法和药有了,这就够了。这就是“分组对照实验”的神力。

林德发明的科学方法几经周折,直到林德去世后才最终被承认,坏血病从此在英国海军中被消灭,英国也因此成为强大的“日不落帝国”,人们彻底信服了林德的“分组对照实验”。

那个稀里糊涂的“放血疗法”最终也靠“分组对照实验”,被证明不但毫无作用,而且治死的病人比不放血多得多。于是人们以为,今后再遇到各种真伪闹不清的疗法,都可靠此法鉴别,其实以后的历史证明,只靠简单的“分组对照实验”还远远不够,且往下看。

二、自愈效应

实际上有许多病不治自己也能好,比如感冒,吃药半个月才好,不吃药两周也好了。这就是自愈,是生物的自我保护机制。

有一种病叫“急性腮腺炎”,腮帮子肿得像猪脸一样,中国过去民间疗法是,在腮帮子上画虎或写虎字,取“虎能食猪”之义,过几天果然病好了,于是人们普遍相信画虎有效。实际上这是一种可以自愈的病,不画虎照样好。

所以,如果要实验一种新药是否有效,必须要在分组中增加一个“对照组”,即不治疗,看看病能否自愈。如果对照组也好了,说明这个病可以自愈,跟吃你那种新药没什么关系。如果对照组好不了,而吃药的那组好了,证明这个病不能自愈,只有吃药才有效。

三、安慰剂效应

二战中,有一次美军伤员太多,战地医疗的麻醉药用完了,伤员们一个个喊痛不止,军医毕阙在无奈的情况下,只好暂时采用骗术,以生理盐水冒充麻醉剂给伤员注射。没想到凡是注射了盐水的伤员全都不疼了,不叫唤了,毕阙惊得目瞪口呆。

战后毕阙经过研究,终于弄清,这种骗术其实就是心理暗示,但真有效果,这就是所谓“安慰剂效应”。于是,分组对照实验中必须再增加一个安慰剂组,一种新药有效没效?是真有效?还是安慰剂式的假有效?

比如给病人分组给药时,安慰剂这组实际上给的是玉米淀粉,但包装得跟真药一样。只有当吃了安慰剂的这组病没好,而吃了真药的那组确实好了,才能证明你这个药确实有效果,不是靠安慰剂效应治好的。

这样,证明一种新药是否有效,起码要有三个组,一、对照组:不治疗,看能不能自愈;二、安慰剂组:看吃安慰剂能不能好;三、治疗组:吃药。如果一二组都好不了,只有吃药的第三组能好,才能证明新药有效的。

四、双盲

以上三个组的方法总起来叫做“单盲”,即只是病人不知道真假,是“盲”的,但医生并不“盲”。

后来又发现,尽管把安慰剂包装成真药模样,但大夫的态度也会暴露出真假。因为大夫知道哪一组是真药,哪一组是安慰剂,大夫态度就不一样,对吃真药那组眼神中很自然透出关切,对安慰剂组就比较糊弄事,病人就能猜出我吃的原来是安慰剂,安慰治疗效果就没了。

怎么办呢?大夫也得“盲”,药由独立的第三方给大夫,大夫也不知道哪是真药,这就是所谓“双盲”。只有这样实验才能更客观。

五、随机

后来人们又发现,分组时也不能有偏颇。比如有意无意中把病轻的分在治疗组,吃真药,而病重的分在对照组和安慰剂组,结果治疗组的病人好了,仍然无法确定是因为他们病轻而痊愈?还是因为吃药而痊愈?反过来病重的分在治疗组也会产生偏差。

再比如,挑选病人时如果多选择比较年轻的,或比较老的,也会产生偏差。因为年轻人抵抗力强,好得快,老人好得慢。等等。

怎么办?挑选病人和分组时必须要做到随机,不能搀杂任何倾向性,这样才能更公正,更客观。现在电脑上有随机函数,更方便从大量病人中随机挑选实验者。

六、大样本

最后人们还发现,挑选的病人不能太少,否则偶然性就会起作用。比如某些人免疫力特别强,不怎么用药也能好,有些人免疫力特别弱,即使治疗用药完全到位也好不了。

统计学上有个“大数原则”,偶然情况毕竟很少,取样数量越大,偶然性就越不明显,也就越接近真实。

为什么实验一种新药需要那么长时间?就是实验的病人样本要多,时间要长,花钱也就多。

七、揭穿外气骗局

总之,到现在这种方法已经比较完善了,要有对照组,安慰剂组,要双盲,要大样本,从各个方面堵住了漏洞,而且这种科学思想也能用于其它各个领域。

比如我们前面说的揭穿“外气”骗局,气功师和病人都以为有外气,能从气功师手中发出气、能量、辐射,或什么场之类,实际上什么也发不出来,不过是心理暗示,跟安慰剂作用一样。

怎么揭穿它呢?也是搞双盲实验,搞分组对照,比如用帘子把气功师与病人隔开,隔断他们之间的形体语言眼神交流,安排真气功师、假气功师、没气功师等各组,一下就能测出是不是心理暗示。

不过我跟气功师们讨论过,他们多半属于中医思维,不具备或不习惯这种来自西方的科学思维方式,不承认,不理解这种方法。但其它相信科学的人心中就有了判断的办法。

八、测谎仪

再比如刑侦上用的测谎仪,其实关键不在于仪器,而在于对嫌疑人如何出题,思路也是“双盲”“对照组”之类。

比如凶杀案中,真凶是用棍子把人打死的,但几个嫌疑人都不知道,于是出一组题目:你是用刀杀死的吗?你是用绳子勒死的吗?你是用棍子打死的吗?你是胶带捂死的吗?……很显然,只有真凶才会在真问题“棍子打死”上反映强烈。

多出几组不同的题目,比如作案地点、作案时间等等,以防止偶然性。只有在所有真问题上都反应强烈,才是真凶,这就是“大样本”的思想。

提问的警官也得找个局外人,他也不知道哪个是真问题,以防止在问到真问题时,声音神色有变化,对结论有影响。这就是“双盲”思想。

总之,这套科学思想非常有用,它能运用于各个领域,能在一大堆混乱的因素中筛选出正确的东西。