按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!
实质蕴涵
为了取代因果概念,罗素从符号逻辑出发提出了一个清楚定义的概念,称为“实质蕴涵”(material implication)。通过使用原子命题的基本观念和一些联结符号如“和”、“或”、“非”与“等于”,我们就能产生“若命题A,则命题B”的观念,这与“非B,则非A”的命题是等价的。这听起来有点像贝叶斯定理中隐含的悖论(在第13章中我们介绍过),但还是有很大的差别,我们将在后面的一章中进行研究。
在19世纪后期,德国医师罗伯特?科赫(Robert Koch)提出了一组必要的假设,用来证明某种病原体(infective agent)将导致某种特定的疾病。这些必要假设是:
1。 只要病原体能够培养出来,疾病就会发生。
2。 只要疾病没有发生,则病原体一定没有培养出来。
3。 当病原体被消除,疾病就会消失。
虽然有点累赘,但是科赫给出了实质蕴涵的条件。在判断某种传染病是否由某种特定病菌引发时,这些条件可能是足够的。但是,对于吸烟和癌症之类的问题,科赫的必要假设就没有意义了。让我们来看看,肺癌和吸烟之间的联系在多大程度上符合科赫假设呢(从而检验了罗素的实质蕴涵是否适用)?病原体是吸烟史,疾病是肺部表皮癌。一些吸烟者并没有得肺癌,不满足科赫的第一个假设。一些得肺癌的人却声称他们没有吸过烟,若我们信其所言,则不满足科赫的第二个假设。如果我们将癌症类型限定为小细胞癌(small oatcell carcinoma),那么不吸烟却得肺癌的人数几乎为零,因而也许满足第二个假设。如果我们拿掉病原体,也就是让病人停止吸烟,他还是可能得病,因此不满足科赫的第三个假设。
如果我们应用科赫假设(从而也就是应用罗素的实质蕴涵),符合这些假设的,只有那些由血液或者其它体液培育出的特定病原体所引发的疾病。但是,对于心脏病、糖尿病、哮喘、关节炎或者其它形式的癌症,这些假设就不再适用。
科恩菲尔德的答案
让我们回过头来,看看科恩菲尔德与5位知名癌症专家在1959年发表的那篇论文,他们逐一介绍了有关吸烟与癌症关系问题所作的研究 。首先是理查德?多尔(Richard Doll)和A?布拉德福德?希尔(A。 Bradford Hill)的研究 ,发表于1952年的《英国医学期刊》(the British Medical Journal)上。多尔和希尔对英国死于肺癌人数的急剧增加感到十分吃惊,于是搜集了数百名肺癌患者,将他们与一些非肺癌患者比较,这些病人也是同时进入同一家医院的,并且在其它方面相似(相同的年龄、性别和社会经济状况)。结果发现,肺癌患者中的吸烟人数几乎是非肺癌患者(在这种研究中,常常称为“对照组”(controls))中吸烟人数的10倍。到1958年底,这类研究另外还有5项,分别以斯堪的纳维亚、美国、加拿大、法国和日本的病人为研究对象,都得到了相同的结果:肺癌患者中吸烟人数大大地高于对照组中的吸烟人数。
这类研究被称为“追溯性研究”(retrospective studies)。
从一种疾病开始着手,向后看与这种病相联的有什么先决条件。这种研究需要有对照组(未患此病的其他组病人),用以断定恰恰是这些先决条件与此病有关,而不是病人某些更一般的特征。对于这种研究,常有人批评对照组可能与所研究的病例之间不相匹配。一项著名的追溯性研究是加拿大开展的,有关人造甜味剂(artificial sweetener)是否为膀胱癌(bladder cancer)病因的研究。结果表明,人造甜味剂与膀胱癌之间似乎存在着某种关联,但是通过对数据的仔细分析之后,发现这些病例几乎都来自社会经济地位较低的阶层,而对照组几乎都来自社会经济地位较高阶层。这意味着研究组与对照组之间不具有可比性。20世纪90年代初期,耶鲁大学医学院(the Yale Medical School)的阿尔万?范斯坦(Alvan Feinstein)和拉尔夫?霍维茨(Ralph Horvitz)对如何进行这类研究提出了一些非常严格的规则,以确保研究组和对照组相互匹配。如果我们将范斯坦-霍维茨 规则(FeinsteinHorvitz rules)应用到这些针对癌症和吸烟关系的追溯性病例对照(casecontrol)研究之上,那么所有这些研究都不符合规则。
另一种替代的研究方法是事前研究(prospective study)。在这类研究中,事先选定一群人,详细记录他们的吸烟史,再跟踪他们以观察会发生些什么事。到1958年,已单独地进行了三次事前研究,第一次研究(同样是希尔和多尔所作,他们开展了第一个追溯性研究)选取了50 000名英国医生。实际上,希尔和多尔这项研究中并未对研究对象跟踪很长时间,而只是通过面谈了解了这50 000名医生的健康习惯,包括他们的吸烟习惯,跟踪调查5年之后,其中很多人真地患上了肺癌。这一研究确实说明吸烟与癌症之间存在联系。他们依据吸烟量的大小将这些医生分成了不同组,结果表明,吸烟越多的医生得肺癌的概率越大。这就是所谓的剂量反应(dose response),是药理学中产生反应的关键证据。在美国,哈蒙德(Hammond)和堆恩(Horn)对187 783名男子进行了一次前事研究(发表于1958年),他们跟踪调查了4个月,也发现了剂量反应。
然而,事前研究还存在一些问题。如果研究是小范围的,结论也许只是针对某个特定群体而言的,不能将它推广到更广泛的人群当中。例如,早期大部分的事前研究都以男性为研究对象,因为当时女性肺癌病例过少,无法开展研究。事前研究的第二个问题是,为了让事件(肺癌)发生得足够多,允许作有意义的分析,研究持续的时间必须很长。解决这两个问题,都需要跟踪大量的人群。大量的研究对象保证了可以将研究结果适用于更为广泛的人群。如果短期内事件的发生率很低,但只要跟踪的人数足够多,短期内同样能得到足够多的事件用以分析。
希尔和多尔第二个研究之所以选择医生有两个原因:一是医生对自己吸烟习惯的回忆比较可靠;二是他们近观过专业的医学训练,因此这群人中发生的所有肺癌病例肯定都会被记录下来。但是,我们能将针对那些接受过良好教育的专业医生得到的研究结论,推广到学历不及高中的码头工人上吗?哈蒙德和霍恩以近200 000的男性为研究对象,希望样本更具有代表性——而这可能会使所获精确信息更少。说到这里,读者可能会想起,某些人批评K?皮尔逊的样本数据,理由是说那是一种便利样本。这些不也是便利样本吗?
为了回应这种反对意见,H?F?多恩(H。 F。 Dorn)在1958年研究了三个大城市的死亡证明书,然后对死者家属进行访问调查。这一研究选择了所有的死亡者,所以不能说是便利样本。结果再次压倒性地证实,吸烟和肺癌之间存在着关联。然而,还是可能有人提出争议,会说对死者家属的访问调查存在不足。因为直到进行这项研究的时候,大家普遍都知道了肺癌和吸烟之间的联系,这样的话,与因其它病死亡者的家属相比,那些因肺癌死亡者的家属可能会对死者生前是否吸烟记得更为清楚。
这也正是大多数流行病学研究的情形,任何一项研究都可能存在着某些不足之处。对于任意一项研究而言,批评者总可以假想出导致结论偏差的各种可能情形。科恩菲尔德和他的合作者们搜集了1958年前针对不同国家、不同总体所作的30项流行病学研究。正如他们所指出的,这么多项针对各种总体开展的研究压倒性地一致,都得到了相同的结论,因而具有较高的可信度。他们对各种异议一项一项地进行讨论,也考察也伯克森的反对意见,表明了该如何用其中的某些研究来回应这些批评。奈曼曾经指出,若抽烟者活得比不抽烟者长而肺癌又是一种老年病的话,最初的那些追溯性研究可能就存在偏差。为此,科恩菲尔德等人用由这些研究中的病人所生成的数据表明,对这些病人的这种描述并不准确。
他们从两个方面讨论了便利样本是否具有代表性的问题。一方面,他们表明了所涉及的病人总体范围,增加了结论对不同总体都成立的可能性。另一方面,他们还指出,这种因果关系可能是源自生物学的基本原理,与病人不同的社会经济状况和种族背景无关,并且回顾了毒物学的研究,证实了吸烟对实验室动物和组织培养存在着致癌效应
科恩菲尔德等人的这篇论文是流行病学研究中有关如何求证病理原因的经典例子。尽管任一单项研究都存在着一些不足,但是随着证据越积越多,一项一项的研究使得同 不念旧恶结论越来越有说服力。
吸烟与致癌 VS。 橙剂
与上述现象形成对照的是,越战的老兵们认为战争中曾用的橙剂(Agent Orange,一种除草剂——译者注)对他们的健康造成了影响,使他们在后来的生活中备受折磨。有关的研究认定导致他们身体损害的原因,正是这种除草剂(herbicide)中所含的污染物,几乎所有这类研究都只是针对这一小部分以不同方式接触到了这种除草剂的人开展的。但是针对其它人群开展的研究却并不支持上述发现。在20世纪70年代,意大利北部的一个化工厂发生的一次意外事故,致使许多人接触到了剂量更大的该种污染物,但并没有产生长期影响。针对新西兰草场工人的研究却表明,那些接触了除草剂的人患一种特殊生育缺陷的可能性增大,但是这些工人大多数都是毛利人,毛利人从基因上说就容易出现这种特殊的生育缺陷。
有关吸烟与橙剂研究的另一个不同之处在于,对于吸烟,人们认为会引起的是一种很明确的病(即肺部表层癌),而由橙剂引起的问题很多,包括神经系统和生殖系统的一些病症。这种情况与毒物学中的一般发现相悖,在毒物学上,一般认为特定的药剂会导致特定类型的病害。对于橙剂的研究,没有得到任何有关剂量反应的迹象,当然,也没有充足的数据能判断这些人到底接触到了多大的剂量。总的来看,这一研究的结果含混不清,就是伯克森、奈曼和费歇尔等人的反对意见也无人问津。
通过对流行病学研究的分析,根据罗素的高度确切性要求和“实质蕴涵”的思想,我们已经非常深入了。现在因果关系从对人群总体许多有缺陷的调查推出,这种关系仅仅是统计意义上的,分布参数的变化可能源于某些特定的原因。但是,一些更为明智的研究者,可以通过综合大量的存在一些不足之处的研究,去发现一些共同的内在线索。
论文发表上的偏差
会不会是这些研究都经过挑选呢?观察者所看到的文献会不会只是从实际所做研究中精心挑选出来的一部分呢?又会不会是那些下面的研究发表了而负面的研究就没有发表呢?别忘了,并非所有的研究都能够发表。有一些论文会因研究者没有能力或不愿意而未能做完,有一些论文会因为不符合杂志的规范而被编辑拒绝。特别是对所讨论的问题存在着争议时,编辑们常常倾向于发表那些容易为科学界接受的论文,而拒绝一些观点不易为科学界接受的论文。
这正是费歇尔提出批评的问题之一。他声称希尔和多尔最初的研究被改造过了,他多年力图让作者公布支持其结论的详细数据。而他们仅仅发表了论文的概要,但费歇尔认为这些概要掩盖了数据中实际所存在的不一致性。他指出,在希尔和多尔的第一个研究中,作者问吸烟者吸烟时是否吸入,这样将数据分为“吸入者”和“不吸入者”两类时,不吸入者得肺癌的多,而吸入者得肺癌的反而少些,希尔和多尔声称这一结果可能是因为部分被调查者没有弄清楚问题的含义。费歇尔对此很不以为然,并问他们为什么不公开真实的研究结论,让人们知道,虽然吸烟对你是有害的,但是如果你非得吸,与其不吸进去,还不如吸进去呢。
让费歇尔反感的是,希尔和多尔针对医生开展跟踪研究时,竟然将这个问题扔到了一边。那么,会不会还有其它什么问题也是精心挑选的呢?费歇尔很想知道。然而,更令他感到震惊的是,政府竟然不惜以大量的权力和金钱来将恐惧植入民众心理当中,他认为这种做法无异于纳粹利用传媒来操控民意。
费歇尔的答案
费歇尔也受到了罗素因果关系论的影响,他认识到实质蕴涵还并不足以描述大多数的科学结论,并写文章深入地讨论归纳推理的属性问题。他认为,如果很好地遵循了实验设计的有关原则,那么就有可能在某些特定研究的基础