題归纳法
万点流光闪,千锤铸剑魂。
频经生死战,不毁见精神。
(房季冬 2023年7月5日)
Dedicated to Inductive Reasoning
Countless sparks in fleeting lights,
To hammer a sword strike by strike.
Through battles of life and death,
With no fail the spirit still shines.
(by Jidong Fang, July 5, 2023)
归纳推理(induction,inductive reasoning)是与演绎推理相反的逻辑推理。归纳法是由一系列特殊判断达到一般结论的推理过程,其结论可能正确,但并不必然正确。而演绎推理则是由一般判断(大前提)达到特殊结论的推理过程,只要前提和推理过程正确,其结论必然正确。演绎推理的大前提大多是由归纳推理得来的,因此两者是互补的思维工具,缺一不可。
归纳推理的优点和缺点
归纳推理很有用,它可以使人依据有限的经验快速形成行为准则,从而不需多加思索而行动。这样就提高了效率,节省了个体的心理和生理资源,有利于生存。但是归纳推理很难穷尽特例,不能保证结论正确。我们见到一只母鸡天天生蛋,却无法保证它以后每天都生蛋。一头猪知道主人每天都给它喂食,却不知道那天早上主人要杀它。袁枚写《鸡》:“养鸡纵鸡食,鸡肥乃烹之。主人计固佳,不可与鸡知。”
天下乌鸦一般黑。这是经过无数观察概括出的结论,至今还没有被经验所推翻。天鹅都是白色的。这个概括性的判断也曾经被无数观察所证实,直到有一天人们发现世界上有黑天鹅。从事实中提炼一般性的结论,需要经过千锤百炼。一般性结论要随时经历生死之战的考验,颠扑不破,才愈加可信。保持怀疑精神和“犯错误”的权利,经常去检验那个所谓的“颠扑不破”的真理,才能走出迷信,逐步接近真理。
归纳法在科学中的应用
观察的可靠性。哲学家弗兰西斯·培根基于知识来自于经验的哲学理论,推崇归纳法。如何在纷纭易变的现象中得到可靠的信息是获得真实知识的一个关键问题。
为解决这个难题,1620年培根在其名著《新工具》一书中提出的归纳法,总结出一套提高观察和实验可信度的方法,为实验观察奠定了基础,从而导致近代实验科学的巨大进步。现代经验科学研究进一步丰富和规范了培根的方法。
科学研究中经常遵循的一些重要的原则包括但不限于:
* 实验设计要设置适当的对照组和实验组。例如,观察某种药物的生理作用时,除了给药之外,对照组和实验组的其它因素应当等同。
* 观察或实验需要设置足够的对照组和实验组。例如,研究单一自变量至少要有两组,研究两个自变量则至少需要四个组。
* 观察某种自变量对因变量的影响尽量采取不同程度的处理。例如,检验药物的生理或毒理作用,需要采用不同的剂量进行系统性的研究,从而获得剂效曲线。
* 要尽量排出各种额外因素的干扰。例如,临床试验中采用双盲法,排除安慰剂作用。
努力提高实验手段的可靠性及测量的精度。例如,实验者可以采用不同的观测手段验证实验和观察结果,对同一指标采取多次测量,等等手段。
* 实验结果的可重复性。包括在本实验室和不同实验室中进行重复等等。
这些都有助于从有限的观察中获得可靠的观察结果,为获得关于群体的一般性结论奠定基础,从而提高结论的可信性。
取样的代表性和结果的可信性。除非穷尽观察,归纳法无法确保结论的正确。然而世界上有许多种事物是极其巨大甚至是无穷大的集合,我们只能做部分观察,或极有限的观察。如何从有限的观察去接近无穷大群体的实际情况? 这是科学研究中极为重要的问题。
依据统计学,在科学观察时必须保证取样有代表性。例如,做疫苗的临床试验时,如果仅从单一性别、年龄段、地域或某一职业的群体中取样,其代表性就不足。取样要有随机性和足够的数量。样本量越大,样本的均数就越接近群体的均数。统计学家为我们控制犯错误的水平提供了各种有效的方法,并且对观察的可信性能够做出定量的计算。这可以帮助我们的观察超越直觉。时至今日,数理统计已经成为各门实验科学必不可少的研究手段。任何轻视数理统计的做法,最终都会受到经验的惩罚。
在这里可能需要做一些澄清。数学家告诉我们,任何一个数学定理的推导都是应用演绎推理,其中包括数学归纳法和统计学定理。而应用数学定理本身的思维过程仍然是遵循演绎推理。应用统计原理得到的结果,则能够帮助我们控制观察的可信性,从而帮助我们为归纳推理提供正例或反例。现代的实验科学有了归纳和演绎这两条腿,才能逐步前进。
归纳推理的强度
在很多情况下,我们并没有足够的时间和条件去做严格的科学实验。于是逻辑思维就往往成为我们可资利用的主要工具。归纳推理的可靠性依赖于推理的强度。为此,逻辑学家们总结出一些影响推理强度的因素。
1.正相似性和负相似性。归纳推理的强度受被观察的对象(a、b、c、等)的相似程度影响。一般说来,正相似性越大,a、b、c等就越相像,这个论证就越弱。反之,负相似性越大,a、b、c等就越不相同,论证就越强。这实际上是说,取样的代表性越好,推理的强度就越大。
例如,我的朋友a、b、c等人都喜欢吃辣椒,因此中国人都喜欢吃辣椒。但实际上,我的朋友们都是湖北人。他们都来自同一地域,有相同的饮食爱好。我们应当在全国各地采样,才能得出更可靠的结论。这和前面提到的临床疫苗试验是一个道理,都是要通过提高取样的代表性来增加推理的强度。
2. 结论的特征。结论断定了多少?这里结论断定有两种情形:一是主项断定的数量;二是谓项断定的数量。一般说来,主项断定的数量越多即越不具体,谓项断定的数量越少即越具体,全称概括就越具普遍性,而论证也就越弱。 被观察事例的数量。
这是从另一个角度去说观察的代表性问题。在前面吃辣椒的例子中,如果主项不是中国人(主项数量多,不具体)而是湖北人(主项数量少,具体),那么论证的强度就增加了,结论更加可信。如果谓项的判断是“爱吃吃辛辣的食物”(谓项数量多,也包括大蒜和大葱等食物,不具体),其论证也会减弱。有一分事实说一分话,自然可信性就高。
3. 被观察事例的数量。一般来讲,被观察到的事例数量越多,论证就越强。 这个道理是显而易见的。如前所述,样本量越大,其均数就越接近群体的均数。
4. 主项与谓项的相关性。在论证中,主项与谓项之间存在一种关联有多大可能?一般来讲,主项与谓项越相关,论证就越强。
例如,“李白、杜甫、王维和白居易都是生活在唐代的伟大诗人,因此诗人生活在唐代就能够成为伟大的诗人。” 这里主项(伟大的诗人)和谓项(生活在唐代)的关系的关系并不很强。显然,还有许多其他诗人生活在唐代,但并不是伟大的诗人。
以上这些方面都涉及取样的代表性问题。控制这些因素都是为了在一定程度上克服归纳推理的缺点,其主旨与前面所说的归纳法在科学中的应用类似。这几种思考方法不如科学归纳法严谨和强大,但所用资源较小(只要动脑就够了),适用于日常生活的各个方面。
尽管逻辑学最初是哲学的一个分支,但是其它学科也对它的发展起到重要的推动作用。其它科学发展起来后,哲学往往会在一旁观战,留下其它学科去逐鹿中原。上面提到的数学仅仅是一个方面。此外,心理学家可以研究逻辑推理的心理过程。归纳推理时常不依赖于语言,而且时常依赖非抽象思维。神经网络研究可以探索由许多简单神经元组成的网络何以能够进行复杂的推理,其中的原理是什么?而动物行为学的研究则可以追溯推理过程的起源,一些研究甚至发现,多种动物可以进行某种演绎推理、归纳推理和溯因推理(关于这一点,可在别处另行探讨)。逻辑学虽然仅有两千多年的历史,逻辑思维却非常久远。这令我们反思,哲学家把人定义为理性动物是否非常妥当。