算命准不准通常是求卦者的主观评价,但通过巧妙的实验设计,我们完全能够客观判断其可靠性。
1985年,《自然》(Nature)杂志曾经刊登过一次著名的检验,用双盲法来评估占星术的可靠性(A double-blind test of astrology)。这次检验的出发点在于,先前针对占星术效果的测试,凡是取得负面结果的,占星师全部以“无视占星要点”、“不是真正的占星”为由表示反对;而凡是取得正面结果的,科学界则一律在质疑其研究方法。为了回避观点之争,研究者肖恩·卡尔森(Shawn Carlson)希望能够设计一种双方都能接受的方法。于是,他与全美占星研究委员会特意派出的28名专业占星家合作,共同设计了一种能够更客观地认识占星术这一存在的检验。
计算机生成的出生时的天宫图,可以算是西方传统文化和现代科技的“结晶” 图/ exaspsychic.net
这次检验要考察的对象,原本是占星学中的一个基本命题:人出生时的天宫图(日、月、行星在天球上的位置)可以在很大程度上决定一个人的人格、行为以及一生中的境遇。在试验中,一批受试志愿者提供了个人信息来构建天宫图,再让若干知名占星师对其作出解释。志愿者随后比较来自占星师的三种解释(其中一种是针对该人给出的,另两种则从针对其他志愿者的解释中随机抽取)与自己情况的相符程度,并对其排序打分。如果选择过程是随机的,那么第一选择选中占星师“正确”解释的概率只有1/3;而如果占星术有效,那么这一概率应该远高于1/3。受试占星师在检验之前信誓旦旦,认为这一概率至少应该达到一半以上。
另一方面,参与其中的占星师也并不直接面见受试志愿者。每位占星师除了要解释大约四名志愿者的天宫图,还要接受另一项考验:将志愿者出生时的天宫图信息与根据CPI(加州人格评估)得出的人格特性报告配对,并为报告打分。这一项任务同样是三选一,占星师收到的每份天宫图都配有三份匿名的CPI报告,其中一份属于相应的志愿者,另两份从其他志愿者中随机抽取。这里随机选中的概率也是1/3,而占星师事先也认为他们选中的几率可以过半。而分数将按照权重折算到结果中。之所以选择CPI作为参考,是因为这一报告在心理学界较为认可,且根据占星师们的意见,它给出的结论与占星术共通之处最多,便于评估比较。
这次参与检验的志愿者并不清楚哪份解释是由占星师针对自身给出的,而占星师也不清楚收到的哪份CPI报告属于哪名待考察的志愿者。为了进一步排除主观因素的影响,测试开始之前,作为本次检验指导人的美国加州大学伯克利分校物理学教授理查德·马勒(Richard Muller)组织不参与检测的学生为每位志愿者分配了随机号码,占星师与检验活动的主持者都是只见号码不见人,不清楚哪个号码对应的究竟是谁,因此这次检验是符合双盲测试标准的。检验的设计者认为,在满足统计学要求的前提下,猜中的概率如果高于1/3,那么可以认为占星术是有效的,否则说明占星术无效。
此次检验所需的天宫图信息是由专用的占星计算机求出的,不过也经过了人工抽样验算,计算结果被证明是可靠的。对受试志愿者的要求是大于 17周岁,并参与CPI评估。这些人以大学生为主,其中有大约1/3是研究生。除了向研究者提供占星所需的出生时刻(精确到15分钟之内)、具体出生地等信息之外,志愿者还需要给出自己对占星的态度,并说明先前是否参与过天宫图占星。为了避免主观因素的影响(如出于抵触情绪刻意提供虚假信息、不做出可靠选择等),凡是对占星持强烈怀疑态度的志愿者全部被排除在最终检验之外。出于同样的考虑,先前有过占星经历的人也被排除掉了,以免此前经验对结果产生影响。同时鉴于检验持续周期较长(10周左右),志愿者在此期间的态度可能会发生变化,或者在其他地方又参与了占星活动,在最终作出选择之前,还需要对他们进行额外的考察。在此过程中,又有2名志愿者被排除在外,其中一人被发现实际上是占星师而在初选时撒了谎,另一人则是在等待结果的过程中,态度从“不相信”变为“极不相信”。另外考虑很多人对自己出生的星座甚为熟悉,而由于大众传媒的影响,很容易将流行文化中不同星座的性格特点等认知代入检验,为了规避这种影响,测试组与对照组的成员在星座方面是一一对应的;同理,两组成员在性别上也是对应的。
论文所示的典型的CPI报告
为了达到预定的置信度,研究者需要招募到128名志愿者,还要设置人数相同的对照组。但不少志愿者最终因种种原因没能作出有效答复,导致实际参与人数少于预期,只有177人,最后形成的测试组与对照组分别是83人与94人。另外,由于占星师方面的不配合,最终只针对116名志愿者提供了可用的数据,也是较预期少很多。尽管如此,根据这些数据得到的结果在统计学上也还是可信的。
那么,结果到底怎么样?当然对占星不利。受试志愿者第一选择选中占星师针对该人解释的概率是33.7%,与随机选择很接近;第二选择选中占星师解释的概率略高,达到了39.8%,但在统计上也与1/3没有本质区别。作为比较,研究者还考察了志愿者选中自己CPI报告的概率,测试组成员在第一选择就选中的概率高达44.6%。这里必须说明的是,这一比例虽然超过了1/3,但在统计学上也还不足够可靠。CPI报告选中率偏低这一点,直接影响了志愿者选择结果的可信度。这可能是由于普通测试者对心理学了解不足而难以读懂评估内容,或者自我认知与实际情况存在偏差等原因导致的,但要探究具体是哪种原因造成的,则超出了本次检验所涵盖的范围。不过,如果大众根据CPI来认识自我的可靠性值得怀疑,那么先前其他基于CPI的调查得出的对占星术有利的结论也同样是不可信的了。
更让人信服的结果,则是从占星师一方得出的。他们第一选择就选中受试者CPI报告的概率只有34%,明显与随机选取接近。研究者挑选的占星师都对CPI测试较为熟悉,并拥有一些心理学背景,因此不存在读不懂CPI报告的问题。另外,由于占星师并非受试者本人,也不会因为自我认知的偏差或难以接受自身的某些缺点而作出错误的选择。既然他们得出的结果在统计学意义上与随机猜测完全相符,而与事前正确率过半的包票相差甚远,于是完全可以得出结论说:他们没有能力根据天宫图来正确地预言受试者的人格。考虑到参与此次检验的占星师还算是业内翘楚,那么整个行当的水准如何,也就不言自明了。
占星师第一次选择挑中CPI报告的概率和随机选择没有统计学差别
在实际生活中,有时顾客与占星师面谈得到的结果并不坏。对此,笔者认为占星师的心理学背景是不能忽视的因素。除了熟悉CPI测试之外,不少占星师也因为了解心理学而善于察言观色,因此占星活动很大程度上也就成了心理学表演。恐怕正是因为这样,占星师才敢在事前夸口,因为那确实是有不少实际案例作依据的;但是,一旦遇到了较真的双盲法,是真是假也就立即显形了。
美国国家科学基金会2014年公布的一项调查显示,2012年美国人中认为占星术“绝对不是科学”的比例为55%,这是自1983年以来最低的数据;另有32%的美国人认为占星术“是某种科学”,而10%则认为“非常科学”。报告中还引述2010年中国科普研究所的一次调查,认为80%的中国人不相信算命,82%不相信相面,87%不相信解梦,92%不相信占星,95%不相信电脑算命。虽然这一数据看似颇为乐观,但是笔者想到的却是《科学世界》杂志在世纪之交针对北京与上海的大中学生进行的一项科普书刊相关调查。这次调查的结果草草看来也很不错,在参与调查的377人中,有49%断言自己可以完全区分真正的科普书籍与伪科学著作,36%认为不完全能,只有3.2%自认完全不能区分真伪。但是,接下来的事实就很耐人寻味了:比如,有些被调查者认为《时间简史》等科普名著属于“读后一笑置之”的书籍,并无科学性可言;而将近1/5的被调查者干脆将科幻小说视作“严谨的科学著作”;一些明显的伪科学书籍更是具有极高的人气,将近一半的被调查者认可《审判达尔文》,而只有极少数人能够指出其不科学之处;此外,赞同“金字塔是外星人作品”或“通灵术真实可靠”的比例也极高。换句话说,自认为在一定程度上能够辨识真伪,与实际具备判断能力,可能是完全不同的两回事。
现在,大众媒体上的占星栏目铺天盖地,而且生活中也有太多的朋友会多少参考占星相关的说法来指导自己的生活和学习。如果只是将占星当作娱乐谈资倒也罢了,但要是当真的话,输的恐怕就是当事人了。毕竟无论占星术是多么的不可靠,其对笃信者产生的心理暗示也是不容忽视的。
撰文/张博(科学世界2015年第7期) |