无论是在日常生活中还是在商业战场中,决策都是攸关个人和企业未来乃至性命的重要因素。尤其是对领导者来说,学会改善自己和整个组织的决策至关重要。诺贝尔经济学奖得主丹尼尔·卡尼曼在最新著作《噪声》中,揭示了如何像对待偏差一样对待人类判断中的随机变化,并为减少判断中的噪声(和偏差)提供了实用的解决方案。
有一些高管会很自豪地告诉我们,相比于定量分析,他们更相信自己的直觉。有关管理决策的研究表明,高管通常会凭直觉、感受或简单的判断来行事,尤其是高级别的、经验丰富的高管。
简而言之,决策者喜欢听从自己的直觉,且多数人对自己的直觉颇为满意。这里就存在一个问题:这些拥有权威且极其自信的人究竟从他们的直觉中“听”到了什么呢?
管理决策中一项有关直觉的综述性研究将直觉定义为对给定行动过程的一种判断,这种判断是一种预感或者关于正确性或合理性的信念,但这种判断并没有明确的判断理由或依据,从本质上说,就是“知道是什么,却不知道为什么”。
内部信号是一种自我管理的奖励,是一个人努力(有时或许没那么努力)做出判断并最终完成判断后的奖励。它是一种令人满意的情感体验,也是一种令人愉悦的一致感,它使我们感到我们所考虑的证据和所做出的判断是正确的。
内部信号很重要,但具有误导性,因为内部信号往往会被理解为一种信念而不是感觉。这种“感觉正确”的情感体验伪装成了我们对判断有效性所持的信心——我知道该判断是正确的,即使我不知道为什么。
然而,对判断所持的信心并不能保证判断的准确性,许多充满信心的预测都是错的。尽管偏差和噪声都会造成预测误差,但此类误差最重要的来源并非受限于预测性判断实际有多好,而是受限于预测性判断应该有多好。我们将这一局限性称为“客观无知”。
哪里有预测,哪里就会有无知如果你经常进行预测性判断,那么你可以问自己一个问题。假设近年来你已经评估了名应聘者,现在,通过将自己的评估与应聘者入职后的实际绩效进行对比,你就能够对自己的招聘决策质量进行评估。如果你随机选出两位你评估过的应聘者,你认为你的事前判断和事后结果达成一致的可能性有多大?换句话说,比较任意两位应聘者,你认为具有更大潜力的应聘者实际上绩效也更高的概率有多大?
我们经常对高管就此问题进行非正式调查,高管们的答案大部分为75%~85%。我们怀疑,这些回答还可能是他们谦虚的说法,否则他们给出的比例会更高。研究人员与高管们的一些一对一的私下交谈显示,高管们实际的自信程度往往更高。
既然你已经熟悉一致性百分比(PC)的统计信息,那么你可以轻易地看出此评估的问题。80%的PC大致对应于0.8的相关系数,在现实中人们很少能达到这么高的预测力。近期一项有关人才选拔的研究发现,人类判断的预测力远低于0.8,平均而言,人类判断的预测相关系数为0.28(PC=59%)。
鉴于人才选拔的难度很大,人类判断的表现很糟糕也在情理之中。年轻人刚开始一份新工作时会面临许多机遇和挑战,这些机遇和挑战会以各种方式改变这个人的生活。他可能很幸运,遇到一位信任他、给他创造机会、在工作上提携他、帮他建立工作信心、增强工作动力的主管;他也可能没那么幸运,尽管自己没犯什么错,职业生涯却充满挫折。同样,他在私人生活中可能遇到的很多事也会影响到他的工作表现,而这些事都是人们在当下所无法预测的,就算是世界上最好的预测模型也无法预测,这种难以解决的不确定性包括所有与你的预测有关但当下无法得知的信息。
难以琢磨的不确定性(未知之事)和不完备的信息(可知但不知之事)都将使完美预测变得不可能。这些未知信息并非源于判断中的偏差或噪声,它们是任务本身的客观特征。这种由于重要信息缺失而产生的客观无知严重限制了人们判断的准确性,为避免用词太过专业,我们用“无知”来指代这种不确定性。这样可以避免将关于世界和未来的不确定性与噪声(应被识别的判断中的变异)产生混淆。
过分自信是已经被大量研究证明了的一种认知偏差,具体而言,人们往往会过度高估自己做出准确预测的能力,即使是在有限信息的条件下。我们所讲的预测性判断中的噪声也可以被称为客观无知,哪里有预测,哪里就会有客观无知,而且客观无知的体量比你想象的要大得多。
异常自信的权威:准确性和黑猩猩掷飞镖差不多心理学家菲利普·泰特洛克(PhilipTetlock)是一个坚持真理且充满幽默感的人。年,他出版了《专家的政治判断》(ExpertPoliticalJudgment)一书。
泰特洛克研究了近位专家的预测,包括著名的记者、受人尊敬的学者以及国家领导人的高级智囊等,他考察了这些人的政治、经济和社会性预测是否正确,这项研究持续了20年之久。
书中有句玩笑话很有名:“整体上专家们的准确性和黑猩猩掷飞镖差不多。”可以肯定的是,专家们讲故事的能力很强,他们可以分析形势,并用令人信服的方式来描绘事态的发展趋势,并满怀信心地反驳那些在演播室里提出反对意见的人,但是他们真的知道将要发生什么事吗?事实上,他们很可能并不知道。
对于每个预测性问题,他都要求专家对三种结果(维持现状、有所增长或有所减少)分配其可能发生的概率。在理想情况下,即使让一只黑猩猩通过掷飞镖的方式进行选择,它都会以相同的概率(1/3)“选中”三个结果中的任意一个。泰特洛克却发现,专家们预测的准确率难以超过这一最低标准。平均而言,他们给那些未来会发生的事件分配的概率只比那些未来不会发生的事件稍高一点,但他们却常常表现得异常自信。那些对世界该如何运转拥有一套清晰理论的权威人士们是最自信的,也是最不可靠的。
泰特洛克的发现表明,对具体事件进行详细的、长期性的预测根本不可能。这个世界是混乱的,一些微不足道的小事都可能引发严重的后果。例如,你可以想到,在出生之前,历史上的每个重要人物以及无关紧要的人物都有50%的可能性会以另一种性别出生。不可预见的事件注定会出现,而且这些不可预见的事件的后果也是不可预见的,因此,你对未来的展望越远,客观无知就随之积累得越多。专家们在政治判断上的局限性并非源于预测者的认知局限,而是由他们对未来的客观无知所决定的。因此,我们的结论是:不应该将专家失败的预测归咎于专家本人,但是,他们确实应该受到批评,因为他们在尝试完成一项不可能完成的任务,却相信自己可以成功完成这项任务。
否认无知是无知的另一种诱导完美预测是不可能实现的,这似乎是显而易见的事。当然,断言未来是不可预测的也算不上什么具有突破性的见解。然而,众多研究证据都表明人们做预测时会过分自信,这说明很多时候这一显而易见的事实被我们忽视了。
过分自信的普遍性让我们对那些依赖直觉的决策者有了新的看法,我们发现,人们经常错误地将自信水平这一主观指标当成了预测有效性的指标。如果你对你的预测充满信心,你就已经陷入了效度错觉中:仅依赖于你所获取的信息进行预测,其准确性必然非常低。
那些对自己的判断极度自信的人不仅过分自信、否认自己的判断中存在的噪声和偏差,或简单地认为自己优于常入,他们甚至还相信可以对一些实际上不可预测的事件进行预测,也就是说,他们从根本上否认了现实的不确定性。用我们的术语来说,这种态度就是“否认无知”(denialofignorance)。
为什么他们的研究结论未受重视?为什么决策者总是依靠直觉来做决策?否认无知已为此提供一个新的解释。当决策者聆听自己的直觉时,他们会听到内部信号并感受到它带来的情感奖励。这种内部信号提示决策者已经做出了好的判断,它给了人们自信,让他们相信“知道是什么,却不知道为什么”的合理性。但是,对证据真实预测效力进行客观的评估并不能带给人们这样的自信。
放弃直觉确定性带来的情感奖励并非易事。领导者们说,在高度不确定的情况下,他们更有可能依赖于直觉进行决策。如果现实无法给予他们把控感和信心,他们便会在直觉中寻求这些感觉。在充满无知的情况下,否认无知就显得更加诱人。
否认无知也解释了另一个难题。面对我们之前给出的研究证据,许多高管给出了一个矛盾的结论。他们辩解道,尽管基于直觉的决策并不完美,但是,如果系统性的替代方案依然不完美,那么这样的方案就不值得采用。例如,人类判断的预测得分与员工绩效之间的平均相关系数为0.28(PC=59%),相应地,机械性预测可能做得更好,但并没有好很多,其预测准确性为0.44(PC=65%)。那么,为什么我们还要采用机械性预测呢?
答案是,在诸如人事选拔这类重要的事件上,这种预测有效性的提高是很有意义的,为了这一小步的提高,某些高管会在工作中做出重大变革。理性地讲,他们明白没有%的成功,因此会努力做好各种决策以提高成功的可能性。他们也明白概率的含义:如果能够以相同的价格购买有65%中奖概率的彩票,没有人会去购买只有59%中奖概率的彩票。
问题在于,在很多情况下两者的“收益”是不一样的,直觉判断往往伴随着奖励,即内部信号。当算法能够获得更高的准确性时,人们愿意相信算法,这种确定性带来的“收益”可以与内部信号相匹敌,甚至超越它。然而,如果替代方案是某种不一定会产生更高的预测准确性的机械性过程,人们就不愿意放弃内部信号带来的情感奖励了。
这一发现对于提高判断质量具有重要意义。尽管所有证据都表明,机械性的预测方法和算法确实可以在一定程度上提高预测的准确性,但很多决策者仍会拒绝采用这些剥夺了他们依据直觉进行决策的方法。只要算法还不够完美,人类的判断就不会被取代,而且在许多领域中,客观无知会使算法永远不可能完美。这就是必须对人类判断进行改进的原因所在。
文中创意图片已获海洛图库授权,如需转载使用,请联系其授权。
编辑
张子胥
想了解更多?戳下方中欧直通车,小欧在等你喔!
表单
CEIBS
中欧