超级预测:总结与回顾

进度条

超级预测:总结与回顾

书评

情报高级研究项目活动 (IARPA) 是一个想要研究预测艺术的情报机构。他们创建了一项研究,预测者相互竞争——以锦标赛的方式——对当前事件进行预测。

作为本次比赛的一部分,志愿者被要求做出预测。事实证明,那些始终做出最准确预测的志愿者——“超级预测者”——拥有卓越的预测能力。有趣的是,这项研究清楚地表明,做出准确的预测并不依赖于任何特殊才能——它是一种习得的技能。

超级预测:预测的艺术与科学致力于了解这些超级预测者并探索普通人如何成为其中的一员。在超级预测, Philip Tetlock 和 Dan Gardner 梳理出超级预报员的一些重要品质:

  • 哲学观=谨慎、谦逊、不确定
  • 思维方式 = 思想开放、聪明好奇、善于反思、善于计算
  • 预测风格=务实,分析,蜻蜓眼,概率,周到更新者,直觉心理学家
  • 职业道德 = 成长心态,勇气

泰特洛克是一位彻底、缜密的思考者,他一步一步慢慢地构建自己的论点。他很少表达自己的意图,这可能会让等待他表达观点的读者感到沮丧。这样做的结果之一就是这本书的起步非常缓慢。直到本书读了三分之一,泰特洛克才进入他的论点的核心,而在这段时间里,读者并不完全确定他的前进方向。然而,一旦泰洛克迈出了步伐,他就会告诉我们一些关于他的主题的有趣的事情,整本书的基调是深思熟虑和严肃的,同时又保持平易近人。不需要高级学位就能理解这里提出的想法。

这里提出的许多想法可能对公司、政府部门或其他组织的负责人有用。尽管没有明确说明,但没有什么可以阻止这样的人修改这些方法以满足自己的需要。然而,这样一个项目将涉及大量工作。如果有向导的话就容易多了。

这本书不是那个指南。虽然它指明了方向,但它不是手册。因此,在这个主题上还有更多的空间可以写,人们希望 Tetlock 和他的同伙将继续探索它。

概括

摘要:读者会立即注意到没有介绍或序言。除了目录之外,还有一种令人心酸(如果神秘)的奉献精神,然后就直接进入正文了。附录包括有抱负的超级预测者的十诫其中包含实用但基本的建议,例如“在对证据反应不足和过度反应之间取得适当的平衡”。封面材料的稀缺将受到那些无论如何跳过此类材料的人的欢迎。那些需要更多背景信息的人会欣赏带有参考文献的注释。

第1章

虽然有些人比其他人更擅长预测,但大约 2% 是超级预测者。预测是一门习得的技能,你可以在本书中学习如何自己做。

各种各样的人在电视和其他媒体上做出预测,但他们的准确性从未被实际测量过。他们出现在电视上并不是因为他们擅长预测;而是因为他们善于预测。他们出现在电视上是因为他们擅长讲故事,他们很有趣,他们很有趣。做出预测的真正原因并不总是为了预测未来。有时预测只是为了娱乐、说服或让人们放心一切都好。通常这些不同的目标不会被明确说明。

超级预测讨论研究表明,大多数专家的预测准确度就像黑猩猩向目标投掷飞镖一样准确。 (这显然是一个众所周知的案例研究,他在本书的后面部分又提到了这个案例,并在第 3 章中提供了更多背景信息。)然而,这项黑猩猩研究表明的重要一点是,尽管大多数专家在他们的预测中,有一些是,至少是短期分析——时间越长,预测就越不准确。三到五年后的预测将接近臭名昭著的投掷飞镖的猴子的准确性。

当阿拉伯世界爆发革命和变革时,阿拉伯之春始于一个人的抗议,没有人能猜到会发生什么。科学家们曾经认为,现实的运作非常精确,一旦我们了解了它的运作方式,我们就能够预测一切。这一想法被爱德华·洛伦兹(Edward Lorenz)和“巴西蝴蝶扇动翅膀可能在德克萨斯州引发龙卷风”的概念所打破:混沌理论。如果存在混乱,那么就会出现不可预测性。可预测性和不可预测性都是事物。两者并不能胜过另一者;这是一个混合体。

然而,我们可以预测很多事情。我们可以预测常规事件,但即使是这些事件也可能因异常情况而发生混乱。时间越长,预测就越困难,但也有例外。虽然未来可能会看到更多的计算机与人类混合进行预测,但人类仍然处于这种混合的前沿和中心。为了做出好的预测,您需要好的算法,但您应该接受您可能并不总是拥有它们。

良好判断项目表明,有些人确实会做出良好的预测。这些人使用特定的技术,并拥有自己独特的思维方式和看待世界的方式。无论您是不是其中的一员,遵循本书中的技巧都会在预测方面带来可衡量的改进。在这个游戏中,随着时间的推移,即使是很小的改进也往往是显着的。

第2章

泰特洛克从医学史开始,强调在很长一段时间内没有系统的测试。好的科学需要健康的怀疑态度,而医学界直到第二次世界大战后才开始使用随机试验。决策通常是根据传统和权威而不是科学做出的。通常,专家相信自己的能力和判断,而不做任何研究。例如,玛格丽特·撒切尔政府支持在斯巴达条件下监禁年轻罪犯的政策。有效吗?他们没有做任何研究;他们认为自己的直觉最清楚。

心理学家说我们的心理世界分为两个领域。系统2是我们的意识生活。它包含了我们所想到的一切。系统 1 是自动反应、自动驾驶功能的世界。编号是故意的——系统 1 排在第一位。它始终在后台运行。仔细思考问题可能会给我们带来更准确的分析,但这并不总是实用的。在新石器时代,人们有时必须快速做出反应。系统1非常有用。但冲动与分析之间的二分法是错误的。这不是两者之一——最好的策略是同时采用两者中的一些。

人们需要理解他们的世界。当他们不理解事情时,他们通常会编造理由来解释,但往往没有意识到自己正在这样做。然而,科学家们受过训练,要对自己的直觉有一定的自律。他们寻找对事物的其他可能的解释;他们认为自己的预感有可能是错误的。接受怀疑很重要,但这违背了人性。自然的事情是抓住第一个看似合理的解释并收集支持它的证据,同时忽略不支持它的证据。确认偏差:我们不喜欢与我们的信念相矛盾的证据。思维中的另一个错误是“诱饵和转换”:如果我们无法回答一个困难的问题,我们就会用一个更简单的问题来代替它。

这场对话中的一个重要因素是模式识别。这有助于我们几乎立即发现问题,而不必花太多时间思考事情。模式识别虽然非常有用,但也有其问题。人们在祝酒时看到耶稣的脸。他们太相信模式识别了。模式识别在某些情况下比在其他情况下更有帮助。关键是要了解哪些情况并学习线索。如果不学习所有可能的模式,直觉并不比随机机会更好。但很难知道你是否有足够的有效直觉线索来使直觉富有成效,因此在根据你的直觉采取行动之前最好仔细检查,以确保它通过逻辑测试。

第3章

为了评估预测的准确性,我们必须能够准确理解预测的内容。这比你想象的要困难得多。

当人们做出预测时,很多事情都没有被说明,例如,当预测者假设观众知道背景时,这可能没问题,直到五年后你拿出预测,没有人记得背景。许多预测都没有给出时间表,正如预测时所暗示的那样。但如果没有时间表,预测就没用。

判断预测还存在更大的障碍——例如概率。如果你说这有可能某事将会发生,这与说某事是一种非常不同的动物将要发生。泰特洛克讲述了一个例子,人们被告知有“严重的可能性”会发生某事,然后询问他们对这种情况发生的确切可能性的看法。答案范围从 20% 到 80% 概率,这说明有时人们对于某件事的含义有非常不同的想法。后果可能是灾难性的。

用数字表达概率的预测者被迫更清楚地思考他们自己的过程。但数字的问题在于它们似乎非常权威。当一个想法用数字表达时,人们可能会认为某事是客观事实而不是主观意见。这个问题的解决方案是让人们更好地了解它。

另一个困难:气象学家说有 70% 的可能性会下雨。如果不下雨,有些人可能会认为天气预报是错误的,但实际上,70% 下雨的可能性意味着 30% 不下雨的可能性。判断天气预报准确性的唯一真正方法是重新运行天气 100 次,看看下雨的频率。但既然我们做不到这一点,我们只能说这个预测并没有被推翻。

我们无法重演历史,因此我们无法判断孤立的预测。然而,我们能做的就是综合考虑大量的预测——看看气象学家的记录。要问的问题不是“当她说 70% 有可能下雨时,那一次下雨了吗?”但是,“在她说70%有可能下雨的所有次数中,那次70%下雨了吗?”这就是校准,通过校准气象学家的预测(按预测数量绘制正确百分比),您可以确定她是否自信不足或过度自信。但为了进行这些评估,您需要拥有大量数据。它对于罕见事件的效果不太好。

说某件事发生的可能性有 60% 也不是很有趣或令人兴奋——人们想要更多的信息。预测者越果断越好,这就是所谓的决心。最佳点是高分辨率和校准。

在前面提到的黑猩猩研究中,要求专家进行预测,结果显示专家并不比黑猩猩好(或随机)。然而,这个平均结果隐藏了重要的细节。实际上有两种不同类型的专家:第一种并不比做出预测的随机机会更好;第二组在预测方面比黑猩猩略好,但他们的结果仍然不是很好。

这些群体之间的差异在于他们的想法。一组围绕大创意组织他们的想法。无论是环保主义者、自由市场原教旨主义者还是社会主义者,这些理想主义者都将他们拥有的信息融入现有框架中。为了进行辩论,他们倾向于堆积为什么他们的分析是正确的理由。他们对自己的能力非常自信,即使他们错了。另一组分析师使用各种工具来收集信息。他们更关心可能性和概率而不是确定性,他们能够承认自己的错误。这些专家在校准和分辨率方面都击败了另一组。

大创意的人倾向于围绕大创意组织他们的所有思维,这扭曲了他们的世界观。他们可以收集他们想要的所有信息;它不会使它们更准确,因为他们正在组织它以适应想法。这些人可能看起来很自信,这使得其他人更有可能相信他们。 (这些人在电视上表现很好,即使他们不是那么好的预言家。)

Net-net:很难从我们自己的角度来看问题,因此最好汇总来自多个来源的信息,并考虑尽可能多的不同角度。以蜻蜓为例:蜻蜓的眼睛由许多不同的镜片组成,所有这些镜片在蜻蜓的脑海中组合成一个图像。泰洛克建议我们应该尝试着观察像蜻蜓这样的东西。

第 4 章

当美国入侵伊朗寻找大规模杀伤性武器时,政府分析人士确信这些武器就在那里。但他们错了。事实证明,分析师不知道他们的分析方法效果如何,因为他们没有跟踪他们工作的准确性。情报界对这种事态感到适当的警惕,情报高级研究项目活动(IARPA)创建了一项研究,旨在更多地了解预测并确定如何衡量预测。

该研究在预测者之间建立了一场锦标赛式的比赛,作为比赛的一部分,公众被要求做出预测。一贯做出最准确预测的人被过滤掉,最好的预测者的预测被加权以放大结果。研究发现,少数人非常擅长预测;他们比大多数未来的专业猜测者更准确。

人们不理解随机性。在耶鲁大学的一项研究中,人们被要求说出抛硬币的结果,然后被告知结果是否正确。在 30 次抛掷中,他们被告知 15 次是对的,15 次是错的,但结果却被操纵了。有些人很早就有过一次正确的抛硬币的同花顺,这些人最有可能给人留下这样的印象:他们在抛硬币方面有某种天赋。显然,这是错误的,因为抛硬币不涉及任何技能。

存在各种各样的逻辑谬误。例如,如果电视节目对某个预言家大肆渲染,因为他在某个特定场合是正确的,那么这并没有任何意义,因为任何人都可能意外地正确一次。这只是随机概率。

运气总是很重要,没有人,无论多么优秀,都是绝对正确的。但有些人比其他人更擅长预测未来。这些超级预测家不仅仅是运气好,而且是幸运的。他们有真正的技能。虽然优秀的预测者会随着时间的推移缓慢回归(回归均值=事物趋向于平均值),但真的好的预测者几乎不会出现倒退。年复一年,有人保持着超级预测者的地位,如果这只是偶然的运气,这是不可能的。

第五章

费米估计是开始分析的好方法。这涉及将问题分解为更小的部分,并找出可以合理估计的内容。从那里开始,剩下的一切都是你不知道的,你应该同样尝试将这些东西分解成尽可能小的类别。此估计过程会产生更准确的估计。

在尝试发现事物的普遍性时,您应该首先尝试找到所考虑事物的外部界限。例如,在估计拥有宠物狗的两个成人和一个儿童家庭的数量时,您将从拥有宠物的家庭数量开始,然后从那里开始工作。通常,人们会匆忙完成这部分,但外部限制很重要,因为人们倾向于关注他们拥有的第一个数字并从那里进行调整。因此,起始数字是一个锚,它可以防止您陷入不可能的领域。要确定内部极限,请对问题提出一些假设。然后,研究每个假设的可能性。

综合两种观点的过程的一部分是寻求外部意见。您也可以从不同的角度审视自己。例如,假设你的第一个结论是错误的,并寻找原因。你也可以尝试将工作搁置一周左右——当你以新的眼光重新审视它时,它看起来会有所不同。或者通过改变某事的措辞来改变观点;从不同的角度来看待这个问题,重新表述这个问题。预报员需要保持开放的心态。他们需要有好奇心,他们必须去证据引导他们的地方,即使它与他们喜欢的理论相矛盾。预报员需要蜻蜓般的眼睛:能够同时看到多种观点的能力。

第六章

如果你把一群人聚集在一起并要求他们所有人预测一些事情,他们会给出各种各样的答案。那是一件坏事?不,这表明他们没有陷入群体思维;他们每个人都在用自己的思想。通常,如果你找到他们所有估计的平均值,你就会得到一个非常接近事实的近似值。这就是“群众的智慧”。

概率的概念是许多人不理解的现代概念。我们的本能看到了一个简单的世界:一个由是的,也许。 (随着我们物种的进化,我们通常不需要更多的设置。有什么威胁吗?是的 - 反应!否 - 放松。也许 - 保持警惕。)概率对人们来说是令人沮丧的,因为人类的思维倾向于将一切简化回是/否/也许的范式。例如,如果下雨的可能性为 75%,但到一天结束时没有下雨,这并不意味着天气预报是错误的 — 下雨的可能性为 75%,也意味着下雨的可能性为 25%不是雨。但人们想知道“是的,会下雨”或“不,不会下雨”,而许多人对天气预报所能做的最好的事情就是将其归类为“可能”。然而,超级预测者通常以概率的方式思考,那些希望加入他们行列的人需要抛开是/否/也许的思维模式,并学会以这种方式思考。

人们也喜欢确定性,但总有一些不确定性。这本身就是需要分析的事情,有两种不确定性:1)你可能对已知的事情不确定,2)你可能对不可知的事情不确定。当不可知的事情存在不确定性时,通常最好保持谨慎并将预测保持在 35-65% 范围内。在 IARPA 的研究中,50% 的估计最不准确,因为该数字用于表达不确定性。换句话说,当人们说有 50-50% 的机会时,这只是一种表达“也许”的奇特方式。然而,优秀的预测者往往会非常细致,会深入研究许多细节。粒度可以提高预测的准确性。

人们寻找意义,尤其是在悲剧时期。他们寻找“为什么?”有些人求助于宗教。有时,当某件事发生时,人们会说这是注定要发生的。他们问,我们那天见面的可能性有多大?但无论多么不可能,那天你一定在某个地方,而且你也可以很容易地遇到其他人。科学家不会问“为什么?”他们问:“怎么样?”超级预言家不相信命运。

第7章

没有简单的数字绘制方法可以实现良好的预测。但是,有些操作通常会有所帮助:

  • 将问题分解为更小的部分。
  • 识别已知和未知。
  • 仔细看看你的所有假设。
  • 考虑外部观点,将问题框定为更广泛的现象中的一个变体,而不是一个独特的事物。
  • 然后,看看是什么让它独一无二;看看你的观点与其他人的观点有何相同或不同。
  • 用蜻蜓的眼睛吸收所有这些信息,构建一个统一的视觉;尽可能清晰简洁地描述你对此的判断,尽可能细化。

一旦做出预测,工作还没有结束。每当有额外信息时,就应该更新预测,而超级预测者比其他预测者更频繁地更新他们的预测。这些更新的预测往往更准确,因为更频繁更新的预测者可能会更了解情况。

更新预测是一件很棘手的事情——人们可能反应不足,也可能反应过度。通常,当我们面对新信息时,无论新证据如何,我们都想坚持自己的信念。人们对事物的看法实际上更多的是关于他们自己的自我认同,而不是其他任何事情。此外,对某件事投入情感的人越多,承认错误就越困难。另一个挑战:一旦人们公开对某件事表明立场,就很难让他们改变观点。但当事实发生变化时,你需要能够改变你的观点。

区分重要信息和不相关信息也很棘手。有时人们认为某件事很重要,但事实并非如此,不相关的信息可能会造成混乱并引发偏见。当一个人对结果不感兴趣时,他们可能会反应过度。当他们真正依恋时,他们可能会反应不足。

诀窍是经常更新预测,但在大多数情况下,只进行微小的调整。当然,有时您需要做出巨大的改变。如果你确实离目标很远,渐进的改变并不能解决问题。

第八章

有些人认为他们就是他们自己,他们无法改变和成长。这些人不会改变和成长。因为他们认为自己做不到,所以从不去尝试。它成为一个自我实现的预言。这些人有固定型思维模式。超级预测者具有成长心态。

著名经济学家约翰凯恩斯非常擅长投资股票市场。他仔细评估了自己的所有失败,并系统地改进了自己的表现。他变得非常成功。

为了成功,我们必须尝试。为了进步,我们必须尝试、失败、分析、调整、再尝试。我们边做边学。我们通过重复来提高。这绝对适用于所有技能。学习预测也是同样的道理。你不能仅仅通过阅读书本来学习它。你必须做。泰洛克还解释说,如果你非常擅长在一种环境(天气)中进行预测,那么它就不会很好地转化为另一种环境(全球政治)。你需要全身心投入,针对每种情况不断练习。

有时你必须接受错误。犯错误是学习过程的一部分。要从失败中学习,我们必须知道我们失败了。所以练习之后需要有反馈。如果没有反馈,人们就会认为自己做得很好并变得过于自信。如果没有反馈,人们就会不断错误地思考自己的表现。反馈应该在事件发生后立即进行,此时一切都还记忆犹新。否则,事后偏见就会出现——一旦我们知道某件事的结果,它就会影响我们对事件的记忆。

那么,事后尸检非常重要。案后彻底解构你的预测。你做对了什么?你做错了什么?为什么?并且要明白,仅仅因为你预测的事情发生了,并不一定意味着你的过程是可靠的——这可能只是巧合。想要因正确的预测而获得功劳并最大限度地减少机会因素是人的天性,但冷静的分析将帮助您提高。

永久测试版意味着持续分析和改进。保持永久的 Beta 状态是一种比智力更重要的方式。事实上,在超级预测者的所有共同品质中,最能预测谁将成为超级预测者的品质是永久测试版的品质。在这种情况下,毅力和坚韧是重要的品质。

第九章

猪湾入侵计划和执行不力。肯尼迪政府失去了信誉,但在古巴导弹危机期间情况发生了变化。处理这两个事件的团队几乎是同一个团队。

在猪湾事件之后,肯尼迪展开了一项调查,以找出问题所在。决策过程被确定为问题所在。团队成员是群体思维的受害者,这是因为人们想要彼此相处。有时,他们会下意识地调整自己的信念,与团队一起走。整群人都可以通过这种方式远离任何理性的停泊处。

肯尼迪团队开发了一种新的、持怀疑态度的方法,他们开始质疑他们的假设。有时,Kennedy 会故意离开房间,让团队有空间在没有老板的情况下提出想法。这真的很有价值。最终,当古巴导弹危机发生时,他们能够产生各种替代解决方案。他们改进的方法很可能使世界免于一场核战争。

这表明一个团队有可能改变他们的决策过程以使其变得更好。当一个积极进取的团队能够学会改变时,就没有必要寻找完美的团队。尽管存在群体思维的风险,但团队合作可以提高判断力,实现比个人单独实现更大的目标。泰特洛克提出了这样的问题:预测员应该团队合作,还是每个人单独工作?

  • 缺点:团队会使人变得懒惰。让其他人来做工作,他们告诉自己,而我们在后台闲逛玩小游戏。此外,团队可能容易受到群体思维的影响。
  • 优点:人们在团队合作时可以共享信息。他们可以分享观点。有了许多视角,蜻蜓眼变得更容易接近。聚合是如此重要。

为了确定优势和劣势是否相互抵消,他们进行了一项研究,看看预测团队是否比个人工作得更好。结果是明确的:团队显然比人更准确。此外,当超级预测者组成团队时,他们的预测超过了预测市场。

这些发现虽然不是成功的必然秘诀,但强调了良好的团队动力的重要性。团队也应该有开放的心态;他们应该有分享的文化。最后,多样性非常重要——甚至比能力更重要。由具有不同观点的不同人员组成的超级团队有更多信息可以继续。

第10章

超级团队在扁平化、无等级结构的情况下运作效果最佳。但企业和政府——需要预测者帮助他们做出决策——在很大程度上是等级森严的。这些如何组合在一起?是否有可能在层级组织中培育出扁平、灵活的结构?有趣的是,泰特洛克以国防军为例。 (他这样做是为了说明需要区分感受和偏见——例如,对国防军作为模型的反应或不适——这样它们就不会影响预测。)

十九世纪,普鲁士军队取得了对邻国的胜利。普鲁士人明白,不确定性是现实的重要组成部分,普鲁士领导人对不确定性也进行了很多思考。重要的是要认识到情况可能变化得非常快。由于对不确定性的强调,官员们接受了灵活应变的培训,以便他们能够在出现情况时进行处理。甚至士兵也被鼓励在适当的时候质疑权威。这一原则被称为“auftragstaktik”,字面意思是,任务指挥.在战争中,需要在当地做出决定以应对不断变化的局势。指挥官告诉下属目标是什么,而不是如何实现它。即使是最卑微的士兵也被期望有自主权。

纳粹继承了这支军队:国防军。国防军在很长一段时间内非常成功。然而,最终他们还是被优势兵力压垮了。错误加速了他们的失败,其中包括希特勒的独裁领导违反了“auftragstaktik”原则。

相比之下,在美国陆军中,下级从来不被允许向上级提出质疑。他们收到了冗长、详细的命令,详细说明了他们要采取的每项行动。几乎没有例外。美国陆军直到 20 世纪 80 年代才吸取了“auftragstaktik”的教训。可以说他们还有很长的路要走,但从那时起他们已经变得更加去中心化。当美国入侵伊拉克时,彼得雷乌斯将军有权对他在当地发现的情况做出反应,并能够最大限度地减少阻力。他强调,员工要学会灵活思考,遇到问题及时处理;从不同角度看待事物的重要性。

第11章

我们遇到的一个大陷阱是认为你所看到的就是全部。我们都会犯错误,却忘记仔细检查我们的假设。通常,我们对问题的范围没有给予足够的关注。例如,如果你问某人:“今年叙利亚的阿萨德统治会垮台吗?”他们的答案将反映出他们是否认为阿萨德统治会曾经落下。他们对范围不敏感。

超级预测者比普通预测者表现出更好(虽然不是完美,但更好)的范围敏感性。他们使用系统 2 定期检查系统 1,使其变得自动化。这样,系统2就成为系统1的一部分。

在一本关于预测的书中,泰特洛克自然必须讨论纳西姆·塔勒布的黑天鹅。最初,欧洲所有的天鹅都是白色的。如果你让一个英国人想象一只非常奇怪的天鹅,他可能会想到一只尺寸异常的天鹅,或者有一个有趣的喙之类的天鹅。但他想象中的所有不同的天鹅很可能都是白色的,因为他从未见过不同颜色的天鹅。即使他试图想象另一种天鹅,他也无法想象。然后,在 17 世纪,英国船只往返澳大利亚,并带来一些纪念品和奇特物品,其中包括一只黑天鹅。这位英国人正在看到一些他以前无法想象的事情。头脑=震惊。

纳西姆·塔勒布(Nassim Taleb)提出的整个黑天鹅理论危及泰特洛克的理论,因此他为读者解构了它。您如何准确定义“黑天鹅”?如果你指的是以前无法想象的事情,那确实是极其罕见的。或者你可以将其简化为“极不可能产生重大后果的事件”。获取极不可能发生的事件的数据非常困难——就其本质而言,它们不会经常发生。良好判断项目运行的时间还不够长,无法收集足够的数据。

如果你仔细观察所谓的黑天鹅事件,它们大多是可预测的,但并不准确。预测的未来越远,预测就越不准确。预测的准确性会随着时间的推移而降低,直到大约五年后,它才与机会相等。因此,长期预测是不可行的。尽管如此,各种公司和机构都做出了长期预测。有时需要它们,以便制定长期计划。在这些情况下,最好的办法就是做好意外惊喜的准备。规划弹性和适应性;想象不可能的事情发生的不同场景,并决定你将如何应对。

第12章

有时,人们对预测他们不喜欢的事情的预测者怀有敌意。相反,他们可能对那些预测他们想听到的内容的人特别友好。有时政治比预测更有力量。有时,人们利用预测来捍卫自己或部落的利益,在这种情况下,准确性往往会退居二线。有些人因为害怕改变而坚持现状,但可以通过良好的研究来说服他们。 (泰特洛克利用了一些鼓舞人心的例子,这些人利用证据和分析来影响人们的观点并改变社会。)

出于多种原因,良好的预测非常重要。它可以决定成功与失败、和平与战争。记录分数和跟踪结果是评估预测的最佳方式。这将有助于预测员改进。这也将有助于我们让人们对做出无法衡量的模糊预测负责。我们需要认真对待记分。

Brier 分数(衡量预测与实际结果之间的差异)相当不错,但与任何事物一样,总有改进的空间。幸运的是,信息技术的兴起加速了我们的计算和测试能力。例如,由于系统地寻找基于证据的解决方案,运动员的表现得以显着提高。

然而,虽然数字是可爱的东西,但它们毕竟只是工具。我们不能为本质上不可数的事物分配度量。有时,真正重要的问题是最难得分的。有时您必须查看复杂的情况并将其分解为较小的问题。需要为此开发更好的方法。