超级预测:总结与回顾

进度条

超级预测:总结与回顾

书评

情报高级研究项目活动 (IARPA) 是一家希望研究预测艺术的情报机构。他们创建了一项研究,预测者相互竞争——锦标赛风格——以预测当前事件。

作为本次比赛的一部分,志愿者被要求做出预测。始终做出最准确预测的志愿者——“超级预测者”——被证明具有卓越的预测能力。有趣的是,这项研究清楚地表明,做出准确的预测并不依赖于任何特殊的才能——这是一种后天习得的技能。

超级预测:预测的艺术与科学 致力于了解这些超级预测者并探索普通人如何成为其中之一。在 超级预测, Philip Tetlock 和 Dan Gardner 梳理出超级预报员的一些重要品质:

  • 哲学观=谨慎、谦逊、不确定
  • 思维方式 = 思想开放、聪明好奇、善于反思、善于计算
  • 预测风格=务实,分析,蜻蜓眼,概率,周到更新者,直觉心理学家
  • 职业道德 = 成长心态,勇气

Tetlock 是一个彻底、仔细的思考者,他一步一步地慢慢建立他的论点。他很少表达他的意图,这会让等待他达到他的观点的读者感到沮丧。这样做的结果之一是这本书起步很慢。直到整本书的三分之一,Tetlock 才开始讨论他的论点,而在此期间,读者并不完全确定他的前进方向。然而,一旦他迈出大步,泰洛克就有一些有趣的事情要告诉我们关于他的主题,整本书的语气是深思熟虑和严肃的,同时又保持平易近人。理解这里提出的想法不需要高级学位。

这里提出的许多想法可能对公司、政府部门或其他组织的负责人有用。虽然没有明确说明,但没有什么可以阻止这样的人修改这些方法以满足自己的需要。然而,这样的项目将涉及大量工作。如果有向导会容易很多。

这本书不是那个指南。虽然它指明了方向,但它不是手册。因此,在这个主题上还有更多的空间可以写,人们希望 Tetlock 和他的同伙将继续探索它。

概括

总结说明: 读者会立即注意到没有介绍或序言。除了目录之外,还有一个辛酸的(如果是神秘的)奉献,然后直接处理文本的主体。附录包括 有抱负的超级预测者的十诫 其中包含实用的(如果是基本的)建议,例如“在对证据反应不足和反应过度之间取得适当的平衡”。对于那些无论如何都跳过这些材料的人来说,前面材料的稀缺性将受到欢迎。那些想要更多上下文的人会欣赏带有参考的笔记。

第1章

虽然有些人比其他人更擅长预测,但大约 2% 是超级预测者。预测是一门习得的技能,你可以在本书中学习如何自己做。

各种各样的人在电视和其他媒体上做出预测,但他们的准确性从未被真正衡量过。他们不上电视是因为他们擅长预测;他们上电视是因为他们擅长讲故事,他们很有趣,很有趣。进行预测的真正原因并不总是为了预测未来。有时,预测只是为了娱乐、说服或向人们保证一切正常。通常这些不同的目标是不明确的。

超级预测 讨论的研究表明,大多数专家在做出预测方面的准确度,就像黑猩猩向目标投掷飞镖一样准确。 (这显然是一个众所周知的案例研究,他在本书的后面会提到,在第 3 章中提供了更多的背景。)然而,这项黑猩猩研究表明的重要一点是,虽然大多数专家在他们的预测,有些是,至少在短期分析中——时间越长,预测就越不准确。三到五年后的预测接近臭名昭著的飞镖猴子的准确性。

阿拉伯之春,当革命和变革在整个阿拉伯世界爆发时,始于一个人的抗议,没有人能猜到会发生什么。科学家们过去认为现实以如此精确的方式运作,一旦我们了解它是如何运作的,我们就能够预测一切。这个想法被爱德华·洛伦兹和在巴西扇动翅膀可能在德克萨斯州掀起龙卷风的概念打乱:混沌理论。如果有混乱,那么就会有不可预测性。可预测性和不可预测性都是两回事。一个不胜过另一个;这是一个混合体。

然而,我们可以预测很多事情。我们可以预测常规事件,但即使是那些也可能因异常而错位。时间越长,预测就越困难,但也有例外。虽然未来可能会在预测中看到更多计算机与人类的混合,但人类仍然是这种混合的前沿和中心。为了做出好的预测,你需要好的算法,但你应该接受你可能不会总是拥有它们。

良好判断项目表明,有些人确实会做出良好的预测。这些人使用特定的技术,并拥有自己独特的思维方式和看待世界的方式。无论您是不是其中的一员,遵循本书中的技巧都会在预测方面带来可衡量的改进。在这个游戏中,随着时间的推移,即使是很小的改进也往往是显着的。

第2章

Tetlock 从医学史开始,强调在很长一段时间内没有有条不紊的测试。好的科学需要健康的怀疑态度,而医学界直到二战后才开始使用随机试验。决策通常基于传统和权威而不是科学。通常情况下,专家相信自己的能力和判断,而不做任何研究。例如,玛格丽特·撒切尔 (Margaret Thatcher) 的政府支持在斯巴达 (Spartan) 条件下监禁年轻罪犯的政策。它起作用了吗?他们没有做任何研究;他们认为自己的直觉最清楚。

心理学家说,我们的心理世界分为两个领域。系统 2 是我们有意识的生活。它包括我们想到的一切。系统 1 是自动反应、自动驾驶仪功能的世界。编号是有意的——系统 1 是第一位的。它总是在后台运行。仔细考虑问题可能会给我们带来更准确的分析,但这并不总是实用的。在新石器时代,人们有时不得不迅速做出反应。系统 1 非常有用。但是冲动和分析之间的二分法是错误的。这不是一个或另一个 - 最好的策略是使用两者中的一些。

人们需要理解他们的世界。当他们不理解事物时,他们通常会编造理由来解释它,但往往没有意识到他们正在这样做。然而,科学家们被训练成对自己的预感有一些自律。他们研究事物的其他可能解释;他们认为他们的预感可能是错误的。接受怀疑很重要,但这与人性背道而驰。自然的事情是抓住第一个合理的解释并收集支持它的证据,而忽略不支持它的证据。确认偏见:我们不喜欢与我们的信念相矛盾的证据。另一个思想错误是“诱饵和转换”:如果我们不能回答一个困难的问题,我们就用它来代替一个更简单的问题。

这种对话的一个重要因素是模式识别。这有助于我们几乎立即发现问题,而不必考虑太久。虽然非常有用,但模式识别也有其问题。人们在敬酒时看到耶稣的脸。他们太相信模式识别了。模式识别在某些情况下比在其他情况下更有帮助。这是了解哪些情况并学习提示的问题。如果不学习所有可能的模式,直觉就不会比随机机会更好。但是很难知道你是否有足够的有效的直觉线索来使直觉富有成效,所以在根据你的直觉采取行动之前最好仔细检查一下,以确保它通过逻辑测试。

第3章

为了评估预测的准确性,我们必须能够准确理解预测的内容。这比你想象的要困难得多。

人们做预测时很多事情都没有说明,例如,当预测者假设观众知道上下文时,这可能没问题,直到五年后您取出预测并且没有人记得上下文。很多预测都没有时间框架,因为它在预测时是隐含的。但没有时间表,预测就毫无用处。

判断预测也存在更大的障碍——例如概率。如果你说 这有可能 某事会发生,这是一种与说某事非常不同的动物 将要 发生。 Tetlock 讲述了一个例子,人们被告知有“严重的可能性”会发生某事,然后询问他们对它发生的确切可能性的看法。答案范围从 20% 到 80% 的概率,说明有时人们对某事的含义有非常不同的看法。后果可能是灾难性的。

用数字表达概率的预测者被迫更清楚地思考他们自己的过程。但数字的问题在于它们似乎非常权威。当一个想法用数字表达时,人们可能会认为某事是客观事实而不是主观意见。这个问题的解决方案是让人们更好地了解它。

另一个困难:假设气象学家说有 70% 下雨的可能性。如果不下雨,有些人可能会认为预报是错误的,但实际上,70% 的下雨几率意味着不下雨的几率为 30%。判断预报准确性的唯一真正方法是重新运行天气 100 次,看看下雨的频率。但既然我们不能这样做,我们只能说预测没有被推翻。

我们无法重新运行历史,因此我们无法判断孤立的预测。然而,我们可以做的是一起查看大量预测——查看气象学家的记录。要问的问题不是,“有一次她说 70% 有可能下雨吗?”但是,“在她说 70% 可能下雨的所有时间中,有没有下过 70% 的时间?”这是校准,通过校准气象学家的预测(按预测数量绘制正确百分比),您可以确定她是信心不足还是过度自信。但是为了进行这些评估,您需要拥有大量数据。它不适用于罕见事件。

说 60% 有可能发生某些事情也不是很有趣或令人兴奋——人们想要更多的信息。预测者越果断越好,这称为分辨率。最佳点是高分辨率和校准。

在前面提到的黑猩猩研究中,要求专家进行预测,结果显示专家并不比黑猩猩好(或随机)。然而,这个平均结果隐藏了重要的细节。实际上有两种不同类型的专家:第一种并不比做出预测的随机机会更好;第二组在预测方面比黑猩猩略好,但他们的结果仍然不是很好。

这些群体之间的差异在于他们的想法。一组围绕大创意组织他们的想法。无论是环保主义者、自由市场原教旨主义者还是社会主义者,这些理想主义者都将他们拥有的信息融入现有框架中。为了进行辩论,他们倾向于堆积为什么他们的分析是正确的理由。他们对自己的能力非常自信,即使他们错了。另一组分析师使用各种工具来收集信息。他们更关心可能性和概率而不是确定性,他们能够承认自己的错误。这些专家在校准和分辨率方面都击败了另一组。

大创意的人倾向于围绕大创意组织他们的所有思考,这扭曲了他们对世界的看法。他们可以收集他们想要的所有信息;它不会让他们更准确,因为他们正在组织它以适应想法。这些人可能看起来很自信,这让其他人更有可能相信他们。 (这些人在电视上做得很好,即使他们不是那么好的预言家。)

Net-net:在我们自己的视角之外很难看到,所以最好将来自多个来源的信息聚合起来,并尽可能多地考虑不同的视角。以蜻蜓为例:蜻蜓的眼睛由许多不同的透镜组成,所有这些透镜在蜻蜓的脑海中组合成一个单一的图像。 Tetlock 建议我们应该尝试像蜻蜓一样看待事物。

第 4 章

当美国入侵伊朗寻找大规模杀伤性武器时,政府分析人士确信这些武器就在那里。但他们大错特错。事实证明,分析师不知道他们的分析方法的效果如何,因为他们没有跟踪他们工作的准确性。情报界对这种情况感到震惊,情报高级研究项目活动 (IARPA) 创建了一项研究,旨在了解有关预测的更多信息并确定如何衡量它。

该研究在预测者之间建立了一场锦标赛式的比赛,作为比赛的一部分,公众被要求做出预测。一贯做出最准确预测的人被过滤掉,最好的预测者的预测被加权以放大结果。研究发现,少数人非常擅长预测;他们比大多数未来的专业猜测者更准确。

人们不理解随机性。在耶鲁大学的一项研究中,人们被要求说出抛硬币的结果,然后被告知他们是否正确。在 30 次投掷中,他们被告知他们对了 15 次,错了 15 次,但结果被人操纵。有些人很早就有正确的抛硬币能力,而这些人最有可能给人的印象是他们有某种跟注抛硬币的天赋。显然,这是错误的,因为抛硬币不涉及任何技巧。

各种逻辑谬误层出不穷。例如,如果一个电视节目因为某个预言家在某个特定场合是对的而大肆宣传,这并不意味着任何事情,因为任何人都可能偶然是对的。这只是随机赔率。

运气总是起着作用,没有人,无论多么好,都不会出错。但是有些人比其他人更擅长预测未来。这些超级预测者不仅仅是幸运的;他们有真正的技能。虽然优秀的预测者会随着时间的推移缓慢回归(回归均值 = 事情趋向于平均水平), 真的 好的预测者几乎不会倒退。年复一年,总有人保持着超级预测者的身份,如果只是运气问题,这是不可能的。

第五章

费米估计是开始分析的好方法。这涉及将问题分解为更小的组件,并找出您可以合理估计的内容。从那里开始,剩下的一切都是你不知道的,你应该同样尝试将这些东西分解成尽可能小的类别。这个估计过程导致更准确的估计。

在尝试发现事物的普遍性时,您应该首先尝试找到所考虑事物的外部界限。例如,在估计拥有宠物狗的两个成人和一个儿童家庭的数量时,您将从拥有宠物的家庭数量开始,然后从那里开始工作。通常,人们会匆忙完成这部分,但外部限制很重要,因为人们倾向于关注他们拥有的第一个数字并从那里进行调整。因此,起始数字是一个锚,它可以防止您陷入不可能的领域。要确定内部极限,请对问题提出一些假设。然后,研究每个假设的可能性。

综合这两种观点的过程的一部分是寻求外界的意见。你也可以从不同的角度审视自己。例如,假设您的第一个结论是错误的,并寻找原因。您也可以尝试将工作搁置一周左右——当您以全新的眼光重新审视它时,它看起来会有所不同。或者通过改变某事的措辞来改变观点;从不同的角度来看,重新表述这个问题。预测者需要思想开放。他们需要有好奇心,他们必须去证据引导他们的地方,即使它与他们的宠物理论相矛盾。预报员需要蜻蜓的眼睛:一次看到许多观点的能力。

第六章

如果你让一群人聚在一起,让他们都预测一些事情,他们会得到各种各样的答案。那是一件坏事?不,这表明他们没有进行集体思考;他们每个人都在用自己的头脑。通常,如果你找到他们所有估计的平均值,你就会对真相有一个很好的近似。这就是“群众的智慧”。

概率的概念是许多人不理解的现代概念。我们的直觉看到了一个简单的世界:一个 是的 和 也许. (随着我们物种的进化,我们通常不需要比这更多的设置。有什么威胁吗?是的-反应!不-放松。也许-保持警惕。)概率对人们来说是令人沮丧的,因为人类的思维倾向于将一切简化回是/否/也许范式。例如,如果有 75% 的下雨机会,但到一天结束时没有下雨,这并不意味着预测是错误的——75% 的下雨机会也意味着 25% 的机会会下雨 不是 雨。但是人们想知道“是的,会下雨”还是“不,不会下雨”,而许多人对天气预报所能做的最好的事情就是将其归类为“可能”。然而,超级预测者通常以概率方式思考,那些希望加入他们行列的人需要抛开是/否/可能的思维模式,学会以这种方式思考。

人们也喜欢确定性,但总有一些不确定性。这本身就是需要分析的东西,并且有两种不确定性:1) 您可能对已知的事物不确定;2) 您可能对不可知的事物不确定。当对不可知事物存在不确定性时,通常最好保持谨慎并将预测保持在 35-65% 范围内。在 IARPA 研究中,对 50% 的估计最不准确,因为该数字用于表示不确定性。换句话说,当人们说有 50-50% 的机会时,这只是一种说可能的奇特方式。然而,好的预测者往往非常细化,深入研究了如此多的细节。粒度可以提高预测的准确性。

人们寻找意义,尤其是在悲剧时期。他们寻找“为什么?”有些人看重宗教。有时,当某事发生时,人们会说这是注定要发生的。他们问,我们在那一天见面的几率有多大?但无论多么不可能,那天你必须在某个地方,而且你也可以很容易地遇到其他人。科学家不会问,“为什么?”他们问:“怎么样?”超级预测者不相信命运。

第7章

没有简单的按数字绘制的方法来进行良好的预测。但是,有些操作通常会有所帮助:

  • 将问题分解为更小的部分。
  • 识别已知和未知。
  • 仔细看看你的所有假设。
  • 考虑外部观点,将问题框定为更广泛的现象中的一个变体,而不是一个独特的事物。
  • 然后,看看是什么让它独一无二;看看你对它的看法与其他人的观点有何相同或不同。
  • 用蜻蜓的眼睛吸收所有这些信息,构建一个统一的视觉;尽可能清晰简洁地描述你对此的判断,尽可能细化。

一旦做出预测,工作还没有结束。只要有额外信息,就应该更新预测,超级预测者比其他预测者更频繁地更新他们的预测。这些更新后的预测往往更准确,因为更新频率更高的预测者可能更了解情况。

更新预测很棘手——有人可能反应不足,也可能反应过度。通常,当我们面对新信息时,我们希望不顾新证据而坚持我们的信念。人们对事物的看法实际上可能更多地是关于他们自己的自我认同,而不是其他任何事物。此外,对某事进行情感投资的人越多,承认错误的难度就越大。另一个挑战:一旦人们对某事公开表明立场,就很难让他们改变看法。但是当事实发生变化时,你需要能够改变你的观点。

区分重要信息和无关信息也很棘手。有时人们认为某些事情很重要,但事实并非如此,不相关的信息会混淆并引发偏见。当一个人对结果不感兴趣时,他们可能会反应过度;当他们真的依恋时,他们可能反应不足。

诀窍是经常更新预测,但在大多数情况下,只进行很小的调整。当然,有时您需要做出巨大的改变。如果你真的离目标很远,增量改变不会削减它。

第八章

有些人认为他们就是他们自己,他们无法改变和成长。这些不是改变和成长的人。因为他们认为他们做不到,他们从不尝试。它成为一个自我实现的预言。这些人有固定的心态。超级预测者有成长心态。

著名经济学家约翰凯恩斯非常擅长投资股票市场。他仔细评估了自己的所有失败,并系统地改进了自己的表现。他变得非常成功。

为了成功,我们必须尝试。为了提高,我们必须尝试,失败,分析,调整,再试一次。我们边做边学。我们通过重复改进。这绝对适用于所有技能。学习预测也是同样的道理。你不能仅仅通过阅读一本书来学习它。你必须做。 Tetlock 还解释说,如果你非常擅长在一种情况下进行预测——天气——它不会很好地转化为不同的情况——全球政治。您需要应用自己,针对每种情况进行练习和练习。

而且有时你必须接受错误。犯错是学习过程的一部分。要从失败中学习,我们必须知道我们失败了。因此,练习需要跟进反馈。没有反馈,人们可能会认为他们做得很好并变得过于自信。没有反馈,人们就会不断地错误地思考自己的表现。反馈应该在活动结束后立即进行,当我们脑海中的一切都还很新鲜时。否则,事后偏见就会出现——一旦我们知道某事的结果,它就会影响我们对事件的记忆。

因此,事后分析非常重要。案件发生后彻底解构您的预测。你做对了什么?你做错了什么?为什么?并且要明白,仅仅因为你预测的事情发生了,并不一定意味着你的过程是可靠的——这可能只是巧合。希望将正确预测归功于自己并尽量减少偶然因素是人类的天性,但冷静的分析将帮助您改进。

永久测试版意味着持续分析和改进。保持永久的 Beta 状态是一种比智力更重要的方式。事实上,在超级预测者的所有共同品质中,最能预测谁将成为超级预测者的品质是永久测试版的品质。在这种情况下,毅力和坚韧是重要的品质。

第九章

猪湾入侵计划和执行不力。肯尼迪政府失去了信誉,但在古巴导弹危机期间情况发生了变化。处理这两个事件的团队几乎是同一个团队。

在猪湾事件之后,肯尼迪展开了一项调查,以找出问题所在。决策过程被确定为问题所在。团队成员是群体思维的受害者,这是因为人们想要彼此相处。有时,他们会下意识地调整自己的信念,与团队一起走。整群人都可以通过这种方式远离任何理性的停泊处。

肯尼迪团队开发了一种新的、持怀疑态度的方法,他们开始质疑他们的假设。有时,Kennedy 会故意离开房间,让团队有空间在没有老板的情况下提出想法。这真的很有价值。最终,当古巴导弹危机发生时,他们能够产生各种替代解决方案。他们改进的方法很可能使世界免于一场核战争。

这表明团队有可能更好地改变他们的决策过程。当一个有动力的团队可以学会改变时,就没有必要寻找完美的团队。尽管存在群体思维的风险,但与个人单独合作相比,团队合作可以提高判断力并实现更大的目标。 Tetlock 提出了一个问题:预报员应该在团队中工作,还是每个人都应该单独工作?

  • 缺点:团队会使人变得懒惰。让其他人来做工作,他们告诉自己,而我们在后台闲逛玩小游戏。此外,团队可能容易受到群体思维的影响。
  • 优点:人们在团队合作时可以共享信息。他们可以分享观点。有了许多视角,蜻蜓眼变得更容易接近。聚合是如此重要。

为了确定优势和劣势是否相互抵消,他们进行了一项研究,看看预测团队是否比个人工作得更好。结果是明确的:团队显然比人更准确。此外,当超级预测者组成团队时,他们的预测超过了预测市场。

这些发现虽然不是成功的自动秘诀,但强调了良好的团队动力的重要性。团队也应该思想开放;他们应该有一种分享的文化。最后,多样性非常重要——甚至比能力更重要。由不同观点的不同人组成的超级团队有更多的信息可以继续。

第10章

超级团队在扁平的、无等级的结构中运作得最好。但是企业和政府——他们需要预测者来帮助他们做出决定——在很大程度上是等级分明的。这些怎么能组合在一起?是否有可能在等级组织中形成扁平、灵活的结构?有趣的是,Tetlock 以国防军为例。 (他这样做是为了说明区分感受和偏见的必要性——例如,对国防军作为模型的反应或不适——这样它们就不会影响预测。)

十九世纪,普鲁士军队战胜了邻国。普鲁士人明白不确定性是现实的重要组成部分,普鲁士领导人对不确定性进行了大量思考。重要的是要意识到情况可能会很快发生变化。由于这种对不确定性的强调,军官们接受了灵活的培训,以便他们能够在出现的情况下处理。甚至士兵也被鼓励在适当的时候质疑权威。这个原则被称为“auftragstaktik”,字面意思是, 任务指挥.在战争中,需要在当地做出决定以应对不断变化的局势。指挥官告诉下属目标是什么,而不是如何实现它。即使是最卑微的士兵也被期望有自主权。

纳粹继承了这支军队:国防军。国防军在很长一段时间内都非常成功。然而,最终,他们被优势力量压倒了。他们的失败是由错误加速的,包括希特勒的专制领导,这违反了 auftragstaktik 的原则。

相比之下,在美军中,下级从不可以质问上级。他们收到了冗长、详细的命令,详细说明了他们要采取的每一项行动。几乎没有例外。美国陆军直到 1980 年代才开始学习 auftragstaktik 课程。可以说,它们还有很长的路要走,但从那时起它们就变得更加去中心化了。当美国入侵伊拉克时,彼得雷乌斯将军有权对他在当地发现的情况做出反应,并能够最大限度地减少抵抗。他强调他的员工学会灵活思考和处理问题的重要性;从不同的角度看待事物的重要性。

第11章

我们遇到的一个大陷阱是认为所见即是。我们都可能犯错误而忘记仔细检查我们的假设。通常,我们没有对问题的范围给予足够的关注。例如,如果你问某人,“今年叙利亚的阿萨德统治会垮台吗?”他们的回答将反映出他们是否认为阿萨德统治 曾经 落下。他们对范围不敏感。

超级预测者比常规预测者表现出更好的——不是完美的,而是更好的——范围敏感性。他们使用系统 2 定期检查系统 1,使其变得自动。这样,系统 2 就成为系统 1 的一部分。

在一本关于预测的书中,泰洛克自然要讨论纳西姆·塔勒布的黑天鹅。最初,欧洲的所有天鹅都是白色的。如果你让一个英国人想象一只非常奇怪的天鹅,他可能会想到一只异常大小的天鹅,或者一只有着有趣喙的东西。但是他想象中的所有不同的天鹅都可能是白色的,因为他从未见过不同颜色的天鹅。甚至当他试图想到另一种天鹅时,他也无法想象。然后,在 17 世纪,英国船只往返于澳大利亚,带来了一些纪念品和奇怪的东西,包括一只黑天鹅。英国人看到了他以前甚至无法想象的东西。头脑=吹。

纳西姆·塔勒布 (Nassim Taleb) 发展的关于黑天鹅的整个理论危及泰特洛克的理论,因此他为读者解构了它。您如何准确定义“黑天鹅”?如果你的意思是以前无法想象的事情,那确实是非常罕见的。或者,也许您可以将其归结为“非常不可能的后果性事件”。很难获得关于极不可能发生的事件的数据——就其性质而言,它们并不经常发生。 Good Judgment Project 运行的时间不够长,无法收集足够的数据。

如果你仔细观察假设的黑天鹅事件,它们大多是可预测的,但不完全是可预测的。他们预测的未来越远,预测就越不准确。预测的准确性会随着时间的推移而降低,直到大约五年后,当它出现机会相等时。因此,长期预测是不可行的。尽管如此,各种公司和机构都会做出长期预测。有时需要它们,以便制定长期计划。在这些情况下,最好的办法是为惊喜做好准备。计划弹性和适应性;想象不可能发生的事情发生的不同场景,并决定你将如何应对。

第12章

有时人们对预测他们不喜欢的事物的预测者怀有敌意。相反,他们可能对那些预测他们想听到的东西的人特别友好。有时,政治比预测更有力量。有时,人们使用预测来捍卫自己或部落的利益,而在这种情况下,准确性往往处于次要地位。有些人固守现状是因为他们害怕改变,但他们可以通过良好的研究被说服。 (Tetlock 利用了一些鼓舞人心的例子,这些人使用证据和分析来影响人们的观点并改变社会。)

出于多种原因,良好的预测非常重要。它可以区分成功与失败,和平与战争。保持评分和跟踪结果是评估预测的最佳方式。这将有助于预报员改进。这也将有助于我们让人们对做出无法衡量的模糊预测负责。我们需要认真对待得分。

Brier 分数——衡量预测和实际结果之间的差异——相当不错,但就像任何事情一样,总有改进的空间。幸运的是,信息技术的兴起加速了我们计算和测试的能力。例如,由于系统地寻找基于证据的解决方案,运动员已经能够显着提高他们的表现。

然而,虽然数字是可爱的东西,但它们毕竟只是工具。我们无法为本质上不可数的事物分配指标。有时,真正重要的问题是最难评分的。有时,您必须查看一个复杂的情况并将其分解为更小的问题。需要为此开发一种更好的方法。