数据专家称直觉告诉他川普会赢,“但你不要相信任何人的直觉”

小编先讲讲本文的作者Nate Silver:对于一般的中国读者来说,这个名字或许不怎么熟悉;但是对于了解美国政治的人而言,这个名字可谓如雷贯耳。不同于其他统计学家,据说他一句话能够让白宫里的总统都开始紧张、牵动千万美国人的神经,被称为“数据魔法师”——这其实都源于他对自2008年始的历次美国国内选举的超精准预测。在2008年美国大选前,他成功预测了美国50个州当中49个州的结果,唯一预测失误的印第安纳州的结果和他的预测仅仅相差1个百分点,这让他声名鹊起,成为政界新宠;2010年国会中期选举,虽不如08年时精准,他仅失误了预测了11席众议院席位和3个州的参议院席位;2012年Nate Silver更是大显神威,成功预测包括9个摇摆州在内美国全部50个州的大选结果,百发百中,无一失误⋯⋯Nate Silver一次次为人们带来奇迹般的预测,让你不得不相信,有人生来就精于此道。下面就是他对2024年大选的预测,以飨读者。

在一场七个关键州的选举中,民调结果都在一个百分点左右波动,50-50是唯一负责任的预测。自从贺锦丽和川普的辩论以来,我的模型基本上就是这样预测的。

然而,当我传达这个令人不满意的消息时,我不可避免地会被问到:“拜托,内特,你的直觉是什么?”

好吧,我会告诉你。我的直觉是川普(会赢)。而且我猜许多焦虑的民主党人也是这么想的。

但我认为你不应该对任何人的直觉——包括我的——赋予任何价值。相反,你应该接受50-50的预测确实意味着50-50。你也应该开放地接受这些预测可能是错误的,这种错误可能同样发生在川普先生或贺锦丽女士身上。

这并不是说我本质上反对直觉。在扑克中,例如,它起着很大的作用。我多年来与之交谈的大多数专家玩家都会说,它会给你一点额外的优势。你永远无法确定,但你的直觉可能会通过捕捉竞争对手虚张声势的模式,将胜率倾向于60-40。

但扑克玩家基于数千手的经验得出这一点。总统选举每四年才举行一次。当被问及谁会赢时,大多数人会说川普,因为最近的偏见——他在2016年赢了,当时并不被看好,然后在2020年几乎赢了,尽管民调远远落后。但我们可能不记得2012年,当时巴拉克·奥巴马不仅赢了,还超过了民调。预测民调误差的方向极其困难。

为什么川普可能会超出民调

那些直觉告诉他们川普先生会赢的人经常提到“害羞的川普选民”的概念。这个理论借用了“害羞的保守党人”一词,指的是英国民调低估保守党的倾向,认为人们不愿意承认投票给保守党是因为社会污名。

但没有太多证据支持害羞选民理论——全球范围内也没有右翼政党现实表现持续超出民调预测的趋势。例如:玛丽娜·勒庞的国民联盟党在今年夏天的法国立法选举中表现就不及民调。如今,许多人很自豪地承认他们支持川普,现在投票给他的污名比以往任何时候都少。

相反,可能的问题是民调专家所说的非响应偏差。并不是川普的选民对民调撒谎;而是在2016年和2020年,民调专家没有接触到足够多的川普选民。

非响应偏差可能是一个难以解决的问题。即使是最好的电话民调,响应率也只有个位数——从某种意义上说,选择回应民调的人是不同寻常的。川普的支持者往往具有较低的公民参与度和社会信任度,因此他们可能不太愿意完成新闻机构的调查。民调专家正试图通过越来越激进的数据处理技术来纠正这个问题,比如按教育程度加权(受过大学教育的选民更有可能回应调查)甚至按人们过去的投票方式加权。但没有任何保证这些方法会奏效。

如果川普先生确实超出了他的民调,将至少有一个明显的迹象:民主党在党派认同上不再有优势——现在大约有同样多的人认同自己是共和党人。

还有一个事实是,贺锦丽女士正在竞选成为第一位女性总统和第二位黑人总统。所谓的布拉德利效应——以前洛杉矶市长汤姆·布拉德利命名,他在1982年加州州长竞选中表现不及民调,指的是选民倾向于说自己未决定,而不是承认他们不会投票给黑人候选人——在2008年或2012年对巴拉克·奥巴马来说不是问题。不过,唯一一次女性成为其党派提名人时,未决定的选民大多反对她。因此,贺锦丽女士可能需要担心“希拉里效应”。

为什么贺锦丽有可能会超出她的民调

低估贺锦丽女士的民调出现意外并不一定比川普先生的意外更不可能。平均而言,民调会有三到四个百分点的误差。如果贺锦丽女士能做到这一点,她将以自2008年奥巴马以来在普选和选举人团中最大的优势获胜。

这可能是如何发生的呢?这可能类似于2017年英国发生的事情,与“害羞的保守党人”理论有关。原本预计保守党会大获全胜,但选举结果却是保守党失去了多数席位。民调专家之间存在很多分歧,有些确实预测到了结果,但其他人则犯了不信任自己数据的错误,在多年来担心“害羞的保守党人”之后,进行了临时调整。

民调越来越像小型模型,民调专家在如何将非代表性的原始数据转化为选民的准确代表方面面临许多决策点。如果民调专家害怕再次低估川普先生,他们可能会有意或无意地做出有利于他的假设。

例如,民调专家正在应用的新技术可能有些过头。其中一个问题是使用“回忆投票加权”,即试图考虑选民在上次选举中报告的选择,因为人们经常记错(小编:记错自己投票给哪个总统候选人?这人得多糊涂啊?还能投票吗?)或误报他们投票给谁,并且更有可能说他们投票给了获胜者(2020年是拜登先生)。

这可能会对贺锦丽女士的民调产生偏见,因为那些说他们投票给拜登先生但实际上投票给川普先生的人会被标记为新的川普选民,而实际上他们并不是。此外,有一个可信的说法是,2020年的民调错误部分是由于新冠疫情的限制:民主党人更有可能待在家里(小编:这是说信奉民主党的选民往往好吃懒做吃不工作靠政府救济为生吗?),因此有更多时间接听电话。如果民调专家正在纠正这种百年一遇的情况,他们这次可能会做得过头。

最后,自从最高法院推翻罗诉韦德案(堕胎权)以来,民主党在过去两年的特别选举、公投和2022年中期选举中,表现一直很强劲。民主党不应寄希望于这一点:像《纽约时报》/锡耶纳学院这样的高质量调查可以通过显示民主党在这些低投票率选举中表现最积极的选民中民调强劲来复制这些结果——但川普先生通过赢得大多数边缘选民来弥补这一点。因此,民主党人可能希望投票率较低。如果这些边缘选民不出现,贺锦丽女士可能会表现超出预期;如果他们出现,川普先生可能会表现超出预期。

或者民调专家正在趋向于一个错误的共识

这里有另一个违反直觉的发现:选举不太可能是势均力敌的结果。

由于民调平均值如此接近,即使是像2016年或2020年那样的小系统性民调误差也可能为贺锦丽女士或川普先生带来一个轻松的选举人团胜利。根据我的模型,大约有60%的可能性会有一位候选人横扫至少七个关键州中的六个。

每当民调公司发布被认为是“离群值”的结果时,它们都会在社交媒体上受到抨击——所以大多数公司不会这样做,而是趋向于共识,并与民调平均值(以及人们的直觉)相匹配。《纽约时报》/锡耶纳学院的民调是少数几个常规例外之一,它们描绘了一个与其他民调大不相同的选民群体,川普先生在黑人和西班牙裔选民中取得了显著进展,但在密歇根州、威斯康星州和宾夕法尼亚州这些蓝墙州落后。

如果其中一位候选人相对决定性地获胜,或者与2020年相比出现更大的变化,不要感到惊讶。(点击这里看原文

发表评论