美国的新冠疫情病例为什么这么多?
2020-11-29

美国现在的新冠疫情病例数字已经突破了1300万人,美国的各家电视台也纷纷开始用悲伤的语调表达沉痛哀悼。当然在世界各地,想必也有很多人说,美国完蛋了!且慢,对于数据驱动的美国来说,不得不问的一个问题在于,美国这1300万病例数字靠谱吗?

如果认真点回答这个问题,答案是:不但不靠谱,而且这些数据还很扯淡。

美国是一个数据驱动的国家,凡事要是没点数据,那就会被人分分钟戴上一顶“不科学”、“不专业”的帽子。不过,国会的媒体《国会山》报抱着忍无可忍的态度指出,“毫无疑问,数字就是不对。无论是新冠确诊病例、死亡病例还是模型预测,关于新冠疫情的大部分数据都有误导性,只是与实际数据相差多少的问题。”

美国白宫对于美国在数据统计上的失败,也是分外无奈,它的一份官方文件中写道,“美国政府也使用COVID追踪项目的检测数据,而这些数据统计都以赤裸裸的数字细节记录了政府在病毒检测数据方面的失败”。

既然数据不靠谱,没有办法,大家只好自己来了。

媒体经常引用的疫情数据,大多来自美国约翰斯·霍普金斯大学的一个疫情统计项目;还有一些研究机构引用美国统计数据网站Worldmeters的实时疫情数据;当然有能耐的美国媒体还自行统计数据,比如美国有线电视新闻网、美国全国广播公司等。所以,一个奇特的数据现象在美国出现了,不同平台发布的数据不尽相同,几乎没一个是一样的。

那么有没有官网的、权威的数据来源呢?理论上还真是有的,这就是美国政府疾病控制中心(CDC)的数据了。如果你查各州政府的数据并且有怀疑的话,那么美国的各州政府都会以认真的态度建议你,以CDC的数据为标准。可要命的是,美国CDC自己也发了一堆的免责声明说,我们的数据更新,更加滞后。

实际上,美国的疾病控制中心(CDC)还强调,由于种种原因,疾控中心不知道新冠确诊病例、入院病例和死亡病例的确切数字。如果疾控中心与各州和地方公共卫生部门报告的数据有不同,那么各州通报的数据应被视为最新数据。于是,问题又转回来了!美国疾控中心免疫与呼吸疾病中心主任南希·梅森尼尔也坦率的在一份声明中承认,美国CDC的检测数据与实际检测病例数的差别正变得越来越大。

美国的病例数据统计究竟出了什么问题?

尽管粗略的来看,问题也是太多了。各种BUG多的已经成了开玩笑的好材料,而最显眼的是两大问题。

第一个问题是美国CDC说是统计数据,实际是不统计数据,只是汇总数据,真正做统计的是各州政府。按照CDC的解释,当前有60个美国附属辖区报告COVID-19病例。这就包括50个州;哥伦比亚特区;纽约市、美属萨摩亚、关岛、美属北马里亚纳群岛、波多黎各和美属维尔京群岛;以及与美国签署自由联合契约的三个独立国家(密克罗尼西亚联邦、马绍尔群岛共和国和帕劳共和国)。

要注意的是,这所有60个地方的统计标准都是不一样的!

美国CDC的解释是,轻症病例的症状可能会延迟出现,报告的数据和检测存在滞后,并非所有病例都需要检测或就医,而且美国各州和地方确认疫情数字的方法也可能存在差异。

不过,美国福克斯电视台的话就比较尖刻了:数据统计重复了。也就是说,如果一个人进行3次病毒检测,结果均呈阳性,很可能算成3人确诊。美国民间组织“促进繁荣委员会”主席、自由市场政策分析师菲尔·科尔本称,美国新冠肺炎确诊病例的增加很大程度上是因为各州把阳性患者的“重复检测”当成不同的个体。这也就是说一个人病毒检测结果呈阳性,随后的每次检测都被视为新增病例。科尔本表示,“所以美国数据是一个大烂摊子。这是非常不幸的,因为在一些地方确诊人数确实出现了上升,但由于过度测试,我们现在拥有大量糟糕的数据,让人很难区分,也很难评估疫情到底有多严重。”

如果你说“这人是为特朗普帮忙“的,他的讲话不可信,那么请再看第二个问题。

第二个问题是,美国的CDC自己就声明,它的所谓官方数据包括有大量的疑似病例和死亡数字。就像美国CDC自己声明的那样,截至2020年4月14日,CDC病例数和死亡数包括确诊、疑似病例数和死亡数。所以说白了,那就是疑似病例和死亡病例都被计算在内。这对其他国家来说,简直不可思议,但对美国这种数据驱动的国家来说,可能只会耸耸肩说,这是重复计算的部分。

没办法,看来美国是绝对不嫌“事大“的一个国家。美国人发明了不少的数据工具,但如果把美国的理论研究放一边,从美国的真实数据运用来看,美国早晚可能被自己的数据驱动玩死。

 

 
 
Copyright (C) 陈功 2001, All Rights Reserved
ICP:京ICP备11028426号