27岁华裔小伙一战成名!自建最准新冠预测模型,研发期间遇到了哪些困难?

如题所述

27岁华裔小伙自建最准新冠预测模型,顾友阳和父母住在加州的圣克拉拉,他花了一周时间建立了自己的新冠病毒死亡人数预测模型和一个展示病例信息的网站。不久之后,他的模型预测的结果开始比那些拥有数亿美元资金和数十年经验的机构预测的结果更加准确。

      美国一位华裔小伙用一周时间建立的一个新冠死亡人数预测模型,准确率击败了耗费巨资建模的全球权威机构。 权威的统计模型应运而生,当公众试图判断冠状病毒在3月和4月可能会有多大影响时,人们一再提到两个预测系统:一个来自伦敦帝国理工学院建立,另一个来自总部位于西雅图的卫生计量与评估研究所(下文简称IHME) 但这些模型的预测结果大相径庭,帝国理工学院警告称,美国可能会有多达200万人死于新冠,而IHME的预测要保守得多,预计有6万人死亡。事实证明,两者的预测都不是很准确。美国死亡人数最终达到了16万人。

       预测数据的巨大差异引起了当时26岁的数据科学家顾友阳的注意。这个年轻人拥有麻省理工学院的电气工程和计算机科学硕士学位,还有一个数学学位,但没有接受过医学或流行病学等流行病相关领域的正式培训。尽管如此,他认为他处理数据模型的经历在疫情期间可能会派上用场。顾友阳和父母住在加州的圣克拉拉,他花了一周时间建立了自己的新冠病毒死亡人数预测模型和一个展示病例信息的网站。不久之后,他的模型预测的结果开始比那些拥有数亿美元资金和数十年经验的机构预测的结果更加准确。旧金山大学著名数据专家和研究科学家杰里米·霍华德说:“他的模型是唯一看起来合理的,其他模型一次又一次地被证明是无稽之谈,但发表预测的人或报道这些预测的记者却没有反省。人们的生活依赖于这些东西,而友阳是唯一一个认真看数据并好好处理的人。”

      顾友阳建立的预测模型从某种程度上来说很简单。他一开始考虑研究新冠检测、住院和其他因素之间的关系,但后来发现各州和联邦政府报告的数据不一致,最可靠的数字似乎是每天的死亡人数。顾友阳说:“其他模型使用了更多的数据来源,但我决定依靠过去的死亡来预测未来的死亡,把它作为唯一的数据输入,有助于过滤掉信号中的杂质。”尽管并不完美,顾友阳的模型从一开始就表现良好。他在预测,,美国将有8万人死亡。实际死亡人数为79,926人。预测可谓是非常准确。

      编辑整合模型清单的赖克说,该组织在疫情后期的预测是合格的。赖克说:“早期,IHME的模式并没有达到它所宣传的效果。最近,它形成了一个合理的模式。我不会说这是最好的一种,但它是合理的。”

温馨提示:答案为网友推荐,仅供参考
相似回答