本文使用数据科学和预测模型,通过审查各种统计指标并预测未来 10 天的增长来研究病毒在佐治亚州的传播。我们还将值与其他州/国家/地区进行比较。

请注意,本文主要是为了说明使用机器学习算法进行预测的示例,该算法具有公开可用的有限数据,本文的意见不应被解释为专业建议。

指数增长

病毒爆发于12月下旬在中国武汉爆发。自那时以来,它使全世界300多万人患病。截至2020年4月27日,美国冠状病毒疫情已增至至少100万例。纽约、新泽西和马萨诸塞州是目前的主要疫情集群。

本文的主要目标是应用数据科学从数据科学的角度审查各种增长/统计指标,并预测未来 10 天的案例数。

关键统计数据

让我们来看看截至 2020 年 4 月 27 日的状态。

我想回答的问题是

  1. 检测总数、阳性病例、住院率和死亡数是多少?

  2. 这些数字增加的幅度一天

  3. 预测未来10天的病例、死亡和住院情况

确诊病例分析

在127,169次测试中,有24,226次证实科维德呈阳性。这意味着,19% 的检测病例被确认为阳性。这不是一个好的数字。

相比之下,美国约为20%,韩国、澳大利亚和新西兰约为2%。加拿大、德国和丹麦的6%至8%左右。意大利约为15%。因此,在这种情况下,格鲁吉亚19%的正率相当高。好消息是这个数字一直在下降。因此,获得3%到10%将是理想的(尽可能低)。

与其他州相比,死亡百分比与其他州相当。这个数字是用死亡数/确诊病例数计算的。

例如,纽约、新泽西和马萨诸塞州的税率为 5% 到 6%。在其他国家,其1%或2%的确诊病例。

已完成测试的百分比

4月份,佐治亚州平均每天进行4000次测试。

人口为1062万,每10万人口38人(+4000/(10.62*1000000)=1000000人)

哈佛全球卫生研究所建议每10万人进行152次测试。

相比之下,马萨诸塞州和纽约州每天每10万进行100次以上的测试。

为了每10万人进行100次测试,格鲁吉亚必须每天做10620次测试。为了达到每10万人152次测试,格鲁吉亚每天必须做16143次测试。

格鲁吉亚要达到这个数字还有很长的路要走。

最近 30 天内确诊病例增加统计信息

通过将当前值与 1 或 2 或 3 或 4 或 4 或 5 或 5 或 10 或 15 或 15 或 20 或 25 或 20 天前以及 4 月 1 日的值进行比较来计算已确认案例值数这些数字在图表的标题中突出显示。

住院增加统计在过去30天

住院增加值的计算方式是将当前值与 1 或 2 或 3 或 4 或 4 或 5 或 10 或 10 或 15 或 20 或 25 或 20 天前以及 4 月 1 日的值进行比较。

要查找的关键数字是需要多少天才能翻倍,增加 4 或 5 倍等。这些数字在图表的标题中突出显示。

死亡人数增加 最近30天的统计数据

下面引用的数字通过将当前值与 1 或 2 或 3 或 4 或 4 或 5 或 10 或 10 或 15 或 20 或 20 天或 25 或 30 天前以及 4 月 1 日的值进行比较来计算。

要查找的关键数字是需要多少天才能翻倍,增加 4 或 5 倍等。这些数字在图表的标题中突出显示。

未来 10 天的预测

这些预测使用使用时间序列数据的 R 代码使用 Facebook 先知算法完成。时间序列预测与其他受监督的回归问题有很大不同。尽管预测可以被视为受监督回归问题的子集,但由于观测的时间性质,需要一些特定的工具。

有许多方法,如指数平滑、阿里玛、萨里玛、LSTM等。 我在这里采取的方法是,将之视为时间序列数据,并使用流行的Facebook先知算法进行日常数据github.io/prophet/””不跟随”\脸谱先知在这里。Facebook 先知算法对如何处理趋势和季节性具有更多的控制力。它具有良好的控制,用于将增长建模为线性或物流,处理趋势突然变化的点。

这一趋势一直在上升,尤其是14天的趋势。病例和住院率似乎在17天内翻了一番。重要的是减慢上升速度(使曲线变平),并可能降低。

使用复制编号的确诊病例预测超出了本文的范围。有关该方法的示例,请参阅本文

总结

目前的指标确实表明,佐治亚州必须采取许多预防措施(社会疏远),以保持传播的低和显著增加测试覆盖率。病例、住院率和死亡率呈上升趋势,尤其是14天的趋势。必须采取措施平缓趋势(曲线)。

Comments are closed.