[Original] 感染高峰预测不可当真

目录
当前网上很多地方都流传一幅《各省感染高峰预测》的图表,自己看到时还包含制作者的制作说明和仅供参考的谨慎,但在多处转载传播的过程中却只留下图表数据而去掉了其中的谨慎,越发当作一个可信依据看待而偏离原始制作者的本意。
印象中这个数据的制作参考了台湾疫情期间官方数据与谷歌搜索指数的相关性研究结果,简单说就是台湾各地区的实际感染数量和对应地区谷歌疫情相关关键词搜索数量之间的比值具有一定相似性,所以理论上说获得一个地区的谷歌搜索指数并且依据这个比值就不难推测出这个地区的粗略感染数量。
这是这套计算的理论基础,之后叠加传播发展趋势相关数据就可以尝试预测高峰周期,理论上确实存在一定可行性,虽然不可能精确但确实具备一定参考价值。
由于国内疫情数据已经完全失去可信度,故而当前只能借由百度指数类比谷歌指数,以台湾的系数计算大陆各省的参考比值。因为缺失了真实疫情数据的参照,已经没有任何方法可以验证该计算的偏差幅度,所以我们既无法知道百度指数和谷歌指数是否在两地间存在可替代关系,也无法知道台湾系数和大陆是否可以类比。
台湾这个模型存在有效性的很重要基础建立在台湾地区的谷歌搜索使用习惯之上,在大陆以外很多地方无论Web环境还是移动端环境都有极高的谷歌搜索使用率,使得指数可靠性更高也更具备参考价值。而国内实际当下使用百度搜索的使用比例近年持续下降,而各应用平台内容趋向封闭使大量搜索转向应用内,外加国内不同地区、不同年龄群体的使用习惯差异可能使得不同地区指数与实际使用情况存在巨大偏差。
所以个人认为这个感染高峰预测不具备可信度。
当前防疫出现完全失去可信数据统计,仅能依赖网友通过搜索指数逆推发展趋势的情况,这本身就是一个极大的问题,相信在各国防疫过程都是罕见的,这其中暴露出的防疫管理问题值得反思。