谷歌搜索数据可以预测癌症的发病率和死亡率
关于疾病和健康类的搜索,一直以来包含在热门的主题搜索当中。这样看来,一些这样的搜索数据也许可以向我们提供一个关于一些癌症形式的可靠信息,不但是发病率,还有死亡率。
最近一篇发表在《JAMA Dermatology》上的文章,研究人员提出了一个简单的问题:
“国家特定的互联网搜索量是否与美国常见癌症的发病率和死亡率相关?”
结果是非常戏剧性的。美国常见癌症 8 种中就有 5 种发病率与谷歌搜索量在统计学上具有显著的相关性:
结肠癌:R = 0.61; P < .001;肺癌: R = 0.73; P < .001;淋巴癌:R = 0.51; P < .001;黑色素瘤:R = 0.36; P = .01;甲状腺癌:R = 0.30; P = .03。
这 5 类癌症中有 4 类不但发病率与谷歌搜索量相关,死亡率也有着相关性:
结肠癌: R = 0.61; P < .001;肺癌: R = 0.62; P < .001;淋巴癌: R = 0.38; P = .006;黑色素瘤: R = 0.31; P = .03。
统计学上的相关性还是非常明显的。
这是一种非常有趣而又常见的动态。当我们学会在网络上搜索,搜索结果向我们提供你需要的信息。从零售到导航,这种互惠的利益现在也可以应用到癌症和健康领域了。但是,这种概念并不是新出现的。早在 2008 年,谷歌开始进行一项有趣的分析,流感相关的搜索数据能否尝试用来预测真实的爆发。然而,谷歌没有达到预想的那样,错失了 2013 年流感季节的高峰期。在《Nature》杂志中的一篇社论《When Google got flu wrong》提供了更为深层次的视角。
现实中,我们的数字足迹——从搜索到游戏,都能够提供大量的信息,足以创造一个生活、疾病和健康的画像,并且其中很多是基于个性化和基于人群的,能够充分的利用这些数据是非常有意义的。
参考资料:[1] Google Search Data Can Predict CancerIncidence And Mortalit