运用大数据分析 手机可以预测埃博拉病毒的传播

瑞典非营利组织Flowminder的研究人员从西非的移动运营商那儿获得了塞内加尔手机用户的数据,为区域人口流动分析,帮助预测埃博拉病毒的传播提供了一个窗口。迄今为止,疫情已经在非洲地区造成了至少1350人死亡。

埃博拉病毒通过体液传播,潜伏期在2到21天,在此期间受害者可能不知道自己已经被感染,因此知道人们要去哪儿和去过那儿非常重要。手机在贫困国家也无处不在,就可以扮演一个关键的角色。所有手机会通过唯一的ID号向附近的信号塔告知它的存在,这样运营商就收集相关数据库,包含人口流动和社会形态的精确信息。

用手机数据预测疾病传播

数据是在2013年从运营商Orange的15万部手机中收集的,该信息已经给了许多研究者,是2015年的一项数据分析挑战赛的一部分。除了自塞内加尔手机用户的数据,研究者还使用了来自传统调查中关于人口流动的数据。Flowminder利用数据建立了人口流动模型。新的模型有助于建立一幅西非人群的整体流动格局的图片。另外,他们还基于受感染者死亡的时间和地点,制作了一个三月份以来疫情扩散的动画。

使用手机数据建立的模型并不是为了造成流动限制,而是为在何处集中进行预防措施和卫生保健提供线索。该组织负责人表示,“如果在其他地区爆发了疫情,数据可以告知与此相连的哪个地区出现疫情的可能性会增加”。

不过该模型还只是基于历史流动的初步模拟,没有考虑人们面对近期危机时如何改变他们的行为。

哈佛大学流行病学家Caroline Buckee参与了模型建立,她演示了这些数据如何能表明人们在离开一个热点后去了哪里,说明了下一个疾病群将在哪儿出现。去年,Buckee还演示了如何用手机数据分析出需要集中灭蚊的地区,帮助抗击疟疾 。此前,研究人员也试图计算公共汽车站人数,和询问病患的目的地,来创建流动性模型。

手机数据的这一应用十分引人注目。迄今为止,没有卫生部门官员们在使用Flowminder模型,但而公共卫生机构对这个领域很感兴趣。从事类似项目的Data-Pop Alliance公司表示,这种方法带来了希望。如果移动运营商提供非常精确的数据,可以提取的价值是巨大的。不过同时也要注意隐私问题,因为收集的数据透露了详细个人信息,而这些信息往往可以回溯到个人。