为大流行做好准备,例如COVID-19,取决于预测大流行过程的能力以及在爆发事件中导致人类传播的人类行为。
一项新的研究发现,电信提供商常规收集的手机元数据可以揭示被诊断患有流感样疾病的人的行为变化,同时还可以保护他们的匿名性。这项研究是由埃默里大学(Emory University)领导,布里斯托大学(University of Bristol)设计的,该研究基于2009年冰岛H1N1流感爆发的数据,并发表在《美国国家科学院院刊》(PNAS)上。
米尔·维福森博士,助理教授 计算机科学系 在 埃默里大学 和研究的第一作者,他表示:“据我们所知,我们的项目是第一大,严谨的学风单独]连结被动收集手机的元数据与实际公开健康数据”。“我们已经证明可以在不损害隐私的情况下做到这一点,而且我们的方法可能会提供有用的工具来帮助监视和控制传染病的爆发。”
该研究小组与冰岛一家主要的手机服务提供商以及该岛上的公共卫生官员合作。他们分析了超过90,000个加密手机号码的元数据,这些数字代表了冰岛四分之一的人口。他们能够将加密的手机元数据链接到1400名匿名个体,这些个体在H1N1爆发期间接受了流感样疾病的临床诊断,同时在所有阶段都保持了隐私。这项研究在COVID-19大流行之前就已经开始了很长时间,完成了十年。
维格富森博士说:“个人联系是关键。在COVID-19大流行期间出现了许多用于智能手机数据的公共卫生应用程序,但它们往往基于相关性。相比之下,我们可以确定地衡量被诊断群体与其他人群之间常规行为的差异。”
布里斯托大学和艾伦·图灵研究所传染病建模和数据分析副教授 Leon Danon博士设计此项研究的资深作者,高级作者补充说:“这项仔细的研究旨在做两件事:告知数学模型,该模型很少考虑感染引起的行为变化,并通过手机数据为传染病监测提供证据。行为改变在我们的研究中可以明显观察到的结果表明,通过常规收集的数据可以衡量传染病负担的诱人可能性,这是我们的未来方向。这项工作需要政府卫生部门和移动电话运营商之间的密切合作,并强调了学术努力,政府与行业之间紧密联系的力量。”
结果表明,平均而言,接受流感样诊断的人在诊断前一天和之后的2-4天改变了他们的手机使用行为:他们从更少的唯一位置拨打了更少的电话。平均而言,他们在诊断后第二天拨打电话所花的时间也比平时更长。
Vigfusson博士补充说:“我们正在进入新的领域,我们想确保自己在做好的科学,而不仅仅是快速科学。我们努力工作并认真开发了保护隐私的协议,并对数据进行了严格的统计分析。
“尽管只有大约40%的人类可以使用Internet,但手机拥有率是普遍的,即使在中低收入国家/地区也是如此,而且手机服务提供商会定期收集计费数据,以深入了解人们的日常行为” ,他解释说。
Vigfusson博士补充说:“ COVID大流行提高了人们对监视和衡量传染病暴发进展的重要性以及与时间赛跑的本质的认识。
“更多的人还意识到,我们的一生中可能还会有更多的流行病。拥有正确的工具,以迅速向我们提供有关流行病爆发状态的最佳信息,至关重要。”
隐私问题是过去手机数据未与公共健康数据链接的主要原因。对于PNAS论文,研究人员制定了一项艰苦的协议以最大程度地减少这些担忧。
手机号是经过加密的,其所有者不是通过名称来识别的,而是通过一个不向研究人员透露的唯一数字标识符来识别的。这些唯一的标识符用于链接手机数据或未标识的健康记录。
Vigfusson博士说:“我们能够在整个过程中保持个人的匿名性。手机提供商没有了解任何个人的健康诊断,而卫生部门也没有了解任何个人的电话行为。”
这项研究涵盖了15亿个通话记录数据点,包括拨打的电话,通话的日期,通话源的基站位置以及通话的持续时间。研究人员将这些数据与医疗服务提供者在中央数据库中对流感样疾病的临床诊断相关联。无需实验室确认流感。
数据分析集中在每个临床诊断前后的29天,并研究了移动性,呼叫次数和呼叫持续时间的变化。他们在相同的时间段内对位置匹配的控件测量了这些相同的因素。
Vigfusson博士补充说:“即使单个手机每天仅产生几个数据点,我们仍能看到一种模式,在被诊断出患有流感样疾病时,人们的行为有所不同。”
尽管这些发现意义重大,但它们仅代表着可能广泛使用该方法的第一步。具体而言,如果新出现的疾病表现出足够明显的行为变化特征,则该方法可能有助于增加监测工作。
当前的工作仅限于冰岛的独特环境:一个只有一个入境口岸,人口相似,富裕且人口少的岛屿。它也仅限于单一传染病H1N1,以及那些经过临床诊断为流感样疾病的人。
Vigfusson博士总结说:“我们的工作有助于讨论哪种匿名数据链接可能对公共健康监控有用。我们希望其他人可以继续努力,研究我们的方法是否可以在其他地方和其他传染病中使用。”