规划问道

多源轨迹数据支持下基于个体的城市尺度传染病扩散模拟研究丨城市数据派

多源轨迹数据支持下基于个体的城市尺度传染病扩散模拟研究丨城市数据派

多源轨迹数据支持下基于个体的城市尺度传染病扩散模拟研究丨城市数据派

数据精英夏季特训营开车啦!

同时报名还可享更多优惠:

任选2套同报,再减200元!

任选3套同报,再减360元!

任选4套同报,再减520元!

任选5套同报,再减700元!

任选6套同报,再减900元!

(以上优惠不包括营5和营14)

多源轨迹数据支持下基于个体的城市尺度传染病扩散模拟研究丨城市数据派

加我获取每套课程详细介绍
加我咨询和报名课程
多源轨迹数据支持下基于个体的城市尺度传染病扩散模拟研究丨城市数据派




项目基本信息
多源轨迹数据支持下基于个体的城市尺度传染病扩散模拟研究丨城市数据派

项目名称:多源轨迹数据支持下基于个体的城市尺度传染病扩散模拟研究

项目负责人:尹凌

依托单位:中国科学院深圳先进技术研究院


项目参与人:

毛亮 副教授 佛罗里达大学

梅树江 主任医师 深圳市疾病预防控制中心

郭媛君 助理研究员 中国科学院深圳先进技术研究院

张欢 中国科学院深圳先进技术研究院

周榕 中国科学院深圳先进技术研究院

林楠 中国科学院深圳先进技术研究院

谢家璐 中国科学院深圳先进技术研究院

刘炳荣 中国科学院深圳先进技术研究院


项目摘要

多源轨迹数据支持下基于个体的城市尺度传染病扩散模拟研究丨城市数据派

传染病是人类的严重威胁。面向传染病扩散过程,提高对时空过程建模的精细度和预测的准确性,促进精准防控,对保障城市居民生命健康至关重要。大规模轨迹数据提供的个体时空活动记录,可突破长期以来传染病扩散模拟在时空精准性上的瓶颈。


本项目基于轨迹数据模式识别的基础性理论分析,提出了从大规模手机位置数据中有效识别城市居民个体日常活动链的方法;提出了一种基于个体居住地共同语义的多源时空数据融合方法以及一套基于交通刷卡数据挖掘的地铁空间人际接触网络构建方法,实现了数据驱动的城市动静态空间大规模个体接触网络构建;构建了个体在不同建筑物从事不同类型活动的疾病传播模型,实现了呼吸道传染病(流感、COVID-19)与虫媒传染病(登革热)在千万级个体与数十万栋建筑物之间的高精度扩散模拟;构建了基于机器学习模型的城市疫情发展趋势短期时空预测模型;设计并模拟了多种个体干预措施(例如,居家令、密接追踪、集中隔离、自我居家隔离、佩戴口罩、接种疫苗、及时检测等),提出面向疫情爆发概率的风险管理措施推荐方法。综上,本项目首先构建了基于轨迹大数据的人员流动与交互活动感知理论与方法,在此基础上,聚焦于城市内部微观尺度下 “人-地-传染病”复杂系统,进一步提出了耦合人员流动的疫情发展趋势短期时空预测、高精度疫情扩散与干预效果模拟方法,形成了一整套融合多源轨迹数据的传染病扩散建模与模拟的框架及方法。


本项目成果一方面突破了传统现场流行病学调查与数据采集的局限性,为空间细粒度疫情风险研判与重大疫情防控措施部署调整提供关键决策支持工具,促进了城市内部传染病疫情防控技术的发展;另一方面促进了大数据时代人类移动分析与建模的理论与方法发展,深化了轨迹数据的应用。项目成果应用于广东省与深圳市的COVID-19、登革热与流感防控中,取得了显著的社会效益。


项目结题成果报告

多源轨迹数据支持下基于个体的城市尺度传染病扩散模拟研究丨城市数据派

以下研究成果内容摘自项目结题成果报告。该项目报告共计33页,关注城市数据派微信公众号,在微信公众对话框中输入 24619,即可获得报告全文PDF的下载方式:


多源轨迹数据支持下基于个体的城市尺度传染病扩散模拟研究丨城市数据派


研究工作主要进展等(部分摘取)

多源轨迹数据支持下基于个体的城市尺度传染病扩散模拟研究丨城市数据派

(1)主要研究内容


本项目原计划主要研究内容包括:突破大规模轨迹数据在传染病建模中的方法壁垒,通过挖掘轨迹数据中蕴含的个体时空活动特征,将其与多源数据特征融合,基于智能体空间显式模型,研究融合人口属性的城市人口移动建模方法、面向现代城市复杂活动空间的个体接触网络构建方法,选用典型的近距离接触传播疾病构建扩散模型,并系统评价模型的有效性。实际进行中,除了进行原计划研究内容,随着研究推进,根据实际疫情防控需求,还增加了基于机器学习模型的城市疫情发展趋势短期时空预测模型、细粒度社区级别的种群拟模型以及干预措施的优化推荐方法研究。


(2)取得的主要研究进展、重要结果、关键数据等及其科学意义或应用前


本项目首先构建了基于轨迹大数据的人员流动与交互活动感知理论与方法在此基础上,聚焦于城市内部微观尺度下“人-地-传染病”复杂系统,进一步提出了耦合人员流动的疫情发展趋势短期时空预测、高精度疫情扩散与干预效果模拟方法,并将成果应用于广东省与深圳市的COVID-19、登革热与流感防控中,取得了显著的社会效益。


多源轨迹数据支持下基于个体的城市尺度传染病扩散模拟研究丨城市数据派

图1 总体研究成果结构图


研究进展一:

构建了基于轨迹大数据的城市人员流动与交互活动感知理论与方法,突破了传统现场流行病学调查与数据采集的局限性,提升传染病在人群中在传播关系的精细解析能力。


城市居民的地理分布、日常活动、出行、人际交互与接触等时空活动是众多传染病传播与扩散过程中重要的影响因素,也是长期以来传染病精细化解析中的黑箱过程。传统现场流行病学调查不仅存在样本小、主观偏差的局限性,而且针对一个人的调查需要配备两名专业人员,花费20-30分钟时间,还可能存在调查人员的暴露风险。近十年来,手机定位、公交刷卡、浮动车 GPS、社交签到等轨迹大数据为突破相关数据采集分析提供了前所未有的契机。基于此,本项目克服轨迹大数据采样稀疏、噪音复杂与语义缺失,提出感知人员流动与交互活动的理论与方法,有效提升疾病在人群中潜在传播关系的精细解析能力与时空传播模型的精准性。


a)阐明轨迹大数据采样规模、频率与地点对人员流动模式识别的影响,为轨迹大数据模式识别提供理论基础。疾病传播相关人员的无偏性、准确性分析是关键需求。然而,大数据产业高速发展导致了轨迹大数据分析方法与应用研究先于理论研究的局面,包括轨迹大数据的有偏性、时空粒度等诸多重要的基础问题尚未解决,形成了制约轨迹大数据科学应用的理论性问题。基于此,本项目以典型的大规模轨迹数据为样本,提出个体与群体时空活动模式的多项挖掘算法,设计系统性试验,获得如下知识发现:16.5%的人口采样规模足够生成稳定的人群活动链模式;手机信号采样频率对出行频率模式挖掘影响最为显著,而对活动半径特征影响较小。上述理论性研究成果为基于轨迹大数据的人员流动模式正确感知以及本项目的后续系列技术提供了重要的、基础性的理论依据。


多源轨迹数据支持下基于个体的城市尺度传染病扩散模拟研究丨城市数据派

图2 手机信号采样频率对四种典型出行模式挖掘的影响评估


b)引入个体时空行为约束条件,实现轨迹大数据降噪与语义增强,提出城市区域大规模个体出行活动链感知方法,提升出行传播建模分析的精准性。准确把握高风险个体与易感人群的活动时间、地点、目的等重要特征是传染病精细化建模、疫区输入人口管理与潜在密切接触者追踪的关键需求。然而,现代城市的人员流动与接触交互行为复杂多样、难以直接获取,大规模手机位置数据存在定位精度不足、不规则与稀疏采样、噪音与偏差并存等模式识别难点。针对上述问题,本项目融合手机位置、城市兴趣点、出行调查等多源数据,基于时间地理学时空制约理论,引入城市居民日常活动时空约束条件进行轨迹数据隆噪与语义增强,基于滑动窗口与不确定性判别,提出时空加权马尔科夫停留活动目的推理方法,有效实现了复杂城市环境中千万级人口的出行活动链模式识别(即出行活动的地点-时间-目的-顺序)(图3),有效提升了个体停留点识别的对象级识别准确率和召回率提。基于该成果,2020年COVID-19疫情期间迅速搭建了境外输入人口重点活动区域的百米级动态监测平台,服务于广东省疾控中心与深圳市疾控中心疫情防控,实现了大数据助力的7个境外疫情高发国输入人口的几一余个重点地区防控。

多源轨迹数据支持下基于个体的城市尺度传染病扩散模拟研究丨城市数据派

图3 大规模个体停密活动出行链模式识别


c)精细化解析不完备轨迹,推理城市公共交通系统中个体间的空间邻近关系,提升人群接触关系建模分析的全面性。公共交通系统(如公交、地铁和出租车)是城市中人群高度聚集又相对封闭的空间,是物理接触广泛且频繁发生的场所,造成了较高的疫情传播风险。公交智能卡数据为研究城市中大规模个体接触现象提供了机遇,然而公交卡中不完备的轨迹记录形成了个体间接触机会推理的难点。例如,智能卡数据只记录了地铁乘客进出站刷卡行为,但乘客在地铁系统中的具体出行行为实则更为复杂,导致提取和度量个体之间的接触频率及时长存在较大难度。针对上述挑战,本项目提出了地铁乘客与列车匹配方法以及乘客之间空间邻近机会度量方法,构建了地铁系统中百万级乘客个体动态接触网络,不但揭示了地铁人群物理接触统计规律,还为城市内部疫情传播扩散风险评估提供了重要技术支持(图 4)。


多源轨迹数据支持下基于个体的城市尺度传染病扩散模拟研究丨城市数据派

图4 公共交通系统中大规模个体接触网络构建及疫情传播风险识别


研究进展二:

提出了耦合人员流动的城市疫情发展趋势短期时空预测模型,将模型空间精度从国家、省、地市级尺度精细到城市内部微观尺度,为空间细粒度疫情风险研判与精准防控提供科学依据。


国家、省、地市级尺度下的传染病模型无法满足对城市内部重点防控区域和高危人群的精准识别与干预。长期使用于中宏观尺度的传染病模型需要进一步改进,才能有效耦合城市内部精细尺度下的人员流动与地理环境复杂性。基于此本项目通过解析并建模城市内部人员流动与环境大数据特征,拓展机器学习方法提出城市内部疫情传播风险的精细化识别与时空预测方法,在空间维度上提升疫情防控的精准性,减少人力、物力的消耗,减少受影响人群,降低社会成本。


传染病非机理模型利用统计学/机器学习模型对疾病流行趋势进行短期预测(通常1~4周),重视时间趋势,对细粒度空间分布缺乏关注。在城市疫情防控层面,面向城市内部细粒度区域,快速准确地预测疫情近期的扩散态势是防控COVID-19、登革热、流感等重大传染病的迫切需求之一。然而,此类型短期预测面临疫情非线性发生发展、多因素交织影响、新发疾病传播特征参数不明确空间精细程度不足等难点。针对上述问题,本项目提出了一种基于残差神经网络的疫情短期预测模型,通过设计卷积方式处理不规则的空间划分,考察了各个区域间的相互影响。此外,提出了一种新的耦合人群移动特征的城市内部传染病时空预测框架,利用网络表示学习算法将细粒度人群移动网络特征从二阶量转化为一阶量,在多种机器学习算法上,证明耦合人群移动能够有效提升城市内部街镇级别上的疫情预测性能。基于上述方法,实现了广州市街镇级别的精细空间尺度登革热时空预警预测(图5),支撑了2019年广东省重点城市登革热防控工作部署;实现了深圳市未来一周各个区域的流感分级预测,支持了深圳市疾控中心在全市流感指数的基础上向市民发布各区对应的流感预警:在COVID-19疫情快速上升期,构建了融合人口输入影响、疾病潜伏期、城市人口密度、人口迁徙等因素的 COID-19新发确诊病例数短期预测模型,实现了广东省内主要地市近三天的每日新增确诊病例数预测(广州和深圳两地误差分别为4.04%和3.26%),实时报送了广东省疾控中心,并联合深圳市疾控中心报送了市疫情防控指挥部,为广东省尤其是深圳市千万级人口的疫情防控提供了相应的决策和参考建议。


多源轨迹数据支持下基于个体的城市尺度传染病扩散模拟研究丨城市数据派

图5 耦合人群移动特征的广州市街镇级登革热时空预测


研究进展三:

提出了耦合人员流动的城市内部高精度疫情扩散与干预效果模拟方法,实现了多种精准干预措施组合优化的智能推荐,为重大疫情的防控措施部署与调整提供关键决策支持。


a)在个体层面,构建千万级个体在城市建筑物之间流动交互的智能体模拟模型,推演疾病扩散过程与干预效果,支撑个体级别精准干预的辅助决策。城市内部人群时空活动与地理环境具有极强的空间异质性与动态性,传统中宏观理论化传染病模型难以明确表达其中过程。基于多智能体的个体化机理模型具有表达疾病传播过程的异质性、动态性与非线性特征的能力。然而,由于缺乏对真实数据的有效耦合,导致模型无法与城市微观环境关联,偏离实际人群行为。针对上述问题,本项目将前述识别出的个体出行活动链与出行调查、建筑物、人口普查数据进行人口属性与空间分布的纠偏与融合,面向城市全人口构建了建筑物级别的出行活动基础模型。结合离散型 SEIR 仓室模型,实现了呼吸道传染病(COVID19、流感)与蚊媒传染病(登革热)在千万级个体与数十万栋建筑物之间的高精度扩散模拟(图 6a),具有揭示活动场所作用、超级传播分布等深入解析的能力在此基础上,识别高风险区域,模拟个体定制化的出行干预策略(例如,居家令宵禁、限制高风险区域出行、调整出行时间等),揭示了出行干预措施在城市内部空间上的异质性作用(图6b),为优化疫情防控措施提供关键科学依据。在COVID-19 防控中,及时进行了深圳市COVID-19 时空扩散趋势推演、第一波疫情各项干预措施的单项措施效果评估、系统计算了疫情爆发概率与密接追踪、佩戴口罩、及时检测之间的复杂关系,不仅为深圳市防疫提供了科学决策依据,而且为国内及全球超大城市实现疫苗群体免疫之前提供常态化措施推荐。


多源轨迹数据支持下基于个体的城市尺度传染病扩散模拟研究丨城市数据派

图6 城市内部传染病个体化时空扩散与干预模型


b)在细粒度社区群体层面,构建城市内部社区人群的传染病时空扩散种群模型,揭示关键传播节点,支撑社区人口流动管制效果的高效模拟。城市内部地理要素分布及嵌入空间的人口流动网络具有极强的异质性,传染病暴发于不同位置,其产生的时空传播风险和造成的防控难度也不尽相同;同时,传播过程中也必然存在造成扩散风险更大的关键空间传播节点。因此,融合人口流动信息构建城市内部传染病时空传播模型,准确识别城市内部高风险暴发位置和关键空间传播节点,是自下而上理解城市内部传染病传播驱动力并前瞻性、精准化制定人口和交通管制策略的关键。然而,当前鲜有研究深入城市内部精细尺度,从初始暴发位置和关键传播节点的角度探索呼吸道传染病的空间传播机理。针对该现状本项目以深圳市和 COVID-19为研究案例,在500 米精细格网尺度上研究了融合人口流动的城市内部呼吸道传染病时空传播建模技术,在此基础上评估了城市内部传染病初始暴发位置所致风险、定量识别了城市内部关键空间传播节点(图7)该成果不但揭示了高风险暴发位置/关键空间传播节点的地理及网络结构特征示,还为深圳市疾病与预防中心提供日常决策辅助支持,为2021年深圳市两起散发疫情提供了风险范围分级划定的科学依据。


多源轨迹数据支持下基于个体的城市尺度传染病扩散模拟研究丨城市数据派

图7 社区级别高风险传播区域识别与管制仿真技术


c)基于城市内部疫情扩散精细化模拟模型,提出了疫情干预措施组合优化的高效推荐技术,提升应急响应下防控措施动态部署与及时调整的能力。面对突发疫情,如何在控制社会成本的情况下快速有效的遏制疾病传播,是关系到社会稳定和生产生活秩序的关键问题,也形成了控制时空扩散现象的策略优化问题与此同时,精细化空间扩散模拟的计算开销巨大,导致难以实时求解扩散控制的最优化方案,形成应急响应技术瓶颈。本项目提出了一种将常规时空扩散计算与大规模并行计算进行松耦合的解决方案。通过提取扩散现象起始条件的典型地理分布,利用线下的大规模并行计算资源求得扩散控制的近似最优方案,形成典型场景知识库:然后于在线环境中,通过匹配实际案例的起始条件,使用知识库中的优化方案对启发式算法进行搜索空间引导,实现快速求解,为精准防控的高效响应提供了可行性。本项目提出了基于爆发概率的风险管控理念下的于预措施优化组合方法,通过海量的个体智能体模型仿真,推荐了抑制COVID-19疫情再次爆发的非药物干预措施组合:密接追踪与隔离+80%公众佩戴口罩+40%患者发病后立即就医,该于预措施组合能够在4周内将疫情二次爆发的几率控制在5%以下,不仅为深圳市防疫提供了科学决策依据,而且为国内及全球超大城市进行干预优化提供了方法学参考。


多源轨迹数据支持下基于个体的城市尺度传染病扩散模拟研究丨城市数据派

图8 抑制COVID-19 疫情再次爆发的非药物干预措施组合推荐


……

还有更多成果内容,详见项目结题成果报告。该项目报告共计33页,关注城市数据派微信公众号,在微信公众对话框中输入24619,即可获得报告全文PDF的下载方式。

最近有朋友问我们:为什么没有及时看到推文?因为微信改了推送规则,没有点“赞”在看,没有把我们“星标”,都有可能出现这种状况。
“星标”,不迷路!看完文章顺手点点“赞”在看,就可以准时与我们见面了~

原文始发于微信公众号(城市数据派):多源轨迹数据支持下基于个体的城市尺度传染病扩散模拟研究丨城市数据派

赞(0)