
项目基本信息
项目名称:大数据驱动的气象环境健康风险评价研究
项目负责人:翟广宇
依托单位:兰州理工大学
项目参与人:
柴国荣 教授 兰州大学
董继元 副教授 兰州大学
孙红杰 讲师 兰州理工大学
梁晓霞 讲师 兰州理工大学
魏天辉 讲师 兰州理工大学
王婧 兰州理工大学
冯昱 兰州理工大学
项目结题摘要
本项目《大数据驱动的气象环境健康风险评价研究》以研究气象环境的变化对易感人群发病风险为主要内容,第一,完成了研究区域中13个城市的气象环境数据和医疗数据的预处理及整合,形成数据驱动的基础库;第二,完成数据驱动的气象环境发病风险的研究。利用基础库的数据为驱动对象,通过分布非线性滞后模型(DLNM)结合广义相加模型(GLM)对气象环境指标和天气敏感性疾病的暴露风险进行分析研究,发现在不同的地区高低温、24小时温差和大气污染物等因素对相关疾病的发病风险均存在不同的滞后效应,同时还对不同地域的相同指标,同一地域的不同气象环境指标的发病风险进行比较研究;第三,完成了对天气敏感性疾病的预测。利用面板平滑转换回归(PSTR)模型和NeuralProphet模型在预测确诊病例和住院病例数高准确度的预测。第四,完成了对我过大气污染治理政策的文本分析,对政策文本的主题、关键词、效力等内容进行研究分析。公开发表论文14篇,专著1部,4项软件著作权。研究中选择的气象环境暴露指标包括表观温度、气温日较差,大气污染物浓度等,这些指标能更加真实客观地反映人体的感觉,既丰富了分布滞后非线性模型在气象环境与心血管疾病方面的研究,也为当地居民和公共卫生部门制定防治措施提供依据。使用预测模型对心血管疾病住院人数进行预测,并将体感温度作为外生变量纳入模型进行研究,丰富了疾病预测模型的研究,并为农村地区医疗机构的人力资源优化以及地区医保资金的配置有一定的参考价值。
项目结题成果报告
以下研究成果内容摘自项目结题成果报告。该项目报告共计38页,关注城市数据派微信号,在对话框中输入 2464,即可获得报告全文PDF的下载方式:
(1)主要研究内容。
本研究从气象环境对居民健康影响的大视角出发,以甘肃省相关市州的新农合住院数据及气象数据为基础建立数据资料库,进而筛选出本地常见的慢性疾病-心血管疾病作为研究的实例,利用分布非线性滞后模型研究不同温度指标和不同颗粒污染物对心血管疾病的发病风险的影响。本研究的主要内容如下:
第一部分: 酒泉市环境温度对心血管疾病住院的滞后效应
本研究探讨酒泉市气温与心血管疾病的关系,有助于识别易感人群,为当地居民在极端天气下预防心血管疾病提供参考。使用酒泉市2011年1月1日至2015年12月31日的数据调查温度与心血管疾病住院之间的关系。使用分布滞后非线性模型(DLNM),并进行亚组分析,以探讨不同年龄和性别群体之间的差异。研究的第一阶段,分析温度对心血管疾病住院21天的整体影响,并选择中间温度作为温度变量的参考值。研究的第二阶段,根据性别(男性与女性)和年龄(<65岁与>65岁)分成亚组,分别分析每个亚组中低温和高温的冷效应和热效应,冷效应被定义为极端和中度寒冷时心血管疾病住院患者95%C的RR,热效应被定义为极端和中度炎热时的相对风险度。
第二部分: 兰州市不同粒径颗粒物对呼吸系统疾病门诊的滞后影响
近年来,随着工业化和城市化进程的加快,能源消耗急剧增加,空气污染随之增加,这对全球环境健康构成了极为严重的风险。大量证据表明,大气颗粒物(PM)浓度的增加将导致因呼吸系统疾病(RESD)等不利健康状况而导致的发病率增加。兰州是中国西北部甘肃省中部的省会和最大城市,是一个以石化、冶金和机械为主的工业城市。兰州由于其地形条件和地理位置,大气处于超稳定状态,不利于大气污染物的扩散和稀释。据我们所知,目前还没有研究评估 PM2.5、PMC和PM10对兰州市RESD的影响。由于研究和数据有限,PM对人类健康的影响尚未得到系统的承认。我们的研究目的是探讨粒径分级PM污染与RESD诊就诊之间的关系。本研究收集了2014年2月1日至2017年12月31日期间兰州市RESD 门诊量、空气污染物和气象指标的数据,并使用广义相加模型(GAMS)评估了三种类型的PM(PM2.5、PMC和PM10)与RESD门诊量的关联。
第三部分: 昼夜温差(DTR)对定西(中国西北部)地区农民心血管疾病住院的影响
本研究旨在探讨中国农村地区DTR与CVD之间的关系。针对2016年1月1日到2019年12月31日期间定西市的农民,采用分布滞后非线性模型评估DTR与心血管疾病风险之间的关系。在所有亚组中,我们观察了 DTR的相对风险(RR)(参考:DTR的中值,12℃)和CVD住院治疗之间的非线性M模型。在DTR为6℃(总人群危险度:1.418;男性:1.546;女性:1.403;年轻人:1.778;老年人:2.549)和 17℃(总:1.781;男性:1.937;女性:1.712;年轻人:2.233;老年人:1.798)时,CVD 的相对风险(RR)达到峰值。在极低(5th,4℃)DTR时,女性(RR1.438)和老年人(RR2.034)对CVD风险的不良影响显著高于男性(RR1.141)和青壮年(RR1.852)。在极高DTR(95th,19℃)时观察到相反的情况(男性:1.267;女性:0.993;年轻人:1.586;老人:1.212)。DTR与CVD发病率相关,这种关联在女性和老年人中更为明显,但在 DTR极高(19℃)时,男性和年轻人则更为明显。
第四部分: 中国平凉农村表观温度对心血管疾病住院率的影响
随着全球气候变化的加剧,气温对人体健康的影响已经成为很多研究的焦点极端高温和低温对环境造成压力,引起人类生理应激,表现为发病率和死亡率目前,心血管疾病是我国城乡居民的第一死因,农村死亡率为46.66%,城市死亡率为 43.81%。心血管疾病(CVD)对居民和社会的经济负担不断增加。本研究旨在分析中国西北平凉市农村地区表观温度和心血管疾病住院率相对风险之间的关系。收集平凉市 2014 到2015年每日数据和天气状况数据。选择表观温度的中值对心血管疾病住院的相对风险进行评估,使用分布滞后非线性模型用于评估滞后 21 天内心血管住院的相对风险之间的关系。
第五部分: 气温日较差对天水市农村居民脑血管病住院率的影响
气温日较差代表每日最高气温与最低气温之差,是衡量每日气温变化程度的适当指标。气温日较差可以提供比平均温度更多的信息。因此,目前的研究使用气温日较差作为指标来探索气候因素对心血管患病率的影响。本研究采用分布式滞后非线性模型分析了2018年至2020年中国甘肃省天水市农村地区的气温日较差与脑血管住院率之间的暴露反应关系。这项研究调查依据性别和年龄分层的组中极端气温日较差的影响。在气温日较差和脑血管入院之间观察到U型关系
第六部分: 气象因素对COVID-19传播的非线性和交互效应:全球城市面板平滑过渡回归模型
新冠肺炎造成的持续流行病与人类共存已有一段时间,因此造成了前所未有的疾病负担。以往的研究证明了气象因素对病毒传播的非线性和单一影响,但如何排除不相关的混杂因素对这种关系的影响是一个问题。通过使用面板平滑转换回归(PSTR)模型,基于2020年7月1日至2022年1月13日期间观察到的全球58个城市的面板数据集,研究气象因素对每日新冠肺炎病例的非线性交互影响。这种新方法提供了一种评估气象因素对每日新发病例的交互作用的可能性,并在一个城市小组中使用固定的效应来控制其他无关的混杂因素。
第七部分: 数据驱动的大气污染治理政策的研究
本研究以数据驱动的方法对我国大气污染治理政策进行分析研究。研究的区域由长三角区域大气污染治理政策,到地方大气污染治理政策,再到中国大气污染治理政策,分析我国政策的热点主题,再对国内外政策进行比较,最后对政策的效力进行评价。通过使用共词分析,困惑度计算,隐含狄利克雷模型提取主题的热度及所属关键词,文本相似度计算,社会网络,关联规则中的FP-Growth算法,ARIMA算法预测主题热度及数学建模等方法为技术支撑进行分析研究。
(2)取得的主要研究进展、重要结果、关键数据等及其科学意义或应用前景。
※主要研究进展、重要结果和关键数据
第一部分:酒泉市环境温度对心血管疾病住院的滞后效应
重要结果:酒泉市气温呈现明显的季节性变化趋势,心血管病住院人数一般随气温的降低而增加,随气温由冷转暖而减少。图1显示了2011年1月1日至2015年12月31日的每日住院CVD 时间序列和温度序列图。
图1 就诊和温度的时间序列图
CVD住院与气象变量之间的斯皮尔曼相关性如图2所示。入院与温度、湿度和日照呈负相关,与风速无相关性。所有相关性均具有统计学意义。

图3显示整个温度对 21个住院滞后期的影响的三维图。温度与住院人数之间存在非线性关系。低温效应先明显,后在滞后7d减弱。高温造成的最大影响发生在当天,然后沿滞后天数衰减。在整个滞后期,极热的影响不明显,而极冷、中冷和中热的影响在前10个滞后期增加,然后在随后的滞后期减弱。一般来说冷效应造成的影响比热效应造成的影响更有害。
图3温度对21个住院滞后期的影响的三维图
冷效应和热效应在前14个滞后期均明显,但在整个滞后期,热效应急剧减弱,在滞后期0-21天变得不可观察,而冷效应在整个滞后期持续。关于寒冷效应,0-21天延迟期的极端寒冷和中度寒冷的RRs分别为0.903(95%CI:0.791,1.031和0.992(95%CI:0.956,1.029)。在热效应方面,滞后0-21天极端热和中度热的 RRS分别为0.993(95%CI:0.827,1.193)和0.993(95%CI:0.938,1.052)。
按性别和年龄划分的分层分析,对男性的冷热效应均强于女性,对成年人的冷热效应强于老年人。根据研究结果,成年人比老年人更容易受到由温度引起的心血管疾病的影响,男性比女性更容易受到影响。时间序列分析显示,在滞后期内,体温与心血管疾病住院人数之间存在非线性相关性。发现低温和高温对心血管疾病住院治疗的滞后期都有影响。
科学意义:与热效应相比,冷效应似乎更有害;事实上,极热似乎有保护作用。酒泉位于中国西北部,整体气温较低,居民更容易受到寒冷天气的影响。当极热天气发生时,人们会减少外出和呆在家里的频率,而使用空调可能会通过降低室内温度来影响结果,从而保护居民免受高温的影响。
性别和年龄都会影响与温度相关的心血管疾病的住院率。在性别分组中,对男性的影响似乎高于女性。这种差异背后的潜在原因可能与生理结构和习惯或个人行为有关,因为男性吸烟和饮酒的频率高于女性,男性比女性承受更大的压力这可能对心血管疾病产生间接影响。在年龄分组中,发现老年人比成年人更能忍受温度。
这是第一项调查酒泉发展中地区温度与心血管病住院人数之间关系的研究,该地区很少选择进行相关研究。该分析可为当地居民和气候条件相似地区居民预防心血管疾病提供参考。与以往的许多研究不同,我们的模型考虑了一些气象变量(如相对湿度和日照)的潜在混杂效应。
该研究调查了中国甘肃省酒泉市温度与心血管疾病住院人数之间的关系。冷效应似乎比热效应更有害。成年人和男性分别比老年人和女性更容易受到温度的影响。本研究通过量化这些影响,为当地公共卫生的发展提供了一些参考。
第二部分: 兰州市不同粒径颗粒物对呼吸系统疾病门诊的滞后影响
重要结果:如图4所示2014-2017年兰州市PM2.5、PMC和PM10浓度呈现明显的季节性趋势,夏季下降,冬季上升。对于PM2.5,RESD门诊量的变化趋势是一致的,夏季门诊量较低,冬季达到高峰。
图4所示2014-2017年兰州市PM2.5、PMC和PM10浓度
PM2.5、PMC、PM10、NO2和SO2之间呈显著正相关(p<0.05)。PM2.5PMC、PM10、NO2和S02与日平均温度和平均相对湿度呈负相关(p<0.05)。大气污染物与气象因子有很强的相关性。
按性别进行的分析中,PM2.5对男性的单一滞后效应有害影响在lag7时最为显著,在这种情况下,PM2.5浓度每增加10ug/m3,门诊量增加0.793。其对女性的单一滞后效应最大ER(0.832)出现在滞后7天。在整个累积滞后阶段,PM2.5对男性和女性的累积滞后效应均具有统计学意义,且PM2.5浓度每增加104g/m3,男性的门诊就诊次数高于女性。PMC在男性和女性之间的单一滞后效应仅在lag7时具有统计显著性,其对男性和女性的累积滞后效应在整个累积滞后阶段均不具有统计显著性。PM10对男性和女性的单一和累积滞后效应在整个滞后阶段均无统计学意义。按年龄进行的亚组分析中,PM2.5对0-5岁儿童的单一和累积滞后效应在整个滞后阶段具有统计学意义,而对6-14岁和15-59岁的人没有统计学意义。老年人>60岁时,单次滞后效应在1-3个滞后日具有统计学意义,而累积滞后效应在2-4个累积滞后日和7个累积滞后日具有统计学意义。总体而言,PM2.5浓度每增加10μg/m3,0-5岁儿童门诊就诊的风险高于其他年龄组。
此外,PMC对0-5岁儿童的单滞后效应在滞后6-7天时具有统计学意义。相比之下,这对6-14岁、15-59岁和60岁的人有影响>60岁无统计学意义。PMC的累积滞后效应在所有年龄组中均无统计学意义。
各年龄组PM10的单滞后效应也无统计学意义;根据单污染物模型的滞后效应结果,选择影响最显著的7个累积滞后日的全人群RESD每日门诊量来拟合多污染物模型。在多污染物模型中分别或同时控制气体污染物S02和NO2后,RESD门诊患者 PM2.5、PMC和PM10的ER 变化小于单污染物模型,且方向不变,表明单污染物模型拟合较好,结果相对稳定。在不调整其他污染物的情况下,三种PM 在不同污染浓度下的暴露-反应关系均为非线性。当PM2.5 浓度为10-55 μg/m3时,曲线相对陡峭,超过该浓度后曲线变平。PMC和PM10的暴露响应曲线呈倒U型,相对危险度随 PM浓度的增加先升高后降低。
科学意义:研究结果表明,PM2.5浓度的增加与RESD患者每日门诊量的增加有显著相关性,而较大颗粒物的增加则有中度相关性。PM2.5造成的不良影高于PMC和PM10。PM2.5似乎是RESD 门诊量增加的主要驱动因素,但仍不楚PM的大小对RESD有实质性影响。我们发现PM2.5的ER在整个滞后期内具有统计学意义,并且随着滞后天数的增加而持续升高,表明PM对RESD的持续影响。PM2.5、PMC和PM10的ER分别在滞后07、滞后05 和滞后07达到峰值,PMC和PM10的ER在统计学上不显著。
分层分析表明,在PM污染与RESD的相关性方面存在性别差异。我们观察到PM2.5和PMC对男性 RESD的影响更为显著,但PM10对女性 RESD 的影响较弱。研究结果表明,与6-14岁和15-59岁的儿童相比,0-5岁的儿童和60岁的老年人更容易受到PM的不良呼吸影响;此外,PM2.5是引发0-5岁儿童和60岁老年人RESD的最重要的PM。
据我们所知,这是首次在兰州评估粒度分级颗粒物污染与RESD门诊就诊的相关性的研究。研究结果表明,PM2.5浓度的增加与具有滞后效应的RESD患者每日门诊量的增加显著相关。对于较大的粒子有适度的关联。在亚组分析中,大气PM对RESD门诊就诊的影响因性别和年龄而显著改变;男性和0-5岁儿童对PM2.5 污染更为敏感。研究结果对于制定预防策略以保护人群免受PM污染的不利影响具有潜在的关键意义。为当地公共卫生部门规划和实施更有效的颗粒物污染预防策略提供了一些参考数据。相关公共卫生部门应采取措施减少污染排放,如减少化石燃料燃烧、限制道路上的车辆数量和推广公共交通出行等。
第三部分: 昼夜温差(DTR)对定西(中国西北部)地区农民心血管疾病住院的影响
重要结果:图5显示了性别和年龄亚组中CVD与DTR的RR(参考DTR=12累积天数:滞后 0-21)之间的关联。CVD的每日DTR和RR之间存在非线性关系(“M 形”模式)。在 6℃的 DTR 下检测到 DTR对 RR 的第一个峰效应(RR=1.418;CI95%,p值<0.05)。在DTR为17℃时观察到第二个峰(RR=1.781;C195%,p值<0.05)。极端DTR(DTR<3℃或DTR>20℃)有保护作用。关于性别特异性效应修正,男性在 17℃时的最大 RR(RR 1.937,p 值<0.05)略高于女性( RR 1.546p值<0.05)。对于年龄特异性效应,当DTR为17℃时,观察到年龄小于65岁患者的最大 RR(RR2.233,p值<0.05)高于65岁以上患者(RR 1.798,CI95%p值<0.05)。另一方面,年龄>65岁患者的RR最大值出现在DTR为6℃时(RR2.549,CI95%,p值<0.05),且高于 DTR为6℃时的其他患者(RR 1.778,CI95%,p 值<0.05)。这表明老年人面临的心血管疾病风险高于处于相对较低 DTR(6℃)的成年人,但处于相对较高DTR(17℃)的成年人比老年人遭受更大的风险。
图5 亚组中DTR对CVD’RR的累积滞后效应参考DTR:12℃,延迟0-21天
图6显示了估计的0-21天极端DTR对CVDRR 的累积影响,对于整个、特定性别和特定年龄的研究组(极低 DTR,4℃,极高的 DTR,19℃;参考 DTR=12℃)比起高 DTR(RR 1.060 滞后日:21),DTR 极低(RR 1.384滞后日:14)时,DTR对CVD入院率影响的显著性估计更强。在滞后14天,极低的DTR(4℃)下DTR 对 CVD 的风险比起男性(RR 1.141)和年轻人(RR 1.859),对女性( RR 1.438)和老年人(RR2.034)的影响更显著。在后21天,极高的DTR(19℃)下欢察到相反的情况。极低 DTR对几个CVD病例的影响在整个研究亚组的后当天表现出抛物线关系。最大的影响发生在14天的滞后。至于极高DTR对CVDRR的影响,对女性有保护作用。滞后效应发生在男性12 天后和一般人群18天后对于年龄亚组,高DTR对CVD病例的影响沿滞后日略有增加。
图6估计极端DTR对CVDRR 的累积滞后效应
图7六种不同的滞后类型,DTR对CVDRR的累积影响
图7说明了DTR对CVD门诊就诊次数的累积影响的六种不同类型。DTR对CVD 门诊就诊次数的累积影响的六种不同类型中,CVD的发病率与DTR(在6℃和 17℃ 观察到极值点)呈“M形”趋势。DTR的累积RR沿着累积日逐渐增加,并在滞后 0-21天时达到最大值。
图8DTR 和CVD 住院21天滞后时间之间关系的三维图
图8通过将它们与参考中值 DTR(12°C)进行比较,揭示DTR 对沿 DTR和滞后的 CVD 相对风险的累积影响。至于不同 DTR的影响,DTR滞后 21天,CVD 相对风险增加最快,范围为 1.6至6°C……
还有更多成果内容,详见项目结题成果报告。该项目报告共计38页,关注城市数据派微信公众号,在公众号对话框中输入 2464 ,即可获得报告全文PDF的下载方式。
原文始发于微信公众号(城市数据派):【气象环境数据+医疗数据】大数据驱动的气象环境健康风险评价研究丨城市数据派