规划问道

【一等奖】如何利用夜间灯光数据和机器学习模型研究滑坡与城市化之间的关系?丨城市数据派


加我获取以上课程详情



小组编号:B1553(一等奖)
‍‍作品名称:基于机器学习的黄土高原地区滑坡灾害风险评估
作者单位:重庆邮电大学计算机科学与技术学院
小组成员:黄艺健,蒋俊,陈睿琨,张天宇
指导老师:寇平浪


作品视频
作品介绍
01
研究背景



黄土高原作为中国西北地区的一个重要地理单元,以其广泛分布的黄土堆积物和复杂的地形特征而闻名。该区域涵盖了宁夏、陕西、甘肃、山西等多个省份,面积广阔,气候条件从干旱的半干旱到温带季风气候不等(Chen et al., 2019)。这种气候的多样性与复杂的地形相互作用,形成了黄土高原独特而丰富的生态系统,但同时也使得该地区成为滑坡等地质灾害的高发区域(He et al., 2008;Wang et al., 2020)。黄土高原的黄土层形成于更新世,由细粒的沉积物组成,其结构疏松、孔隙度高,遇水易崩解,这些特点使得该地区常年受到严重的水土流失影响,进一步诱发了大量滑坡灾害(Ayalew & Yamagishi, 2005)。


随着中国经济的快速发展,黄土高原的城市化进程显著加快,大规模的人类活动逐渐向高滑坡易发性区域扩展(Xu et al., 2015)。城市扩展、道路建设以及农田开垦等活动不仅直接改变了地表条件,增加了土壤侵蚀,还加剧了滑坡的发生频率和强度(Chen et al., 2011;Wang et al., 2020)。尤其是在交通干道沿线,由于土石方开挖、道路切割以及雨水排泄不当,滑坡风险显著提高(Chen et al., 2015)。这些人为因素与黄土高原复杂的地质和气候条件叠加,使得该地区的滑坡灾害更加频繁且破坏性极大(Aghdam et al., 2016)。

综上所述,黄土高原作为一个地质和气候条件复杂多变的地区,其滑坡灾害的发生不仅由自然因素决定,也受到人类活动的显著影响。随着城市化进程的推进,NTL数据在滑坡易发性研究中的应用日益重要,它为我们提供了一个有效的工具,能够在区域尺度上评估和预测滑坡风险(Xu et al., 2015)。通过结合地质、气象、生态和社会经济数据,本研究旨在深入探讨黄土高原滑坡易发性与人类活动之间的复杂关系,进而为该地区的滑坡防治与可持续发展提供科学支持和决策依据。

02
研究区域



黄土高原,作为中国西北地区的重要地理单元,以其独特的黄土堆积物和复杂的地形特征著称。该区域涵盖了宁夏、陕西、甘肃、山西等省份,面积广阔,气候条件多样,从干旱半干旱到温带季风气候不等。研究区的选取主要集中在黄土高原的核心区域,该区域的滑坡易发性相对较高,并且近年来随着城市化进程的加快,人类活动向这些高滑坡易发性区域的扩展趋势愈发显著。本研究旨在深入探讨黄土高原滑坡易发性与人类活动之间的复杂关系,进而为该地区的滑坡防治与可持续发展提供科学支持和决策依据。


图1 研究区范围


03
研究方法‍‍



3.1 数据源

在本研究中,地层岩性、降雨量、NDVI、粘粒含量、侵蚀类型、数字高程模型(DEM)、坡向、坡度、曲率、道路、水路和滑坡点等数据源是通过多种途径获取的,以确保模型的准确性和可靠性。本研究选择了2018-2019年的NDVI数据,全国道路数据,全国河流数据,岩性数据,DEM数据,滑坡点数据,以及年平均降雨量数据作为原始数据。NDVI数据来自NASA提供的MODIS卫星影像,通过对植被覆盖区域的光谱反射率进行计算,生成了高分辨率的NDVI影像,以评估植被覆盖对滑坡易发性的影响。降雨量数据主要依赖于国家气象局发布的气象观测数据.路和道路数据同样通过时空三极环境大数据平台下载获得,确保了数据的覆盖性和准确性。数字高程模型(DEM)数据来源于NASA和USGS(美国地质调查局)提供的SRTM(Shuttle Radar Topography Mission)30米分辨率数字高程模型。滑坡点数据则通过中国科学院资源环境科学与数据中心提供,结合历史滑坡事件的记录,构建了一个准确的滑坡点数据库。


图2 滑坡诱发因素

3.2 机器学习‍‍

利用机器学习数据库内置的sklearn库,根据各种模型的算法结构,对指定黄土高原的历史滑坡数据进行评估和处理,比较各模型算法的分析结果。先通过模型进行各因子的连接,生成渔网数据进行处理,再代入python代码以获得结果。


图3 研究框架


图4 数据处理模型

3.3 模型精度评估标准

交叉验证可用于检查评估模型预测结果的程度。在滑坡易发性评价过程中,根据训练样本分配历史滑坡事件:验证样本=7:3,对滑坡事件数据进行交叉验证。利用精确率、召回率和F1-score统计指标对滑坡易发性模型的性能进行比较和评估。此外,使用混淆矩阵通过二分分类问题分析了样本数据的真实类别和学习者的预测类别。滑坡易发性评价结果的预测能力直接或间接影响滑坡灾害的局部控制。为了预测和比较模型在滑坡易发性评估中的性能,引入受试者工作特征曲线(ROC)来分析模型的准确性。ROC是表征1-特异性和易感性检测质量的有效方法之一,特别是在滑坡敏感性评估中。它通过整体准确度来表达模型的准确度,并通过表达其正确预测事件发生或不发生的能力来预测系统的质量。

04‍‍
结果展示



4.1 黄土高原滑坡易发性预测模型性能评估:各模型的ROC曲线分析

从黄土高原滑坡易发性模型的分析结果来看,各个机器学习模型在预测滑坡易发性方面展现了不同的性能,具体体现在ROC曲线下的AUC值上。CNN和GBDT模型的AUC值为0.84,表明它们在区分正负样本方面具有较好的表现,是所有模型中性能最优异的。支持向量分类器(SVC)和随机森林分类器(RFC)的AUC值分别为0.83和0.82,这两个模型在处理滑坡易发性预测时也表现出相对稳定且良好的性能。逻辑回归(LR)模型的AUC值与RFC相同,也为0.82,显示出在二分类任务中较强的分类能力。K-近邻(KNN)模型的AUC值为0.80,尽管略低于前述模型,但仍然表现出一定的可靠性。高斯朴素贝叶斯(GNB)的AUC值为0.76,在所有模型中表现相对较差,但仍能在某些特定情况下提供有效的分类结果。这些AUC值表明,尽管所有模型在滑坡易发性预测方面都有较好的表现,但CNN和GBDT模型的整体性能最佳,在实际应用中可能更为理想。


图5 滑坡‍‍易发性等级及ROC曲线(a)SVC.(b)RFC.(c)KNN.(d)CNN.(e)GBDT.(f)GNB.(g)LR,(h)CNN、GBDT、GNB、KNN、LR、RF 和 SVM 的 ROC 图(黑色虚线表示参考线。在此之上,ROC 曲线有效)

CNN模型计算的滑坡易发性各个因子的贡献率排序表明(图6),侵蚀类型是影响滑坡易发性的最关键因素,其贡献率最高,接近0.45。这表明在研究区内,侵蚀类型对滑坡的发生具有最显著的控制作用。其次是植被指数(NDVI),其贡献率约为0.3,表明植被覆盖程度显著影响了滑坡的易发性,可能是由于植被对土壤的加固作用以及对降水渗透的影响。高程和降雨量的贡献率也较为突出,分别为0.15和0.1,表明地形高度和气象因素对滑坡的发生有重要影响。此外,坡度和坡向的贡献率也较高,分别为0.08和0.06,指示地形的倾斜程度和方向在滑坡的分布中起到了一定作用。相比之下,曲率、粘粒含量、水路距离、道路距离及地层岩性对滑坡的影响较小,其贡献率均低于0.05。总体来看,该图表明了研究区内滑坡易发性主要受控于地形、植被、气象及地质因素的复杂交互作用。

4.2滑坡易发性各因子贡献率排序及关键影响因素分析

图6 滑坡易发性的影响因子

图7 滑坡易发性的频率分布图

4.3 黄土高原滑坡易发性频率分布分析及多模型比较

在分析黄土高原滑坡易发性值的频率分布图时,我们采用了多种滑坡易发性模型(包括CNN、GBDT、GNB、KNN、LR、RFC和SVC),并使用了sklearn库进行计算。


不同模型在滑坡易发性识别中的表现存在显著差异。GBDT和SVC模型在高易发性区域的识别上表现尤为出色,而CNN和KNN模型则在低易发性区域具有较高的敏感性。RFC模型则展示出较好的泛化能力,能够有效地平衡各区间的识别准确性。通过综合这些模型的特点,可以在滑坡易发性预测中选择最适合的模型组合,以提升整体预测精度。

图8 2012和2023年的夜间灯光(NTL)的比较。(a)2012和2023年的夜间灯光的的频率分布图;(b)2012和2023年的夜间灯光的的箱线图,箱体的横线和矩形点分别是中位数和平均值。

图9 2012和2023年的夜间灯光(NTL)的比较。(a)2012和2023年的夜间灯光的的频率分布图;(b)2012和2023年的夜间灯光的的箱线图,箱体的横线和矩形点分别是中位数和平均值。

4.4 2012-2023年黄土高原夜间灯光亮度(NTL)变化及其反映的城市化进程分析

从图8a和图8b中可以观察到,NTL的分布在空间上存在显著的区域差异。总体而言,NTL较高的区域主要集中在黄土高原的边缘地带,特别是东南部和西南部,这些区域通常是城市化程度较高的地区,城市聚集区和主要交通干道可能是主要的光源。


黄土高原地区在2012年至2023年间经历了显著的城市化进程,人类活动的增强直接反映在夜间灯光亮度的提升上。NTL的增加可能不仅仅代表了城市扩展,还可能包括了农村地区的逐步发展和区域内的基础设施改善。


图10  2012到2023年期间的夜间灯光(NTL)变化和滑坡易发性的关系。圆点是NTL的变化,虚线是NTL变化的标准差。

4.5 黄土高原地区夜间灯光变化与滑坡易发性关联分析:人类活动向高易发性区域的扩展趋势
黄土高原地区的夜间灯光变化与滑坡易发性之间存在明显的关联。低滑坡易发性区域的NTL变化较为稳定,而在高滑坡易发性区域,NTL变化显著增强,且波动性更大。这表明滑坡易发性在一定程度上影响了该地区的人类活动和城市发展,同时,人类活动在向滑坡易发性高的区域蔓延。

05
结论



本研究通过对黄土高原滑坡易发性与夜间灯光亮度变化的系统分析,揭示了黄土高原地区复杂的地质环境与城市化进程之间的相互作用。通过多种机器学习模型的对比分析,我们发现CNN和GBDT模型在滑坡易发性预测中表现最佳,尤其是在识别低易发性和高易发性区域时展现出独特的优势。同时,NTL数据的分析表明,随着城市化进程的加快,黄土高原滑坡易发性高的区域夜间灯光亮度显著增加,反映了人类活动在这些区域的扩展与地质灾害风险的提升。本文的研究结果不仅验证了NTL作为城市化和人类活动强度指标的有效性,还进一步揭示了NTL在监测滑坡易发性变化中的潜力。未来的城市规划和地质灾害防治应充分考虑这些因素,以降低滑坡风险,促进区域的可持续发展。


06
创新性



本作品利用NTL(夜间灯光数据)研究滑坡与城市化之间的关系,通过构建并对比多种模型,最终选择了最佳模型,以揭示城市化对滑坡发生的影响。通过数据收集、模型训练与评估,我们筛选出最优的预测模型,实现了对滑坡风险的精准分析,为城市规划和灾害管理提供了有力的科学支持。


最近有朋友问我们:为什么没有及时看到推文?因为微信改了推送规则,没有点“赞”在看,没有把我们“星标”,都有可能出现这种状况。
“星标”,不迷路!看完文章顺手点点“赞”在看,就可以准时与我们见面了~

原文始发于微信公众号(城市数据派):【一等奖】如何利用夜间灯光数据和机器学习模型研究滑坡与城市化之间的关系?丨城市数据派

赞(0)