
数据精英夏季特训营开车啦!
同时报名还可享更多优惠:
任选2套同报,再减200元!
任选3套同报,再减360元!
任选4套同报,再减520元!
任选5套同报,再减700元!
任选6套同报,再减900元!
(以上优惠不包括营5和营14)

项目基本信息
项目名称:大数据与地震数值预测探索
项目负责人:石耀霖
依托单位:中国科学院大学
项目参与人:
张东宁 研究员 中国地震局地球物理研究所
杨树新 研究员 应急管理部国家自然灾害防治研究院
柯艺芬 中国科学院大学
纪双西 中国科学院大学
黄禄渊 助理研究员 应急管理部国家自然灾害防治研究院
张贝 助理研究员 中国地震局地球物理研究所
尹凤玲 助理研究员 中国地震局地球物理研究所
周龙寿 助理研究员 应急管理部国家自然灾害防治研究院
孙云强 中国科学院大学
项目结题摘要
地震数值预报由中国地震局提出,并纳入2007-2020年的国家地震科学技术发展纲要,是重要的探索性研究。本项目按照计划对数值地震预报方法和路线图开展研究,对长期、中期和短临预报科学思路分别为:
对长期预报重视长期平均结果,开展时间无关的地震数值预报研究。项目提出了路线图,以青高原东北缘(有丰富历史和考古地震资料)地震活动区为例进行研究,做弹塑性三维有限元模拟,拟合区域位移和应力特征;进而随时间加荷产生长达万年以上人工合成地震目录,重现区域地震活动性的主要特征;在此基础上分别给出长期平均的六级以上和七级以上大地震发生的概率。
在中期预报中提出时间相关的地震数值预报,除了根据地质地球物理资料建立模型和给定边界条件外,着重解决应力初始条件选取问题,使人工目录能够重现百年来的历史地震序列,进而计算今后数十年地震的发生。鉴于初始条件的不确定性,采用MonteCarlo方法,通过能满足产生历史地震序列约束条件的成千上万模型的综合分析,提出未来的地震概率预测。并取在青藏高原1900年来的6.7级以上地震,和川滇地区6.5级以上地震为例,分别进行了时间无关数值预测可行性的试验,取得了初步成果。
在大数据人工智能开展短期预测方面,项目利用地震活动性参量“以震报震”进行中短期地震预测尝试。用LSTM神经网络等方法,对川滇地区、南加州地区等进行了一年期的预测尝试并取得了一定预测效果。在大地震后的强余震预测方面,利用数据驱动的b值确定方法,发现余震序列与背景b值的差值有可能预测5级以上强余震。项目对计算方法改进、计算程序编写、模型合理构建等方面也做了一系列工作,建立并不断改进计算平台。
项目还重视地应力这一关键物理量的计算和观测值的对比验证,取得了初步的满意结果。项目在把地震预测延伸到地震灾害链预测方面也进行了探讨。
项目共发表文章40篇,其中SCI论文30篇,发明专利1项。培养博十生9人,硕十生3人。在疫情影响下,仍尽力开展了国际学术交流和参加国际会议。
关键词:地震;地震数值预测;地应力;大数据;灾害链
项目结题成果报告
以下研究成果内容摘自项目结题成果报告。该项目报告共计46页,关注城市数据派微信号,在对话框中输入 2492,即可获得报告全文PDF的下载方式:
(1)主要研究内容。
地震预报是世界科学面对的难题,需要持续的艰苦探索。我们曾经提出了地震预报要从经验预报走向物理预报,而物理预报的核心是要能够通过数值方法定量化地用客观的准则开展地震概率预报,并据此提出了数值预报路线图的设想(图1),本项目就是进一步探索该构想是否真正具有发挥作用的前景,具体如何实现该构想等问题。
图1地震数值预测路线图(石耀等,2018)
地震长期、中期和短临预报,具有不同特征,长中短临渐进式预测,是我国地震工作者长期实践中提出的宝贵经验总结,因此在地震数值预测中,项目针对它们的特点,包括了针对长中短临预测各自特征的研究内容。
地震活动空间上是不均匀的,大地震往往在地震特别活动的地带发生。长期地震预测,主要研究内容是给出空间不同区带长期平均的大地震发生概率。本项目通过时间无关的地震数值预测模型研究来实现。
但是,大地震的发生会释放积累的应变能,而下一个大地震需要一定时间应变能的积累,大地震复发具有一定的准周期性,在中期预报中必须考虑历史地震序列对未来地震发生的影响,本项目通过时间相关的地震数值预测模型研究内容来实现这一目标。在地震数值预测刚刚起步的情况下,由于模型和初始条件、边界条件存在的种种不确定性,还难以解决地震短临预测实际问题。因此把模型驱动与数据驱动结合起来,充分利用人工智能新方法处理日益增多的地震和前兆大数据积累,寻求在短临预测中探索数值预测的新方法,并能运用于实际,是研究的另一重要内容。
地震数值预报的计算量需要与实际观测量对比和吻合,虽然对于位移、应变和地震活动性等已经实现一定程度的比较,但对一个关键物理量,即在目前地震物理预测中频繁使用的库仑应力概念,仍然缺乏直接观测。因此本项目把动态和静态地应力变化的理论计算和实际观测的对比研究作为重要的研究内容,它关系到数值预测的理论是否有坚实科学基础,因此需要格外得到关注。
地震的发生,不但与构造应力积累有关,而且与自然界旱涝、潮汐等触发因素有关;不但与自然因素有关,而且与人类大规模生产活动造成的水库蓄放水、地下水开采、页岩油气和地热资源开发等有关。定量的数值拟研究地震的触发机理,已经成为地震预测研究中不可忽视的内容之一,也是本项目研究内容之一。另外,从对地震的预测,进一步发展为对地震灾害链的预测,也是一个重要的课题。本项目对这方面过去被学术界关注比较少、缺乏定量分析的问题,例如地震滑坡湖啸的数值模拟问题也作为延伸的研究内容。
在所有这些研究中,都需要研究改进计算方法、提高处理复杂物理耦合问题的能力、增加计算速度和精度,建立适应要求的计算平台。这些重要的研究内容是开展研究和取得进展的技术基础。
(2)取得的主要研究进展、重要结果、关键数据等及其科学意义或应用前景。
(一) 时间无关的长期地震数值预报
时间无关的长期预报基本科学思路如图一1所示。建立区域构造和地震孕育发生的模型,要根据深部探测结果给出的地壳结构、断层参数、岩体和断层的物理力学性质等建立模型,根据大地测量结果等确定边界条件开展计算。如果计算的位移场与实际GPS测量比较吻合,计算的应力场与实际应力测量和震源机制比较吻合.则认为该模型一定程度上反映了实际地质构造运动情况,对于时间无关的数值预报,可以在任选初始条件下,持续增加边界载荷,开展黏弹塑性有限元计算,计算应力随时间的增长变化。如果一个单元达到屈服条件而破坏代表一个小地震;如果一个单元的破坏诱发多个单元相继屈服破坏,代表大地震.从错动量和错断的断层面积可以计算相应的地震震级,计算结果可以形成人工合成地震目录,这样得到的人工合成地震目录如果与真实地震目录在G-R关系、大地震复发频率等地震活动性特征具有相似性,则可以利用该模型对长期的与时间无关的平均地震速率做出预测。
图一1时间无关的地震预报路线图
项目选取具有较丰富资料(仪器、历史、考古地震资料)的地震活动区域青藏高原东北缘为例,构建含有主要断层的三维黏弹塑性有限元模型(图一2)。
这一模型产生的位移速度、应力状态与实际GPS观测和应力及震源机制大体吻合反映了区域构造特征。随后用上述方法从零应力状态开始产生人工合成地震目录(图一3)。由于只有当模型研究区域进入亚临界状态时才具有仿真意义,所以只使用5.0万年以后的目录;由于概率性预报需要尽可能长期的资料进行统计,所以计算到8万年,采用35000年的合成目录开展概率预测分析。人工合成目录的b值为 1.01,真实仪器地震目录b值为0.97,二者基本耦合。研究区域大震频度与考古地震资料也大体吻合,几个断裂带之间大震转移频度的计算值与考古地震结果也大体吻合。因此基于这样的人工目录进行长期平均的地震活动概率预测是具有可信的基础的。预测结果如图一4所示:



(二) 时间相关的中期地震数值预报
时间无关的地震数值预测的一个主要问题是,它只能提供长期平均的大地震发生概率。但是一次大地震释放弹性应变能后,会要一定的时间间隔后才能重新积累起下一次大地震所需的能量,即大地震有一定的复发周期。例如,汶川 Ms8.0地震的复发周期一般估计为数千年,因此在大地震之后的短期内,再次发生大地震的概率会比较低,并不应该在任何条件下都采用一个时间无关的发震概率。
针对这种情况,提出了时间相关的中期地震数值预报的科学思路(图二1)这里的核心问题,就是初始条件不能随意指定,而必须是以历史地震序列活动情况作为约束而确定。这种确定要分两种情况:对于研究的起始时间以来历史上发生过大地震的地方,如果知道岩体或断层强度,以及该地现今的应力增长速率(并假定在数十年到数百年的时间尺度上该速率基本可以视为常数),则可以从地震时的应力状态(贴近岩体强度)和历史增长速率,反推出过去某一起始时刻的应力状态(图二2);对于起始时间以来没有发生过历史大地震的地方,我们无法确切知道它的初始应力状态,但是可以知道应力大小一定是在某个限度之下,因为如果大于该限度,历史上一定会已经发生过大地震了。作为一种尝试的办法,就是对大量的没有发生过历史大地震的各个地点,采用Montecarlo方法,各自随机生成一个在限度之下的应力状态作为该点的初始应力状态。在给定了初始应力状态后,类似时间无关地震数值预测的流程,计算应力场演变和地震发生过程重现历史地震序列。
在此过程中为了使模拟的地震序列严格重复历史地震序列可能对初始应力或断层强度要做一些微调。在模型能够重复历史地震序列后,继续往后计算,得到未来地震发生的一种可能情况。注意,由于没有发生过历史地震地点的初始应力,都是随机产生的,因此单个的模型对未来的预测,很难产生有说服力的实际价值。为此,需要计算在合理约束范围内的成千上万个随机产生的模型,它们的总体平均的结果,对未来的地震发展趋势,应该提供概率性的预测。

图二2时间相关地震数值预测中初始应力的取法示意图。
紫色水平点划线显示断层强度大致水平,对于研究时间窗口内发生过地震的地方,知道现今应力增长速率且假定在研究时段内为常数,就可以确定其初始应力状态。对于无地震广大地区,其初始应力水平无法确切知道,但一定在绿色点划线之下。应力演变中的一些突变是大震造成的同震应力变化,在知道震级和震源错动状况时,也是可以计算的。
项目首先以青藏高原为例,利用二维有限单元法计算重演1900年到2014年内26个6.7级以上地震发生的序列(图二3)。计算中根据GPS观测插值的边界条件(图二4),计算未来几十年到100年的应力演变和地震危险,计算地震发生时,既考虑区域构造应力加载(图二5),也考虑了强震造成的应力扰动(图二6),二者的共同作用下重现了历史强震的发展过程。在同震应力计算中由于是二维近似,对走滑和逆掩断层造成的应力变化,采用不同的向各向同性杀死单元来模拟。总共计算10000个随机模型,对未来大震危险性给出概率估计图(图二7)。初步结果显示未来强震危险性概率较高地区集中在巴颜喀拉块体边界及鲜水河断裂带地区。





鉴于高原面积较大、断层细节得不到很好反映,历史达震震级标准也取得较高,因此本项目对地震活跃、资料丰富的川滇地区进行了更细致的研究。川滇地区地处我国南北地震带南段,近百年来地震活动性持续较高,该地区未来强震预测研究备受关注。
该区的特点是柔性下地壳的流动对上地壳的拖曳作用明显,在构造应力增加速率的计算中必须得到考虑。
在三维研究中这一特征不难得到反映,项目研究团队早已解决该问题,但是由于概率预测中要计算成千上万的模型求得平均的效应因此难以承担如此大规模的三维计算任务,在时间相关的地震数值预测中目前还只能限于二维计算,因此需要采取一些合适的简化方法,既保持足够的精度,又要能节约计算机时。项目发现仅用GPS位移插值作为边界条件,不能准确模拟川滇实际观察到的区域内部运动特征,存在较大速度残差(图二8).因此,发展了对该残差以多项式拟合方式找到适当的比例因子,施加研究区域各点所需要的适当大小和方向的拖曳力,令最终计算结果可与实测值最佳吻合(图二9),计算得到较为可靠的应力增加速率(图二10)。
图二8 左图为仅加速度边界条件时得到的年度速度解(红色箭头)及与实际GPS观测的速度比较图。右图为二者残差。可以看到川滇地震活动区域差别较大。
图二9 左图增加了下地壳流动对上地壳拖曳力的分布情况,右图为同样速度边界条件加上下地壳拖曳力的等效体力后得到的速度解(红色箭头)及与实际GPS观测的速度(黑色箭头)比较图,二者吻合程度大幅度提高。
图二10计算的川滇地区应力增长速率
根据该区域百年时间内发生的30次Ms>6.5级的历史地震,结合区域地质背景及GPS观测数据等,建立区域有限元准三维弹性模型,通过反演给定区域特定时刻合理的初始应力场:在此基础上,综合考虑地震孕育阶段和震后调整阶段的动力学过程,以库仑摩尔破裂准则作为判断地震发生的条件,模拟单次地震过程和历史地震序列的发展过程,同时,对于数值模拟中的不确定性成分,通过大量MonteCarlo 随机试验得到5000种初始应力场模型,确保所有模型均能重现历史地震的发震过程,最终得到现今应力场状态,并据此计算地震危险性系数,将不同模型的计算结果进行概率统计,初步得到研究区域2017年九寨沟地震后的地震危险性概率分布(图二11),结果显示历史地震破裂区的危险性概率大幅降低,相对安全;而龙门山断裂带东北段发震概率高达30%,主要是受2008年汶川地震震后应力扰动的影响:龙门山断裂带西南段(包括汶川地震破裂区与芦山地震破裂区的中间区域)与鲜水河断裂带交界处发震概率约为15%~20%:另外滇西南龙陵瑞丽断裂带及澜沧江断裂带附近发震概率约为10%~15%,近年来滇西南地区小震频发,该地区地震危险性同样值得注意。
从图二11也可以看出集中在川滇地区的包含了更多断层细节的模型,比西藏大区域比较粗糙的模型,更好地反映了地震活动情况。模型利用的资料在 2017年截止,2017年以后发生的今后还有必要进一步增添规模较小但影响地震活动的断层,并且调整断层细节部分(光滑、拐弯、断续、错开等),尝试进一步提升模型预测效果。
图二11利用1900-2017年资料计算的川滇地区未来地震概率分布图。标出了2017年以来的较大地震:4-5 级为灰色、5-6 级为蓝色、6 级以上为红色圆圈。
(三)基于人工智能大数据分析的中短期地震数值预报的尝试
目前本项目提出的数值地震预报方法的探索,只能提供长期、中期的地震率预测,但由于初始应力状态的不确定性,在中短期的地震预测中目前还很难得到应用。因此,在探索物理模型驱动的地震预报同时,项目也开始探索数据驱的中短期预测方法,是否能够较快地在预报实践中发挥作用。
我国地震经验预测中最基础的方法是利用地震活动性变化来预测未来的地震活动,探索了b值、地震频度等的时间变化,以及地震分布的条带、空区等空间特征,预测大地震发生的可能性。国内外也开始了不少利用人工智能方法探索地震预测的尝试。因此本项目也首先从这方面开始工作。项目选择16个地震预报因子来进行尝试,包括时空窗口内观测到的地震频度、最大地震震级、最小二乘b值、最小二乘偏差、最大震级欠缺、最大似然b值、 以及平均经、纬度和地震条带性及条带范围等反映空间分布的特征量。在预报因子选取中故意保持一定的冗余以观察其影响。采用两年窗口的数据预测随后一年的最大地震震级,窗口按月滑动(图三1)。

试验中我们发现效果较好的是长短时记忆神经网络(LongShort-TimeMemory, LSTM),这是一种特殊的循环神经网络,它提升了神经网络的长时间记忆能力(图三2),适用于有关时间序列数据的记忆和分析,我们先用该方法进行了地下水泉涌量预测、进而进行了太阳黑子数目和太阳黑子纬度相关的蝴蝶图预测,取得了经验后,对川滇、加州等地方开展了地震预测的试验。
图三2 LTSM神经网络记忆单元结构图
图三3 LTSM神经网络预测效果图
……
还有更多成果内容,详见项目结题成果报告。该项目报告共计46页,关注城市数据派微信公众号,在公众号对话框中输入 2492 ,即可获得报告全文PDF的下载方式。
原文始发于微信公众号(城市数据派):大数据与地震数值预测探索丨城市数据派