2. 中南大学 重载铁路工程结构教育部重点实验室,湖南 长沙 410075;
3. 南卡罗来纳大学 土木与环境工程系,哥伦比亚 29208
2. The Key Laboratory of Engineering Structures of Heavy Haul Railway, Ministry of Education, Central South University, Changsha 410075, China;
3. Department of Civil and Environmental Engineering, The University of South Carolina, Columbia 29208, America
滑坡敏感性是指在综合分析相关地质和地形条件的基础上,某一区域发生滑坡的可能性.在确定了致灾因子之后,评估模型是编制滑坡敏感性区划图的一个关键问题.过去几十年的研究提供了多种可选择模型,一般可分为两类,即定性模型和定量模型.定性方法是基于专家经验的知识驱动型方法,如层次分析法[1-2]等,具有不确定性和主观性.随着计算机技术、遥感技术以及地理信息系统技术的全面发展,研究人员更倾向于采用定量方法来进行地质灾害区划.定量方法是基于统计学的数据驱动型方法,如逻辑回归(LR)分析法[3]等.在机器学习逐渐发展起来后,一些学者开始使用支持向量机法[4]等方法来进行滑坡敏感性分析.定量方法具有较好的确定性和客观性.
Polykretis等[5]的研究认识到由于致灾因子之间的复杂非线性关系、缺乏相关数据以及环境动态变化的整合,导致编制滑坡敏感性区划图存在困难.然而迄今为止,大多数的分类和回归学习方法都是浅层结构的算法,不同特征之间的非线性关系没有得到充分反映.深度学习的本质是通过构建具有许多隐藏层和大量训练数据的模型来学习更多特性,实现对上层的特征抽象,一定程度上对传统模型所暴露出的目标函数优化和收敛不足等问题进行了提升与改进.因此,这种方法提高了分类或预测的准确性.本研究首次将深度信念网络(DBN)模型用于滑坡地质灾害评估,并将结果与LR和BPNN模型进行比较分析.
1 滑坡及致灾因子数据集 1.1 研究区域四川省具有明显的西高东低、高低悬殊的地形特点.西部是川西高原,主要为高原和山地;东部是四川盆地,主要为平原和丘陵.四川处在中国1级和2级阶梯交界处和地震分布带中,省内存在岷江断裂带、龙门山断裂带等一些大规模的断裂带,构造运动活跃,对滑坡的形成提供了充足的地质条件.由于地貌和地质背景复杂,水文条件丰富,该地区每年都会发生大量滑坡灾害.
1.2 历史滑坡数据集在编制滑坡敏感性区划图的过程中,通过模型对历史滑坡分布数据进行分析可以获取每个因子之间的内在联系,从而最终预测每个点的滑坡发生概率.本文将调研得到的四川省滑坡分布图在GIS环境下数字化,制成四川省滑坡历史灾害分布图(图 1).从图 1可以看出,四川省滑坡历史灾点主要分布在南部、东北部和中部.
滑坡灾害是多因素相互作用的结果.评价指标的选取是否合理对滑坡评价过程和结果有着重要的影响.根据以往相关研究经验[6-7]并结合四川省的自然条件情况,本文选取了高程、地貌、岩性、坡度、与构造带距离、与水系距离、年均降雨量等7个致灾因子(图 2),每个因子具体的来源和格式见表 1.
深度学习的概念来源于对人工神经网络的研究.它将低级特性结合起来形成更抽象的高级表示(属性类或特性),以发现数据的分布式特性.DBN是一种高效的无监督学习算法.迄今为止,它已广泛应用于图像分类、语音识别和其他领域[8-9].
DBN在编制滑坡敏感性区划图中的一个显著优势是,它从可能对滑坡的发生至关重要的因素中学习特征.本文的7个致灾因子是研究者经常使用的,但这些因素之间的复杂相互作用和内在联系难以解释和量化.传统的网络训练方法如反向传播BPNN和径向基函数(RBF)对因素的原始特征依赖性很强,缺乏揭示因素组合效应的能力.在这种情况下,DBN被认为是解决这个问题的较好的方法.鉴于此,本研究尝试将DBN应用于四川省的滑坡敏感性区划图.
DBN是一个双向深度网络,是由受限玻尔兹曼机器(RBM)组成的概率生成模型.RBM由输入数据层(可视层v)和隐藏层h组成,各层神经元之间不存在连接(图 3).
将若干个RBM连接起来则构成了一个DBN,其中,上一个RBM的隐层即为下一个RBM的显层,上一个RBM的输出即为下一个RBM的输入.训练过程中,需要充分训练上一层的RBM后才能训练当前层的RBM,直至最后一层(图 4).
LR模型是分类问题中常用的广义线性回归分析模型.在编制滑坡敏感性区划图的过程中,LR分析了致灾因子之间的线性关系,对每个点的滑坡发生率进行分类和预测.各致灾因子的权重记录在表 2中.随后,历史滑坡数据集和所有致灾因子图层叠加在GIS平台下的6 391个栅格单元中.
反向传播神经网络BPNN是人工神经网络中应用最广泛、最具代表性的模型.它是一种由误差反向传播算法训练的多层前馈网络.BPNN具有大规模并行处理能力、自适应性、自学习能力、强容错性、鲁棒性和分布式信息存储等特点.本研究采用Matlab环境下的人工神经网络工具箱进行建模分析.
3 模型预测结果 3.1 DBN模型本研究选取典型的4层DBN,包含3个RBM和一个输出层来对已有数据进行训练.整个训练过程分为两步:首先是对RBM进行预训练,神经元数量、学习率和批次更新数量等参数需要在训练过程中根据研究需要不断调整;最终确定RBM的三层神经元数量分别为100, 50和20,训练方法为SGD,学习率为1,每批次更新数量为100,采用适用于概率预测的性能函数MSE和激活函数Sigmoid.在对前三层RBM训练之后,对整个网络进行训练,输入层节点选择7个,代表 7个致灾因子,最后一层网络节点数为1,表示单元滑坡敏感预测值;优化函数使用Adam,损失函数采用MSE,学习率为0.01,迭代次数为1 000次,以70 %的数据(4 474个单元)为训练集,30 %的数据(1 917个单元)为测试集,整个网络准确率为83 %.
利用训练好的DBN,对四川省进行滑坡敏感性预测,预测范围为0~0.990 5.根据自然断点法将滑坡敏感性分为低0~0.205 5,中0.205 5~0.509 3,高0.509 3~0.760 3和极高0.760 3~0.990 5四个等级,得到四川省滑坡敏感性区划图(图 5a).
在LR分析中,单个历史滑坡被视为因变量.存在则标记为1,不存在标记为0.数据导出到SPSS,得到代表各致灾因子之间线性关系的值:
(1) |
(2) |
式中, I因子代表各个致灾因子的权重.
根据式(1)和式(2),推导出四川地区P的分布范围为0.019 5~0.799 1.根据自然断点分类法,将滑坡敏感性区划图分为低(0.019 5~0.160 6),中(0.160 6~0.318 6),高(0.318 6~0.508 9)和极高(0.508 9~0.799 1).预测结果如图 5b所示.
3.3 BPNN模型选取典型的3层BPNN对输入数据进行训练.隐含层和输出层传递函数分别采用Tansig和Logsig,训练函数采用Traingdx,阈值和权值的学习函数采用Learngd,性能函数采用MSE.输入层节点数设为7,即本文选取的滑坡一级致灾因子个数;输出层节点数设为1,表示单元滑坡敏感性值.
利用BPNN得到四川省滑坡敏感性分布范围为0~0.992 5,根据自然断点分类法分为低(0~0.348 7), 中(0.348 7~0.536 7), 高(0.536 7~0.726 7)和极高(0.726 7~0.992 5).预测结果如图 5c所示.
4 结果分析 4.1 ROC曲线精度评估ROC曲线分析是评估模型预测结果准确性的常用方法.为了进一步讨论DBN的特点,利用ROC来评估3个模型编制滑坡敏感性区划图结果的准确性.其中,曲线下面积(AUC)是模型精度的最终评价标准.DBN, LR和BPNN的ROC曲线如图 6所示,AUC值分别为0.899, 0.782和0.867.从这些数据来看,DBN在3个模型中具有最好的预测精度,表明了深层神经网络处理复杂因素特征的优势.
图 5从几个方面揭示了结果的差异.首先,3个模型编制的滑坡敏感性区划结果具有相似的特征,即低、中敏感区主要集中在西部,而高、极高敏感区则分布在南部.其次,3个模型预测得到不同比例的4种敏感性水平.显然,DBN和BPNN之间的差异并不显著,而DBN和LR之间的差异主要集中在西北和东部地区.LR与DBN及BPNN在四川省西北部和中部地区的区划差异明显地揭示了三者数据挖掘能力的不同,同为非线性处理模型的DBN和BPNN有更接近的结果,而两者在四川省西北部的区划结果相比于LR模型更符合实际情况.
图 7和图 8探讨了3个模型结果的差异,最明显的是3个模型中DBN对敏感性进行了保守的预测,“极高”和“高”敏感性覆盖的面积分别占总面积的27.57 %和18.57 %.同时,52.72 %的历史滑坡被确定为“极高”敏感性等级,优于BPNN的33.75 %和LR的43.06 %.另外,计算了不同敏感性等级中的历史滑坡数,DBN预测处于“极高”和“高”敏感性的历史滑坡占总量的81.04 %,为3个模型中最好.
与BPNN的29.63 %相比,DBN中总共18.96 %的历史滑坡被错误地归类为“低”和“中”敏感性,更好地控制假阴性.
4.3 致灾因子的敏感性为了探究不同模型中致灾因子的影响,进行了统计试验以探讨预测得到的滑坡敏感性与各级不同致灾因子面积的比例(图 9).由该图可知,DBN和BPNN都反映了平均年降雨量和与水系距离跟滑坡发生之间的正相关关系,因为预测的“高”和“极高”的敏感滑坡集中在年降雨量较大且与水系距离较近的区域,这与先前研究的结论一致[10-11].如图 9所示,高程因素也起着至关重要的作用. LR的结果表明,海拔1~2 km的区域覆盖了大部分“极高”的敏感区域,而DBN更倾向于小于1 km的区域.
在3个模型中,坡度因素对滑坡发生的影响没有如此显著的统计意义,因为滑坡在该因素的不同水平上分布几乎均匀,这与侧重于个别滑坡机制的研究的预期和结论有些差异.这一现象的出现可以解释为四川省内的历史滑坡同时存在土质滑坡和岩质滑坡,而坡度对土质滑坡影响较大,对岩质滑坡影响较小.
总的来说,DBN和BPNN的结果显示出非常相似的分布特征,在高程、与水系距离和年平均降雨量等因素上差异不大,而在剩下的4个因素上则存在较大差异.LR的结果与DBN和BPNN有显著差异,特别是在地貌因素上,LR预测大多数高敏感区域将分布在台地中.这一发现虽然是初步的,但仍然有助于理解每个模型对致灾因子的响应.
5 结论1) 基于DBN和LR,BPNN模型进行滑坡敏感性评价,结果表明四川西南部和东南部更容易发生滑坡.其中DBN模型区划结果显示整个四川省处于“极高”和“高”敏感性的比例为46.14 %,LR模型为37.44 %,BPNN模型为40.35 %.
2) DBN具有较好的假阴性率控制性能,区划结果精度高于LR和BPNN,验证了该方法的准确性.
3) DBN与LR,BPNN模型对致灾因子的响应不同.利用深度学习DBN模型能综合反映致灾因子在外在条件下复杂的内在相互关系,尤其是在大范围、大数据量的区域中,可以成为以后地质灾害区划研究的重要手段.
[1] |
Avtarc R, Singh C K, Singh G, et al. Landslide susceptibility zonation study using remote sensing and GIS technology in the Ken-Betwa River Link area, India[J]. Bulletin of Engineering Geology and the Environment, 2011, 70(4): 595-606. DOI:10.1007/s10064-011-0368-5 |
[2] |
Abedini M, Tulabi S. Assessing LNRF, FR, and AHP models in landslide susceptibility mapping index:a comparative study of Nojian Watershed in Lorestan Province, Iran[J]. Environmental Earth Sciences, 2018, 77(11): 405-417. DOI:10.1007/s12665-018-7524-1 |
[3] |
Aditian A, Kubota T, Shinohara Y. Comparison of GIS-based landslide susceptibility models using frequency ratio, logistic regression, and artificial neural network in a Tertiary Region of Ambon, Indonesia[J]. Geomorphology, 2018, 318: 101-111. DOI:10.1016/j.geomorph.2018.06.006 |
[4] |
Ballabio C, Sterlacchini S. Support vector machines for landslide susceptibility mapping:the Staffora River Basin case study, Italy[J]. Mathematical Geosciences, 2012, 44(1): 47-70. |
[5] |
Polykretis C, Chalkias C. Comparison and evaluation of landslide susceptibility maps obtained from weight of evidence, logistic regression, and artificial neural network models[J]. Natural Hazards, 2018, 93(3): 1-26. |
[6] |
Kanungo D P, Sarkar S, Sharma S. Combining neural network with fuzzy, certainty factor and likelihood ratio concepts for spatial prediction of landslides[J]. Natural Hazards, 2011, 59(3): 1491-1512. DOI:10.1007/s11069-011-9847-z |
[7] |
Chen W, Xie X S, Wang J L, et al. A comparative study of logistic model tree, random forest, and classification and regression tree models for spatial prediction of landslide susceptibility[J]. Catena, 2017, 151: 147-160. DOI:10.1016/j.catena.2016.11.032 |
[8] |
Djurdjevic P D, Huber M.Deep belief network for modeling hierarchical reinforcement learning policies[C]//Proceedings of 2013 International Conference on Systems, Man, and Cybernetics.Manchester: IEEE, 2013: 2485-2491. https://www.researchgate.net/publication/262395798_Deep_Belief_Network_for_Modeling_Hierarchical_Reinforcement_Learning_Policies?_sg=nF0pIZZ4ScjD36c_yiKd3oFoaxSTyMRWTwqqspfYNsrddoW_aozgzBFm8ola-t2_1guItk2BfKa9bhZdye0USA
|
[9] |
Kim H, Lee S, Lee D, et al. Real-time human pose estimation and gesture recognition from depth images using super pixels and SVM classifier[J]. Sensors, 2015, 15: 12410-12427. DOI:10.3390/s150612410 |
[10] |
Cheng D Q, Cui Y F, Su F H, et al. The characteristics of the Mocoa compound disaster event, Colombia[J]. Landslides, 2018, 15: 1223-1232. DOI:10.1007/s10346-018-0969-1 |
[11] |
Han Z, Wang W D, Li Y G, et al. An integrated method for rapid estimation of the valley incision by debris flows[J]. Engineering Geology, 2018, 232: 34-45. DOI:10.1016/j.enggeo.2017.11.007 |