您好, 访客   登录/注册

基于地表变形数据的潜在滑坡识别研究

来源:用户上传      作者:

  摘  要:潜在滑坡识别对地质灾害高发区的滑坡研究有重要意义。文章以中巴经济走廊灾害多发区某一试验区为例,结合由2014-2019的Sentinel1-A雷达数据计算出的地表变形数据,选取试验区地形、水文、地质、聚类共8种特征变量基于随机森林模型进行滑坡识别,滑坡识别结果总体精度为88.62%,Kappa系数为0.78。結果表明,结合地表变形数据的随机森林模型可以较好的识别潜在滑坡,聚类特征对于识别结果有重要贡献。
  关键词:随机森林;中巴经济走廊;地质灾害;特征变量
  中图分类号:P642.22 文献标志码:A 文章编号:2095-2945(2020)06-0009-05
  Abstract: The identification of potential landslides is of great significance for landslide research in high-risk areas of geological hazards. Taking a test area in a disaster-prone area of the China-Pakistan Economic Corridor as an example, combined with the surface deformation data set calculated from the Sentinel1-A radar data of 2014-2019, eight characteristic variables of terrain, hydrology, geology, and clustering in the test area were selected. Landslide identification was performed using a random forest model. The overall accuracy of the landslide identification result was 88.62%, and the Kappa coefficient was 0.78. The results show that the random forest model combined with the surface deformation data set can better identify the distribution of potential landslides, and the clustering features make an important contribution to the recognition results.
  Keywords: random forest; China-Pakistan Economic Corridor; geological disaster; characteristic variable
  引言
  滑坡是一种多发常见、分布广、范围大、破坏性严重的地质灾害之一,严重威胁着人民生命财产安全[1]。传统的识别方法周期长、工作量大、危险性高,而遥感技术具有时间快、成本低等优势,将其应用到滑坡的识别中对于滑坡发生的可能性预测,助力防灾减灾救灾等综合工作具有较大的价值。
  近年来,随着传感器的多元化,众多学者使用不同数据源和方法进行滑坡识别的研究。张群等借助Geoeye-1卫星影像提取光谱、空间、纹理及邻域特征,基于面向对象方法提取甘肃黑方台黄土滑坡区域[2]。徐乔等使用高分辨率QuickBird 影像,提取光谱、纹理及形状特征识别出疑似滑坡区[3]。余坤勇等利用ALOS 多光谱数据预测山体滑坡空间分布趋势,结果表明随机森林模型预测精度高于逻辑回归模型,达到90.8%[4]。Chaoying Z等使用一种典型的小基线子集(SBAS)干涉合成孔径雷达(InSAR)技术分析乌东德水库滑坡的时空变形特征[5]。Aggeliki K等基于Sentinel-1,Sentinel-2和Landsat-8多源遥感数据对马其顿西北部某煤矿区进行滑坡分布识别和绘制[6]。滑坡识别的一个主流思路就是使用机器学习的方法,包括支持向量机、神经网络、随机森林等[7-9],还有学者将其它方法应用到滑坡识别,如主成分变换、物探法[10-11]等。
  本文借助地表变形数据,即利用PS变形点进行空间自相关分析,计算出平均速度的聚类特征,再结合地形、水文、地质共8种特征变量,基于随机森林算法,对中巴经济走廊某试验区进行潜在滑坡识别和研究,并分析不同特征变量的重要性。
  1 研究区概况
  中巴经济走廊是中国和巴基斯坦两国之间交通、能源、海洋等领域交流与合作的战略通道,是我国“一带一路”重点工程之一,走廊内地质环境极为复杂、自然灾害活跃,山体滑坡、落石、塌方、地震等地质灾害时常发生,给人们的生命财产安全和社会经济发展带来严重的威胁,因此对走廊内的潜在滑坡识别很有必要和意义。
  2 数据源与处理
  2.1 雷达影像数据
  Sentinel-1卫星是欧洲航天局哥白尼计划(GMES)中的地球观测卫星,由两颗卫星组成,载有C波段合成孔径雷达,卫星数据不易受天气环境的影响,可提供不论昼夜和云雨雾等状况下的连续图像。从欧空局数据中心(https:∥scihub.Copernicus.eu/dhus/#/home)获取试验区2014年10月31日到2019年10月29日共122景Sentinel-1A IW SLC数据,用于生成试验区的地表变形数据。获取的Sentinel-1影像基本参数如表1所示。
  基于PS-InSAR技术,输入研究区Sentinel-1A影像,进行裁剪配准、相位估计、差分干涉、相位解缠等一系列处理步骤,计算得到试验区时间序列上的地表变形数据即PS变形点,试验区位置及PS变形点如图1 所示,不同颜色的PS变形点显示了不同区间的平均形变速率,可以看出试验区内沿着沟谷分布的区域较为稳定,但是仍然存在下降速率较大的PS点。    2.2 其它数据
  地形因子对滑坡的识别有很大的影响,获取空间分辨率为30米的ASTER GDEM高程数据,作为地形特征变量的提取。在ArcGIS中对DEM 数据进行裁剪,提取坡度、坡向、曲率、水系。试验区的地质构造断对滑坡也具有一定影响,从巴基斯坦地质中心获取的覆盖研究区范围断层空间分布数据,作为滑坡识别的又一特征变量。
  3 研究方法
  3.1 随机森林模型
  随机森林算法是由Breiman于2001年提出的一种非参数新型机器学习方法,即在变量(列)的使用和数据(行)的使用上进行随机化,生成很多分类树,再汇总分类树的结果,随机森林在运算量没有显著提高的前提下提高了预测精度,该方法分类准确性高、抗噪能力较强、泛化性能较好,已经广泛应用于分类和识别的相关研究中。
  3.2 样本数据选取
  样本数据来自于Google earth高清影像的目视解译。结合试验区部分实地考察照片以及由Sentinel-1A计算出的PS变形点的平均速度分布范围勾画滑坡区域,生成滑坡区域内共682个的滑坡点,再利用ArcGIS 10. 2软件在已知勾画的滑坡区之外随机生成相等数目的稳定点。将获取的682个滑坡点和682个稳定点,按照比例7:3随机分配分为训练样本集和验证样本集,分别用于随机森林识别滑坡的模型建立和精度验证,图2 是试验区位置及选取的样本空间分布,图3 是在Google earth高清影像辅助样本解译的PS变形点和实地考察照片。
   3.3 特征变量选取
  滑坡是自然界多种因子综合作用的结果,各个因子之间往往有着相互关联的因果关系。滑坡发生与否,首先受到自身地理环境的影响,包括地形地貌、土壤环境和植被信息等。一般情况下,在地势平坦区不易发生滑坡灾害,在地形起伏大的区域会随着地震、降雨等事件而发生滑坡,且滑坡发生的概率会随着坡度和高程的增加而增加。同时,构造面又为降雨等水流进入斜坡提供了通道,故各种节理、裂隙、层面、断层发育的斜坡,特别是当平行和垂直斜坡的陡倾角构造面及顺坡缓倾的构造面发育时,最易发生滑坡。另外,离水系越近的土壤,其含水性越大,而含水性越大往往有利于滑坡的发生,因而到水系距离也是滑坡发生的一个影响因子。
  空间自相关是指一些变量在同一个分布区内的观测数据之间潜在的相互依赖性,如果这个变量的空间分布存在规律性,这个变量是空间自相关的。ArcGIS中的空间自相关分析,可以计算某个变量在某个位置上的值受相邻位置上该变量值的影响程度,并对该变量空间分布的独立性和隨机性进行检验,从而表现变量的聚类特征。本文基于试验区的地表变形数据即PS变形点,以平均速率作为变量,基于 Getis和Moran's I 两种模型进行统计分析,分别得出两种模型的Gi*指数和Morans I指数,公式如下。
  公式(1)中,Wij(d)为在d距离内的空间相邻权重矩阵,同样地,若i与j相邻,该Wij(d)为1,不相邻为0。公式(2)中:N为样本数,Xi变量X在i位置的值,Xj变量X在j位置的值,Wij表示空间权重。综上考虑,最终选取试验区地形、水文、地质、聚类共8种特征变量(表2),提取结果如图4所示。
   4 结果和分析
  4.1 分类与精度评价
  输入8个特征变量以及训练样本集,在随机森林模型中,人为调整树的T个数和变量个数m,计算RFC模型,设置T从1-100逐一变化对融合特征进行滑坡识别,并统计总体精度,技术路线如图5所示。
  通过随机森林算法的特征变量和训练样本的输入和建模,得到识别滑坡的结果,并计算了滑坡识别结果的混淆矩阵,结果显示滑坡识别的总体精度为88.62%,Kappa精度为0.78,用户精度和生产精度分别为89.18%和87.87%(表3),总体来看识别效果良好。
  4.2 重要性评估
  随机森林模型可以对输入的特征变量进行重要性排序,如图6所示,可以看出不同特征变量在此次滑坡识别实验中的对识别结果的贡献。
  由图6可以看出对滑坡识别贡献最大的是Gi*指数,即热(冷)点分析中的 Getis模型的聚类特征。地形特征中高程的贡献最大,而坡向和曲率贡献最小,坡度和坡向的评分接近,远低于高程,由此可以推测在海拔越高的地方发生滑坡的可能性越大。断层因子的评分较高,在构造方面,例如断层发育的斜坡,当平行和垂直斜坡的陡倾角构造面及顺坡缓倾的构造面发育时,最易发生滑坡,断层评分也已说明研究区内的滑坡易发区受断层的影响因素较大。
  通过热(冷)点分析计算的Gi*指数贡献最大,主要是因为PS变形点的平均速度的聚类特征,平均速度为负,表示该点地面下沉,但是一个或者两个的下沉点往往不一定代表滑坡点,但是当下沉点成一簇一簇聚集起来分布,则该区域最有可能发生滑坡,如特征变量的重要性排序所示,Gi*指数的贡献远大于其它7个特征变量。
  4.3 数据对比验证
  通过分类后处理步骤设置阈值,消除分类结果中的微小细碎斑块,得到图7所示黑色不规则多边形的滑坡区域,统计样本点中分为滑坡点的稳定点和分为稳定点的滑坡点,可以看出大多滑坡点都落在黑色不规则多边形内,即滑坡点落在滑坡区,而只有少数稳定点误分到滑坡点。出现误分的原因可能有以下原因:样本点本身存在的误差;随机森林模型的算法误差;滑坡的发生机理和诱发因子复杂,特征选择不够全面。以上都有可能造成分类结果精度的误差。
  通过将PS变形点覆盖到滑坡识别结果中进行对比(图8),可以看出在空间趋势上,PS变形点的下沉速度较大的点大多落在黑色不规则多边形内,即下降位移较大的点落在识别的滑坡区里,通过PS变形点和识别结果的对比,可以看出地表变形数据和滑坡识别区域的对应效果较好。
  5 结束语
  本文结合地表变形数据中的PS变形点,通过空间自相关分析,使用 Getis和Moran's I两种模型计算了平均速度的聚类特征,再结合地形、水文、地质特征变量,对中巴经济走廊某试验区进行潜在滑坡识别,识别结果总体精度为88.62%,Kappa系数为0.78。   特征重要性排序中Gi*指数评分最高,表明下沉点成团聚集的地方,最有可能发生滑坡。地形特征中高程的贡献大于坡向和曲率,由此可以推测在海拔越高的地方发生滑坡的可能性越大。坡向和曲率和贡献重要性较小,不是滑坡发生的主导因素。
  降水量尤其暴雨也是导致滑坡可能发生的重要因素,然而由于研究区降水数据缺乏,因此只考虑了地表变形数据、地形、水文、地质等特征,而人类活动等其它潜在因子也对滑坡产生影响,这可能对模型的预测结果造成一定的误差。
  参考文献:
  [1]赵宝强,韩守富,白艳萍,等.时序InSAR技术在大型滑坡监测中的应用[J].科技创新与应用,2019(1):21-24.
  [2]张群,赵超英.基于面向对象的高分遥感数据甘肃黑方台黄土滑坡半自动识别[J].灾害学,2017,32(3):210-215.
  [3]徐乔,孟凡利,余绍淮.基于面向对象随机森林分类模型的滑坡遥感解译[J].中外公路,2019,39(3):30-33.
  [4]余坤勇,姚雄,邱祈荣,等.基于随机森林模型的山体滑坡空间预测研究[J].农业机械学报,2016,47(10):338-345.
  [5]Chaoying Z,Ya K,Qin Z,et al.Landslide Identification and Monitoring along the Jinsha River Catchment (Wudongde Reservoir Area),China,Using the InSAR Method[J].Remote sensing,2018, 10, 993.
  [6]Aggeliki K,Konstantinos N.Landslide mapping using optical and radar data a case study from Aminteo Western Macedonia Greece[J].European Journal of Remote Sensing,2019,2279-7254.
  [7]李松,鄧宝昆,徐红勤,等.地震型滑坡灾害遥感快速识别方法研究[J].遥感信息,2015,30(4):25-28.
  [8]李勋,杨环,殷宗敏,等.基于DEM和遥感影像的区域黄土滑坡体识别方法研究[J].地理与地理信息科学,2017,33(4):86-92.
  [9]姚雄,余坤勇,刘健,等.基于随机森林模型的降水诱发山体滑坡空间预测技术[J].福建农林大学学报:自然科学版,2016,45(2):219-227.
  [10]李成龙,张景发.基于主成分分析的遥感震害变化检测方法与应用[J].地震,2013,33(2):103-108.
  [11]郭瑞,李素敏,陈娅男,等.基于 SBAS-InSAR 的矿区采空区潜在滑坡综合识别方法[J].地球信息科学学报,2019,21(7):1109-1120.
转载注明来源:https://www.xzbu.com/1/view-15119222.htm