面向地球化学异常识别的深度学习算法对比研究

doi:10.11720/wtyht.2023.2667

面向地球化学异常识别的深度学习算法对比研究

李沐思^,¹^,²^,³, 陈丽蓉^,²^,³, 谢飞², 谷兰丁², 吴晓栋², 马芬², 尹兆峰²

1.中国地质科学院, 北京 100037

2.中国地质调查局发展研究中心, 北京 100037

3.中国地质大学(北京) 地球科学与资源学院, 北京 100083

Comparison of deep learning algorithms for geochemical anomaly identification

LI Mu-Si^,¹^,²^,³, CHEN Li-Rong^,²^,³, XIE Fei², GU Lan-Ding², WU Xiao-Dong², MA Fen², YIN Zhao-Feng²

1. Chinese Academy of Geological Sciences, Beijing 100037,China

2. Development and Research Center, China Geological Survey, Beijing 100037,China

3. School of Earth Sciences and Resources, China University of Geosciences (Beijing), Beijing 100083,China

通讯作者: 陈丽蓉(1984-),女,博士,助理研究员,主要从事空间信息技术应用与服务、时空大数据分析及人工智能算法在地学领域应用研究工作。Email:chenlirong@mail.cgs.gov.cn

责任编辑: 蒋实

收稿日期: 2021-12-10 修回日期: 2022-04-24

基金资助:

中国地质调查局地质调查项目“地质云系统集成与共享服务”(DD20190392)

Received: 2021-12-10 Revised: 2022-04-24

作者简介 About authors

李沐思(1998-),女,硕士研究生,主要从事地质大数据挖掘与分析研究工作。Email:342159595@qq.com

摘要

针对选用不同网络结构的深度学习算法进行地球化学异常识别,重构符合成矿分布的地球化学背景时选择依据较少的问题,本文基于闽西南铜锌银成矿区1∶20万水系沉积物数据,采用3种无监督深度学习模型AE、MCAE、FCAE,分别提取了样本中多元素的组合结构特征、空间分布特征以及混合特征,并基于其重构地球化学背景,模拟成矿分布。结果显示,FCAE模型圈定的异常区域与已知铜矿点最贴合,其次是MCAE模型和AE模型,其AUC值分别为0.80、0.78、0.61,且FCAE模型和AE模型对卷积窗口尺寸变化不敏感;说明面向地球化学异常识别构建深度学习算法时,基于提取空间分布特征或混合特征的算法综合表现较好,且基于提取组合结构特征或混合特征的算法对由观测空间尺度变化或不一致引起的噪声有较强抗干扰能力。本文为因地制宜地构建基于深度学习算法的地球化学异常识别模型提供了有效依据。

关键词： 地球化学异常识别; 卷积自编码器; 特征融合; 无监督学习; 特征提取; 深度学习

Abstract

There is a lack of selection bases in the geochemical anomaly identification and the reconstruction of the geochemical background conforming to the metallogenic distribution using deep learning algorithms with different network structures. Given this, based on the 1∶200 000 stream sediment data of the copper-zinc-silver metallogenic area in southwestern Fujian Province, this study extracted the combined structural characteristics, spatial distribution characteristics, and mixed characteristics of multiple elements in the samples using three unsupervised deep learning models, i.e., AE, MCAE, and FCAE. Then, these characteristics were used to reconstruct the geochemical background and simulate the metallogenic distribution. The results show that the anomaly areas delineated by the FCAE model were the most consistent with the known copper ore occurrences, followed by the MCAE and AE models. The FCAE, MCAE, and AE models had an area under the curve (AUC) score of 0.80, 0.78, and 0.61, respectively. Moreover, the FCAE and AE models were not sensitive to the change in the convolution window size. These results indicate that when deep learning algorithms are constructed for geochemical anomaly identification, the algorithms based on the extraction of spatial distribution characteristics or mixed characteristics perform well, and those based on the extraction of combined structural characteristics or mixed characteristics have a strong anti-interference ability for the noise caused by the change or inconsistency of the spatial observation scale. This study provides some effective selection bases for constructing geochemical anomaly identification models based on deep learning algorithms.

Keywords： geochemical anomaly identification; convolutional autoencoder; feature combination; unsupervised learning; feature extraction; deep learning

PDF (6584KB) 元数据多维度评价相关文章导出 EndNote| Ris| Bibtex 收藏本文

本文引用格式

李沐思, 陈丽蓉, 谢飞, 谷兰丁, 吴晓栋, 马芬, 尹兆峰. 面向地球化学异常识别的深度学习算法对比研究[J]. 物探与化探, 2023, 47(1): 179-189 doi:10.11720/wtyht.2023.2667

LI Mu-Si, CHEN Li-Rong, XIE Fei, GU Lan-Ding, WU Xiao-Dong, MA Fen, YIN Zhao-Feng. Comparison of deep learning algorithms for geochemical anomaly identification[J]. Geophysical and Geochemical Exploration, 2023, 47(1): 179-189 doi:10.11720/wtyht.2023.2667

0 引言

地质成矿过程复杂,在复杂的地质条件下形成了区域内多元的背景模式^[1]。区域内物、化探数据隐藏了某种规律的空间变化,对应了区域内的成矿特征。探索区域内物、化探数据的多元特征信息,能为矿产资源预测提供重要参考^[2]。

随着计算机科学的高速发展,人工智能技术被广泛应用于地球科学领域。神经网络、深度学习等技术被证明是挖掘非线性时空数据的强大工具,能有效识别地质过程中的复杂模式^[3]。利用深度学习方法降维处理地球化学数据,挖掘隐藏在地质环境中符合成矿分布的背景信息,圈定地球化学异常区域作为勘探靶区,被证明是辅助矿产勘测的有效方法^[4]。

目前面向地球化学异常识别的深度学习算法,在预测矿产分布上都取得了不错的效果。如文献[5]中基于卷积神经网络学习Pb元素与矿体的相关性,其验证集的准确率达到0.83;在文献[6]中利用深度自编码网络识别W和Mo元素数据,生成的高值异常区域与W、Mo成矿分布吻合。然而不同网络结构的深度学习算法,即使在基于相同化探数据进行异常识别时,生成的异常分布间也存在明显差异,如在文献[7]中对比了不同层数的卷积自编码器基于同一地球化学数据集的异常识别效果,结果表明编解码组的数目越多,识别的异常与已知铁矿的相关性越低。

因此根据区域地质条件选择结构合适的深度学习算法进行地球化学异常识别,对于提高异常靶区圈定成矿的准确率十分关键。对比不同网络结构配置的深度学习算法提取地质背景信息的效果,能为依据研究区域地质背景具体成矿条件选择合适的深度学习模型特征,从而为构建地球化学异常预测模型提供有效依据。

本文基于闽西南坳陷带铜锌银成矿区的1∶20万水系沉积物数据设计了对比实验,利用3种无监督深度学习模型AE(autoencoder,AE)^[8]、MCAE(multi-convolutional autoencoder,MCAE)^[9]、FCAE(fusion convolutional autoencoder,FCAE)^[10]进行地球化学异常识别,分别提取了样本中多元素间的组合结构特征、空间分布特征,以及融合了前两者的混合特征,将其作为区域多元地质特征在深度学习模型中的3种降维表达。为对比3种深度学习模型的综合性能,分别绘制了其ROC曲线和AUC分布,并分析了模型对卷积窗口尺寸变化的敏感度,以了解空间观测尺度变化时模型的抗干扰能力,同时生成了地球化学异常图,并将其与已知矿点位置和断层分布进行对比,进而验证模型预测成矿分布的准确度。

1 地质概况

本次研究选取位于闽西南与粤东北交接地区的一片区域,该区域属于闽西南坳陷带的胡坊—永定隆起带中段西坡。该研究区域是我国重要的铜、银金属成矿带之一,区域地质简图如图1所示。

图1

新窗口打开| 下载原图ZIP| 生成PPT

图1 研究区域地质简图(修改自Guan Q F等^[10])

Fig.1 Geological schematic diagram of the study area(modified from Guan Q F, et al.^[10])

研究区域地质史上经历了前泥盆纪基底变质变形、盖层沉积及构造活化等3大阶段,出露地层包括前泥盆纪基底岩系、晚古生代以海相沉积为主的盖层岩系以及中新生代陆相碎屑火山岩等3大岩系^[11]。区内NE向和NNE向断裂构造广泛发育,多以左行侧列式成组出现,部分已发展为深大断裂,控制了研究区域内中生代盆地的形成、分布和沉积。区内岩浆活动强烈,以加里东及燕山早期似斑状黑云母花岗岩为主,属古田岩体的一部分^[12]。

研究区域内各元素异常套合显著,以铜异常浓集中心最明显,但异常较分散,区域内已知铜矿点数量仅11个,已知铜矿资源分布稀疏。该区部分地段已发现铜铝矿化,具有相似的成矿背景,是寻找斑岩型铜矿的有利地区^[13]。在该区域地层存在未发现铜矿点的可能性较大,具有重要勘探价值。

2 研究方法

采用不同神经网络进行地球化学异常识别,其效果也不同^[14]。本文基于对现有模型的改编,设计了3种无监督深度学习模型AE、MCAE、FCAE,分别基于不同类型的地球化学元素异常特征圈定异常靶区。3种模型的结构是一个灵活的框架,其本质是对深度学习中自编码器神经网络的衍生设计,基于其框架可以采用不同组合的神经网络构建模型,为依据区域地质背景具体成矿条件构建用于地球化学异常识别的适合深度学习的模型提供了设计思路和参考依据。

2.1 特征提取

利用深度学习模型对化探数据进行异常识别,从而得到区域内多元地质特征的降维向量表示,实现对复杂地质条件下区域成矿特征的重构。本文在已有研究的基础上,利用自编码器AE提取样本中多元素间的组合结构特征,多卷积自编码器MCAE提取样本中多元素的空间分布特征,混合卷积自编码器FCAE提取融合以上两种特征的混合特征。

2.1.1 自编码器

自编码器模型(autoencoder,AE)由Rumelhart于1986年提出^[15],其本质是一种数据降维方法,通过AE能得到数据特征融合后的降维表达。AE网络结构呈对称分布,通过神经网络的反向传播,输入数据的维度与输出数据的维度保持一致,其结构如图2所示。AE的编码器(encoder)接收输入数据,生成一个经过压缩的特征向量,该特征向量保留了输入数据中的隐藏规律^[16];解码器(decoder)则利用编码器生成的特征向量,重构输出与原始输入数据维度一致、表达相近的特征向量。

图2

新窗口打开| 下载原图ZIP| 生成PPT

图2 自编码器模型AE

Fig.2 Autoencoder model (AE)

为了提取样本元素间的组合结构特征,AE的输入数据x是以样本为单位的地球化学特征数据。样本元素间的组合结构特征是指样本中所有组分间隐藏的某种组合关系,通过提取该特征,有助于发现与成矿关联最紧密的特征元素组合,降低弱相关组分对成矿预测的干扰。

(1)h=f(x)=S_f(W_i􀱋x+b_i),

(2)y=g(h)=S_g(W_j􀱋h+b_j),

AE属于无监督学习,其编码器和解码器分别构造了编码函数f(x)和解码函数g(h);􀱋表示叉乘,即向量积。

式(1)中S_f为编码器激活函数;h为经过f(x)映射后x的特征表达;W_i和b_i分别为编码器输入层到隐藏层之间网络的权重矩阵和偏置矩阵。式(2)中S_g为解码器激活函数;y为经过g(h)映射后x的重构数据;W_j和b_j分别为解码器隐藏层到输出层之间网络的权重矩阵和偏置矩阵,其中W_j通常取 ${W^{T}}_{i}$ 。

式(1)与式(2)中的参数矩阵可用θ_i={W_i,b_i}和θ_j={W_j,b_j}进行表示,模型训练的目的是优化模型参数[θ_i,θ_j],使输入x与输出y之间的重构误差达到最小。AE的整体损失函数可定义为:

(3)J_AE(θ_i,θ_j)=

\underset{θ_{i,} θ_{j}}{a r g m i n} \sum^{N}

L(x,y),

式中L(x,y)表示x与y之间的重构误差,用于衡量x与y之间的接近程度; N表示样本总数。通过批量梯度下降法在网络中迭代调整AE各层网络的权重和偏置,使损失函数最小化。

由于大多数样品不具备异常特征,因此异常分布的区域通常在研究区域内的面积占比较小。AE通过模型训练能从化探数据中学习到区域的地球化学背景模式,在重构过程中发现重构误差高于一般背景样本的异常样本,从而识别出极少数具有异常特征的样本。

2.1.2 多重卷积自编码器

在深度学习领域,卷积自编码器同时结合了自编码器和卷积神经网络(convolutional neural networks,CNN)的功能和优点^[17],是用于降维提取和重构数据局部特征的常用方法之一,被广泛应用于图像处理^[18]、异常检测^[19]等领域。

卷积神经网络能通过卷积核过滤局部数据,共享空间或时间上的特征值,极大地降低模型计算量,实现对数据局部特征的自动提取^[20]。当AE的输入层和输出层之间通过CNN逐层连接时就构成了CAE。CAE与AE相比能实现对输入数据的进一步压缩,只保留与成矿特征关联最密切的参数,以防止模型出现过拟合^[21],同时提取元素数据中的局部空间特征。CAE在AE的基础上提高了无监督学习的算法效率,有效减少了数据标记的工作量^[22]。

CAE与AE具备形式类似、含义一致的损失函数。CAE实现异常识别的原理与AE相同,但编码函数和解码函数存在区别,其主要区别在于输入数据x的输入方式不同,以及每层网络的权重和偏置的转换过程不同。

为提取样本中多种元素的空间分布特征,同时组合多个CAE组成了多重卷积自编码器模型(multi-convolutional autoencoder,MCAE),其模型结构如图3所示。MCAE的输入数据是以元素为单位的地球化学特征数据,每个CAE针对提取单个样本元素的空间分布特征。编码和解码过程主要由CNN的参数决定,如卷积核个数、卷积核尺寸等。模型训练的目的与AE相同,使输入x与输出y之间的重构误差达到最小。

图3

新窗口打开| 下载原图ZIP| 生成PPT

图3 多重卷积自编码器模型MCAE^[9]

Fig.3 Multi-Convolutional Autoencoder model (MCAE)^[9]

2.1.3 混合卷积自编码器

地球化学异常识别模型可用于辅助矿产预测的底层逻辑是,模型会将实际地质背景下的已知矿点识别为异常,通过学习已知矿点作为异常样本的特征,提取区域矿点分布特征信息,以模拟复杂地质环境下的矿产分布,从而辅助预测未知矿点的位置。为了提高异常识别模型预测的准确率,需要在模型中尽可能综合多元地质背景信息。利用混合卷积自编码器模型(fusion convolutional autoencoder,FCAE)提取融合了样本多元素组合结构特征和空间分布特征的混合特征,以在模型中进一步融合区域复杂地质特征信息。

FCAE同时综合了AE和MCAE的结构和优点,其模型结构如图4所示。FCAE由两个子自编码器AE-S和AE-C构成。AE-S是位于FCAE外层的自编码器,由多个CAE构成,相当于MCAE,用于提取样本中多种元素的空间分布特征。AE-C是位于FCAE内层的自编码器,连接了AE-S的编码器和解码器,用于在FCAE模型中融合样本元素之间的组合结构特征。

图4

新窗口打开| 下载原图ZIP| 生成PPT

图4 混合卷积自编码器模型FCAE^[10]

Fig.4 Feature fusion convolutional autoencoder (FCAE)^[10]

使用FCAE进行异常识别的原理与AE和MCAE相同,模型训练目的都是最小化输入x与输出y的重构误差。训练过程中,FCAE的编码和解码过程在AE-S和AE-C中混合进行。FCAE的输入数据与MCAE输入数据的结构一致,都是以元素为单位的地球化学特征数据。

2.2 异常得分计算

在基于自编码器神经网络的研究中^[23⇓-25],经常利用重构误差检测原始数据中的异常。重构误差的本质是对自编码器输入层原始数据与输出层重构数据差异的定量描述,重构误差的常用计算方法有欧氏距离、马氏距离、余弦距离等。

在本项研究中,利用每个样本原始数据和模型重构数据之间的欧式距离作为样本的重构误差,用于定量描述每个样本的异常程度,并将其作为每个样本的异常得分。假设每个样本包含N个观测值(如N个元素的标准化浓度值),则样本i与样本j之间的欧式距离D_ij计算为:

(4)D_ij=

\sqrt{\overset{N}{\sum_{k = 1}} (x_{i k} - x_{j k})^{2}}

式中:x_ik表示样本i第k个观测值;x_jk同理。样本的异常得分越大,说明该样本的异常程度越明显,该样本成为异常样本的概率越大。

2.3 性能评估

在评价不同深度学习模型异常识别效果的过程中,必须考虑异常样本占总样本和异常样本占已知矿点样本的比例,以确定模型圈定靶区预测矿产分布的准确度。受试者工作特征曲线(receiver operating characteristic curve, ROC)经常被用于评价分类预测模型的性能^[26],目前已被广泛应用于分类预测模型的评价,本文基于ROC曲线对模型进行定量对比评价。

ROC曲线的曲线下面积(area under curve,AUC)是用于定量描述预测模型预测准确度的常用指标,当AUC∈(0.5,1)时说明模型预测达到了可接受的精度。通常情况下,ROC曲线越陡峭,越靠近左上角的(0,1)坐标,则说明ROC曲线的AUC值越大,预测模型性能越好。

利用ROC曲线确定异常样本和背景样本的最佳区分阈值的具体做法如下:首先利用已知矿点和样本异常得分绘制ROC曲线,取ROC曲线上距离左上角(0,1)最近的一点作为最佳临界点,取该点的异常得分作为异常得分的最佳区分阈值,异常得分不小于该阈值的样本,预测为异常样本,否则预测为背景样本。模型预测的混淆矩阵如表1所示。

表1 模型预测结果混淆矩阵

Table 1 Confusion matrix of model prediction results

真实/预测	异常样本	背景样本
已知矿点	true positive(TP)	false negative(FN)
非已知矿点	false positive(FP)	true negative(TN)

新窗口打开| 下载CSV

真阳性率(true positive rate, TPR)同时也被称为召回值(Recall),是衡量预测分类模型准确度的重要指标之一。在地球化学异常识别模型中TPR含义如下式所示:

(5)TPR=

\frac{异 常 样 本 中 预 测 正 确 为 已 知 矿 点 样 本 的 数 量}{已 知 矿 点 样 本 的 总 数}

为了进一步定量比较模型圈定异常区域的能力,定义一个性能评价指标P_Abnormal,其计算公式如下:

(6)P_Abnormal=

\frac{识 别 为 异 常 的 样 本 数 量}{样 本 总 数}

由式(5)和式(6)可知,P_Abnormal越小,TPR值越大,说明异常识别模型圈定的异常区域与已知矿点位置重合越精确,模型的性能评价越好。

利用AE、MCAE以及FCAE 3种无监督深度学习模型进行地球化学异常识别,重构区域多元地质背景信息,提取区域成矿特征的流程如图5所示。

图5

新窗口打开| 下载原图ZIP| 生成PPT

图5 地球化学异常识别流程

Fig.5 Flow chart of geochemical anomaly identification

3 实验与评价

3.1 数据处理

本实验在研究区采集了1∶20万水系沉积物测量中3 484个采样点的数据,包括32种元素和6种氧化物。利用邻近样本的平均值填充缺失和极端异常处的样本数据。为了进一步降低噪声的影响,采用标准归一化将输入数据归一化到[01]区间。

研究区域内已知铜矿点有11个。为了通过地球化学异常识别圈定铜矿靶区,需要选择与铜成矿密切相关的元素和氧化物作为异常识别的指标。采用Benesty等^[27]的方法计算Pearson相关系数,铜与其他地球化学变量之间的Pearson相关系数见表2^[10]。根据相关系数检验表,当显著性水平为0.001时,若两个变量的相关系数大于0.104,说明两个变量显著相关^[28]。因此选取Cu、Ag、Au、Zn、As、Cd、Sb、Ti、Pb、P、Na₂O这11个地球化学变量作为铜成矿的异常识别指标,最终得到了11个地球化学变量维数为57×92、空间分辨率为1634.5 m×1492.8 m的样本浓度值矩阵,作为模型的输入数据。

表2 Cu与其他指标的Pearson相关系数^[10]

Table 2 Pearson correlation coefficient of Cu with other elements and oxides^[10]

指标	Ag	Au	Zn	As	Cd	Sb	Ti	Pb	P	Na₂O
相关系数	0.742	0.531	0.525	0.434	0.379	0.353	0.244	0.242	0.142	0.156

新窗口打开| 下载CSV

模型网络基于keras(2.5.0)和tensorflow-gpu(2.5.0)搭建,python版本为3.7.4。硬件环境采用Intel(R)Xeon(R)Gold 6142 CPU@2.60GHz,8核处理器,显卡为NVIDIA GeForce RTX 3080,采用29.77TFLOPS半精度和29.77TFLOPS单精度。

实验采用的AE、MCAE、FCAE模型网络结构如表3和表4所示。表3描述了AE和MCAE的网络结构。表4描述了FCAE编码器和解码器的网络结构。AE、MCAE、FCAE模型基于同一数据集进行无监督训练,每次训练时采用相同的优化函数和损失函数。优化函数基于自适应学习率调整,损失函数基于均方误差函数。

表3 AE和MCAE网络结构

Table 3 AE and MCAE network structure

模型	编码器	解码器
AE	输入:以样本为单位输入,输入为11×5244(57×92)的样本浓度值矩阵全连接层:250个神经元,激活函数relu 全连接层:180个神经元,激活函数relu 全连接层:80个神经元,激活函数relu	全连接层:80个神经元,激活函数relu 全连接层:180个神经元,激活函数relu 全连接层:250个神经元,激活函数relu 输出:输出维度为11×5244(57×92)的重构矩阵,激活函数为softmax
AE	训练次数为10000次
MCAE	输入层:以元素为单位输入,维度为(57×92)5244×11的样本浓度值矩阵卷积层:二维卷积,卷积核数为16,多尺寸卷积窗口,激活函数relu,填充方式same 池化层:二维池化,池化窗口3×2,填充方式same	上采样层:二维上采样,池化窗口3×2 卷积层:二维卷积,卷积核数为16,多尺寸卷积窗口,激活函数relu,填充方式same 输出层:卷积窗口为1的卷积层,输出维度为11×5244(57×92)的重构矩阵,激活函数sigmoid
MCAE	训练次数为1500次

新窗口打开| 下载CSV

表4 FCAE网络结构

Table 4 FCAE network structure

模型	编码器		解码器
模型	AE-S编码器	AE-C编码器	AE-C解码器	AE-S解码器
FCAE	输入:以元素为单位输入,维度为(57×92)5244×11的样本浓度值矩阵卷积层:二维卷积,卷积核数为16,多尺寸卷积窗口,激活函数relu,填充方式same 池化层:二维池化,池化窗口3×2,填充方式same	输入:以元素为单位输入,维度为(57×92)5244×11的样本浓度值矩阵卷积层:二维卷积,卷积核数为16,多尺寸卷积窗口,激活函数relu,填充方式same 池化层:二维池化,池化窗口3×2,填充方式same	输入:AE-C编码器输出的拼接层上采样层:二维上采样,池化窗口3×2 卷积层:二维卷积,卷积核数为16,多尺寸卷积窗口,激活函数relu 输出:卷积窗口为1的卷积层,输出维度为11×5244(57×92)的重构矩阵,激活函数是sigmoid,填充方式same	输入:AE-S解码器输出的拼接层上采样层:二维上采样,池化窗口3×2 卷积层:二维卷积,卷积核数为16,多尺寸卷积窗口,激活函数relu
FCAE	AE-S的训练次数为1200次,AE-C的训练次数为1000次

新窗口打开| 下载CSV

3.2 实验结果

3.2.1 性能对比

表5和图6综合对比了3种特征提取模型AE、MCAE、FCAE的性能,其中表5汇总了3种模型的P_Abnormal、Recall以及AUC,图6为3种模型的ROC曲线和AUC分布。

表5 三种模型性能对比

Table 5 Performance comparison of three models

模型	P_Abnormal	Recall	AUC
AE	0.126	0.455	0.611
MCAE	0.499	0.909	0.780
FCAE	0.399	0.909	0.802

新窗口打开| 下载CSV

图6

新窗口打开| 下载原图ZIP| 生成PPT

图6 三种特征提取模型的ROC曲线和AUC分布

Fig.6 ROC curves and AUC distributions of three feature extraction models

由图6可知,3种深度学习模型的平均AUC均大于0.5,因此3种模型都能有效完成对多元成矿特征的降维提取,重构符合区域成矿分布的地质背景信息。

AE通过提取样本中多元素间的组合结构特征进行异常识别,AE模型的平均AUC分布在[0.611],Recall不到0.5,在3种特征提取模型中综合性能最差,说明元素间的组合特征包含的成矿信息有限,基于样本多元素间的组合结构特征不足以有效重构区域地质背景,生成符合成矿分布的异常区域。

MCAE通过提取样本中多元素的空间分布特征进行异常识别,MCAE模型的平均AUC略高于AE模型,分布在[0.780],Recall达0.909,MCAE模型综合性能明显优于AE模型,说明基于空间分布特征重构的地质背景中包含区域有效成矿信息的比例显著提高。

FCAE通过提取融合了组合结构特征和空间分布特征的混合特征进行异常识别,FCAE模型的平均AUC最高,分布在[0.802],Recall与MCAE模型相同,但衡量模型圈定异常区域与已知矿点分布重合度的P_Abnormal更小,因此FCAE模型圈定的靶区更精确,说明基于混合特征重构区域地质背景的过程中,保留的成矿分布信息最完整,重构的区域地质情况还原程度最高。

3.2.2 卷积核尺寸敏感度分析

提取多元素空间分布特征的MCAE模型,以及提取多元素混合特征的FCAE模型结构中都存在CNN,而卷积窗口的大小是影响CNN性能的关键参数,在实际应用中必须考虑模型对卷积窗口尺寸变化的敏感性。另外,由于提取多元素组合结构特征的AE模型中不存在CNN,因此AE模型对卷积窗口尺寸变化不敏感。

实际场景中,卷积窗口尺寸的变化可理解为对区域的观测空间尺度发生变化,因此探索卷积窗口尺寸变化对于模型性能的影响,能反映模型性能对观测空间尺度变化的敏感度,从侧面体现了模型对由观测空间尺度变化引起噪声的抗干扰能力。

针对MCAE模型和FCAE模型设计了对比试验,设置11组尺寸不同(21、23、26、29、32、35、38、41、44、47、50)的卷积窗口,每组实验模型结构与表3和表4保持一致。为降低随机初始化对结果的影响,每组卷积窗口随机初始权重训练50次。MCAE模型和FCAE模型在不同尺寸卷积窗口下的AUC分布如图7所示。

图7

新窗口打开| 下载原图ZIP| 生成PPT

图7 不同尺寸卷积窗口的MCAE和FCAE性能对比

Fig.7 Performance comparison of MCAE and FCAE with different size convolution window

由图7a、b可知,随着卷积窗口尺寸增大,MCAE模型的AUC值波动明显,模型性能逐渐提高后趋于平稳。FCAE模型的AUC值波动较小,模型性能随卷积窗口尺寸变化不明显。

由图7c可知,当卷积窗口尺寸相同时,FCAE模型的平均AUC值略高于MCAE模型,且两模型的性能差距与卷积窗口尺寸大小成反比。FCAE模型在卷积窗口为35时取得最大AUC值0.802,MCAE模型在卷积窗口为47时取得最大AUC值0.780。

对比实验结果说明,MCAE模型对观测空间尺寸变化敏感,FCAE和AE模型对观测空间尺寸变化不敏感。因此在重构符合区域成矿分布的地质背景时,基于组合结构特征(AE模型)和混合特征(FCAE模型)的深度学习算法能有效降低观测空间尺度变化或不一致引起的噪声带来的影响,有利于采用类似网络结构的深度学习算法在实际矿产勘测场景的推广应用。

3.3 地球化学异常分布

基于ROC曲线得到最优阈值,将每种深度学习模型计算得到的异常得分转换为平面热力分布图,作为其地球化学异常识别的可视化结果,并在图中标明已知铜矿点和断层分布,如图8所示,图中异常得分越高的区域颜色越深。

图8

新窗口打开| 下载原图ZIP| 生成PPT

图8 -1 基于ROC曲线最佳阈值的地球化学异常分布

Fig.8 -1 Geochemical anomaly distribution map based on optimal threshold of ROC curve

图8

新窗口打开| 下载原图ZIP| 生成PPT

图8 -2 基于ROC曲线最佳阈值的地球化学异常分布

Fig.8 -2 Geochemical anomaly distribution map based on optimal threshold of ROC curve

研究区域内存在11个已知铜矿点。由图8可知,提取样本多元素组合结构特征的AE模型圈定的异常区域覆盖了7个已知铜矿点,提取样本多元素空间分布特征的MCAE模型覆盖了8个,提取样本多元素混合特征的FCAE模型覆盖了9个。

针对同一化探数据集,基于不同的无监督深度学习算法圈定的异常区域分布间存在明显差异,3种模型圈定的中高异常区域分布类似,但低异常和背景区域分布差异显著。其中MCAE和AE的异常分布相似度较高,但MCAE圈定的异常区域范围更小,更贴合已知铜矿分布;与AE和MCAE相比,FCAE模型圈定的中高值异常区域与已知铜矿点分布最贴合,且对中部沿断层分布的铜矿点有较好的预测效果。

3种无监督深度学习算法生成的地球化学异常图中存在若干偏离预测异常区域的已知矿点,分析其可能原因为:

1)在应用无监督异常识别算法前,选择合理的降维算法(如主成分分析法、层次聚类法等)提取与矿种成矿密切相关的地球化学变量作为异常识别指标,能显著改进成矿相关的地球化学异常识别结果^[27]。当基于不合适的降维算法提取矿种异常识别指标时,输入数据中会损失大量区域成矿特征的关键信息,使预测模型无法准确还原区域成矿分布,造成已知矿点偏离模型预测区域。

2)矿产分布预测工作通常需要基于多类型探测数据,同时结合专业地质背景知识,以挖掘区域成矿规律,辅助指导矿产资源预测工作^[6]。在通过异常识别模型预测矿产分布的过程中,仅基于单一类型的化探数据,而没有考虑其他探测手段的数据源(如遥感数据和地球物理数据等),不足以支撑异常识别模型提取成矿规律的有效信息以准确预测矿产分布,从而造成已知矿点偏离模型预测区域的情况。

4 讨论

深度学习算法的卷积神经网络需要限制输入数据为规则网格数据^[29],但一些研究区域可能并不具备规则网格数据的采样条件,因此在实际推广中,模型结构中存在CNN的MCAE模型和FCAE模型可能会受到限制,而AE模型中不存在CNN,不受限于输入数据的规格,有机会适用于更广泛的应用场景。

本文研究区域内矿产数量较少且分散,识别的地球化学异常分布只占整个研究区域的一小部分。在已知矿点数量众多且分布占据大部分区域的地区,其地球化学异常模式与本文存在较大差异^[30]。因此本文分析的深度学习算法是否适用于该类区域的地球化学异常识别问题,还需要进一步的探索与研究。

基于3种深度学习模型的优缺点及适用范围进行对比总结,如表6所示。针对不同无监督深度学习算法(AE、MCAE、FCAE)在同一研究区圈定的异常分布差异明显的问题,分析其可能原因如下:

表6 三种模型对比总结

Table 6 Summary of the comparison of the three models

提取特征	模型	覆盖矿点数/ 总矿点数	优点	缺点	适用范围
元素组合结构特征	AE	7/11	能有效圈定靶区且对空间噪声不敏感	圈定靶区的准确率相对较低	矿产分布稀疏的地区
元素空间分布特征	MCAE	8/11	能相对精确地圈定靶区	需限制输入数据为规则网格数据,且对空间噪声较敏感	矿产分布稀疏且具有规则网格数据采样条件的地区
元素组合结构与空间分布混合特征	FCAE	9/11	能精确地圈定靶区,同时有效预测沿断层分布的铜矿点,且对空间噪声不敏感	需限制输入数据为规则网格数据	矿产分布稀疏且具有规则网格数据采样条件的地区

新窗口打开| 下载CSV

1)不同类型的成矿特征含有区域内成矿规律的有效比例不同,因此基于提取出的不同类型的成矿特征,还原区域成矿规律的有效程度存在差异,造成基于不同类型的成矿特征圈定的异常分布间存在明显差异。

2)不同的深度学习网络在结构设计上各有特点,在异常识别的过程中会不同程度地损失区域成矿特征中的有效信息,因此不同的深度学习网络对于区域成矿特征信息的还原程度不同,从而造成基于不同结构的深度学习网络圈定的异常分布间存在差异。

研究表明,融合地球化学变量的空间分布特征和组合关系对地球化学异常识别是有利的,在今后的地球化学异常识别研究中,应考虑更多的特征融合方法。另外,如何基于区域地球化学数据的特点,更好地构建融合特征的地球化学异常识别模型,辅助指导矿产勘探工作,也是值得深入研究的问题。

5 结语

本文利用闽西南铜锌银成矿区1∶20万水系沉积物数据,通过对比AE、MCAE、FCAE 3种无监督深度学习模型的地球化学异常识别结果,以及3种模型对卷积窗口尺寸变化的敏感度,分析总结了具有不同网络结构的深度学习模型在面向地球化学异常识别时的优缺点及适用范围。AE、MCAE、FCAE 3种模型分别基于提取样本元素的组合结构特征、空间分布特征以及融合前两种特征的混合特征,实现对复杂区域成矿特征的重构,以圈定地球化学异常靶区。本文根据区域具体成矿分布特点,选择合适的深度学习算法进行地球化学异常识别,以辅助矿产勘探提供了有效选择依据。

实验结果表明,AE、MCAE、FCAE 3种深度学习模型都能有效模拟区域矿产分布,其中基于提取样本元素混合特征(FCAE)和空间分布特征(MCAE)的模型,圈定的异常靶区与已知铜矿分布最贴合,同时基于提取样本元素混合特征(FCAE)和组合结构特征(AE)的模型对由观测空间尺度变化或不一致引起的噪声有较强抗干扰能力。采用适合网络结构的深度学习模型能有效提取地质环境中的复杂成矿信息,根据具体区域地质背景选择适合的深度学习算法圈定异常勘探靶区,能有效提高找矿效率。

本文研究区域内已知铜矿点数量较少且分布稀疏,计算规模相对较小,深度学习算法的性能有待进一步发掘,下一步工作可以针对已知矿点数量众多且分布密集地区,探索适合结构的深度学习算法以预测其矿产分布。

参考文献

原文顺序

文献年度倒序

文中引用次数倒序

被引期刊影响因子

[1]

郭科.

复杂地质地貌区多尺度地球化学异常识别的非线性研究[D]. 成都: 成都理工大学, 2005:12.