基于深度神经网络的重力异常反演
Inversion of gravity anomalies based on a deep neural network
通讯作者: 熊杰(1975-),男,博士,副教授,CCF会员,主要研究方向为地球物理反演理论、人工智能。Email:xiongjie@yangtzeu.edu.cn
责任编辑: 王萌
收稿日期: 2021-06-17 修回日期: 2021-10-21
基金资助: |
|
Received: 2021-06-17 Revised: 2021-10-21
作者简介 About authors
王蓉(1995-),女,硕士,主要研究方向为地球物理反演理论、人工智能。Email:
为解决传统线性反演方法容易陷入局部极小,计算效率低等问题,本文提出了一种基于深度学习的重力异常反演方法。该方法首先构造不同形状的二维密度模型,正演得到重力异常,组成数据集;然后用该数据集训练深度神经网络;最后将重力异常数据输入到训练好的深度神经网络,直接得到反演结果。实验结果表明,该方法能快速、准确地反演出地下异常体的位置和形态,且具有较好的泛化能力和抗噪声能力,可用于重力异常反演。
关键词:
Traditional linear inversion of gravity anomalies is liable to encounter local minima and suffer low computational efficiency. Given this, this paper proposed a deep learning-based inversion of gravity anomalies. Specifically, two-dimensional density models of various shapes were firstly established, and gravity anomalies were obtained through forward simulation using these models to form a dataset. Then, a deep neural network was trained using the dataset. Finally, gravity anomaly data were input into the deep neural network to directly yield inversion results. Experimental results show that the inversion method proposed in this study can determine the locations and shapes of underground anomalies quickly and accurately, with high generalization ability and anti-noise ability. Therefore, this method can be used for the inversion of gravity anomalies.
Keywords:
本文引用格式
王蓉, 熊杰, 刘倩, 薛瑞洁.
WANG Rong, XIONG Jie, LIU Qian, XUE Rui-Jie.
0 引言
深度神经网络的本质是通过构建具有许多隐藏层的网络结构来学习更复杂的函数映射关系。深度神经网络相较于传统的人工神经网络来说更为高级,有望解决传统的神经网络依然存在的泛化不足和欠拟合等问题。目前,全连接(FC, fully connected)是地球物理应用中常用的一种深度神经网络体系结构。此方法计算过程简单,学习能力强,泛化能力强,已成功地应用于地球物理反演。Zhang等[11]通过训练FC网络估算地下地震相的分布进行了全波形反演;马国庆等[12]提出通过FC网络实现场源位置反演;梁立锋等[13]提出在混合深度学习反演弹性阻抗基础上,探讨超参数对网络性能的影响,为深度学习地震反演超参数选取提供依据;Wu等[14]使用全卷积残差网络(FCRN)进行声阻抗反演,并通过转移学习方法改善了它们的实验结果;Hu等[5]采用深度学习的方法对磁数据进行反演。此外,基于深度学习的方法还可以开发用于地震检测和定位,故障检测,天油气藏预测以及波形分类和识别等方面[15⇓⇓⇓-19]。深度神经网络在上述领域得到了初步的应用,并为重力反演领域提供了新的思路[20⇓-22]。
因此,本文提出基于全连接神经网络的重力异常反演方法。该方法将重力异常作为数据集,利用深度全连接网络来预测地下二维密度模型。
1 方法原理
1.1 全连接网络
全连接网络的一般体系结构分为3种类型:输入层、隐藏层和输出层。输入层和输出层中的节点数分别由输入数据的大小和标签数决定,一个简单的三层全连接网络结构如下图1所示。
图1
图1是一个简单的三层全连接网络示意,全连接的含义是每一个节点会接受上一层所有节点的输出。网络的正向传播可以看作是从输入到输出的数据转换过程。在简单的三层深度全连接网络中,隐层又称为全连接层,隐层中每一个神经元都与前一层的所有神经元连接。一个隐层与其前一层之间的神经元权值的关系可表达为:
式中:x代表输入;y是输出;f是非线性激活函数;w是权重;b表示偏差值。
深度全连接网络结构擅于提取数据集中有用的信息,将输入数据转换为预期的输出。因此,为了达到学习的目的,并使网络的输出与实际值之间的误差最小,在学习过程中采用了反向传播算法。反向传播算法是训练中常用的算法,它使用损失函数来计算神经网络的梯度。均方误差(MSE)是深度全连接网络中常用的损失函数,可以定义为:
式中:y代表网络的输出;y'代表真实值;N表示样本数量。
深度全连接网络训练是一个不断优化的过程,因此,我们需要找到网络中权重和偏差的最佳参数值。权重和偏差的更新过程可以表示为:
式中:w和w'是在进入网络前后的权重;b和b'是网络迭代更新前后的偏差;η是学习速率,或称为步长,它用来控制网络的学习进度。通常,当学习率太低或是太高,网络训练都不会收敛,因此,需要找到最佳的学习率。参数更新过程完成之后,当达到最大迭代次数或训练出错时,可以停止网络训练。
1.2 基于深度全连接网络的重力异常反演
基于深度全连接网络的反演方法是一种非线性的地球物理反演方法,它的核心思想是用深度全连接网络建立从输入(地表观测数据)到输出(地下介质模型)之间的映射关系[5]。地球物理反演问题是以正演计算为基础,已知从密度模型m到重力异常d的映射关系可以表示为矩阵方程,如式(4)所示:
式中:d=(d1,d2,…,dM)T;m=(m1,m2,…,mN)T; M和N分别是观测点数量和网格单元的数量;G是M×N维核矩阵。
与传统方法不同,基于深度全连接网络的重力异常反演通过求解以下优化问题来实现[5]:
其中:Θ表示网络中需要更新的权重和偏差;Net(·)深度全连接网络表示从观测数据d到预测密度模型mpred之间的映射;L是MSE损失函数。上式的意义在于优化Θ,使得预测密度模型mpred(Net(d, Θ))和真实密度模型m之间的误差最小。
基于深度全连接网络的重力异常反演的示意图(图2)所示,首先,设计大量不同密度分布的模型样本,通过正演得到其对应的重力异常,构成训练数据集;然后利用该训练数据集训练深度全连接网络;最后,通过将重力异常输入到训练好的深度全连接网络,直接得到反演结果(地下介质密度模型)。
图2
图2
基于深度全连接网络的重力异常反演示意
Fig.2
Schematic diagram of gravity anomaly inversion based on deep fully connected network
通常,基于深度全连接网络的反演,在训练阶段会花费更多的时间,并且,时间开销与样本大小和网络结构有关系,但是一旦训练完毕,反演计算时间就可以基本忽略。
2 网络结构及L2正则化
2.1 深度全连接网络的建立与训练
在本文中, 综合考虑到深度全连接网络的训练速度、网络结构以及重力异常d与密度模型m的关系,通过进行多次尝试并参考我们的训练和反演结果,设计了图3所示的网络结构。该深度全连接网络一共有6个隐藏层,每个隐藏层的神经元数量设置为150,输入层包含101个神经元,输出层包含800个神经元。
图3
2.2 L2正则化
深度全连接网络中存在的一个普遍问题就是容易过拟合,表现为网络模型过于复杂,在训练集上预测误差很小,但在测试集上预测误差较大,泛化能力非常弱。为了防止过度拟合,需要使用L2正则化来改善网络。
L2正则化也称为权重衰减,是用于改善深度神经网络过度拟合的常用方法,L2正则化的本质是在原始损失函数的基础上添加参数,从而限制网络的学习能力。另外,为了使神经网络更全面地学习样本数据,我们将真实观测的异常数据d与预测的异常数据(d'=Gm')之间的损失项添加到原始损失函数中。总之,改进的损失函数表达式如下:
式(6)的第一项是模型恢复程度,第二项是数据拟合程度,第三项为权重衰减正则化,它代表了网络中所有权值的平方和。式中, λ为正则化参数;n是训练集的大小。需要注意的是正则化项不包括偏置值。
3 模型试验与结果分析
3.1 数据集设置
本文设计的观测系统如下:将地下空间划分为800个(20行×40列)矩形单元格,每个单元格大小为25 m×25 m,地面观测点设置为101个,观测点之间的间隔为10 m,设计了3×3(75 m×75 m)、4×4(100 m×100 m)、5×5(125 m×125 m)、3×6(75 m×150 m)、6×3(150 m×75 m)、4×8(100 m×200 m)、8×4(200 m×100 m)一共7个形状规则且单一的模型,如图4所示。考虑到密度到重力异常是线性关系,并且网络很容易学习这种简单的线性关系,因此,在本文中,仅仅为模型样本设置两个不同的密度值(200 kg/m3、300 kg/m3)。通过正演共生成了5 541组数据。
图4
3.2 验证集测试
通常,训练集用于训练深度全连接网络的权重与偏差,而验证集用于验证训练后网络的准确性。在本文中,对于深度全连接网络,一共有5 541组数据样本,前80%作为训练集,后20%作为验证集。深度全连接网络反演训练及预测所需的时间分别为377 s和1.4 s。表1为深度全连接网络的反演参数设置。
表1 深度全连接网络反演参数设置
Table 1
分类 | 参数设置 | 深度全连接网络 |
---|---|---|
数据集 | 训练集 | 4432 |
测试集 | 1109 | |
网络设置 | 学习率 | η=10-4 |
激活函数 | ReLU | |
优化器 | Adam | |
L2正则化 | λ=0.01 | |
训练过程 | Epochs | 50000 |
Batch size | 1000 | |
目标函数 | cost=a×cost1+b×cost2+c×cost3 |
图5
图6
3.3 泛化能力测试
由于训练集和验证集都是从总样本中提取的,所以,训练集的反演结果只能评估网络的质量,而不能评估网络的泛化能力。为了评估该网络的泛化能力,本文设计了多个复杂模型,且该模型对应的重力异常数据都不参与网络训练,并根据不同的密度参数进行了两组实验。其中,实验1采用被学习过的密度参数的异常做反演,密度分别为200、300 kg/m3,实验2采用未被学习的其他密度参数的异常做反演,密度分别为100、500、1000 kg/m3。
图7
图7
6种复杂模型样本的平均反演结果
Fig.7
Average Inversion results of six complex model samples
为了进一步测试本方法的泛化能力,实验2分别对未被学习的密度模型进行反演实验,反演时选取的密度参数分别为100、500、1 000 kg/m3,反演结果如图8所示。
图8
图8
不同密度参数得到的异常数据反演结果
Fig.8
Inversion results of abnormal data obtained with the same density parameters
3.4 抗噪能力分析
图9
图9
加入5 dB的高斯白噪声后的反演结果
Fig.9
Inversion result after adding 5 dB Gaussian white noise
图10
图10
加入10 dB的高斯白噪声后的反演结果
Fig.10
Inversion result after adding 10 dB Gaussian white noise
4 结论
本文提出了基于深度全连接神经网络的重力异常反演方法,该方法首先构造不同形状的二维密度模型,通过正演得到重力异常观测值,组成训练集,然后,用该训练集来训练深度神经网络,最后直接输入重力异常观测值到训练好的深度全连接网络,得到预测的二维密度模型。实验结果表明,该方法可以快速准确反演出异常体的位置和密度,具有较好的泛化能力和抗噪声能力,能用于重力异常反演问题。
深度全连接网络在深度神经网络中属于比较简单的网路,下一步工作将围绕如何设计更深、更复杂的网络结构以改进反演效果,并应用于三维重力反演等方面。
参考文献
Deep learning
[J].DOI:10.1038/nature14539 URL [本文引用: 1]
ImageNet classification with deep convolutional neural networks
[J].
基于卷积神经网络识别重力异常体
[J].
Identification of gravity anomalies based on convolutional neural network
[J].
Inversion of magnetic data using deep neural networks
[J].DOI:10.1016/j.pepi.2021.106653 URL [本文引用: 4]
Inversion and uncertainty estimation of gravity data using simulated annealing: An application over Lake Vostok, East Antarctica
[J].
Inversion of potential field data by genetic algorithms
[J].DOI:10.1046/j.1365-2478.1997.3430267.x URL [本文引用: 1]
2-D Resistivity inversion using the neural network method
[J].DOI:10.1002/cjg2.861 URL [本文引用: 1]
基于粒子群优化算法的感应测井反演
[J].
Induction logging inversion based on particle swarm optimization algorithm
[J].
Ant colony optimisation inversion of surface and borehole magnetic data under lithological constraints
[J].DOI:10.1016/j.jappgeo.2014.11.010 URL [本文引用: 1]
Regularized elastic full-waveform inversion using deep learning
[J].
基于重磁数据梯度比值的深度学习技术实现场源位置反演方法
[J].
Deep learning technology based on the gradient ratio of gravity and magnetic data to realize the field source position inversion method
[J].
超参数对GRU-CNN混合深度学习弹性阻抗反演影响研究
[J].
Study on the influence of hyperparameters on GRU-CNN hybrid deep learning elastic impedance inversion
[J].
Seismic impedance inversion using fully convolutional residual network and transfer learning
[J].DOI:10.1109/LGRS.2019.2960166 URL [本文引用: 1]
多波地震深度学习的油气储层分布预测案例
[J].
A case of oil and gas reservoir distribution prediction based on multi-wave seismic deep learning
[J].
基于深度学习算法不同数据集的地震反演实验
[J].
Seismic inversion experiments based on different data sets of deep learning algorithm
[J].
Waveform classification and seismic recognition by convolution neural network
[J].
Current status and application prospect of deep learning in geophysics
[J].
Denoising ambient seismic field correlation functions with convolutional autoencoders
[J].DOI:10.1093/gji/ggz509 URL [本文引用: 1]
基于BP神经网络的重力异常分离
[J].
Gravity anomaly separation based on BP neural network
[J].
基于深度学习的重力异常与重力梯度异常联合反演
[J].
Joint inversion of gravity anomaly and gravity gradient anomaly based on deep learning
[J].
3D gravity inversion based on deep convolution neural networks
[J].
/
〈 |
|
〉 |
