E-mail Alert Rss
 

物探与化探, 2024, 48(4): 1065-1075 doi: 10.11720/wtyht.2024.1380

方法研究·信息处理·仪器研制

基于可伸缩型注意力机制的神经网络地震数据去噪方法

张敏,1,2, 许一卓1,2, 易继东1,2

1.中国石油大学(华东) 地球科学与技术学院,山东 青岛 266580

2.深层油气重点实验室,山东 青岛 266580

A method for seismic data denoising based on the neural network with a retractable attention mechanism

ZHANG Min,1,2, XU Yi-Zhuo1,2, YI Ji-Dong1,2

1. School of Geosciences,China University of Petroleum(East China),Qingdao 266580,China

2. Key Laboratory of Deep Oil and Gas,Qingdao 266580,China

第一作者: 张敏(1983-),女,高级实验师,主要从事地震数据去噪、速度反演和地震波成像方面的研究工作。Email:zhangm@upc.edu.cn

责任编辑: 叶佩

收稿日期: 2023-09-20   修回日期: 2024-03-28  

基金资助: 国家自然科学基金项目(42074133)
中石油重大科技合作项目(ZD2019-183-003)

Received: 2023-09-20   Revised: 2024-03-28  

摘要

地震资料中的随机噪声会影响地震数据的质量,从而影响后续处理与解释的准确性。传统去噪方法受先验条件的约束,效率低下,神经网络具有强大的特征提取能力,能够弥补这些缺点。然而,由于传统神经网络卷积核的局限性,可能会导致全局信息丢失。为了克服这个缺点,本文在卷积神经网络(CNN)的基础上,添加了可伸缩型注意力机制。该机制在网络中同时呈现密集和稀疏两种类型的自注意力模块,这两种注意力模块交替使用可以显著增强神经网络的表现能力,扩大接受场。通过卷积层和注意力模块提取地震数据浅层特征和深层特征,结合CNN的局部建模能力和Transformer的全局建模能力,有利于提升网络的全局交互作用,增强其去除噪声和处理细节的能力。最后,合成和实际地震数据实验结果均表明,该方法相较于Unet和DnCNN,具有更好的噪声压制与保留地震数据有效信息的能力,可以大幅提高信噪比,为地震数据的处理和解释提供帮助。

关键词: 随机噪声; 卷积神经网络; 可伸缩型注意力机制; Transformer

Abstract

Random noise in seismic data impairs the quality of the data,thus affecting the accuracy of subsequent processing and interpretation.Conventional denoising methods,constrained by prior conditions,exhibit low efficiency.Neural networks possess a strong feature extraction ability,which can make up for these shortcomings.However,the limitations of convolution kernels in conventional neural networks may lead to the loss of global information.Hence,this study introduced a retractable attention mechanism to the convolutional neural network (CNN).This mechanism presents both dense and sparse self-attention modules in the CNN.The alternate use of the two self-attention modules can significantly enhance the performance of the CNN and expand the receptive field.The shallow and deep features of seismic data were extracted using the convolutional layer and self-attention modules.Combined with CNN's local modeling ability and Transformer's global modeling ability,they contributed to enhancing CNN's global interaction and ability to reduce noise and deal with details.As indicated by the experimental results of synthetic and field data,the method used in this study can more effectively suppress noise and retain effective information of seismic data compared to Unet and DnCNN,significantly improving the signal-to-noise ratio and thus assisting in the processing and interpretation of seismic data.

Keywords: random noise; convolutional neural network; retractable attention mechanism; Transformer

PDF (8334KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

张敏, 许一卓, 易继东. 基于可伸缩型注意力机制的神经网络地震数据去噪方法[J]. 物探与化探, 2024, 48(4): 1065-1075 doi:10.11720/wtyht.2024.1380

ZHANG Min, XU Yi-Zhuo, YI Ji-Dong. A method for seismic data denoising based on the neural network with a retractable attention mechanism[J]. Geophysical and Geochemical Exploration, 2024, 48(4): 1065-1075 doi:10.11720/wtyht.2024.1380

0 引言

由于环境干扰或人为因素的影响,实际采集到的地震数据不可避免的存在各种噪声,随机噪声作为其中的一种背景噪声广泛存在于地震资料中,较强的随机噪声会给后续地震数据处理与解释造成很大的困难,严重影响反演和偏移成像的精度[1]。在实际生产工作中,地震数据处理通常需要满足“三高”要求,即高信噪比(SNR)、高分辨率和高保真度。因此,有效地去除随机噪声,提高信噪比是地震数据处理重要任务之一。传统地震数据去噪方法是根据地震数据的信号和噪声特性来去除噪声,主要包括基于稀疏变换的方法,如Wavelet变换[2-3]、Curvelet变换[4-5]、Radon变换[6]等;基于预测滤波的方法,如中值滤波[7-8]f-x反褶积[9]等;基于波动方程的方法[10]和基于矩阵降秩的方法[11-12]。但由于传统方法往往存在需要满足某些假设,受到先验条件的约束,并需要人工调节超参数,导致该方式效率低下,自动化程度低。因此,目前亟需一种科学且高效的去噪方法来满足地震勘探高精度要求。

为了解决这些问题,基于深度学习的去噪方法受到了越来越多的关注,并在地震去噪领域得到了广泛应用[13-15]。随机噪声,由于其随机性,不具有任何稳定的统计特性,不与地震数据中的任何真实信息相关联,因此网络可以学会识别并预测它。深度学习通过神经网络从训练集中学习含噪数据与干净数据之间的关系,能够有效地区分地震数据的有效信号和随机噪声,从而实现地震数据噪声衰减。与传统方法相比,这种方法无需花费大量时间进行参数调整,可以在较短的时间内完成去噪处理。其中卷积神经网络(CNN)是目前备受关注的神经网络之一,其能够学习到地震数据中的各个层次结构[16-17]。在浅层,它们可以学习到地震数据简单的纹理结构。而在深层,网络可以学习到地震数据更复杂的结构特征。随机噪声往往没有这种层次结构,因此在训练中通常被视为不相关的扰动,因此这种层次结构使得网络可以区分地震数据中的有效信息和随机噪声。Si等[18]使用去噪卷积神经网络(DnCNN)成功压制了地震数据中的随机噪声,去噪效果优于传统方法。王钰清等[19]使用数据增广的方法,利用CNN网络对地震数据随机噪声进行衰减。罗仁泽等[20]在Unet的基础上引入残差块,增强了网络的泛化能力,在去除随机噪声的同时保护了有效信号。尽管大多数基于CNN的方法在地震数据噪声压制方面已经取得了不错的效果,但研究发现CNN的卷积层存在几个问题[21-23]。如传统神经网络的卷积核与地震数据内容无关,卷积核仅能探测到与其卷积的局部邻域内的特征,只能捕捉局部依赖关系,而对于地震数据中的全局特征,需要堆叠多个卷积层或使用全连接层。当进行长期依赖型建模时,可能会造成全局信息丢失,严重影响后续地震数据的恢复。

为了克服这个缺点,有学者提出了一种以Transformer为新骨干的网络,称为Swin Transformer,目前已经在越来越多的计算机视觉任务中,如图像分割、目标检测、图像恢复等领域都取得了不错的效果,性能效率甚至超越了CNN[24-27]。Transformer通过自注意力机制可以更好地捕捉数据中的关系和依赖,不仅能够对不同长度的输入数据进行处理,还能对数据中的所有位置进行建模,有助于提高网络的准确性、灵活性和全局建模能力。本文尝试将Swin Transformer作为主骨干网络,并进一步结合CNN的特性,构成Swin Transformer去噪卷积神经网络(STCNN)对地震数据噪声进行压制。本研究的创新性主要体现在引入了一种可伸缩型注意力机制,该机制结合了密集注意力模块(DAB)和稀疏注意力模块(SAB)。在地震数据处理中,DAB模块采用非重叠局部窗口来学习地震数据的局部特征,而SAB模块则使用稀疏网格捕获更全局的信息并强调网络表示的稀疏性。随机噪声由于其随机性通常不是重要特征,因此在稀疏表示中往往被忽略,所以稀疏性表示有助于网络学习到最重要的特征来重建地震数据。这两种注意力模块在STCNN中交替使用,构成了一种可伸缩型注意力机制。使得网络能够更精准地学习地震数据的复杂依赖关系,有助于增强网络获取地震数据局部信息与全局信息的能力,进一步提升网络的去噪性能和保护地震有效信号的能力。最后通过合成数据和实际地震数据实验,与Unet和DnCNN两种传统神经网络的结果进行对比,验证了本文所使用的STCNN方法的有效性。

1 方法原理

1.1 深度学习噪声压制模型

通常采集到的地震数据包含两个部分,有效信息和噪声,表达式为:

I=I+v,

式中:I表示采集到的地震数据,I表示所需的无噪地震数据,v表示噪声数据。深度学习去噪的目的是从含噪地震数据中减去得到的噪声分布v,以获得近似于无噪的地震数据I。噪声分布v由网络训练出来的预测模型得到。

在噪声未知的情况下,通过STCNN建立II的关系,公式为:

I=NetSTCNN(I;ψ),

式中:NetSTCNN表示神经网络STCNN,ψ=(a,b)表示矩阵的权重a和偏差b

1.2 网络结构设计

STCNN结合了CNN与Transformer并引入残差网络,网络模型整体架构如图1所示。为了提高训练精度,防止过拟合,STCNN利用残差连接构建深度特征提取模块。对于输入的含噪地震数据I,首先利用3×3卷积层获得浅层特征F0,并对得到的浅层特征进行归一化后进入由Swin Transformer组成的自注意力模块残差组中,提取地震数据的深度特征。再通过一个3×3卷积得到新的特征F1,对得到的这些特征逐个求和后得到最终特征映射FI=F0+F1。最后利用重建模块从特征映射FI中恢复生成高质量的去噪地震数据I

图1

图1   STCNN网络模型

Fig.1   STCNN network model


1.3 残差组

为了更好地提取地震数据的深层特征,网络采用NB个连续残差组,其中每个残差组由NA对自注意力模块,自注意力模块由DAB与SAB组成,两者成对存在并连续。默认设置NB为17,NA为2。

DAB和SAB的内部结构如图2所示,F0归一化后得到特征xl-1进入自注意力模块,首先通过归一化层(LN)和多头自注意力(MSA)得到x^l,再进入多层感知机(MLP)得到xl。这一过程的公式如下所示:

x^l=MSA[LN(xl-1)]+xl-1,
xl=MLP[LN(x^l)]+x^l

图2

图2   残差组

Fig.2   Residual group


由自注意力模块得到的xl,最后经过3×3卷积层与残差链接获得残差组的最终输出,此处残差链接的作用是提高训练精度,防止过拟合。

地震数据的深度特征提取主要集中在多头自注意力机制(MSA)中。此时MSA的计算公式为:

MSA(m)=Softmax(QKTC)V,

式中:QKV分别为来自地震信号输入mIN×C的query(查询向量)、key(键向量)和value(值向量),N为地震信号长度,C为维度。Softmax为归一化指数函数,作用是将结果转化为非负数,并使得结果概率之和为1。

为了对比MSA改进前后的计算复杂度,假设输入的地震数据尺寸大小为H×D,将地震数据切割成步长为P的小块,建立新的特征投影XIh×w×C,其中h=Hp,w=DP。MSA提取特征信息计算公式为:

Ω(MSA)=4hwC2+2(hw)2C

图3a所示,DAB中的密集注意力(D-MSA)是将每个特征与非重叠邻近窗口的特征信息进行交互计算,每个窗口尺寸为W×W,共进行hW×wW次自注意力计算,D-MSA计算复杂度为:

Ω(D-MSA)=4hwC2+2W2hwC

图3

图3   密集注意力(D-MSA)与稀疏自注意力(S-MSA)

a—密集注意力;b—稀疏注意力

Fig.3   Dense attention and sparse attention

a—dense attention;b—sparse attention


图3b所示,SAB中的稀疏注意力(S-MSA)就是使每个特征与特征间隔为K的稀疏区域内的特征信息进行交互计算,每组有hK×wK个特征信息,共进行K×K次自注意力计算,S-MSA计算复杂度为:

Ω(S-MSA)=4hwC2+2hKwKhwC,

由于W2hwhK×wKhw,所以本文选用的D-MSA和S-MSA具有更低的计算复杂度,节约计算成本。

假设图3为截取的地震数据,总共被分成4块,每块中的特征信息之间可以交互计算,DAB利用固定的非重叠局部窗口获取地震数据密集区域的特征信息,SAB则以稀疏网格的形式学习较远区域的特征信息,具有更强的补充全局信息的能力。为了更好提取地震数据的深度特征,通过交替使用DAB和SAB,构建成可伸缩型注意力机制,这样既可以学习到局部密集区域的特征从而获取地震数据的局部信息,也可以学习到全局稀疏区域的特征从而获取地震数据的全局信息,扩大了接受场,增强了网络处理细节和保护有效信息的能力。

1.4 重建模块

重建模块就是直接使用3×3卷积层,将输出的图像恢复成输入地震数据的尺寸大小。此外,还需要使用残差链接,将原始地震数据特征也添加到重建模块中,以获得更多的地震有效信息,减少误差,从而生成高质量去噪后的地震数据I^。整个过程公式为:

I^=Conv(FI)+I

损失函数是衡量模型预测与真实值之间差异的量度,为了得到更好的去噪效果,本文选择使用Charbonnier损失函数L,该损失函数最大的优点就是对异常值不敏感,防止误差过大,提高训练效率。L值越小说明模型的预测越接近于真实数据,这通常意味着去噪效果更好。

L=I^-I2+ε2,

式中:I^为去噪后的地震数据,I为原始地震数据,ε为超参数(一般设置为10-3)

2 数据实验与分析

2.1 实验设置

为了测试STCNN方法对随机噪声的压制效果,本文使用合成地震数据和实际地震数据进行训练、验证和测试并与传统神经网络DnCNN和Unet进行对比。所有实验均在Pytorch环境中进行,使用电脑配置CPU为Intel (R) Core (TM) i5-7500 CPU,主频为3.40 GHz,GPU为NVIDIA GeForce GTX 3060 Ti,内存为64 GB。

在合成地震数据实验中,通过正演得到共100炮,每炮有601道和3 001个采样点的合成地震数据。将合成地震数据切成64×64的小块,并对其中50%的数据进行180°旋转,新增旋转后的数据加入到数据集中,从而得到标签数据集。对数据集旋转可以扩充数据集和增加数据集的多样性,有助于提高网络训练效果,降低过拟合。对标签数据集添加不同等级信噪比的随机高斯噪声,目的是提升模型的泛化能力,针对不同等级的噪声都有很好的去噪能力,从而获取特征数据集。经过以上预处理总共得到了包含标签数据集与特征数据集在内的20 000个合成地震数据集,如图4所示。最后,对合成地震数据集进行归一化处理,并将其分配成比例为80%、10%、10%的训练集、验证集和测试集。损失函数选用Charbonnier损失函数,目的是检验模型预测的噪声与数据集添加的噪声之间的差别,评估预测值是否达到稳定,此损失函数最主要的特点就是对异常值不敏感,避免过于放大误差。优化器选用Adan,此优化器结合了自适应优化器、Nesterov冲量以及解耦的权重衰减策略的优点,可以承受更大的学习率和bach size,加快收敛,提高训练效率,此处batch size设置为16。初始学习率设置为0.000 1,共训练50个epochs。

图4

图4   合成地震数据的部分训练样本

Fig.4   Partial training samples of synthetic seismic data


在实际地震数据实验中,选取经过处理过的实际地震数据作为标签数据集,同样对标签数据集添加不同等级信噪比的随机噪声作为特征数据集,两者共同组成实际地震数据训练样本集。因实际地震数据训练样本非常少,所以需要对其进行数据增广,采用镜像、旋转的方式扩充训练样本集,最终生成5 000个大小为64×64的实际地震数据训练样本集,如图5所示。选取同一区域未经处理的另一部分实际数据作为测试数据,该数据大小为128道,每道512个采样点,采样间隔为4 ms。此阶段为实际地震数据的优化训练阶段,使用了基于合成地震数据训练得到的模型,在其基础上进一步优化,形成针对特定实际地震数据进行随机噪声压制的网络模型,主要起引导优化作用。

图5

图5   实际地震数据的部分训练样本

Fig.5   Partial training samples of real seismic data


本文综合以往专家学者评价指标,选用峰值信噪比(peak signal to noise ratio,PSNR)和结构相似性(structural similarity,SSIM)作为评价网络训练结果的好坏。分别如下式所示:

MSE=i=1n(I-I)2n,
PSNR=10·lg(I2maxMSE),
SSIM=(2μμ^+c1)(2σ^+c2)(μ2+μ^2+c1)(σ2+σ^2+c2),

式中:MSE表示输入数据与去完噪后地震数据之间的均方误差,I表示输入数据,I^表示去噪后的数据,n表示数据总数,Imax表示输入数据中最大值,PSNR越大,说明去噪后得到的地震数据峰值信噪比越高,残留的噪声也就越多,效果就越差;μI表示输入数据的均值,μ^表示去噪后数据的均值,σ2表示输入数据的方差,σ^2表示去噪后数据的方差,σ^表示输入数据与去噪后数据之间的协方差,因为分母不能为0,所以c1c2是选取大于0常数。SSIM[0,1],SSIM越接近1,说明去噪后的地震数据与输入数据相似度越高,去噪效果就越好。

2.2 实验结果及分析

2.2.1 合成地震数据测试

图6a是干净的合成地震数据,对合成地震数据添加不同等级的随机高斯白噪后,选取噪声等级为20%的地震数据展示,其峰值信噪比为12.57 dB,如图6b所示,能够看出红色矩形区域内地震信号被噪声严重破坏。

图6

图6   合成的地震数据(a)及含噪地震数据(b)

Fig.6   Synthetic seismic data(a) and noisy seismic data(b)


DnCNN、Unet和STCNN对含噪地震数据的去噪效果如图7所示,可以看出3种方法都去除了大部分的随机噪声,但图7a中DnCNN的去噪结果在红色矩形处出现了明显的同相轴中断现象,地震信号受到了破坏,而图7d的Unet和图7g的STCNN在同相轴连续性方面优于DnCNN。从差值剖面图可以明显发现,图7e的Unet和图7b的DnCNN存在明显的有效信息损失情况,而图7h的STCNN的有效信息损失相对较少。利用局部相似图也可以获得同样的结论,局部相似图是指通过显示去噪结果与去除掉噪声之间局部相似性来评估各个方法在去噪过程中出现的有效信息损失情况。对比图7cfi,STCNN的相似图明显浅于DnCNN和Unet,说明相对而言STCNN对地震资料的有效信息破坏最小。经计算,图7c的DnCNN的SSIM为0.901 5,图7f的Unet的SSIM为0.928 6,图7i的STCNN的SSIM为0.9474低于DnCNN和Unet,从数值上可以证明STCNN在保留有效信息方面强于DnCNN和Unet。对比3种方法去噪后的PSNR,Unet与DnCNN去噪后的PSNR分别为29.62 dB和28.31 dB,而STCNN去噪后的PSNR为31.12 dB略高于Unet和DnCNN,说明STCNN相比较而言拥有更强的噪声压制能力。综合比较,无论是噪声压制,恢复地震信号还是对有效信息的保护,STCNN都有较为不错的表现,去噪性能优于Unet和DnCNN。

图7

图7   3种去噪方法在合成地震数据中的测试结果

a—DnCNN去噪结果;b—DnCNN去除的噪声;c—a和b的局部相似图;d—Unet去噪结果;e—Unet去除的噪声;f—d和e的局部相似图;g—STCNN去噪结果;h—STCNN去除的噪声;i—g和h的局部相似图

Fig.7   Results of three denoising methods in synthetic seismic data

a—DnCNN denoising result;b—noise data removed by DnCNN;c—similarity map between panels fig.a and fig.b;d—Unet denoising result;e—noise data removed by Unet;f—similarity map between panels fig.d and fig.e;g—STCNN denoising result;h—noise data removed by STCNN;i—similarity map between panels fig.g and fig.h


为了更直观、清晰地比较3种方法的去噪效果,本文将去噪结果转换成f-k域进行分析。如图8cd所示,DnCNN和Unet的f-k谱在高频低波数处都有一定的有效信息损失。而图8e所示的STCNN方法则基本上恢复了地震信号,没有明显的噪声残留和有效信息损失,与干净地震信号f-k谱差别最小。

图8

图8   3种去噪方法在合成地震数据测试中的f-k谱对比

a—干净地震数据的f-k谱;b—含噪地震数据的f-k谱;c—DnCNN去噪结果的f-k谱;d—Unet去噪结果的f-k谱;e—STCNN去噪结果的f-k谱;f—DnCNN去除噪声的f-k谱;g—Unet去除噪声的f-k谱;h—STCNN去除噪声的f-k

Fig.8   Comparison of the f-k spectrum of three denoising results in synthetic seismic data testing

a—f-k spectra of clean seismic data;b—f-k spectra of noisy seismic data;c—f-k spectra of DnCNN denoising result;d—f-k spectra of Unet denoising result;e—f-k spectra of STCNN denoising result;f—f-k spectra of noise data removed by DnCNN;g—f-k spectra of noise data removed by Unet;h—f-k spectra of f-k spectra of noise data removed by STCNN


对比图8fgh,利用STCNN方法去除噪声的f-k谱中有效信息部分要少于DnCNN和Unet,再次证明了STCNN在去除随机噪声、保证有效信息和处理细节方面,达到了一种平衡,整体去噪性能略优于DnCNN和Unet。

对合成地震数据添加不同等级的噪声进行测试,对比其去噪后的性能指标,如表1所示。当原始地震数据PSNR为12.57 dB和18.45 dB时,3种方法都表现出了一定的去噪效果,STCNN的PSNR为31.12 dB和35.15 dB分别高于DnCNN的28.31 dB、32.91 dB和Unet的29.62 dB、34.73 dB,说明STCNN比DnCNN和Unet具有更强的噪声的压制能力。STCNN的SSIM数值为0.947 4和0.990 1也高于DnCNN的0.901 5、0.971 2和Unet的0.928 6、0.983 7,说明STCNN在保护有效信息方面也要优于DnCNN和Unet。在面对低信噪比PSNR为5.36 dB时,STCNN去噪后的19.54 dB也高于DnCNN的13.64 dB和Unet的14.12 dB,仍然具有高于DnCNN和Unet的去噪性能。

表1   不同噪声水平下的去噪效果性能指标对比

Table 1  Comparison of denoising effect indexes at different noise levels

加入噪声水平去噪算法去噪后PSNR/dB去噪后SSIM
σ= 10%
PSNR:18.45
DnCNN
Unet
STCNN
32.91
34.73
35.15
0.9712
0.9837
0.9901
σ= 20%
PSNR:12.57
DnCNN
Unet
STCNN
28.31
29.62
31.12
0.9015
0.9286
0.9474
σ= 50%
PSNR:5.36
DnCNN
Unet
STCNN
13.64
14.12
19.54
0.6845
0.6926
0.7687

新窗口打开| 下载CSV


综合上述所有对比情况得出结论,STCNN在对合成地震数据噪声压制方面和处理细节方面都优于其他方法,对于不同等级的随机噪声也都有较好的压制效果。综合来看,STCNN比DnCNN和Unet更有利于后续的地震数据处理。

下面对3种去噪方法的损失函数曲线进行对比分析,如图9所示。STCNN损失函数的收敛速度以及收敛结果都要优于DnCNN和Unet,可以更快地达到相对稳定的收敛状态。

图9

图9   3种网络的损失函数曲线

Fig.9   Loss function curves of the three networks


为了评估不同去噪方法的训练效率,在相同的软硬件环境下,3种去噪方法训练50个epoch所需要的时间对比如表2所示。STCNN的训练时间比DnCNN多了约1.42 h,但仍低于Unet的训练时间。这是因为相较于DnCNN,STCNN结合了残差网络与可伸缩型注意力机制,模型的设计相对复杂,计算复杂度明显高于只有17层DnCNN,所以花费了更多的计算时间,这是后续STCNN需要改进的地方。

表2   3种去噪方法的运行时间对比

Table 2  Comparison of the running time of the three methods

去噪方法DnCNNUnetSTCNN
训练时间/h1.453.362.87

新窗口打开| 下载CSV


2.2.2 实际地震数据测试

为了进一步对比3种方法的去噪性能,对实际地震数据进行测试,该数据为128道,每道512个采样点,采样间隔为4 ms,各个算法去噪结果如图10所示。图10a为实际地震数据,同相轴被噪声严重干扰。图10b图10c分别为DnCNN的去噪结果和去除的噪声,图10e图10f分别为Unet的去噪结果和去除的噪声,图10h图10i分别为STCNN的去噪结果和去除的噪声。图10dgj为相应的局部相似图。从图10中可以明显发现,STCNN有效地去除了噪声,且相比较而言局部相似图最浅,说明对有效信息的破坏最小。虽然Unet和DnCNN也去除了大部分噪声,但相对而言有效信息损失较为严重。从图10方框处对比分析,STCNN比DnCNN保留了更多的地震信号局部细节,STCNN的同相轴局部信息要比DnCNN更多、更精准,构造特征更明显。所以综合比较,STCNN在噪声压制和处理细节方面效果最优,拥有更好的去噪性能,更符合地震数据处理的要求。

图10

图10   实际地震数据去噪结果

a—真实地震数据;b—DnCNN去噪结果;c—DnCNN去除的噪声;d—b和c的局部相似图;e—Unet去噪结果;f—Unet去除的噪声;g—e和f的局部相似图;h—STCNN去噪结果;i—STCNN去除的噪声;j—h和i的局部相似图

Fig.10   Field seismic signal denoising results

a—field seismic data;b—DnCNN denoising result;c—noise data removed by DnCNN;d—similarity map between panels fig.b and fig.c;e—Unet denoising result;f—noise data removed by Unet;g—similarity map between panels fig.e and fig.f;h—STCNN denoising result;i—noise data removed by STCNN;j—similarity map between panels fig.h and fig.i


3 结论

本文结合了残差网络和可伸缩型注意力机制,构建了一种高效的地震数据去噪网络,即STCNN去噪网络。该网络引入的可伸缩型注意力机制通过交替使用密集注意力模块和稀疏注意力模块,使得网络可以有效地进行全局信息的建模和提取。其通过使用卷积层和残差组分别提取地震数据浅层与深层特征,可以进一步加强模型的全局交互能力,提高去噪的效率和准确性。最后通过大量的数据训练,得到输入与输出数据之间的隐式映射关系,使模型可以直接对相似的地震数据进行去噪。

经过合成地震数据与实际地震数据测试,证明了STCNN相较于DnCNN和Unet在地震数据去噪方面表现更优秀,去噪后的结果拥有更高的峰值信噪比和结构相似性,保留了更多地震数据的细节特征,在有效去除噪声的同时也减少了对地震资料有效信息的破坏,实现了两者之间的均衡。但STCNN也存在着一些不足之处,由于实际地震数据噪声分布复杂且种类多样,面对复杂的实际地震数据,STCNN的去噪效果会受到一定的影响,还有待进一步提高。因此在下一步工作中,需要针对不同噪声进行训练,增强训练集的多样性与复杂性,提高网络的泛化性与智能去噪的能力。

参考文献

Li J, Wu X, Hu Z.

Deep learning for simultaneous seismic image super-resolution and denoising

[J]. IEEE Transactions on Geoscience and Remote Sensing, 2022, 60(1):1-11.

[本文引用: 1]

曹静杰, 杨志权, 杨勇, .

一种基于曲波变换的自适应地震随机噪声消除方法

[J]. 石油物探, 2018, 57(1):72-78.

DOI:10.3969/j.issn.1000-1441.2018.01.010      [本文引用: 1]

基于稀疏反演的随机噪声消除方法需要估计一个与噪声能量相匹配的阈值才能获得可靠的去噪结果。由于不同数据的噪声能量不同,因此通常采用人工调节的方法获得合理的阈值估计,这会耗费大量的计算资源和人力成本。为此提出一种自适应的随机噪声消除方法,以曲波变换为稀疏变换,通过迭代过程中解的稀疏性与拟合误差之间的内在关系确定合适的阈值,并且自动终止迭代,因而不依赖于对噪声能量的估计就能实现对噪声的消除。利用理论模型数据及两个地区实际地震数据验证了方法的有效性。

Cao J J, Yang Z Q, Yang Y, et al.

An adaptive seismic random noise elimination method based on Curvelet transform

[J]. Geophysical Prospecting for Petroleum, 2018, 57(1):72-78.

DOI:10.3969/j.issn.1000-1441.2018.01.010      [本文引用: 1]

The conventional sparse inversion-based random noise elimination utilizes a thresholding operation to conduct denoising,on the basis that seismic signals are sparsely expressed in a transform domain.This would produce effective denoising when threshold values match noise energy.However,owing to variety in the noise energy of different data,the reasonable threshold is usually obtained by manual adjustment,which is time- and labor-consuming.This paper proposes an adaptive random noise elimination method that does not rely on noise energy estimation.The method uses a Curvelet transform as the sparse transform and chooses a proper threshold value through the inner relationship between solution sparsity and fitting error,thus terminating the iteration automatically.Testing on both synthetic data and field data demonstrate that the proposed method can eliminate random noise while preserving effective signal.

吴招才, 刘天佑.

地震数据去噪中的小波方法

[J]. 地球物理学进展, 2008, 23(2):493-499.

[本文引用: 1]

Wu Z C, Liu T Y.

Wavelet method in seismic data attenuation

[J]. Progress in Geophysics, 2008, 23(2):493-499.

[本文引用: 1]

张恒磊, 张云翠, 宋双, .

基于Curvelet域的叠前地震资料去噪方法

[J]. 石油地球物理勘探, 2008, 43(5):508-513.

[本文引用: 1]

Zhang H L, Zhang Y C, Song S, et al.

Curvelet domain-based prestack seismic data denoise method

[J]. Oil Geophysical Prospecting, 2008, 43(5):508-513.

[本文引用: 1]

孙苗苗, 李振春, 曲英铭, .

基于曲波域稀疏约束的OVT域地震数据去噪方法研究

[J]. 石油物探, 2019, 58(2):208-218.

DOI:10.3969/j.issn.1000-1441.2019.02.006      [本文引用: 1]

炮检距向量片(offset vector tile,OVT)道集中噪声与有效信号的差异小,深层的弱有效信号同相轴连续性差,传统去噪方法在抑制噪声的同时会对弱有效信号造成较大损伤。为解决这一问题,在OVT道集中引入了基于压缩感知(compressed sensing,CS)理论的曲波域稀疏约束地震数据去噪方法,该方法基于曲波变换的多方向性和各向异性对地震数据进行稀疏描述,利用与噪声相关的信息约束正交匹配追踪(orthogonal matching pursuit,OMP)重构算法的迭代过程,实现对弱有效信号的提取。模型测试和实际资料处理结果表明:小波阈值去噪方法在抑制噪声的同时会损伤与噪声差异小的弱有效信号,对同相轴的连续性改善不明显,造成深层弱有效信号的同相轴连续性差;CS小波去噪方法可一定程度保护弱有效信息,但由于无法精确表达直线或曲线等边缘特征,分离与噪声差异小的深层弱信号及噪声时效果不理想;基于CS理论的曲波域稀疏约束地震数据去噪方法克服了OMP重构算法对信号稀疏度的依赖,有效提取了OVT域地震数据的中、深反射层的弱有效信号,在压制强随机噪声的同时减少了弱有效信号的损失,提高了地震剖面的信噪比和同相轴的连续性。 

Sun M M, Li Z C, Qu Y M, et al.

A seismic denoising method based on Curvelet transform with constraint in OVT domain

[J]. Geophysical Prospecting for Petroleum, 2019, 58(2):208-218.

[本文引用: 1]

薛昭, 董良国, 单联瑜.

Radon变换去噪方法的保幅性理论分析

[J]. 石油地球物理勘探, 2012, 47(6):858-867.

[本文引用: 1]

Xue Z, Dong L G, Shang L Y.

Amplitude preservation theoretical analysis of Radon transforms denoising method

[J]. Oil Geophysical Prospecting, 2012, 47(6):858-867.

[本文引用: 1]

Liu C, Liu Y, Yang B J, et al.

A 2D multistage median filter to reduce random seismic noise

[J]. Geophysics, 2006, 71(5):V105-V110.

[本文引用: 1]

国胧予, 刘财, 刘洋, .

基于f-x域流式预测滤波器的地震随机噪声衰减方法

[J]. 地球物理学报, 2020, 63(1):329-338.

DOI:10.6038/cjg2020N0030      [本文引用: 1]

随机噪声的影响在地震勘探中是不可避免的,常规的随机噪声压制方法在处理中往往会破坏具有时空变化特征的非平稳有效地震信号,影响地震数据的准确成像.当前油气勘探的目标已经转变为"两宽一高",随着数据量的增大,对去噪方法的处理效率也提出了更高的要求.因此,开发高效的非平稳地震数据随机噪声压制方法具有重要意义.预测滤波技术广泛用于地震随机噪声的衰减,本文基于流式处理框架提出一种新的f-x域流式预测滤波方法,通过在频率域建立预测自回归方程,运用直接复数矩阵逆运算代替迭代算法求解非平稳滤波器系数,实现时空变地震同相轴预测,提高自适应预测滤波的计算效率.通过与工业标准的FXDECON方法和f-x域正则化非平稳自回归(RNA)方法进行对比,理论模型和实际数据的测试结果表明,提出的f-x域流式预测滤波方法能更好地平衡时空变有效信号保护、随机噪声压制和高效计算三者之间的关系,获得合理的处理效果.

Guo L Y, Liu C, Liu Y, et al.

Seismic random noise attenuation based on streaming prediction filter in the f-x domain

[J]. Chinese Journal of Geophysics, 2020, 63(1):329-338.

[本文引用: 1]

Naghizadeh M, Sacchi M.

Multicomponent f-x seismic random noise attenuation via vector autoregressive operators

[J]. Geophysics, 2012, 77(2):V91-V99.

[本文引用: 1]

Witten B, Shragge J.

Extended wave-equation imaging conditions for passive seismic data

[J]. Geophysics, 2015, 80(6):WC61-WC72.

[本文引用: 1]

张良, 韩立国, 方金伟, .

双稀疏字典和FISTA的地震数据去噪

[J]. 地球物理学报, 2019, 62(7):2071-2683.

[本文引用: 1]

Zhang L, Han L G, Fang J W, et al.

Seismic data denoising via double sparsity dictionary and fast iterative shrinkage-thresholding algorithm

[J]. Chinese Journal of Geophysics, 2019, 62(7):2071-2683.

[本文引用: 1]

唐杰, 孟涛, 张文征, .

利用基于深度学习的过完备字典信号稀疏表示算法压制地震随机噪声

[J]. 石油地球物理勘探, 2020, 55(6):1202-1209,1160.

[本文引用: 1]

Tang J, Meng T, Zhang W Z, et al.

Suppression of seismic random noise with overcomplete dictionary signal sparse representation algorithm based on deep learning

[J]. Oil Geophysical Prospecting, 2020, 55(6):1202-1209,1160.

[本文引用: 1]

宋辉, 高洋, 陈伟, .

基于卷积降噪自编码器的地震数据去噪

[J]. 石油地球物理勘探, 2020, 55(6):1210-1219,1160-1161.

[本文引用: 1]

Song H, Gao Y, Chen W, et al.

Seismic noise suppression based on convolutional denoising autoencoder

[J]. Oil Geophysical Prospecting, 2020, 55(6):1210-1219,1160-1161.

[本文引用: 1]

Wang Y Q, Lu W K, Liu J L, et al.

Random seismic noise attenuation bas ed on data augmentation and CNN

[J]. Chinese Journal of Geophysics, 2019, 62(1):421-433.

[本文引用: 1]

高好天, 孙宁娜, 孙可奕, .

DnCNN和U-Net对地震随机噪声压制的对比分析

[J]. 地球物理学进展, 2021, 36(6):2441-2453.

[本文引用: 1]

Gao H T, Sun N N, Sun K Y, et al.

Comparative analysis of DnCNN and U-Net on suppression of seismic random doise

[J]. The Journal of China Universities of Posts and Telecommunications, 2021, 36(6):2441-2453.

[本文引用: 1]

Wang F, Chen S.

Residual learning of deep convolutional neural network for seismic random noise attenuation

[J]. IEEE Geoscience and Remote Sensing Letters, 2019, 16(8):1314-1318.

[本文引用: 1]

陈天, 易远元.

基于深度卷积神经网络的地震数据随机噪声压制

[J]. 地震学报, 2021, 43(4):474-482,533.

[本文引用: 1]

Chen T, Yi Y Y.

Random noise suppression of seismic data based on deep convolutional neural network

[J]. Acta Seismologica Sinica, 2021, 43(4):474-482,533.

[本文引用: 1]

Si X, Yuan Y, Si T, et al.

Attenuation of Random noise using denoising convolutional neural networks

[J]. Interpretation, 2019, 7(3):SE269-SE280.

[本文引用: 1]

王钰清, 陆文凯, 刘金林, .

基于数据增广和CNN的地震随机噪声压制

[J]. 地球物理学报, 2019, 62(1):421-433.

DOI:10.6038/cjg2019M0385      [本文引用: 1]

卷积神经网络(Convolutional Neural Network,CNN)是一种基于数据驱动的学习算法,简化了传统从特征提取到分类的两阶段式处理任务,被广泛应用于计算机科学的各个领域.在标注数据不足的地震数据去噪领域,CNN的推广应用受到限制.针对这一问题,本文提出了一种基于数据生成和增广的地震数据CNN去噪框架.对于合成数据,本文对无噪地震数据添加不同方差的高斯噪声,增广后构成训练集,实现基于小样本的CNN训练.对于实际地震数据,由于无法获得真实的干净数据和噪声来生成训练样本集,本文提出一种直接从无标签实际有噪数据生成标签数据集的方法.在所提出的方法中,我们利用目前已有的去噪方法从实际地震数据中分别获得估计干净数据和估计噪声,前者与未知的干净数据具有相似纹理,后者与实际噪声具有相似的概率分布.人工合成数据和实际数据实验结果表明,相较于F-X反褶积,BM3D和自适应频域滤波算法,本文方法能更好地压制随机噪声和保护有效信号.最后,本文采用神经网络可视化方法对去噪CNN的机理进行了探索,一定程度上解释了网络每一层的学习内容.

Wang Y Q, Lu W K, Liu J L, et al.

Random seismic noise attention based on data augmentation and CNN

[J]. Chinese Journal of Geophysics, 2019, 62(1):421-433.

[本文引用: 1]

罗仁泽, 李阳阳.

一种基于RUnet卷积神经网络的地震资料随机噪声压制方法

[J]. 石油物探, 2020, 59(1):51-59.

DOI:10.3969/j.issn.1000-1441.2020.01.006      [本文引用: 1]

应用深度学习方法压制地震噪声的训练集和测试集均来自同一数据集,使得模型的泛化性受限。为解决泛化性问题,提出一种基于卷积神经网络(CNN)的残差U型网络(RUnet)压制随机噪声的方法。方法的设计思想是在基于卷积神经网络的U型网络(Unet)基础上加入残差块,以增强网络对随机噪声的捕获能力。该方法建立在端到端的编码解码网络结构上,将含噪声地震数据作为输入,由多个卷积层和残差块提取随机噪声的本质特征,构成编码;再由多个反卷积层和残差块构成解码,网络的输出即为噪声压制后的地震数据。在残差块之后加入批规范化层,采用带泄露整流函数作为非线性因子,提高网络模型对地震资料随机噪声的泛化性和敏感性。在叠后和叠前地震数据实验中将RUnet卷积神经网络方法与小波变换、离散余弦变换、三维块匹配(BM3D)算法和Unet卷积神经网络算法进行去噪效果对比,结果表明,RUnet卷积神经网络方法相比其它4种方法,对随机噪声的压制更有效,并且在一定程度上保护了有效信号。

Luo R Z, Li Y Y.

Random seismic noise attenuation based on RUnet convolutional neural network

[J]. Geophysical Prospecting for Petroleum, 2020, 59(1):51-59.

DOI:10.3969/j.issn.1000-1441.2020.01.006      [本文引用: 1]

The training and test sets used for deep learning methods to suppress seismic noise originate from the same data set,which leads to limited model generalization.This study proposes a random noise suppression method using the RUnet convolutional neural network.The design idea of the method is to add a residual block on the basis of the Unet convolutional neural network to enhance the networks ability to capture random noise.First,based on the code-decode network structure,this method used seismic data containing noise as the input,and extracted the essential features of random noise using multiple convolutional layers and residual blocks to form the coding process.Then,multiple deconvolution layers and residual blocks were used to build the decoding process; the output of the network was noise-suppressed seismic data.A batch normalization layer was added after the residual block and the leakage rectification function was used as the nonlinear factor to improve the generalization and sensitivity of the network model to seismic random noise.Testing using post-and pre-stack data showed that compared with the wavelet transform,discrete cosine transform,BM3D algorithm,and Unet convolutional neural network,the RUnet convolutional neural network was more effective in suppressing random noise and preserving signal.

Yang L, Chen W, Wang H, et al.

Deep learning seismic random noise attenuation via improved residual convolutional neural network

[J]. IEEE Transactions on Geoscience and Remote Sensing, 2021, 59(9):7968-7981.

[本文引用: 1]

杨翠倩, 周亚同, 何昊, .

基于全局上下文和注意力机制深度卷积神经网络的地震数据去噪

[J]. 石油物探, 2021, 60(5):751-762,855.

DOI:10.3969/j.issn.1000-1441.2021.05.006      [本文引用: 1]

在地震数据处理中,随机噪声压制是提高地震数据信噪比的关键。针对目前卷积神经网络大多关注局部特征以及在特征提取方面的局限性,提出了一种结合全局上下文和注意力机制的深度卷积神经网络(global context and attention-based deep convolutional neural network,GC-ADNet),并用残差学习压制地震数据随机噪声的方法。其中,全局上下文模块(global context block,GCBlock)既关注局部信息,又能提取全局上下文信息;注意力模块(Attention Block)不仅强调关键特征,还能高效提取隐藏在复杂背景中的噪声信息。加入残差学习和批量规范化方法加快了网络的训练和收敛速度,使用扩张卷积扩大上下文信息并降低计算成本。将GC-ADNet应用于合成和实际地震数据处理,并与现有的去噪方法进行了比较。实验结果表明,GC-ADNet能够更有效压制随机噪声,并保留更多局部细节信息。

Yang C Q, Zhou Y T, He H, et al.

Global context and attention-based deep convolutional neural network for seismic data denoising

[J]. Geophysical Prospecting for Petroleum, 2021, 60(5):751-762,855.

DOI:10.3969/j.issn.1000-1441.2021.05.006      [本文引用: 1]

The attenuation of random noise is a critical step for improving the signal-to-noise ratio of seismic data during seismic data processing.Existing convolutional neural networks mostly focus on local features and have limited feature extraction capability.In this work,a deep convolutional neural network is proposed that combines global context and attention-based deep convolutional neural network (GC-ADNet).Residual learning is used to suppress the random noise in seismic data.The global context block boosts the denoising performance by not only making the network focus on local information but also extracting global context information.Simultaneously,the attention module is used to highlight key information and efficiently extract the noise from in the complex background.In addition,the residual learning and batch normalization methods are included to speed up the training and convergence,and dilated convolution is used to enlarge the contextual information and reduce the computational cost.The proposed method was tested on both synthetic and actual seismic data.Compared with state-of-the-art denoising methods,the proposed method,and particularly the GC-ADNet,demonstrated superior random noise suppression and local detail retention capabilities.

周文辉, 石敏, 朱登明, .

基于残差注意力网络的地震数据超分辨率方法

[J]. 计算机科学, 2021, 48(8):24-31.

DOI:10.11896/jsjkx.200900034      [本文引用: 1]

地震数据在油气勘探、地质勘探领域发挥着至关重要的作用。精确详细的地震数据有助于对油气勘探做出精确指导,减小勘探的风险,从而产生巨大的社会效益和经济效益。在提升地震数据分辨率方面,现有的方法在面对海量数据时,在高分辨恢复、去噪性能和效率上效果欠佳,难以恢复出细节丰富的地质信息,无法满足实际需求。地震数据能够反映地质构造以及地层的组成,具有局部相关性高、全局相关性低的特点。同时,地震数据高频部分通常蕴含着地质勘探等重要信息,如分层、断层信息等。针对地震数据的特点,文中将地震数据重建问题转化为图像超分辨率问题,提出了采用基于生成对抗网络的地震数据超分辨方法。针对地震数据分布具有局部相关性高、全局相关性低的特点,设计残差注意力模块,挖掘地震数据的内在相关性,通过训练含有相对生成对抗损失函数的生成对抗网络模型,来对地震数据进行超分辨率恢复,以得到更加精确的地震数据。在真实的地震数据集上进行了实验验证,结果表明,所提方法在地震数据超分辨上效果良好,在性能指标PSNR和SSIM上有3%~4%的提升,具有较强的实用性。

Zhou W H, Shi M, Zhu D M, et al.

Seismic data super-resolution method based on residual attention network

[J]. Computer Science, 2021, 48(8):24-31.

[本文引用: 1]

Liu Z, Lin Y T, Cao Y, et al.

Swin transformer:Hierarchical vision transformer using shifted windows

[C]// Montreal:2021 IEEE/CVF International Conference on Computer Vision(ICCV), 2021:9992-10002.

[本文引用: 1]

Cao H, Wang Y Y, Chen J, et al.

Swin-Unet:Unet-like pure transformer for medical image segmentation

[J]. Image and Video Processing, 2021.

[本文引用: 1]

Fan C M, Liu T J, Liu K H.

SUNet:Swin transformer UNet for image denoising

[C]// Austin:2022 IEEE International Symposium on Circuits and Systems(ISCAS), 2022:2333-2337.

[本文引用: 1]

Zhang K, Li Y, Liang J, et al.

Practical blind image denoising via swin-conv-UNet and data synthesis

[J]. Machine Inteligence Research, 2023, 20(6):822-836.

[本文引用: 1]

/

京ICP备05055290号-3
版权所有 © 2021《物探与化探》编辑部
通讯地址:北京市学院路29号航遥中心 邮编:100083
电话:010-62060192;62060193 E-mail:whtbjb@sina.com , whtbjb@163.com