E-mail Alert Rss
 

物探与化探, 2021, 45(6): 1559-1568 doi: 10.11720/wtyht.2021.0292

《重、磁方法理论及应用研究》专栏

基于DCT的广义指数阈值衰减凸集投影算法在位场数据补空中的应用

艾寒冰,, 王彦国,

东华理工大学 地球物理与测控技术学院,江西 南昌 330013

Interpolation of potential-field data by Projection Onto Convex Sets algorithm with generalized exponential threshold and based on Discrete Cosine Transform

AI Han-Bing,, WANG Yan-Guo,

School of Geophysical and Measurement-Control Technology, East China University of Technology,Nanchang 330013, China

通讯作者: 王彦国(1985-),男,博士,副教授,硕士研究生导师,从事勘探重磁学方面的教学与研究工作。Email:wangyg8503@126.com

责任编辑: 王萌

收稿日期: 2021-01-4   修回日期: 2021-05-19  

基金资助: 国家重点研发计划项目“铀矿基地深部成矿条件地球物理探测技术研究”.  2017YFC0602603
江西省自然科学基金项目“基于位场多源型tilt-depth法的场源深度快速自动反演研究”.  20171BAB213030
国家自然科学基金项目“基于位场广义梯度张量的欧拉反褶积方法研究”.  41504098

Received: 2021-01-4   Revised: 2021-05-19  

作者简介 About authors

艾寒冰(1998-),男,在读硕士研究生,主要从事重磁勘探方面的学习与研究工作。Email: 1724178612@qq.com

摘要

数据补空或插值是位场数据处理中一个非常基本且重要的问题,在野外数据测量过程中遇到水域、断崖等情况时无法进行数据采集,导致数据出现缺失情况。为了便于后续数据处理,需要对缺失数据体进行补全。本文将离散余弦变换(DCT)应用到凸集投影(POCS)算法中来补全位场缺失数据,并给出了广义指数阈值衰减方式。模型试验及实例应用表明,基于DCT并结合广义指数阈值衰减形式的POCS算法具有数据补空精度高、补空痕迹小和补空数据噪声含量更接近真实情况等优点。

关键词: 数据补空 ; 离散余弦变换 ; 凸集投影算法 ; 广义指数阈值

Abstract

Data filling or interpolation is a fundamental and vital problem of potential-field data processing. Some data cannot be measured when some places are unable to reach, such as rivers, or cliffs. If we want to acquire the missing data for better subsequent processing, we need to interpolate or fill in the missing data. Hence, this article introduces the Discrete Cosine Transform (DCT) method into the Projection Onto Convex Sets (POCS) algorithm to tackle this problem, and a generalized exponential threshold attenuation method is also given. Finally, model tests and practical applications show that the POCS algorithm with generalized exponential threshold and based on DCT has the advantages of high accuracy, small filling or interpolating traces and the noise standard of the filled data are closer to real situation.

Keywords: data filling or interpolation ; DCT ; POCS ; generalized threshold model

PDF (10546KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

艾寒冰, 王彦国. 基于DCT的广义指数阈值衰减凸集投影算法在位场数据补空中的应用. 物探与化探[J], 2021, 45(6): 1559-1568 doi:10.11720/wtyht.2021.0292

AI Han-Bing, WANG Yan-Guo. Interpolation of potential-field data by Projection Onto Convex Sets algorithm with generalized exponential threshold and based on Discrete Cosine Transform. Geophysical and Geochemical Exploration[J], 2021, 45(6): 1559-1568 doi:10.11720/wtyht.2021.0292

0 引言

在野外重磁数据采集过程中,常会遇到沼泽、河流、水库或断崖等恶劣环境,导致数据无法采集,使得一部分数据空缺,不利于后期数据处理与解释。目前,解决这一问题的主要措施是进行数据网格插值,较为常用的有克里金插值法[1]、最小曲率法[2]、等效源法[3]、线性插值法[4]等,不过这些方法的数据补空精度较低[5]。王万银等[6]引入最小曲率插值方法,给出了其差分迭代格式,并讨论了相关技术措施,验证了该方法精度明显高于常规余弦插值法,但方法受给定初值影响较大;王明等[7]把位场数据插值类比成热流传导的过程,进而提出了基于热传导模型的位场网格数据补空方法,并验证该法比最小曲率法插值效果更优;闫浩飞等[5]采用基于线性阈值衰减的凸集投影算法(POCS)进行位场数据补空,该方法相对常规插值方法具有更高的数据补空精度;曾小牛等进一步将该方法进行推广,提出了基于凸集投影算法的重力数据扩充、下延一体化方法[8]和重力同时填充扩边和去噪方法[9],有效地改善了常规分步骤进行插值、扩边、下延和去噪的问题,获得了良好的处理效果。

本文在凸集投影算法数据补空精度高基础上,结合离散余弦变换(DCT)能量聚集度高及消耗内存小的优点,并在Gao等[10]、张华等[11]在地震数据补空的研究基础上,提出了基于DCT的广义指数阈值衰减POCS算法,用于重磁数据的高质量补空工作。

1 理论基础

凸集投影算法广泛用于图像修复,该方法将所有图像约束表示为希尔伯特空间中的一系列闭合凸集Ci(i=1,2,3,…,m),然后将任意初始值x迭代投影到投影算子H下的所有闭合凸集的交点上。将位于交点边界上的最终投影点作为最优解,其原理如图1所示,POCS迭代过程表达式为:

xk+1=HmHm-1H1xk,k=0,1,,K

图1

图1   POCS算法原理[10]

Fig.1   The mechanism of POCS method[10]


基于DCT的数据补空凸集投影理论公式:

Dk=Dobs+MC-1TkCDk-1,k=1,2,3,,K,

式中:K是总迭代次数;Dobs(x,y)是含缺失数据的原始观测数据;Dk代表第k次迭代补空的数据;CC-1代表二维离散余弦正、反变换;M是采样矩阵,其与输入数据维度相同,如果某点值为0,代表该点有数据,无需插值,反之为1,则代表该点需要进行插值计算;Tk是门限值矩阵,可表示为:

Tk(i,j)=1,|Sk(i,j)|pk0,|Sk(i,j)|<pk

式中:pk是第k次迭代阈值,Sk是第k次的DCT变换谱。

Abma[13]给出的线性阈值衰减形式为:

pk=pkmax-(k-1)(pkmax-pkmin)K-1,

式中: pkmax=max(abs(Sk)), pkmin=min(abs(Sk)),k=1,2,…,K

本文给出的广义指数阈值衰减形式为:

pk=pkmax*exp-k-1K-1Paraln(pkmax/pkmin)

式中:Para为控制衰减速度的参数,当Para=1时为Gao等[10]提出的阈值衰减情况,当Para=0.5时即为张华等[11]提出的阈值衰减形式。

凸集投影算法进行数据补空的基本流程为:对原始输入数据采用DCT处理,给定一个阈值,使得变换谱中振幅大于等于这个阈值时保留,振幅低于这个阈值则充零代替,然后对该数据进行反离散余弦变换乘以采样矩阵,最后将其与原始待补空数据叠加,而在下一次迭代计算时,减小阈值重复上述操作,直到达到结束迭代计算的条件。本算法需要实现对不规则数据网格化,以满足DCT变换的需要,算法的关键在于选择合适的稀疏变换和阈值衰减方式,其工作流程图见图2

图2

图2   基于DCT的POCS数据补空流程

Fig.2   The flow-process diagram of POCS method to interpolate based on DCT


2 模型试验

为了验证指数阈值衰减凸集投影算法在位场中的应用效果及优越性,建立了一个由参数不同的4个模型体产生的叠加重力异常进行试算,使用的模型体参数如表1所示,模拟测区面积为500 m×500 m,点距与线距均为10 m。图3是完整的叠加重力异常,其中黄色虚线所圈部分为地质体边缘在地面的正投影,粉红色锯齿圈出区域为待补空部位。

表1   模型参数

Table 1  Model parameters

模型编号模型类型x方向范围/my方向范围/mz方向范围/m密度/(g·cm-3)
Model 1圆柱体-200~200-190~-11010~902
Model 2棱柱体-50~50-50~5020~400-2
Model 3棱柱体-200~0100~20030~10002
Model 4球体100~200100~20010~1102

新窗口打开| 下载CSV


图3

图3   组合模型产生的重力异常及缺失部位(粉色部分)

Fig.3   Forward gravity anomaly with complete data and the target zone (pink part)


图4展示了Surfer软件中4种常用的插值算法所获得的数据补空结果及其与图3的残差情况。可以看出,所有的常规插值算法都在模型体1处存在等值线的间断,尤其反距离加权平均法的最为明显,最小曲率法的等值线畸变最不明显,但最小曲率法的残差值最大,其次是反距离加权法的。另外,常规插值方法的残差均在原始数据的正异常处为负值,而负异常处为正值,这表明了补空的数据没有达到真实值的幅度。表2给出了4种方法的插值均方根误差(RMS),可以看出,反距离加权法的数据补空精度最差,其次是最小曲率法,二者误差是克里金法和径向基函数法的2倍左右。

图4

图4   常规插值方法的数据补空及与原数据的残差

a、b—克里金法插值及残差;c、d—径向基函数法插值及残差;e、f—反距离加权法插值及残差;g、h—最小曲率法及残差

Fig.4   Results of interpolation using conventional methods and the differences with the original data

a、b—interpolated result of Kriging and its residuo;c、d—interpolated result of radial basis function and its residuo;e、f—interpolated result of inverse distance to a power and its residuo;g、h—interpolated result of minimum curvature and its residuo


表2   不同常规插值方法的数据补空误差

Table 2  RMS errors of interpolating data using different conventional interpolation methods

处理方法均方根误差/mGal
克里金法0.123
径向基函数法0.113
反距离加权法0.285
最小曲率法0.217

新窗口打开| 下载CSV


为了了解线性阈值及指数阈值衰减凸集投影与总迭代次数关系,图5绘制了不同模式下的凸集投影方法数据补空误差与最大迭代次数K关系曲线。可以看出,无论是线性衰减,还是不同参数的指数衰减,数据补空误差均是随着总迭代次数K增加而逐渐减小,不过指数衰减的速率要明显大于线性衰减,其中Para=0.5时衰减速率最快。线性阈值衰减方式POCS算法基本收敛在0.070 mGal,指数阈值衰减基本收敛在0.030 mGal,不过指数阈值衰减的误差随着迭代次数变化呈现出了一定的波动性。对比图5表2可以看出,线性阈值衰减、指数阈值衰减凸集投影算法的数据补空精度分别是常规方法效果最好的径向基函数法的1.6倍和4.5倍,这表明了采用基于指数阈值衰减的凸集投影算法能够获得更好的数据补空效果。

图5

图5   线性及指数阈值衰减凸集投影算法的理论数据补空误差与总迭代次数K关系曲线

Fig.5   The relationship between the errors of interpolating data by using POCS with different threshold models and the total number of iterations


图6则是基于线性与指数阈值衰减的POCS算法迭代800次数据补空后的重力异常及其与图3的残差,可以看出,无论线性阈值,还是不同参数指数阈值POCS法处理后的重力异常等值线均较圆滑,并不存在明显的等值线畸变情况。从残差图中可以看出,POCS算法的残差在原始数据表现为正异常区域内为正值,而负异常区为负值,这恰于常规插值方法数据补空的残差是相反的,也就是说,基于POCS算法的数据补空的幅值略大于实际数据的。

图6

图6   基于线性、指数阈值衰减的凸集投影算法数据补空结果及与原数据的残差(K=800)

a、b—线性阈值插值及残差; c、d—指数阈值(Para=0.5)及残差;e、f—指数阈值(Para=1)及残差;g、h—指数阈值(Para=2)及残差

Fig.6   Results of interpolation using POCS method with linear and exponential threshold and the difference with the original data (K=800)

a、b—interpolated result using linear threshold and its residuo;c、d—interpolated result using exponential threshold (Para=0.5) and its residuo;e、f—interpolated result using exponential threshold (Para=1) and its residuo;g、h—interpolated result using exponential threshold (Para=2) and its residuo


为了进一步证实本文算法的有效性,对理论重力异常(图3)添加了30%随机噪声(图7),然后再对含噪重力异常进行了数据缺失处理(图7粉色部位)。图8是4种常用插值方法获得的含噪重力数据补空结果及其与无噪声重力异常的残差,表3给出了4种插值方法的误差。对比表3表2可以看出,相对无噪声时,含噪数据的常规插值方法补空误差有所增加,不过规律基本保持,还是反距离加权法的误差最大,最小曲率法次之。从图8可以看出,4种常规插值方法获得的补空数据仍在在模型体1位置存在等值线的畸变情况,另外还可以看出插值区域的噪声水平与周边数据噪声水平明显不一致,补空区的等值线更加圆滑些。

图7

图7   图3添加30%随机噪声后的重力异常及缺失部位

Fig.7   Gravity anomaly and missing site after adding 30% random noise of Fig. 3


图8

图8   常规插值方法对含噪缺失数据体的补空结果及与原数据的残差

a、b—克里金法插值及残差;c、d—径向基函数法插值及残差;e、f—反距离加权法插值及残差;g、h—最小曲率法及残差

Fig.8   Results of interpolating noise-corrupted data using conventional interpolation methods and the difference with the original noise-free data

a、b—interpolated result of Kriging and its residuo;c、d—interpolated result of radial basis function and its residuo;e、f—interpolated result of inverse distance to a power and its residuo;g、h—interpolated result of minimum curvature and its residuo


表3   不同常规插值方法对含噪重力异常的数据补空误差

Table 3  RMS errors of interpolating noise-corrupted data using different conventional interpolation methods

插值方法均方根误差/mGal
克里金法0.191
径向基函数法0.185
反距离加权法0.315
最小曲率法0.280

新窗口打开| 下载CSV


图9是线性及指数阈值衰减POCS算法的补空的关系曲线。可以看出,线性阈值衰减POCS法的补空数据仍然是随着总迭代次数的增加而减小,基本收敛在0.137 mGal,但不同para时的指数阈值衰减POCS法数据插值误差则是随着迭代增加,先减小后增加,最终基本收敛在0.272 mGal处,推测是误差增加是由于噪声的反复重建导致的。图10可以看出,线性阈值衰减的POCS法(图10a)也在模型体1处产生了明显的等值线间断情况,补空区内的异常同样较为光滑,与残差图(图10b)仍是南、北两侧为大面积的正差值,而中部则整体表现为大面积数据与无噪声理论值之间均方误差与总迭代次数K的负差值,这表明含噪数据进行补空时,线性阈值衰减的POCS法数据填充的误差主要是数据未真实恢复引起的。指数阈值衰减的POCS法(图10c、e、g)补空的数据明显也存在着局部的波动,即含有一定的噪声,残差图(图10d、f、h)则是正负异常间隔出现,即认为主要误差是由噪声干扰引起的。

图9

图9   含噪声时凸集投影算法的数据补空误差与总迭代次数K关系曲线

Fig.9   The relationship between the errors of interpolation data using POCS with different threshold models for the noise-corrupted data and the total number of iterations


图10

图10   图7采用线性与指数阈值衰减POCS算法的数据补空结果及其残差结果

a、b—线性阈值插值及残差; c、d—指数阈值(Para=0.5)及残差;e、f—指数阈值(Para=1)及残差;g、h—指数阈值(Para=2)及残差

Fig.10   Results of interpolation using POCS method with linear and exponential threshold model and the differences with the noise-free data

a、b—interpolated result using linear threshold and its residuo;c、d—interpolated result using exponential threshold (Para=0.5) and its residuo;e、f—interpolated result using exponential threshold (Para=1) and its residuo;g、h—interpolated result using exponential threshold (Para=2) and its residuo


3 应用实例

为了检验本文算法的实际资料处理能力,对黑龙江嫩北农场布格重力异常进行挖空与数据补空处理。图11是网格密度500 m×250 m的布格重力异常,布格重力异常总误差为0.018 mGal。由于该区中部NWW流向的科洛河在汛期时河床较宽,最宽处可达1 km,汛期时重力数据将无法采集,故这里对科洛河的大致流域区域进行了数据挖空处理(图11粉色部位)。

图11

图11   黑龙江嫩北农场布格重力异常及缺失部位(粉色部分)

Fig.11   Bouguer gravity anomaly of Nenbei Farm in Heilongjiang Province and the target zone (pink part)


图12是理论模型测试所提及的4种常用插值方法处理的结果及其残差分布,可以看到,这4种插值方法数据补空结果基本一致,很难看出彼此差异,且等值线畸变现象也难以直接显示,其主要原因是挖空区域宽度仅为2~3个点距。从残差图上可以看出,补空数据与实际数据的残差仍是大面积的正、负值,即误差具有一定的范围,这显然不利于后期数据处理与解释。表4是的4种常规插值方法的数据补空误差,可以看出,径向基函数法的数据补空误差最小,其次是最小曲率法和克里金法,反距离加权法的误差仍是最大,不过所有常规方法的数据补空误差均远大于布格重力异常的总误差,也就是说补空数据质量较差。

图12

图12   实际数据的常规插值方法数据补空结果

a、b—克里金法插值及残差;c、d—径向基函数法插值及残差;e、f—反距离加权法插值及残差;g、h—最小曲率法及残差

Fig.12   Results of interpolation using conventional methods and the differences with the real data

a、b—interpolated result of Kriging and its residuo;c、d—interpolated result of radial basis function and its residuo;e、f—interpolated result of inverse distance to a power and its residuo;g、h—interpolated result of minimum curvature and its residuo


表4   不同常规方法对实际资料进行数据补空的误差

Table 4  The errors of interpolation results using conventional methods for the read data

处理方法名称均方根误差/mGal
克里金法0.105
径向基函数法0.091
反距离加权法0.298
最小曲率法0.105

新窗口打开| 下载CSV


图13给出了基于线性、不同参数Para指数阈值衰减POCS算法数据补空均方根误差与总迭代次数K的关系曲线,可以看出,无论是线性、还是不同参数的指数阈值衰减,POCS算法数据重建误差均随着K增加而逐渐减小,线性阈值衰减POCS算法的误差基本收敛于0.149 mGal,远高于布格重力异常总误差,即线性阈值衰减的POCS算法重建的数据质量也较低;指数阈值衰减POCS算法的误差收敛于0.008 mGal,则低于布格重力异常总误差,重建数据质量较高,重建数据完全可以替代真实数据。图14给出了Para=0.5时指数阈值衰减POCS法的处理结果以及残差分布,残差图中显示了缺失数据宽度较小的西北侧基本为0,而补空区较宽的东南侧基本是正负异常间隔出现,且数据幅值较小,这体现出了本文方法在数据补空方面的优势。

图13

图13   不同衰减方式POCS补空的误差与总迭代次数K的关系曲线

Fig.13   The relationship between the errors of interpolating data using POCS with different threshold models and the total number of iterations


图14

图14   实际数据指数阈值衰减POCS算法处理结果

a—指数阈值(Para=0.5)数据补空结果;b—与实测数据的残差 (K=6500)

Fig.14   Using exponential threshold-based POCS method to interpolate real field data

a—interpolated result (Para=0.5);b—the residuo (K=6500)


4 结论

针对缺失的重磁数据需要有效恢复的问题,本文采用了基于DCT的广义指数阈值衰减凸集投影算法进行数据补空工作。通过模型分析与实例应用,证实了基于指数阈值衰减的凸集投影算法在数据补空中存在补空精度高及补空痕迹小的优点,另外补空数据还能与实际数据噪声含量保持一致。

参考文献

孙洪泉. 地质统计学及其应用[M]. 北京: 中国矿业大学出版社, 1990.

[本文引用: 1]

Sun H Q. Geological statistics and its application [M]. Beijing: China University of Mining and Technology Press, 1990.

[本文引用: 1]

Briggs I C.

Machine contouring using minimum curvature

[J]. Geophysics, 1974, 39(1):39-48.

DOI:10.1190/1.1440410      URL     [本文引用: 1]

Cordell L.

A scattered equivalent-source method for interpolation and gridding of potential-field data in three dimensions

[J]. Geophysics, 1992, 57(4):629-636.

DOI:10.1190/1.1443275      URL     [本文引用: 1]

郭志宏.

一种使用的等值线型数据网格化方法

[J]. 物探与化探, 2001, 25(3):203-208.

[本文引用: 1]

Guo Z H.

A practical contour type data gridding technique

[J]. Geophysical and Geochemical Exploration, 2001, 25(3):203-208.

[本文引用: 1]

闫浩飞, 刘国峰, 薛典军, .

基于凸集投影方法的重磁数据规则缺失重建

[J]. 地球物理学进展, 2016, 31(5):2192-2197.

[本文引用: 2]

Yan H F, Liu G F, Xue D J, et al.

Reconstruction of gravity/magnetic data with the projection-onto-convex-sets methods

[J]. Progress in Geophysics, 2016, 31(5):2192-2197.

[本文引用: 2]

王万银, 邱之云, 刘金兰, .

位场数据处理中的最小曲率扩边和补空方法研究

[J]. 地球物理学进展, 2009, 24(4):1327-1338.

[本文引用: 1]

Wang W Y, Qiu Z Y, Liu J L, et al.

The research to the extending edge and interpolation based on the minimum curvature method in potential field data processing

[J]. Progress in Geophysics, 2009, 24(4):1327-1338.

[本文引用: 1]

王明, 刘前坤, 李芳, .

基于热传导模型位场网格数据补空方法研究

[J]. 物探与化探, 2015, 39(S1):144-151.

[本文引用: 1]

Wang M, Liu Q K, Li F, et al.

Filling grid dummy values by heat conduction model

[J]. Geophysical and Geochemical Exploration, 2015, 39(S1):144-151.

[本文引用: 1]

曾小牛, 李夕海, 刘继昊, .

基于凸集投影的重力数据扩充下延一体化方法

[J]. 石油地球物理勘探, 2019, 54(5):1166-1173.

[本文引用: 1]

Zeng X N, Li X H, Liu J H, et al.

An integration of interpolation, edge padding, and downward continuation for gravity data based on the projection onto convex sets

[J]. Oil Geophysical Prospecting, 2019, 54(4):1166-1173.

[本文引用: 1]

曾小牛, 李夕海, 侯维君, .

基于凸集投影的重力同时填充扩边和去噪方法

[J]. 石油地球物理勘探, 2020, 55(1):197-205.

[本文引用: 1]

Zeng X N, Li X H, Hou W J, et al.

Simultaneous interpolation, edge padding and denoising method for gravity data based on the projection onto convex sets

[J]. Oil Geophysical Prospecting, 2020, 55(1):197-205.

[本文引用: 1]

Gao J J, Chen X H, Li J Y, et al.

Irregular seismic data reconstruction based on exponential threshold model of POCS method

[J]. Applied Geophysics, 2010, 7(3):229-238.

DOI:10.1007/s11770-010-0246-5      URL     [本文引用: 4]

张华, 陈小宏.

基于jitter 采样和曲波变换的三维地震数据重建

[J]. 地球物理学报, 2013, 56(5):1637-1649.

[本文引用: 2]

Zhang H, Chen X H.

Seismic data reconstruction based on jittered sampling and curvelet transform

[J]. Chinese J. Geophys., 2013, 56(5):1637-1649.

[本文引用: 2]

/

京ICP备05055290号-3
版权所有 © 2021《物探与化探》编辑部
通讯地址:北京市学院路29号航遥中心 邮编:100083
电话:010-62060192;62060193 E-mail:whtbjb@sina.com