基于DCT的广义指数阈值衰减凸集投影算法在位场数据补空中的应用
东华理工大学 地球物理与测控技术学院,江西 南昌 330013
Interpolation of potential-field data by Projection Onto Convex Sets algorithm with generalized exponential threshold and based on Discrete Cosine Transform
School of Geophysical and Measurement-Control Technology, East China University of Technology,Nanchang 330013, China
通讯作者: 王彦国(1985-),男,博士,副教授,硕士研究生导师,从事勘探重磁学方面的教学与研究工作。Email:wangyg8503@126.com
责任编辑: 王萌
收稿日期: 2021-01-4 修回日期: 2021-05-19
基金资助: |
|
Received: 2021-01-4 Revised: 2021-05-19
作者简介 About authors
艾寒冰(1998-),男,在读硕士研究生,主要从事重磁勘探方面的学习与研究工作。Email:
数据补空或插值是位场数据处理中一个非常基本且重要的问题,在野外数据测量过程中遇到水域、断崖等情况时无法进行数据采集,导致数据出现缺失情况。为了便于后续数据处理,需要对缺失数据体进行补全。本文将离散余弦变换(DCT)应用到凸集投影(POCS)算法中来补全位场缺失数据,并给出了广义指数阈值衰减方式。模型试验及实例应用表明,基于DCT并结合广义指数阈值衰减形式的POCS算法具有数据补空精度高、补空痕迹小和补空数据噪声含量更接近真实情况等优点。
关键词:
Data filling or interpolation is a fundamental and vital problem of potential-field data processing. Some data cannot be measured when some places are unable to reach, such as rivers, or cliffs. If we want to acquire the missing data for better subsequent processing, we need to interpolate or fill in the missing data. Hence, this article introduces the Discrete Cosine Transform (DCT) method into the Projection Onto Convex Sets (POCS) algorithm to tackle this problem, and a generalized exponential threshold attenuation method is also given. Finally, model tests and practical applications show that the POCS algorithm with generalized exponential threshold and based on DCT has the advantages of high accuracy, small filling or interpolating traces and the noise standard of the filled data are closer to real situation.
Keywords:
本文引用格式
艾寒冰, 王彦国.
AI Han-Bing, WANG Yan-Guo.
0 引言
在野外重磁数据采集过程中,常会遇到沼泽、河流、水库或断崖等恶劣环境,导致数据无法采集,使得一部分数据空缺,不利于后期数据处理与解释。目前,解决这一问题的主要措施是进行数据网格插值,较为常用的有克里金插值法[1]、最小曲率法[2]、等效源法[3]、线性插值法[4]等,不过这些方法的数据补空精度较低[5]。王万银等[6]引入最小曲率插值方法,给出了其差分迭代格式,并讨论了相关技术措施,验证了该方法精度明显高于常规余弦插值法,但方法受给定初值影响较大;王明等[7]把位场数据插值类比成热流传导的过程,进而提出了基于热传导模型的位场网格数据补空方法,并验证该法比最小曲率法插值效果更优;闫浩飞等[5]采用基于线性阈值衰减的凸集投影算法(POCS)进行位场数据补空,该方法相对常规插值方法具有更高的数据补空精度;曾小牛等进一步将该方法进行推广,提出了基于凸集投影算法的重力数据扩充、下延一体化方法[8]和重力同时填充扩边和去噪方法[9],有效地改善了常规分步骤进行插值、扩边、下延和去噪的问题,获得了良好的处理效果。
1 理论基础
凸集投影算法广泛用于图像修复,该方法将所有图像约束表示为希尔伯特空间中的一系列闭合凸集Ci(i=1,2,3,…,m),然后将任意初始值x迭代投影到投影算子H下的所有闭合凸集的交点上。将位于交点边界上的最终投影点作为最优解,其原理如图1所示,POCS迭代过程表达式为:
图1
基于DCT的数据补空凸集投影理论公式:
式中:K是总迭代次数;Dobs(x,y)是含缺失数据的原始观测数据;Dk代表第k次迭代补空的数据;C和C-1代表二维离散余弦正、反变换;M是采样矩阵,其与输入数据维度相同,如果某点值为0,代表该点有数据,无需插值,反之为1,则代表该点需要进行插值计算;Tk是门限值矩阵,可表示为:
式中:pk是第k次迭代阈值,Sk是第k次的DCT变换谱。
Abma[13]给出的线性阈值衰减形式为:
式中:
本文给出的广义指数阈值衰减形式为:
凸集投影算法进行数据补空的基本流程为:对原始输入数据采用DCT处理,给定一个阈值,使得变换谱中振幅大于等于这个阈值时保留,振幅低于这个阈值则充零代替,然后对该数据进行反离散余弦变换乘以采样矩阵,最后将其与原始待补空数据叠加,而在下一次迭代计算时,减小阈值重复上述操作,直到达到结束迭代计算的条件。本算法需要实现对不规则数据网格化,以满足DCT变换的需要,算法的关键在于选择合适的稀疏变换和阈值衰减方式,其工作流程图见图2。
图2
图2
基于DCT的POCS数据补空流程
Fig.2
The flow-process diagram of POCS method to interpolate based on DCT
2 模型试验
表1 模型参数
Table 1
模型编号 | 模型类型 | x方向范围/m | y方向范围/m | z方向范围/m | 密度/(g·cm-3) |
---|---|---|---|---|---|
Model 1 | 圆柱体 | -200~200 | -190~-110 | 10~90 | 2 |
Model 2 | 棱柱体 | -50~50 | -50~50 | 20~400 | -2 |
Model 3 | 棱柱体 | -200~0 | 100~200 | 30~1000 | 2 |
Model 4 | 球体 | 100~200 | 100~200 | 10~110 | 2 |
图3
图3
组合模型产生的重力异常及缺失部位(粉色部分)
Fig.3
Forward gravity anomaly with complete data and the target zone (pink part)
图4
图4
常规插值方法的数据补空及与原数据的残差
a、b—克里金法插值及残差;c、d—径向基函数法插值及残差;e、f—反距离加权法插值及残差;g、h—最小曲率法及残差
Fig.4
Results of interpolation using conventional methods and the differences with the original data
a、b—interpolated result of Kriging and its residuo;c、d—interpolated result of radial basis function and its residuo;e、f—interpolated result of inverse distance to a power and its residuo;g、h—interpolated result of minimum curvature and its residuo
表2 不同常规插值方法的数据补空误差
Table 2
处理方法 | 均方根误差/mGal |
---|---|
克里金法 | 0.123 |
径向基函数法 | 0.113 |
反距离加权法 | 0.285 |
最小曲率法 | 0.217 |
为了了解线性阈值及指数阈值衰减凸集投影与总迭代次数关系,图5绘制了不同模式下的凸集投影方法数据补空误差与最大迭代次数K关系曲线。可以看出,无论是线性衰减,还是不同参数的指数衰减,数据补空误差均是随着总迭代次数K增加而逐渐减小,不过指数衰减的速率要明显大于线性衰减,其中Para=0.5时衰减速率最快。线性阈值衰减方式POCS算法基本收敛在0.070 mGal,指数阈值衰减基本收敛在0.030 mGal,不过指数阈值衰减的误差随着迭代次数变化呈现出了一定的波动性。对比图5与表2可以看出,线性阈值衰减、指数阈值衰减凸集投影算法的数据补空精度分别是常规方法效果最好的径向基函数法的1.6倍和4.5倍,这表明了采用基于指数阈值衰减的凸集投影算法能够获得更好的数据补空效果。
图5
图5
线性及指数阈值衰减凸集投影算法的理论数据补空误差与总迭代次数K关系曲线
Fig.5
The relationship between the errors of interpolating data by using POCS with different threshold models and the total number of iterations
图6
图6
基于线性、指数阈值衰减的凸集投影算法数据补空结果及与原数据的残差(K=800)
a、b—线性阈值插值及残差; c、d—指数阈值(Para=0.5)及残差;e、f—指数阈值(Para=1)及残差;g、h—指数阈值(Para=2)及残差
Fig.6
Results of interpolation using POCS method with linear and exponential threshold and the difference with the original data (K=800)
a、b—interpolated result using linear threshold and its residuo;c、d—interpolated result using exponential threshold (Para=0.5) and its residuo;e、f—interpolated result using exponential threshold (Para=1) and its residuo;g、h—interpolated result using exponential threshold (Para=2) and its residuo
图7
图7
Fig.7
Gravity anomaly and missing site after adding 30% random noise of
图8
图8
常规插值方法对含噪缺失数据体的补空结果及与原数据的残差
a、b—克里金法插值及残差;c、d—径向基函数法插值及残差;e、f—反距离加权法插值及残差;g、h—最小曲率法及残差
Fig.8
Results of interpolating noise-corrupted data using conventional interpolation methods and the difference with the original noise-free data
a、b—interpolated result of Kriging and its residuo;c、d—interpolated result of radial basis function and its residuo;e、f—interpolated result of inverse distance to a power and its residuo;g、h—interpolated result of minimum curvature and its residuo
表3 不同常规插值方法对含噪重力异常的数据补空误差
Table 3
插值方法 | 均方根误差/mGal |
---|---|
克里金法 | 0.191 |
径向基函数法 | 0.185 |
反距离加权法 | 0.315 |
最小曲率法 | 0.280 |
图9是线性及指数阈值衰减POCS算法的补空的关系曲线。可以看出,线性阈值衰减POCS法的补空数据仍然是随着总迭代次数的增加而减小,基本收敛在0.137 mGal,但不同para时的指数阈值衰减POCS法数据插值误差则是随着迭代增加,先减小后增加,最终基本收敛在0.272 mGal处,推测是误差增加是由于噪声的反复重建导致的。图10可以看出,线性阈值衰减的POCS法(图10a)也在模型体1处产生了明显的等值线间断情况,补空区内的异常同样较为光滑,与残差图(图10b)仍是南、北两侧为大面积的正差值,而中部则整体表现为大面积数据与无噪声理论值之间均方误差与总迭代次数K的负差值,这表明含噪数据进行补空时,线性阈值衰减的POCS法数据填充的误差主要是数据未真实恢复引起的。指数阈值衰减的POCS法(图10c、e、g)补空的数据明显也存在着局部的波动,即含有一定的噪声,残差图(图10d、f、h)则是正负异常间隔出现,即认为主要误差是由噪声干扰引起的。
图9
图9
含噪声时凸集投影算法的数据补空误差与总迭代次数K关系曲线
Fig.9
The relationship between the errors of interpolation data using POCS with different threshold models for the noise-corrupted data and the total number of iterations
图10
图10
a、b—线性阈值插值及残差; c、d—指数阈值(Para=0.5)及残差;e、f—指数阈值(Para=1)及残差;g、h—指数阈值(Para=2)及残差
Fig.10
Results of interpolation using POCS method with linear and exponential threshold model and the differences with the noise-free data
a、b—interpolated result using linear threshold and its residuo;c、d—interpolated result using exponential threshold (Para=0.5) and its residuo;e、f—interpolated result using exponential threshold (Para=1) and its residuo;g、h—interpolated result using exponential threshold (Para=2) and its residuo
3 应用实例
图11
图11
黑龙江嫩北农场布格重力异常及缺失部位(粉色部分)
Fig.11
Bouguer gravity anomaly of Nenbei Farm in Heilongjiang Province and the target zone (pink part)
图12
图12
实际数据的常规插值方法数据补空结果
a、b—克里金法插值及残差;c、d—径向基函数法插值及残差;e、f—反距离加权法插值及残差;g、h—最小曲率法及残差
Fig.12
Results of interpolation using conventional methods and the differences with the real data
a、b—interpolated result of Kriging and its residuo;c、d—interpolated result of radial basis function and its residuo;e、f—interpolated result of inverse distance to a power and its residuo;g、h—interpolated result of minimum curvature and its residuo
表4 不同常规方法对实际资料进行数据补空的误差
Table 4
处理方法名称 | 均方根误差/mGal |
---|---|
克里金法 | 0.105 |
径向基函数法 | 0.091 |
反距离加权法 | 0.298 |
最小曲率法 | 0.105 |
图13给出了基于线性、不同参数Para指数阈值衰减POCS算法数据补空均方根误差与总迭代次数K的关系曲线,可以看出,无论是线性、还是不同参数的指数阈值衰减,POCS算法数据重建误差均随着K增加而逐渐减小,线性阈值衰减POCS算法的误差基本收敛于0.149 mGal,远高于布格重力异常总误差,即线性阈值衰减的POCS算法重建的数据质量也较低;指数阈值衰减POCS算法的误差收敛于0.008 mGal,则低于布格重力异常总误差,重建数据质量较高,重建数据完全可以替代真实数据。图14给出了Para=0.5时指数阈值衰减POCS法的处理结果以及残差分布,残差图中显示了缺失数据宽度较小的西北侧基本为0,而补空区较宽的东南侧基本是正负异常间隔出现,且数据幅值较小,这体现出了本文方法在数据补空方面的优势。
图13
图13
不同衰减方式POCS补空的误差与总迭代次数K的关系曲线
Fig.13
The relationship between the errors of interpolating data using POCS with different threshold models and the total number of iterations
图14
图14
实际数据指数阈值衰减POCS算法处理结果
a—指数阈值(Para=0.5)数据补空结果;b—与实测数据的残差 (K=6500)
Fig.14
Using exponential threshold-based POCS method to interpolate real field data
a—interpolated result (Para=0.5);b—the residuo (K=6500)
4 结论
针对缺失的重磁数据需要有效恢复的问题,本文采用了基于DCT的广义指数阈值衰减凸集投影算法进行数据补空工作。通过模型分析与实例应用,证实了基于指数阈值衰减的凸集投影算法在数据补空中存在补空精度高及补空痕迹小的优点,另外补空数据还能与实际数据噪声含量保持一致。
参考文献
Machine contouring using minimum curvature
[J].DOI:10.1190/1.1440410 URL [本文引用: 1]
A scattered equivalent-source method for interpolation and gridding of potential-field data in three dimensions
[J].DOI:10.1190/1.1443275 URL [本文引用: 1]
一种使用的等值线型数据网格化方法
[J].
A practical contour type data gridding technique
[J].
基于凸集投影方法的重磁数据规则缺失重建
[J].
Reconstruction of gravity/magnetic data with the projection-onto-convex-sets methods
[J].
位场数据处理中的最小曲率扩边和补空方法研究
[J].
The research to the extending edge and interpolation based on the minimum curvature method in potential field data processing
[J].
基于热传导模型位场网格数据补空方法研究
[J].
Filling grid dummy values by heat conduction model
[J].
基于凸集投影的重力数据扩充下延一体化方法
[J].
An integration of interpolation, edge padding, and downward continuation for gravity data based on the projection onto convex sets
[J].
基于凸集投影的重力同时填充扩边和去噪方法
[J].
Simultaneous interpolation, edge padding and denoising method for gravity data based on the projection onto convex sets
[J].
Irregular seismic data reconstruction based on exponential threshold model of POCS method
[J].DOI:10.1007/s11770-010-0246-5 URL [本文引用: 4]
/
〈 |
|
〉 |
