回归分析法在日变数据推算中的应用
张向宇1,2, 关永贤1,2, 张锡林1,2
1.中国地质调查局 广州海洋地质调查局,广东 广州 510075
2.国土资源部海底矿产资源重点实验室,广东广州 510075

作者简介: 张向宇(1987-),女,黑龙江人,工程师,硕士,主要从事海洋重磁数据处理技术研究。

摘要

在海洋磁测数据日变改正过程中,常会因各种因素限制,导致日变数据缺失,这时就需要结合多台站数据推算工区位置处的日变数据。通过借鉴前人研究成果及考察相关分析结果,可以近似认为台站间日变数据具有一定的线性关系,并引入统计学中常用的回归分析法拟合出某一位置日变数据的推算公式,进而得到推算数据。选取南海区域实测数据验证可知该方法具有一定的可靠性,可以解决日变数据缺失等问题,从而提升海洋磁测数据的精度,是一种改进的磁测数据日变改正方法。

关键词: 回归分析; 日变改正; 纬差; 海底日变站
中图分类号:P631 文献标志码:A 文章编号:1000-8918(2016)03-0603-06 doi: 10.11720/wtyht.2016.3.24
The application of regression to estimating geomagnetic data
ZHANG Xiang-Yu1,2 GUAN Yong-Xian1,2, ZHANG Xi-Lin1,2
1.MLR Key Laboratory of Marine Mineral Resources,Guangzhou 510075,China
2.Guangzhou Marine Geological Survey,Guangzhou 510075,China
Abstract

Researchers have always met with problems like lack of geomagnetic data when processing magnetic data,so it is necessary to estimate geomagnetic data in appointed area.Based on an analysis of diurnal geomagnetic correction with multi-observatories,the authors have found that geomagnetic data of different observatories are linear,so the formula of estimating geomagnetic data can be fitted by importing regression,and then the effects of the method can be checked by using observed data.The reliability of the method is confirmed,which is a progress in data processing.

Keyword: regression; diurnal correction; latitude difference; geomagnetism observation

中图分类号: P631 文献标识码: A 文章编号: 1000-8918(2016)03-0603-06

日变改正是磁测数据处理中较为重要的一个步骤, 其改正效果的好坏对最终得到的磁测数据精度影响较大。随着磁测工作的不断开展, 日变改正时遇到的问题越来越多, 尤其是对海洋磁测数据来说, 问题尤为突出。

近几年, 南海不同区域磁测数据处理过程中时常遇到一些问题, 首先是陆地台站日变数据缺失, 目前南海周边可用的陆地台站很有限, 且数据均来源于网络, 时常出现工区作业日期内无日变数据可下载的情况; 其次是陆地台站与工区距离较远, 某些工区与陆地台站的中心距离超过了台站控制范围, 针对这种情况, 野外施工有时会根据需要投放海底日变站, 但海底日变站的投放往往受制于野外作业时的实际状况, 有时投放位置不佳, 导致日变站控制范围不能覆盖整个工区, 有时海底日变站丢失、受到各种干扰或产生故障, 导致无法回收数据, 有时投放深度太深, 导致回收的数据受海水层影响较大而失真。

这些问题的出现将导致日变改正无法较好进行, 从而导致最终处理后数据的精度达不到海洋地质规范的要求。因此找寻有效的方法对日变数据进行推算, 添补数据是很有必要的。

近年来国内多位学者对日变数据的推算提出了多种方法, 单汝俭等[1]在1990年提出了包括二维多项式最小二乘拟合法、时空拟合法和线性内插法在内的3种局部地区地磁日变拟合方法; 边刚等[2]在2009年采用多站同步实例分析了加权平均法和函数拟合法在海洋磁测量地磁日变改正中的应用; 卞光浪等[3]在2010年提出了基于纬差加权法的海洋磁测量多站地磁日变改正值计算, 摆脱了距离上的相对关系, 将日变数据的差异只建立在纬度关系上。笔者通过对沿岸几个日变站的数据进行计算验证, 证实该方法较距离加权法效果更好。

笔者通过分析纬差加权法的应用效果, 发现其在使用时有一些限制条件, 并由此引入统计学中常用的回归分析法, 通过选择合理的样本数据拟合出日变数据推算公式。通过对实测数据的计算分析, 验证了该方法的可靠性, 同时也给出了其使用条件。

1 回归分析法引入
1.1 纬差加权法分析

纬差加权法假设测点P的地磁日变改正值由局部邻域内的多个同步地磁日变站检测信息加权平均得到。设地磁日变站坐标为(φ i, λ j), 在t时刻各站的地磁日变改正值为Δ Ti(φ i, λ j, t), 记各站权函数为Wi(φ , λ ), 则测点的地磁日变改正值可表示为

设权函数Wi(φ , λ )与纬差的μ (μ ≥ 0)次方的倒数成正比, 则权函数表达式为

Wi(φ, λ)=φikΔφiX)2+ε2μ2, (2)

其中: φik为第i个地磁日变站纬度的k(一般取0≤ k≤ 2)次幂; Δ φ iX为测点与第i个地磁日变站之间的纬差; ε 为平滑因子, 通常取不为零的小数, 当测点距各地磁日变站纬差较大时, 可忽略其影响。

文献[3]中应用某3个台站的实际地磁日变数据对式(1)中μ k分别取0、1、2时纬差加权法的计算精度进行统计, 发现当μ =1、k=1时计算出的误差最小, 这时测点P的地磁日变改正值为:

ΔT(φ, λ, t)=φAΔφBPΔT1(φ1, λ1, t)+φBΔφAPΔT2(φ2, λ2, t)φAΔφBP+φBΔφAP, (3)

其中, Δ T1(φ 1, λ 1, t)为A台站地磁日变改正值, Δ T2(φ 2, λ 2, t)为B台站地磁日变改正值, φ Aφ B

别为A台站和B台站的纬度, Δ φ AP、Δ φ BP分别为测点PA站和B站的纬差。

选取南海周边几个地磁日变台站数据(日期覆盖15 d, 采样间隔为1min, 数据均由互联网下载)对该方法进行验证, 另外再选取1个以往野外测量时投放的海底日变站(投放位置16.85° N, 112.45° E, 水深917 m)数据, 采用的几个陆地日变站的相关信息见表1, 其位置分布见图1。

表1 地磁台站信息

表1中4个陆地台站中每2个1组作为基台站代入式(1)中分别推算16.85° 处的日变数据, 并统计与同纬度处海底日变数据的差值, 结果见表2

表2 纬差加权法推算日变数据偏差统计

表2中计算结果显示内插计算时越南DLT台和海南琼中台推算的日变数据与海底日变数据的偏差最小, 外推计算时广州台和海南琼中台推算的日变数据与海底日变数据的偏差最小。内插准确度总体高于外推, 内插时使用的2个台站与待推算位置处的纬度越近, 推算准确度越高; 外推时2个台站中需有至少1个台站离待构造位置处的纬度较近, 依表2中统计数据判断此台站与待推算处纬差最大不应超过3° 。

从纬差加权法的分析看出, 该方法在内插时效果较好, 但在外推时效果一般, 尤其在待推算位置距离2个台站较远时该方法失效。从式(3)中可以看到, 纬差加权法是人为地认为不同地磁台站间的日变数据呈线性相关关系, 取表1中4个地磁台站某段时间的数据成图, 成图前对4组数据统一基值, 结果见图2。

图2 不同地磁台站日变曲线对比

从图中可以看到, 不同台站的日变曲线形态相似, 但幅值随纬度的变化有所不同, 具有一定的相关性。同时取4台站收集到的30天内的数据进行相关分析, 结果见表3。从表中所示结果可知, 不同地磁台站的日变数据具有一定的相关性, 纬度相差越小的台站数据相关性越好。由上述几方面的分析, 可近似地认为地磁台站间的日变数据呈线性相关关系, 因此可以引入统计学中常用的回归分析法拟合关系式并推算日变数据。

表3 4台站地磁日变数据相关系数统计
1.2 回归分析法原理

由式(1)可知, 地磁台站(这里仅研究3个台站)间日变数据呈线性关系, 即

ΔT=T1+T2, (4)

其中, ab为常数, Δ T1、Δ T2分别为2个基台站的地磁场值, Δ T为待推算位置处地磁场值。式(4)的关键在于求取参数ab的值, 当可以收集到相同时间段内Δ T、Δ T1、Δ T2的数据作为样本, 则可利用最小二乘法对式(5)中的参数ab进行无偏估计, 最终得到一个确定的回归方程[4]

2 回归分析法验证

选取广州地磁台、海南琼中地磁台和越南PHU地磁台数据, 分别利用回归分析法推算12° 处的日变数据, 并与越南DLT地磁台的真实日变数据进行对比, 选择这样的台站组合意在检验回归分析法在外推计算时的效果。待推算日变数据的时间段为2012年5月12日~5月27日, 收集2012年5月1日~5月30日期间4个台站的日变数据, 取样间隔均为1min, 数据均由互联网下载得到。

表3可看到, 纬差越大的台站相关性越差, 则纬度高于广州地磁台的日变台站数据将与越南DLT台数据相关性更差, 不宜用作基台站作回归分析计算, 而上述选择的这4个地磁台站日变数据相关性较好, 可作线性回归分析。

其次在回归分析前需要选取样本数据, 根据待推算的时间段有2种选择方法, 一种是在待推算时间段内选择一定时长的数据, 另一种是在与待推算时间以外时间段内选择一定时长的数据。通常样本应具有一定数据量, 数据量越大, 则回归分析得到的估算值误差越小; 同时样本数据的时间越靠近待推算时间段, 则估算值误差越小; 另外地磁日变经常出现磁扰磁暴现象, 使数据误差增大, 故样本数据应尽量选择连续磁平静日数据。由此分别选择5月2日~5月11日和5月15日~5月25日的数据作为样本, 分别考察不同样本数据对推算结果偏差的影响(表4), 同时将6组不同样本数据推算得到的部分日变数据成图显示, 见图3。

表4 回归分析法偏差统计

图3 回归分析法推算日变数据对比

在3组基台站组合中(表4和图3), 以广州地磁台和海南琼中地磁台为基台站的数据与越南DLT台日变数据偏差最小, 且选择待推算时间内的样本数据得到的结果最好, 而越南PHU台和广州地磁台为基台站得到的结果偏差最大。

因海南琼中地磁台是3个基台站中与待推算位置纬差最小的台站, 而广州地磁台是3个基台站中与海南琼中地磁台经度最接近的台站, 故其推算结果为最佳。由这一组样本数据的推算可知, 在使用回归分析法做外推计算时, 2个基台站中应至少有1个台站与待推算位置处的纬差不应超过7° , 2个基台站间的经度越接近推算效果越好。将待推算时间内所有的越南DLT地磁台数据、偏差最小的推算日变数据及两者差值进行归一化(统一以零为基值)后并成图(图4)。

图4中看到, 推算日变数据曲线与越南DLT台真实日变数据曲线拟合程度较好, 两者偏差较大的部分多位于磁扰处, 而磁扰发生时会导致日变曲线的畸变, 从而导致此时的多台站数据不符合预设的线性相关关系, 以至于回归分析法得到的推算数据出现误差。而往往对磁扰部分数据的处理有其他压制方法, 因此这种误差可以在其他步骤中进行消除。

图4 日变数据偏差对比

3 回归分析法与纬差加权法比较

回归分析法是以纬差加权法的公式为基础, 并且是在纬差加权法外推计算效果不佳的情况下引出的, 所以这里对两种方法在外推和内插时的推算效果作一对比。

首先用回归分析法对表2中涉及到的地磁台站数据作同样的内插计算时, 偏差统计见表5。其次用纬差加权法对表4中涉及的地磁台站数据作同样的外推计算时, 偏差统计见表6

表5 两种方法内插计算偏差统计
表6 两种方法外推计算偏差统计

表5表6中看到, 无论是内插还是外推计算时, 回归分析法得到的数据与实际的地磁日变数据偏差均小于纬差加权法得到的结果。尤其是在外推, 且基台站距离待推算位置纬差较大, 纬差加权法失效的情况下, 回归分析法仍可以获得较好的效果。

对回归分析法的验证计算以及与纬差加权法的效果对比可以说明, 在一定条件下, 回归分析法可以在缺失日变数据的情况下用来进行推算的。

4 实例分析

选取南海某工区实测数据, 地理范围12° N~16° N, 114° E~120° E, 共采集9条测线, 主测线为东北— 西南走向, 联络测线均垂直于主测线。最适合用来做日变改正的地磁台是越南DLT地磁台, 但可获得的DLT台站数据在测量日期内出现大量缺失(野外作业时间6月21日~7月3日, 越南DLT台数据只覆盖6月24日~28日)。其他地磁台站距离工区都较远, 不宜用来改正, 因此考虑使用回归分析法推算与越南DLT台同纬度(12° N)处的日变数据。

表4的偏差统计可知, 最适合用来做推算的基台站组合应为广州地磁台和海南琼中地磁台, 但在搜集日变数据时发现, 广州地磁台数据缺失6月22日、6月24日、6月25日、6月27日4天的数据, 而越南DLT台在野外作业时间前后相邻的7天内都无可用数据, 这样无法形成合适的样本数据。越南PHU地磁台和海南琼中地磁台数据均可覆盖野外作业时间, 故最后选择采用这2个台站作为基台站推算12° N处日变数据, 选择6月24日~28日内各台站数据作为样本数据, 将该时间段内越南DLT台数据和得到的推算数据成图显示, 如图5所示。从图中可知, 由广州地磁台和琼中地磁台推算的数据与越南DLT台数据更为接近。

图5 南海某工区日变数据对比

用推算得到的数据进行日变改正, 其他处理步骤已先期完成, 处理参数一致, 得到的交点差统计见表7, 为了有所对比, 将由海南琼中地磁台(代号QZ)数据改正后的结果一起罗列。从表中可以看到, 由广州地磁台和琼中地磁台推算得到的数据改正后交点差均方根差值最小, 效果最好。

表7 南海某工区实测数据交点差统计

对于该工区, 因无法搜集到位置最近的陆地台站数据, 野外又没有投放海底日变站, 同时因为工区所处纬度较其他几个陆地台站较远, 不能使用纬差加权法等其他日变数据推算方法, 这时回归分析法发挥了较大作用, 解决了无可用地磁日变数据的问题, 并且提高了改正后数据的精度。

5 总结

1) 纬差加权法外推时在基台站离待推算位置纬差超过3° 时, 外推数据偏差较大, 而回归分析法则可以突破3° 的限制。内插时, 回归分析法得到的数据偏差小于纬差加权法得到的数据。

2) 使用回归分析法时选择样本数据与作业时间越接近越好, 选择作业期间的数据做样本得到的结果偏差小于作业时间相邻时间段做样本的结果。样本数据的选择应尽量选择连续磁平静日数据, 样本数据越多准确度越高, 从文中实例来看至少应有5天数据做样本。

3) 纬差加权法可以由2基台站数据推算相邻任一纬度处的日变数据, 不需样本数据, 2基台站与待推算位置的纬度越接近精度越高, 2基台站纬度差应尽量控制在10° 内, 外推时2基台站中要有一个距离待推算位置处的纬差不超过3° 。

4) 回归分析法只能在待推算位置处有作业期间相邻时间段内的日变数据来做样本数据才可使用, 在内插时其偏差较纬差加权法小, 外推时当待推算位置距离最近基台站纬度差超过3° 时, 偏差明显小于纬差加权法。

综上, 回归分析法在一定的使用条件下具有可靠性, 可以在某些缺失日变数据的情况下起到较好的补充数据的作用。

The authors have declared that no competing interests exist.

参考文献
[1] 单汝俭, 金国, 曾志成. 局部地区地磁日变及拟合方法研究[J]. 长春地质学院学报, 1990, 20(3): 315-322. [本文引用:1]
[2] 边刚, 刘雁春, 卞光浪, . 海洋磁力测量中多站地磁日变改正值计算方法研究[J]. 地球物理学报, 2009, 52(10): 2613-2618. [本文引用:1]
[3] 卞光浪, 刘雁春, 翟国君, . 基于纬差加权法的海洋磁力测量多站地磁日变改正值计算[J]. 测绘科学, 2010, 35(3): 118-120. [本文引用:1]
[4] 时立文. SPSS 19. 0统计分析从入门到精通[M]. 北京: 清华大学出版社, 2012. [本文引用:1]
[5] GB/T13909-92. 海洋调查规范海洋地质地球物理调查[S]. 北京: 中国标准出版社, 1993. [本文引用:1]
[6] 管志宁. 地磁场与磁力勘探[M]. 北京: 地质出版社, 2005. [本文引用:1]
[7] 郭建华, 薛典军. 多台站地磁日变校正方法研究及应用[J]. 地球学报, 1999, 20(s1): 932-937. [本文引用:1]
[8] 刘天佑, 陈国新. 海磁日变资料的处理[J]. 石油地球物理勘探, 1987, 22(4): 454-460. [本文引用:1]
[9] 潘鸿, 张小宇, 吴勇民. 应用统计学[M]. 北京: 人民邮电出版社, 2011. [本文引用:1]
[10] 王磊, 边刚, 任来平, . 时差对海洋磁力测量地磁日变改正的影响分析[J]. 海洋测绘, 2011, 31(6): 39-41. [本文引用:1]
[11] 卞光浪, 翟国君, 刘雁春, . 海洋磁力测量中地磁日变站有效控制范围确定[J]. 地球物理学进展, 2010, 25(3): 817-822. [本文引用:1]
[12] 徐行, 廖开训, 盛堰. 海底地磁日变观测站的设计与应用[J]. 海洋测绘, 2005, 25(1): 67-69. [本文引用:1]
[13] 徐行, 廖开训, 陈邦彦, . 多台站地磁日变观测数据对远海磁测经度的影响分析[J]. 海洋测绘, 2007, 27(1): 38-40. [本文引用:1]