基于实码加速遗传算法的投影寻踪模型在圈定水系沉积物地球化学异常中的应用——以湖南某铅锌矿床为例
郝立波, 田密, 赵新运, 赵昕, 张瑞森, 谷雪
吉林大学 地球探测科学与技术学院,吉林 长春 130026
通讯作者:田密(1990-),女,博士,从事应用地球化学研究工作。E-mail:tianmi62080608@126.com

作者简介:郝立波(1961-),男,教授,博士生导师,主要从事地球化学研究工作。E-mail:haolb@jlu.edu.cn

摘要

单纯利用成矿元素圈定异常,可能会出现异常与已知矿床不对应的现象。矿化过程伴随着某些微量元素的富集,同时也伴随着一些元素的贫化,将成矿元素与富集及贫化微量元素相结合,可以大大提高地球化学找矿的效果。利用基于实码加速遗传算法的投影寻踪模型将高维数据投影到一维子空间进行分析,既可以得到投影值的大小又可以获得每个元素的权重,在不损失重要信息的同时又可以剔除噪声数据,具有较好的稳健性。通过某铅锌矿床实例研究,发现单纯应用成矿元素圈定异常,会出现某些异常区没有矿床,或者某些矿床并无对应异常的情况,而利用投影值圈定的异常范围与已知矿床吻合得更好,说明投影寻踪方法的分析结果更加突出了一些与成矿有利部位的异常,减少了异常查证面积而没有丢失异常信息。因此,将多元素信息结合,利用基于实码加速遗传算法的投影寻踪模型能够有效处理高维数据并获取重要的信息,能够比较准确地圈定异常区域。

关键词: 水系沉积物; 投影寻踪模型; 地球化学异常; 微量元素; 矿床
中图分类号:P632 文献标志码:A 文章编号:1000-8918(2016)06-1151-06 doi: 10.11720/wtyht.2016.6.15
The application of projection pursuit model combined with RAGA to identifying stream ediment geochemical anomalies: A case study of a Zn-Pb deposit in Hunan Province
HAO Li-Bo, TIAN Mi, ZHAO Xin-Yun, ZHAO Xin, ZHANG Rui-Sen, GU Xue
College of GeoExploration Science and Technology, Jilin University,Changchun 130026, China
Abstract

The anomalies composed of ore-forming elements may not correspond with the known deposits. Some trace elements are accumulated during the mineralization process whereas some elements are depleted. The combination of the ore-forming elements and other trace elements influenced by mineralization may enhance the effect of geochemical exploration. In this study, high-dimensional data were converted into one-dimensional data for analysis by projection pursuit model based on RAGA. The projection values and the weights of elements can be calculated by this method. Moreover, important information will not be lost and the noise data will be deleted. In addition, this method is very robust. By the case study of a Pb-Zn deposit, it is found that some deposits are not in anomaly areas or some deposits do not have corresponding anomalies. However, the ranges of anomalies obtained by this method correspond with the known deposits better. The results of PPC highlights the anomalies associated with the known deposits and, moreover, the anomaly information has not been lost. The projection pursuit model combined with RAGA by using multiple elements performs better on high dimensional data and identifies stream sediment geochemical anomalies effectively and accurately.

Keyword: stream sediment; projection pursuit model; geochemical anomaly; trace element; Zn-Pb deposit

以往进行水系沉积物地球化学勘查时, 人们通常使用成矿元素或者成矿元素与伴生元素相结合的方式圈定异常。实际上, 矿化过程中不可能单纯发生成矿元素及伴生元素的富集, 同时必定伴有某些元素的贫化。由元素的带出而引起的贫化现象已经在众多矿床试验研究中得到证实[1, 2, 3, 4, 5, 6, 7]。成矿过程中元素的富集与贫化是成矿作用的两个方面, 研究表明, 成矿作用过程中发生贫化的元素与发生富集的元素, 都可以很好地指示矿床或矿体的存在, 综合利用富集元素的正异常和贫化元素的负异常能更有效指示出矿化带的产出位置。系列试验结果表明, 矿床中贫化元素在地球化学勘查中也具有一定的指示作用, 与成矿及伴生元素配合使用, 可以对靶区的成矿前景进行更加合理、准确的评价[8]

虽然人们已经认识到, 综合利用富集和贫化元素形成的正、负异常有利于地球化学异常的圈定[9]。但是目前的方法还只是采用单元素圈出正异常或负异常, 综合各个单元素异常的结果来圈定找矿靶区。这种筛选的方法有很大的人为性和客观性, 而且有一些区域可能由次生作用等其他因素导致, 并不是真正的异常, 或者有些异常与矿体并没有实际的联系, 都可能导致错误的判断。因此如何综合利用这些富集及贫化元素数据, 去掉噪声数据, 提取有用信息, 对于水系沉积物地球化学勘查有着重要意义。

投影寻踪(projection pursuit model, 简称PPC模型)是一种可用于高维数据降维分析的方法, 它由Friedman 和Tukey [10]提出, 通过将整体散布程度和局部凝聚程度结合起来形成的新指标来做聚类和分类分析。PPC方法能成功地克服高维数据的“ 维数祸根” 所带来的严重困难, 可以将高维数据投影到一维空间, 再对投影后的一维数据进行分析, 比较不同一维投影结果, 找出最佳的投影。它能排除与数据结构和特征无关的或关系很小的变量的干扰, 能成功地将非正态分布的高维数据投影到一维空间上, 避免权重的人为设定, 不会损失大量有用的偏态信息, 能自动找出数据的内在规律, 因此稳健性较好[11, 12, 13, 14]

笔者拟利用水系沉积物数据的元素富集以及贫化信息, 应用基于实码加速遗传算法的投影寻踪模型, 将高维数据投影到一维子空间上, 寻找出能反映高维数据结构或特征的投影, 以便于更加直观地研究和分析高维数据, 依据投影值的大小来圈定找矿靶区[15]

1 原理及方法
1.1 地质背景的消除

研究表明, 地质背景对水系沉积物中微量元素的含量影响很大[16]。如Th, U等易富集在酸性岩中, 而Cr, Ni等易富集在基性— 超基性岩中。若研究区岩性复杂, 微量元素的原始数据可能只能体现出地质背景的差异, 而伴随着成矿作用产生的富集与贫化信息可能会被地质背景所掩盖。因此在综合评价之前, 有必要对地质背景进行校正[17]。因此, 首先依据文献[18]方法将研究区水系沉积物数据进行分类, 然后将数据进行标准化, 尽量消除岩性背景的影响。

1.2 投影寻踪方法的基本流程

1) 评价指标集的归一化处理

假定x'(i, j)(i=1, 2, …, n; j=1, 2, …, m), n是样点数; m是样点的指标数。x(i, j)是第j个指标的第i个样点的值, 对于在矿化过程中发生富集的元素:

x(i, j)=x'(x, j)-xmin(j)xmax(j)-xmin(j);

对于在矿化过程中发生贫化的元素:

x(i, j)=xmax(j)-x'(i, j)xmax(j)-xmin(j)

式中, xmax (j)、xmin (j)分别为第j个指标值的最大值和最小值, x(i, j)为指标特征值归一化的序列。

2) 构建投影指标函数Q(a)

PPC法就是把p维数据{x'(i, j)|j=1, 2, …, p}综合成以a={a(1), a(2), …, a(p)}为投影方向的一维投影值z(i):

然后根据{z(i)|i=1, 2, …, n}的一维散布图进行分类与评价。式中, a为单位长度向量。

3) 优化投影指标函数

当各指标值的样本集给定时, 投影指标函数 Q(a)只随着投影的方向a的变化而变化。不同的投影方向反映不同的数据结构特征, 最佳投影方向就是最大可能暴露高维数据某类特征结构的投影方向。因此, 可以通过求解投影指标函数最大化问题来估计最佳投影方向, 即:

最大化目标函数 max:Q(a)=Sz· Dz,

约束条件

这是一个以{a(j)|j=1, 2, …, p}为优化变量的复杂非线性优化问题, 应用基于实数编码的加速遗传算法(RAGA)[19-20]来解决其高维全局寻优问题, 从而可以得到最佳投影方向a

4) 分类与优序排列

由步骤3求得最佳投影方向a后可得到各样本点的投影值z(i)。将z(i)值从小到大排序, 通过某方法(如分形方法, 聚类法或3s检验法)可以得到异常下限, 进而将投影值划分为不同值域, 即可判断元素富集程度, 圈定找矿靶区。

2 应用实例
2.1 研究区地质特征

研究区大地构造位置属华南褶皱系中部, 地处扬子古陆与华夏古陆之间的南岭构造带上(图1)。区域内岩性复杂, 出露地层由老到新有寒武系、泥盆系、石炭系、二叠系、白垩系等。区内大量发育的古生界碳酸盐岩沉积建造和碎屑岩沉积有利于成矿热液的交代及成矿物质的活化、迁移和聚集, 是区内主要的赋矿层位。区域岩浆活动强烈, 岩浆岩发育广泛, 燕山早中期岩浆活动伴随大规模的多金属成矿作用, 是区域内有色金属矿产最为主要的成矿时期[21]

图1 湖南某铅锌矿区地质简要

2.2 结果与讨论

研究区水系沉积物数据(包括主要成矿元素Pb、Zn以及其他微量元素)的统计特征见表1。根据主要矿床的地球化学特征以及相似类型矿床的研究结果, 认为矿体中Co、Cr、Sr、V、P、Zr、La为主要的亏损元素, 其余微量元素均为富集元素。

表1 湖南某铅锌矿区水系沉积物数据描述性统计分析

根据研究区地球化学数据特征, 并结合以往的研究经验, 对数据建立PPC模型。选定父代初始种群规模400, 交叉概率Pc=0.80, 变异概率Pm=0.80, 优秀个体数目为20个, a=0.05, 迭代2次进入加速循环。加速次数为8次, 最佳投影方向a从大到小分别为Pb 0.31, Sb 0.29, F 0.27, Cu 0.27, Ag 0.26, Cd 0.25, Th 0.24, Be 0.23, As 0.23, Nb 0.22, Zn 0.22, Ba 0.21, Mo 0.20, Li 0.17, B 0.16, Zr 0.16, Y 0.14, U 0.14, Bi 0.14, P 0.12, Co 0.09, La 0.09, V 0.09, Sr 0.08, Cr 0.07, Hg 0.06。投影方向a中各分量大小实质上反映了各指标对综合异常值的影响程度, a越大, 说明影响权重越大。

为了便于对比, 对单元素Pb和Zn的原始数据和标准化数据, 以及综合富集及亏损元素而获得的原始数据的投影值和标准化数据的投影值分别取对数, 然后进行3s检验剔除异常值, 采用均值+1.65倍方差作为异常下限, 绘制异常图(图2)。根据研究区矿点与异常的分布范围, 将研究区分为5个区域, 分别为区1、区2、区3、区4和区5。

图2 湖南某铅锌矿区不同方法处理后的异常分布

对于Pb, 原始方法圈定的异常区域2与矿点吻合较好, 区域1次之, 区域3欠佳; 对于Zn, 原始方法圈定的异常区域均没有与矿点完全吻合, 尤其是区域3, 几乎没有在异常图上显示出来。进行地质背景校正后, 异常区3与Pb矿点吻合得更好; 对于Zn, 区2和区3的异常范围均有了改进, 但是区域3的效果并不理想。将原始数据和标准化数据分别经投影寻踪处理, 由图中可以看出, 原始数据的结果很差, 标准化后数据的效果较好。区2异常与矿床(点)已完全吻合, 区1异常范围有了一定的改进, 和已知矿点吻合得更好, 尤其是右下角的两个小矿点已能在异常图上显示出来。区3的效果尤为显著, 许多小矿点均在异常图上显示出来, 找矿效果有了很大的提高。值得注意的是, 前两种方法的结果均显示出较大范围的4号异常区, 而投影寻踪方法将异常区缩到较小的范围, 更突出矿点的位置。

除了前述5个异常区域外, Pb, Zn原始圈定方法还发现了分散于各处的杂乱无章的较小异常区, 而标准化数据投影寻踪方法几乎只保留了面积较大的5号异常区, 该区位于泥盆系地层, 是主要的成矿地层, 因此该异常区可能有较好的成矿远景。无论是异常的形态规模还是分布, 投影寻踪方法的预测结果与实际的矿床(点)、分布的吻合度都要比传统(单元素)方法(无论是原始数据还是标准化数据)的效果好。相比较而言, 投影寻踪方法的分析结果更加突出了一些成矿有利部位的异常, 减少了异常查证面积而没有丢失异常信息。

由此可见, 仅凭单个成矿元素并不能准确地圈定异常区域, 而将多元素结合, 利用基于实码加速遗传算法的投影寻踪模型能够有效处理高维数据并获取重要的信息, 能够比较准确地圈定异常区域。

将最佳投影向量a值由大到小排序并作折线图(图3)。根据折线图的变化趋势并结合实际情况, 以0.2和0.1为分界点(这两处有比较明显的拐点)可将投影元素分为3类:第1类为Pb、Sb、F、Cu、Ag、Cd、Th、Be、As、Nb、Zn、Ba、Mo; 第2类为Li、B、Zr、Y、U、Bi、P; 第3类为Co、La、V、Sr、Cr、Hg。

图3 最佳投影方向向量值分布

第1类元素的向量值比较大, 可能为本区铅锌矿床的主要伴生元素, Pb的权重最大, 而Zn的权重相较于Pb小。之前并没有研究指出Th和Nb是铅锌矿床的主要伴生元素, 但是在本研究区, Th和Nb却是很好的指示元素。第2类元素的权重较低, 但是其仍能在一定程度上指示矿床的位置。第3类元素的向量值最低, 对矿床位置的指示能力最弱。

3 结论

地质背景会影响水系沉积物中微量元素的含量, 进行投影寻踪之前需要将数据进行标准化以消除地质背景的影响。将包括富集以及贫化元素信息的高维数据依据最佳方向投影到一维, 可以使结果便于观察和解释, 能够剔除噪声信息并提取出有价值的信息, 更加准确地圈定异常。投影寻踪模型在水系沉积物地球化学异常综合评价中得以应用, 不仅能得到各个样本的异常值大小, 还可以由优化投影方向反映出各个元素对结果的贡献。

通过实例研究发现, 在异常的形态规模和分布特点等方面, 投影寻踪方法的预测结果要比传统(单元素)方法的效果好。投影寻踪方法的分析结果更加突出了一些成矿有利部位的异常, 减少了异常查证面积而没有丢失异常信息。将多元素信息结合, 利用基于实码加速遗传算法的投影寻踪模型能够有效处理高维数据并获取重要的信息, 能够比较准确地圈定异常区域。在今后的水系沉积物地球化学处理中, 应注意对岩性复杂区域的数据标准化处理以及富集和贫化元素的结合应用。

The authors have declared that no competing interests exist.

参考文献
[1] 季克俭, 王立本, 吕凤翔, . 热液矿床的负晕和地球化学场系[J]. 地质学报, 1992, 66(4): 350-361. [本文引用:1]
[2] 马生明, 朱立新, 刘海良, . 甘肃北山辉铜山铜矿地球化学异常结构研究[J]. 地球学报, 2011, 32(4): 405-412. [本文引用:1]
[3] 朴寿成, 刘树田, 姜寒冰, . 地球化学负异常及其找矿意义[J]. 地质与勘探, 1996, 32(2): 46-50. [本文引用:1]
[4] 孙承辕, 张干. 漠滨金矿区外围地层及矿区围岩中金的负异常及其地球化学意义[J]. 地质与勘探, 1993, 29(3): 47-52. [本文引用:1]
[5] Goldberg I S, Abramson G Y, Los V L. Depletion and enrichment of Primary haloes: their importance in the genesisof and exploration for mineral deposits[J]. Geochemistry: Exploration, Environment, Analysis, 2003, 3(3): 281-293. [本文引用:1]
[6] Robertson I D M, Taylor G F. Depletion haloes infresh rocks surrounding the Cobarorebodies, N. S. W. , Australia: implications for exploration and ore genesis[J]. Journal of Geochemical Exploration, 1987, 27(1-2): 77-101. [本文引用:1]
[7] Shi C Y, Wang C F. Regional geochemical secondary negative anomalies and their significance[J]. Journal of Geochemical Exploration, 1995, 55(1-3): 11-23. [本文引用:1]
[8] 马生明, 朱立新, 唐世新, . 甘肃北山白山堂铜矿外围找矿靶区地球化学评价方法示范[J]. 地球学报, 2013, 34(3): 338-346. [本文引用:1]
[9] 马生明, 朱立新, 刘海良, . 甘肃北山辉铜山铜矿地球化学异常结构研究[J]. 地球学报, 2011, 32(4): 405-412. [本文引用:1]
[10] Friedman J H, Turkey J W. A projection pursuit algorithm forexploratory data analysis[J]. IEEE Trans. On Computer, 1974, 23(9): 881-890. [本文引用:1]
[11] 付强, 赵小勇. 投影寻踪模型原理及其应用[M]. 北京: 科学出版社, 2006, 21-49. [本文引用:1]
[12] 肖凡. 基于RAGA的PPC模型在个旧化探资料处理中的应用研究[D]. 武汉: 中国地质大学, 2008. [本文引用:1]
[13] 金菊良, 张欣莉, 丁晶. 评估洪水灾情等级的投影寻踪模型[J]. 系统工程理论与实践, 2002, 22(2): 140-144. [本文引用:1]
[14] 张军, 梁川, 赵燮京. 基于RAGA的PPC模型在节水灌溉多方案择优中的应用[J]. 中国农村水利水电, 2006(12): 141. [本文引用:1]
[15] Liu C H. The application of PPC model using RAGA in soil quality evaluation[J]. Journal of Heilongjiang Hydraulic Engineering College, 2005, 32(1): 7. [本文引用:1]
[16] 郝立波, 李巍, 陆继龙, . 确定岩性复杂区的地球化学背景与异常的方法[J]. 地质通报, 2007, 26(12): 1531. [本文引用:1]
[17] 赵禹, 赵玉岩, 郝立波, . 利用快速聚类分析分区确定化探背景上限的方法[J]. 物探化探计算技术, 2014, 36(4): 487-491. [本文引用:1]
[18] 焦保权, 白荣杰, 孙淑梅, . 地球化学分区标准化方法在区域化探信息提取中的应用[J]. 物探与化探, 2009, 33(2): 165-169. [本文引用:1]
[19] 金菊良, 杨晓华, 丁晶. 基于实数编码的加速遗传算法[J]. 四川大学学报: 工程科学版, 2000, 32(4): 1-5. [本文引用:1]
[20] 刘慧卿, 张先起, 杨会娟. 基于RAGA的投影寻踪模型在土壤重金属污染评价中的应用[J]. 河南农业科学, 2005, 34(10): 60-63. [本文引用:1]