基于深度兴趣演化网络的成矿预测——以西澳表生钙结岩型铀矿为例
Metallogenic prediction based on the deep interest evolution network: A case study of supergenetic calcrete-hosted uranium deposits in Western Australia
通讯作者: 何剑锋(1977-),男,博士,教授,博导,主要研究方向:智能核信息处理、嵌入式系统应用开发。Email:hjf_10@yeah.net
第一作者:
责任编辑: 王萌
收稿日期: 2024-09-23 修回日期: 2024-11-28
基金资助: |
|
Received: 2024-09-23 Revised: 2024-11-28
近年来,推荐系统算法受到数字地球科学研究领域的关注,有望在成矿预测领域得到广泛应用。海量地学数据中包含着多种语义信息,而在传统的成矿预测研究中并未对其进行充分挖掘。深度兴趣演化网络(deep interest evolution network,DIEN)作为推荐系统算法,对语义信息挖掘充分,可以达到对用户偏好的预测。故本文采用DIEN作为预测模型,根据西澳大利亚政府提供的数据库,选取由解释基岩提取的语义信息作为控矿要素。通过训练模型对研究区进行成矿预测,结果显示92.95%的铀矿点分布在预测图内中高概率区域,并且部分未知区域显示为较高预测概率,在去除部分区域已知铀矿点后重新训练模型,该区域仍显示中高预测概率。表明DIEN对成矿预测研究中语义信息进行了有效挖掘,且模型对于研究区存在较好的预测能力,为成矿预测研究开辟了全新的思路。
关键词:
Recommendation system algorithms, having recently garnered significant attention in the field of digital Earth science, are expected to be widely applied in metallogenic prediction. Traditional metallogenic prediction studies fail to fully mine the various types of semantic information in massive geoscience data. The deep interest evolution network (DIEN), as a recommendation system algorithm, can fully mine semantic information to predict user preferences. Therefore, this study employed the DIEN model as the prediction model and the semantic information extracted from bedrock interpretation as the ore-controlling elements according to the database provided by the Western Australian government. The model was trained to perform metallogenic prediction for the study area. The prediction results indicate that 92.95% of uranium ore occurrences fell within the medium-high probability zone in the prediction map, with some unknown zones also showing high prediction probabilities. After removing known uranium ore occurrences in some zones, the retrained model still yielded medium-high prediction probabilities in these zones. The results suggest that the DIEN can effectively mine semantic information in metallogenic prediction studies, and the DIEN model exhibits strong predictive capacity for the study area, providing a novel approach for metallogenic prediction studies.
Keywords:
本文引用格式
张长江, 何剑锋, 聂逢君, 夏菲, 李卫东, 汪雪元, 张鑫, 钟国韵.
ZHANG Chang-Jiang, HE Jian-Feng, NIE Feng-Jun, XIA Fei, LI Wei-Dong, WANG Xue-Yuan, ZHANG Xin, ZHONG Guo-Yun.
0 引言
1 地质背景
研究区位于西澳大利亚州的中南部,大地构造背景为伊尔冈克拉通,这是澳大利亚最大的太古宙克拉通地块,主要形成于29.4亿~26.3亿年前,由大量以前存在的地块(年代多为32亿~28亿年)增生而成[8]。伊尔冈克拉通主要由1个花岗岩片麻岩地体和3条花岗绿岩带组成(图1),它们形成于不同时代,较老的绿岩带和花岗岩年龄为31亿~29亿年,较年轻的绿岩带与花岗岩年龄为27.5亿~26.5亿年。在岩石类型上,花岗岩和花岗闪长岩类岩石约占70%以上[9]。此外,伊尔冈克拉通上也发育有大量的拉斑玄武岩和科马提火山岩,并经历过多期次的区域变质与变形作用[8-9]。 伊尔冈克拉通地盾是澳大利亚最重要的成矿区,发育有大量金、镍、钽、铁、铜、锌、铂等矿床[10⇓⇓-13]。
图1
伊尔冈北部在白垩纪早期气候潮湿,水系丰富,晚期气候干燥,水系变为盐湖,地形逐步准平原化;在中新世时期又隆起,水系复活,再度发生侵蚀作用,使前期准平原化形成的部分遭到侵蚀,出露基岩,形成新高原。在新高原形成的后期,气候日益干燥,河流的侵蚀能力逐渐减弱,河道逐渐被冲积物填充。此外,该区覆盖了广泛的U丰度达(2~25)×10-6的太古宙花岗质岩石,氧化条件发育到300 m深处,铀转化为铀酰离子复合物,在地下水中横向运移。在地下水位上升到地表5 m以内,二氧化碳的蒸发和流失促进了沉淀,特别是碳酸钙和镁的沉淀。当铀、钒和钾的活性离子浓度积超过钒钾铀矿的溶度积时,钒钾铀化合物在裂缝中或碳酸盐和黏土颗粒之间沉积,发育形成表生钙结岩型铀矿[16⇓⇓⇓⇓-21]。
2 研究方法
图2
在行为序列层,通过向量映射将用户历史行为序列映射为向量,其输出结果作为兴趣抽取层的输入项。在兴趣抽取层采用的是循环神经网络模型GRU(gated recurrent unit),GRU由两个门控单元组成,分别是更新门和重置门(图3)。
图3
GRU有4个公式,公式之间相互关联,不能独立使用,公式如下所示:
其中:ut是更新门控向量;rt是复位门控向量;
推荐系统模型中多数采用损失函数负对数似然函数来监督整体预测,其公式为:
其中:x∈D,D是大小为N的训练集;y∈{0,1},表示用户是否点击目标;p(x)是网络的输出,即用户点击目标的预测概率。
因Ltarget只包含监督最终预测结果,而历史状态ht无法获得适当的监督,故提出辅助损失来监督历史状态ht的学习,辅助损失公式为:
其中:σ(x1,x2)=
最后的全局损失为:
其中:α为超参数,用于平衡Ltarget和Laux。
在兴趣进化层采用了注意力机制和AUGRU,其中AUGRU由注意力机制和GRU组合而成,组合方式为将GRU的更新门中加入注意力分数。注意力机制和AUGRU的公式如下:
式中:at是注意力分数;
3 实验分析
影响表生钙结岩型铀矿形成的因素众多,而不同控矿要素与矿点之间存在不同程度的关联性,这些关联性是成矿预测的基础。地下岩石矿物的不同种类和密度会引起地球磁力和重力异常,而研究区的成矿模式与花岗岩密切相关;表生钙结岩型铀矿由钒钾铀化合物在地下水流作用下迁移沉积而成,而钍元素化学性质稳定,难以随地下水迁移。故选取研究区磁场总强度、磁场总强度垂直一阶求导、去趋势全球均衡残差重力、去趋势全球均衡残差重力的一阶求导、铀浓度、钍浓度和钾浓度作为控矿要素用于模型预测[20]。此外,研究区的 1:2 500 000解释基岩地质图隐藏着多种语义信息,如基岩类型、岩石类型、地质年龄和地质年代等,而研究区在中新世之后,含铀花岗质岩石在地下水作用下沉积形成铀矿,故这些信息可作为控矿要素。
3.1 数据处理
本文选取了研究区内71个铀矿点,以铀矿点为圆心,选取某一半径圆内的缓冲区赋值为1,表示为成矿区域,其他区域均赋值为0,表示非成矿区域(图4),即图中黄色区域为成矿区域,其他区域为非成矿区域。
图4
由于栅格数据的分辨率不一致,通过GIS软件将磁场总强度、磁场总强度垂直一阶求导、去趋势全球均衡残差重力、去趋势全球均衡残差重力的一阶求导、铀浓度、钍浓度和钾浓度数据统一分辨率(图5)。
图5
图6
图7
图8
图9
图10
图11
3.2 构造数据集
DIEN算法的输入数据分为3个类型:连续数值型、类别型和时间序列型。磁场总强度、磁场总强度垂直一阶求导等栅格数据(图5)为连续数值,可作为连续数值型数据。基岩类型信息和岩石类型信息(图6和图7)具有类别特性,转换得到的栅格数据可作为类别型数据。地层信息和地质年龄信息(图8~图11)具有时间特性,将转换得到的栅格数据进行拼接,可作为时间序列型数据,即起始地层栅格数据和终止地层栅格数据拼接构造为地层时间序列数据,起始地质年龄栅格数据和终止地质年龄栅格数据拼接构造为地质年龄时间序列数据。将研究区划分为1 598×803个空间网格单元,每个空间网格单元对应的数据与推荐系统算法DIEN的用户历史数据具有相似性,均由连续数值型、类别型和时间序列型3种类型数据构成,故可将每个空间网格单元数据作为DIEN模型的输入数据源。
4 结果分析
将数据集按2:1:1划分为训练集、验证集和测试集,训练DIEN模型,图12为模型的损失曲线,当迭代约100次后训练集和验证集的损失值趋于稳定,表明模型在迭代约100次后达到较好的收敛性,即模型对于研究区存在稳定的预测能力。图13为模型迭代360次后测试集的ROC(receiver operating characteristic)曲线,当ROC曲线越接近左上角点时,说明模型具有更好的性能,ROC曲线下的面积为AUC(area under the curve),AUC用以评估模型性能,其取值范围为0~1,越接近1模型性能越好,该模型AUC达到了0.901。图14为模型的AUC曲线,当迭代约200次后训练集和验证集的AUC趋于稳定,表明模型已经达到较好的性能状态,可以准确地预测样本的分类结果。
图12
图13
图14
图15为研究区预测,将预测概率在0.1~0.3之间划为低概率,0.3~0.6之间划为中概率,大于0.6划为高概率,低概率区域包含了7.05%的选取铀矿点,中概率区域包含了15.49%的选取铀矿点,高概率区域包含了77.46%的选取铀矿点,且部分非铀矿点区域呈现中高概率。证明模型对于研究区域的铀矿预测表现良好,并表明部分非铀矿点区域也存在成矿潜力。去除特定部分区域的全部5个选取铀矿点,约占研究区域选取铀矿点的7%,重新训练模型迭代
图15
图16
图16
研究区预测(去除部分区域的选取铀矿点)
Fig.16
Study area prediction (selected uranium sites with some areas removed)
图17
图17
研究区预测(去除30%的选取铀矿点)
Fig.17
Study area prediction (30% of selected uranium deposits are removed)
5 结论
本文通过对研究区域的解释岩基矢量数据分析,提取其包含的语义信息,如基岩类型、岩石类型、地质年龄和地质年代,作为成矿预测的控矿要素,训练模型得到研究区预测图的中高概率区域包含选取的92.95%铀矿点;去除部分区域的已知铀矿点后,重新训练得到的模型对于该部分区域的预测概率仍为中高概率;随机去除30%的铀矿点后,重新训练得到的模型对于研究区的低概率以上区域未见明显变化和缩小;表明研究区的语义信息隐藏着成矿预测研究的有利信息,且DIEN对其进行了有效发掘。
通过DIEN在成矿预测方面的应用,表明推荐系统算法在数字地球科学领域存在应用前景,并且有望在成矿预测领域得到深度的应用。DIEN算法对于成矿预测存在泛化能力,可为其他类型矿床的成矿预测研究提供指引和思路。
参考文献
大数据时代(铀)成矿预测技术方法变革
[J].
Technological and methodological changes of (uranium) mineral resources prediction in big data era
[J].
Yeelirrie uranium deposit in Western Australia
[R].
基于深度学习的深层次矿化信息挖掘与集成
[J].
Deep learning-based mining and integration of deep-level mineralization information
[J].
基于深度学习的推荐系统研究综述
[J].
Survey on deep learning-based recommender systems
[J].
大数据时代矿床学研究发展状况综述
[J].
A review on the development of mineral deposit science in the era of big data
[J].
数学地球科学跨越发展的十年:大数据、人工智能算法正在改变地质学
[J].
The great-leap-forward development of mathematical geoscience during 2010-2019:Big data and artificial intelligence algorithm are changing mathematical geoscience
[J].
西澳大利亚太古代伊尔岗地块的地质情况简介
[J].
Brief introduction to the geological situation of Archean Yilgam block in Western Australia
[J].
赴西澳考察综合报告
[J].
A comprehensive report on the investigation in western Australia
[J].
西澳大利亚中西铁矿区地质特征及找矿标志
[J].
Geological features and exploration indicators of the Midwest iron ore district in western Australia
[J].
澳大利亚铀矿资源现状与勘查开发建议
[J].
Present situation of uranium resources in Australia and suggestions for exploration and development
[J].
Regolith geology of the Yilgarn Craton,Western Australia:implications for exploration
[J].
A guide for mineral exploration through the regolith in the Yilgarn Craton,Western Australia
[J].
Uranium occurrences in calcrete and associated sediments in Western Australia
[R].
GSWA 2009 extended abstracts:Promoting the prospectivity of Western Australia
[R].
澳大利亚内陆古水系中钙结岩和膏结岩岩相的分类和成因及其与钒钾铀矿矿化的关系
[J].
Classification and genesis of calcareous and gypsum lithofacies in the ancient inland water system of Australia and their relationship with the mineralization of vanadium-potassium-uranium deposits
[J].
西澳伊利里含铀钙结岩水文地质环境
[J].
Hydrogeological environment of uranium-bearing calcium nodules in Yili,western Australia
[J].
Mineral systems approach applied to GIS-based 2D-prospectivity modelling of geological regions:Insights from Western Australia
[J].
Fuzzy inference systems for prospectivity modeling of mineral systems and a case-study for prospectivity mapping of surficial Uranium in Yeelirrie Area,Western Australia
[J].
Calcrete-hosted surficial uranium systems in Western Australia:Prospectivity modeling and quantitative estimates of resources.Part 1-Origin of calcrete uranium deposits in surficial environments:A review
[J].
Deep interest evolution network for click-through rate prediction
[J].
/
〈 |
|
〉 |
