基于SMOTE-LSTM算法的测井岩性识别研究

doi:10.11720/wtyht.2025.1492

[1]

许振浩, 马文, 李术才, 等.

岩性识别:方法、现状及智能化发展趋势

[J]. 地质论评, 2022, 68(6):2290-2304.

[本文引用: 1]

Xu

Z H

, Ma

W

, Li

S C

, et al.

Lithology identification: Method,research status and intelligent development trend

[J]. Geological Review, 2022, 68(6):2290-2304.

[本文引用: 1]

[2]

安鹏, 曹丹平.

基于深度学习的测井岩性识别方法研究与应用

[J]. 地球物理学进展, 2018, 33(3):1029-1034.

[本文引用: 1]

An

P

, Cao

D P

.

Research and application of logging lithology identification based on deep learning

[J]. Progress in Geophysics, 2018, 33(3):1029-1034.

[本文引用: 1]

[3]

Antariksa

G

, Muammar

R

, Lee

J

.

Performance evaluation of machine learning-based classification with rock-physics analysis of geological lithofacies in Tarakan Basin,Indonesia

[J]. Journal of Petroleum Science and Engineering, 2022, 208: 109250.

[本文引用: 1]

[4]

范宜仁, 黄隆基, 代诗华.

交会图技术在火山岩岩性与裂缝识别中的应用

[J]. 测井技术, 1999(1):53-56,64.

[本文引用: 1]

Fan

Y R

, Huang

L J

, Dai

S H

.

Application of crossplot technique to the determination of lithology composition and fracture identification of igneous rock

[J]. Well Logging Technology, 1999(1):53-56,64.

[本文引用: 1]

[5]

Moscatelli

M

, Piscitelli

S

, Piro

S

, et al.

Integrated geological and geophysical investigations to characterize the anthropic layer of the Palatine hill and Roman Forum

[J]. Bulletin of Earthquake Engineering, 2014, 12(3):1319-1338.

[本文引用: 1]

[6]

Sun

J J

, Li

Y G

.

Multidomain petrophysically constrained inversion and geology differentiation using guided fuzzy c-means clustering

[J]. Geophysics, 2015, 80(4):ID1-ID18.

[本文引用: 1]

[7]

张永刚.

地震波阻抗反演技术的现状和发展

[J]. 石油物探, 2002, 41(4):385-390.

[本文引用: 1]

Zhang

Y G

.

The present and future of wave impedance inversion technique

[J]. Geophysical Prospecting for Petroleum, 2002, 41(4):385-390.

[本文引用: 1]

[8]

Liu

W

, Du

W F

, Guo

Y L

, et al.

Lithology prediction method of coal-bearing reservoir based on stochastic seismic inversion and Bayesian classification:A case study on Ordos Basin

[J]. Journal Geophysics Engineering, 2022, 19(3):494-510.

[本文引用: 1]

[9]

匡立春, 刘合, 任义丽, 等.

人工智能在石油勘探开发领域的应用现状与发展趋势

[J]. 石油勘探与开发, 2021, 48(1):1-11.

[本文引用: 1]

Kuang

L C

, Liu

H

, Ren

Y L

, et al.

Application and development trend of artificial intelligence in petroleum exploration and development

[J]. Petroleum Exploration and Development, 2021, 48(1):1-11.

[本文引用: 1]

[10]

毋雪雁, 王水花, 张煜东.

K最近邻算法理论与应用综述

[J]. 计算机工程与应用, 2017, 53(21):1-7.

[本文引用: 1]

Wu

X Y

, Wang

S H

, Zhang

Y D

.

Survey on theory and application of K-Nearest-neighbors algorithm

[J]. Computer Engineering and Applications, 2017, 53(21):1-7.

[本文引用: 1]

[11]

Wang

X D

, Yang

S C

, Zhao

Y F

, et al.

Lithology identification using an optimized KNN clustering method based on entropy-weighed cosine distance in Mesozoic strata of Gaoqing field,Jiyang depression

[J]. Journal of Petroleum Science and Engineering, 2018, 166:157-174.

[本文引用: 1]

[12]

吕红燕, 冯倩.

随机森林算法研究综述

[J]. 河北省科学院学报, 2019, 36(3):37-41.

[本文引用: 1]

Lyu

H Y

, Feng

Q

.

A review of random forests algorithm

[J]. Journal of the Hebei Academy of Science, 2019, 36(3):37-41.

[本文引用: 1]

[13]

Xi

Y T

, Mohamed Taha

A M

, Hu

A Q

, et al.

Accuracy comparison of various remote sensing data in lithological classification based on random forest algorithm

[J]. Geocarto International, 2022, 37(26):14451-14479.

[本文引用: 1]

[14]

丁世飞, 齐丙娟, 谭红艳.

支持向量机理论与算法研究综述

[J]. 电子科技大学学报, 2011, 40(1):2-10.

[本文引用: 1]

Ding

S F

, Qi

B J

, Tan

H Y

.

An overview on theory and algorithm of support vector machines

[J]. Journal of University of Electronic Science and Technology of China, 2011, 40(1):2-10.

[本文引用: 1]

[15]

朱怡翔, 石广仁.

火山岩岩性的支持向量机识别

[J]. 石油学报, 2013, 34 (2):312-322.

[本文引用: 1]

Zhu

Y X

, Shi

G R

.

identification of lithologic characteristics of volcanic rocks by support vector machine

[J]. Acta PetroleiI Sinica, 2013, 34 (2):312-322.

[本文引用: 1]

[16]

李占山, 刘兆赓.

基于XGBoost的特征选择算法

[J]. 通信学报, 2019, 40(10):101-108.

[本文引用: 1]

Li

Z S

, Liu

Z G

.

Feature selection algorithm based on XGBoost

[J]. Journal on Communications, 2019, 40(10):101-108.

[本文引用: 1]

[17]

闫星宇, 顾汉明, 肖逸飞, 等.

XGBoost算法在致密砂岩气储层测井解释中的应用

[J]. 石油地球物理勘探, 2019, 54(2):447-455,241.

[本文引用: 1]

Yan

X Y

, Gu

H M

, Xiao

Y F

, et al.

XGBoost algorithm applied in the interpretation of tight-sand gas reservoir on well logging data

[J]. Oil Geophysical Prospecting, 2019, 54(2):447-455,241.

[本文引用: 1]

[18]

苏高利, 邓芳萍.

论基于MATLAB语言的BP神经网络的改进算法

[J]. 科技通报, 2003, 19(2):130-135.

[本文引用: 1]

Su

G L

, Deng

F P

.

On the improving backpropagation algorithms of the neural networks based on MATLAB language:A review

[J]. Bulletin of Science and Technology, 2003, 19(2):130-135.

[本文引用: 1]

[19]

Luo

H

, Lai

F Q

, Dong

Z

, et al.

A lithology identification method for continental shale oil reservoir based on BP neural network

[J]. Journal of Geophysics and Engineering, 2018, 15(3):895-908.

[本文引用: 1]

[20]

刘武生, 康世虎, 贾立城, 等.

二连盆地中部古河道砂岩型铀矿成矿特征

[J]. 铀矿地质, 2013, 29(6):328-335.

[本文引用: 1]

Liu

W S

, Kang

S H

, Jia

L C

, et al.

Characteristics of paleo-valley sandstone-type uranium mineralization in the middle of erlian basin

[J]. Uranium Geology, 2013, 29(6):328-335.

[本文引用: 1]

[21]

樊嵘, 孟大志, 徐大舜.

统计相关性分析方法研究进展

[J]. 数学建模及其应用, 2014, 3(1):1-12.

[本文引用: 1]

Fan

R

, Meng

D Z

, Xu

D S

.

Survey of research process on statistical correlation analysis

[J]. Mathematical Modeling and Its Applications, 2014, 3(1):1-12.

[本文引用: 1]

[22]

Fernandez

A

, Garcia

S

, Herrera

F

, et al.

SMOTE for learning from imbalanced data:Progress and challenges,marking the 15-year anniversary

[J]. Journal of Artificial Intelligence Research, 2018, 61:863-905.

[本文引用: 1]

[23]

Gers

F A

, Schmidhuber

J

, Cummins

F

.

Learning to forget:Continual prediction with LSTM

[J]. Neural Computation, 2000, 12(10):2451-2471.

[本文引用: 1]

[24]

Yu

Y

, Si

X S

, Hu

C H

, et al.

A review of recurrent neural networks:LSTM cells and network architectures

[J]. Neural Computation, 2019, 31(7):1235-1270.

[本文引用: 1]

[25]

刘建伟, 宋志妍.

循环神经网络研究综述

[J]. 控制与决策, 2022, 37(11):2753-2768.

[本文引用: 1]

Liu

J W

, Song

Z Y

.

Overview of recurrent neural networks

[J]. Control and Decision, 2022, 37(11):2753-2768.

[本文引用: 1]

[26]

Milligan

G W

, Cooper

M C

.

A study of standardization of variables in cluster analysis

[J]. Journal of Classification, 1988, 5(2):181-204.

[本文引用: 1]

岩性识别:方法、现状及智能化发展趋势

1

2022

... 岩性识别是认识地下空间、开发地质资源的一项基础性工作^[1],以往岩性识别主要依赖于钻孔取样、岩矿测试和人为鉴定,虽然识别结果可靠,但成本高、效率低、主观性强^[2].利用测井技术可高效获取与岩性相关的电阻率、声波、自然伽马等地球物理数据,并建立多源地球物理测井数据的高效解译技术,是实现岩性低成本识别的重要途径.目前常用的基于地球物理数据的岩性识别方法包括:岩石物理方程法^[3]、交会图技术^[4]、克里格空间插值法^[5]、数据反演法^[6].但由于地球物理属性与岩性之间关系复杂,例如电阻率受岩性影响的同时,也受含水率、黏土含量等因素的干扰,上述方法在岩性解译过程中往往存在多解性问题^[7-8]. ...

岩性识别:方法、现状及智能化发展趋势

1

2022

... 岩性识别是认识地下空间、开发地质资源的一项基础性工作^[1],以往岩性识别主要依赖于钻孔取样、岩矿测试和人为鉴定,虽然识别结果可靠,但成本高、效率低、主观性强^[2].利用测井技术可高效获取与岩性相关的电阻率、声波、自然伽马等地球物理数据,并建立多源地球物理测井数据的高效解译技术,是实现岩性低成本识别的重要途径.目前常用的基于地球物理数据的岩性识别方法包括:岩石物理方程法^[3]、交会图技术^[4]、克里格空间插值法^[5]、数据反演法^[6].但由于地球物理属性与岩性之间关系复杂,例如电阻率受岩性影响的同时,也受含水率、黏土含量等因素的干扰,上述方法在岩性解译过程中往往存在多解性问题^[7-8]. ...

基于深度学习的测井岩性识别方法研究与应用

1

2018

... 岩性识别是认识地下空间、开发地质资源的一项基础性工作^[1],以往岩性识别主要依赖于钻孔取样、岩矿测试和人为鉴定,虽然识别结果可靠,但成本高、效率低、主观性强^[2].利用测井技术可高效获取与岩性相关的电阻率、声波、自然伽马等地球物理数据,并建立多源地球物理测井数据的高效解译技术,是实现岩性低成本识别的重要途径.目前常用的基于地球物理数据的岩性识别方法包括:岩石物理方程法^[3]、交会图技术^[4]、克里格空间插值法^[5]、数据反演法^[6].但由于地球物理属性与岩性之间关系复杂,例如电阻率受岩性影响的同时,也受含水率、黏土含量等因素的干扰,上述方法在岩性解译过程中往往存在多解性问题^[7-8]. ...

基于深度学习的测井岩性识别方法研究与应用

1

2018

... 岩性识别是认识地下空间、开发地质资源的一项基础性工作^[1],以往岩性识别主要依赖于钻孔取样、岩矿测试和人为鉴定,虽然识别结果可靠,但成本高、效率低、主观性强^[2].利用测井技术可高效获取与岩性相关的电阻率、声波、自然伽马等地球物理数据,并建立多源地球物理测井数据的高效解译技术,是实现岩性低成本识别的重要途径.目前常用的基于地球物理数据的岩性识别方法包括:岩石物理方程法^[3]、交会图技术^[4]、克里格空间插值法^[5]、数据反演法^[6].但由于地球物理属性与岩性之间关系复杂,例如电阻率受岩性影响的同时,也受含水率、黏土含量等因素的干扰,上述方法在岩性解译过程中往往存在多解性问题^[7-8]. ...

Performance evaluation of machine learning-based classification with rock-physics analysis of geological lithofacies in Tarakan Basin,Indonesia

1

2022

... 岩性识别是认识地下空间、开发地质资源的一项基础性工作^[1],以往岩性识别主要依赖于钻孔取样、岩矿测试和人为鉴定,虽然识别结果可靠,但成本高、效率低、主观性强^[2].利用测井技术可高效获取与岩性相关的电阻率、声波、自然伽马等地球物理数据,并建立多源地球物理测井数据的高效解译技术,是实现岩性低成本识别的重要途径.目前常用的基于地球物理数据的岩性识别方法包括:岩石物理方程法^[3]、交会图技术^[4]、克里格空间插值法^[5]、数据反演法^[6].但由于地球物理属性与岩性之间关系复杂,例如电阻率受岩性影响的同时,也受含水率、黏土含量等因素的干扰,上述方法在岩性解译过程中往往存在多解性问题^[7-8]. ...

交会图技术在火山岩岩性与裂缝识别中的应用

1

1999

... 岩性识别是认识地下空间、开发地质资源的一项基础性工作^[1],以往岩性识别主要依赖于钻孔取样、岩矿测试和人为鉴定,虽然识别结果可靠,但成本高、效率低、主观性强^[2].利用测井技术可高效获取与岩性相关的电阻率、声波、自然伽马等地球物理数据,并建立多源地球物理测井数据的高效解译技术,是实现岩性低成本识别的重要途径.目前常用的基于地球物理数据的岩性识别方法包括:岩石物理方程法^[3]、交会图技术^[4]、克里格空间插值法^[5]、数据反演法^[6].但由于地球物理属性与岩性之间关系复杂,例如电阻率受岩性影响的同时,也受含水率、黏土含量等因素的干扰,上述方法在岩性解译过程中往往存在多解性问题^[7-8]. ...

交会图技术在火山岩岩性与裂缝识别中的应用

1

1999

... 岩性识别是认识地下空间、开发地质资源的一项基础性工作^[1],以往岩性识别主要依赖于钻孔取样、岩矿测试和人为鉴定,虽然识别结果可靠,但成本高、效率低、主观性强^[2].利用测井技术可高效获取与岩性相关的电阻率、声波、自然伽马等地球物理数据,并建立多源地球物理测井数据的高效解译技术,是实现岩性低成本识别的重要途径.目前常用的基于地球物理数据的岩性识别方法包括:岩石物理方程法^[3]、交会图技术^[4]、克里格空间插值法^[5]、数据反演法^[6].但由于地球物理属性与岩性之间关系复杂,例如电阻率受岩性影响的同时,也受含水率、黏土含量等因素的干扰,上述方法在岩性解译过程中往往存在多解性问题^[7-8]. ...

Integrated geological and geophysical investigations to characterize the anthropic layer of the Palatine hill and Roman Forum

1

2014

... 岩性识别是认识地下空间、开发地质资源的一项基础性工作^[1],以往岩性识别主要依赖于钻孔取样、岩矿测试和人为鉴定,虽然识别结果可靠,但成本高、效率低、主观性强^[2].利用测井技术可高效获取与岩性相关的电阻率、声波、自然伽马等地球物理数据,并建立多源地球物理测井数据的高效解译技术,是实现岩性低成本识别的重要途径.目前常用的基于地球物理数据的岩性识别方法包括:岩石物理方程法^[3]、交会图技术^[4]、克里格空间插值法^[5]、数据反演法^[6].但由于地球物理属性与岩性之间关系复杂,例如电阻率受岩性影响的同时,也受含水率、黏土含量等因素的干扰,上述方法在岩性解译过程中往往存在多解性问题^[7-8]. ...

Multidomain petrophysically constrained inversion and geology differentiation using guided fuzzy c-means clustering

1

2015

... 岩性识别是认识地下空间、开发地质资源的一项基础性工作^[1],以往岩性识别主要依赖于钻孔取样、岩矿测试和人为鉴定,虽然识别结果可靠,但成本高、效率低、主观性强^[2].利用测井技术可高效获取与岩性相关的电阻率、声波、自然伽马等地球物理数据,并建立多源地球物理测井数据的高效解译技术,是实现岩性低成本识别的重要途径.目前常用的基于地球物理数据的岩性识别方法包括:岩石物理方程法^[3]、交会图技术^[4]、克里格空间插值法^[5]、数据反演法^[6].但由于地球物理属性与岩性之间关系复杂,例如电阻率受岩性影响的同时,也受含水率、黏土含量等因素的干扰,上述方法在岩性解译过程中往往存在多解性问题^[7-8]. ...

地震波阻抗反演技术的现状和发展

1

2002

... 岩性识别是认识地下空间、开发地质资源的一项基础性工作^[1],以往岩性识别主要依赖于钻孔取样、岩矿测试和人为鉴定,虽然识别结果可靠,但成本高、效率低、主观性强^[2].利用测井技术可高效获取与岩性相关的电阻率、声波、自然伽马等地球物理数据,并建立多源地球物理测井数据的高效解译技术,是实现岩性低成本识别的重要途径.目前常用的基于地球物理数据的岩性识别方法包括:岩石物理方程法^[3]、交会图技术^[4]、克里格空间插值法^[5]、数据反演法^[6].但由于地球物理属性与岩性之间关系复杂,例如电阻率受岩性影响的同时,也受含水率、黏土含量等因素的干扰,上述方法在岩性解译过程中往往存在多解性问题^[7-8]. ...

地震波阻抗反演技术的现状和发展

1

2002

... 岩性识别是认识地下空间、开发地质资源的一项基础性工作^[1],以往岩性识别主要依赖于钻孔取样、岩矿测试和人为鉴定,虽然识别结果可靠,但成本高、效率低、主观性强^[2].利用测井技术可高效获取与岩性相关的电阻率、声波、自然伽马等地球物理数据,并建立多源地球物理测井数据的高效解译技术,是实现岩性低成本识别的重要途径.目前常用的基于地球物理数据的岩性识别方法包括:岩石物理方程法^[3]、交会图技术^[4]、克里格空间插值法^[5]、数据反演法^[6].但由于地球物理属性与岩性之间关系复杂,例如电阻率受岩性影响的同时,也受含水率、黏土含量等因素的干扰,上述方法在岩性解译过程中往往存在多解性问题^[7-8]. ...

Lithology prediction method of coal-bearing reservoir based on stochastic seismic inversion and Bayesian classification:A case study on Ordos Basin

1

2022

... 岩性识别是认识地下空间、开发地质资源的一项基础性工作^[1],以往岩性识别主要依赖于钻孔取样、岩矿测试和人为鉴定,虽然识别结果可靠,但成本高、效率低、主观性强^[2].利用测井技术可高效获取与岩性相关的电阻率、声波、自然伽马等地球物理数据,并建立多源地球物理测井数据的高效解译技术,是实现岩性低成本识别的重要途径.目前常用的基于地球物理数据的岩性识别方法包括:岩石物理方程法^[3]、交会图技术^[4]、克里格空间插值法^[5]、数据反演法^[6].但由于地球物理属性与岩性之间关系复杂,例如电阻率受岩性影响的同时,也受含水率、黏土含量等因素的干扰,上述方法在岩性解译过程中往往存在多解性问题^[7-8]. ...

人工智能在石油勘探开发领域的应用现状与发展趋势

1

2021

... 机器学习方法采用多层非线性计算单元,表达高度非线性输入数据与输出数据之间关系^[9],可以促进多源地球物理数据的有机融合,可有效应对岩性识别的多解性问题.目前已用于岩性识别的机器学习算法主要有:KNN(聚类算法)、RF(随机森林算法)、SVM(支持向量机算法)、XGBoost(极端梯度提升树算法)、BP(反向传播神经网络算法).KNN算法作为一种基于距离的监督学习方法,在分类和回归任务中都有着良好的预测效果^[10].其中,基于加权余弦距离的KNN聚类方法^[11],是通过将数据属性和模型属性集成到算法模型中,整体预测精度较基线算法提升近10%.RF算法则以其训练速度快、泛化误差小的特点,在基于多光谱数据的出露岩性预测中得到81.8%的分类精度^[12-13].但在高维空间,面对不同地质测井特征,RF算法稳定性明显低于SVM算法,SVM算法通过核函数捕捉复杂的非线性边界和离群数据,可有效识别不同岩性的细微差异^[14],特别在基于SVM算法的岩性识别模型解决火山岩储层岩层预测问题时,界面分辨能力显著提升,识别平均相对误差绝对值为6.3%^[15].XGBoost算法采用加权投票机制,通过迭代优化提高预测精度,并在计算速度和内存效率方面实现显著改进.算法在处理大规模岩性数据集时展现优异的鲁棒性^[16],在致密砂岩气储层测井高效分类计算中,精度达到84.6%^[17].BP神经网络模型特点在于自动提取并优化特征表示,融合多模态数据,实现端到端的学习过程.模型在复杂数据的抽象特征学习方面展现出独特优势^[18],尤其在陆相页岩地层岩性识别中,预测准确率可达80%^[19]. ...

人工智能在石油勘探开发领域的应用现状与发展趋势

1

2021

... 机器学习方法采用多层非线性计算单元,表达高度非线性输入数据与输出数据之间关系^[9],可以促进多源地球物理数据的有机融合,可有效应对岩性识别的多解性问题.目前已用于岩性识别的机器学习算法主要有:KNN(聚类算法)、RF(随机森林算法)、SVM(支持向量机算法)、XGBoost(极端梯度提升树算法)、BP(反向传播神经网络算法).KNN算法作为一种基于距离的监督学习方法,在分类和回归任务中都有着良好的预测效果^[10].其中,基于加权余弦距离的KNN聚类方法^[11],是通过将数据属性和模型属性集成到算法模型中,整体预测精度较基线算法提升近10%.RF算法则以其训练速度快、泛化误差小的特点,在基于多光谱数据的出露岩性预测中得到81.8%的分类精度^[12-13].但在高维空间,面对不同地质测井特征,RF算法稳定性明显低于SVM算法,SVM算法通过核函数捕捉复杂的非线性边界和离群数据,可有效识别不同岩性的细微差异^[14],特别在基于SVM算法的岩性识别模型解决火山岩储层岩层预测问题时,界面分辨能力显著提升,识别平均相对误差绝对值为6.3%^[15].XGBoost算法采用加权投票机制,通过迭代优化提高预测精度,并在计算速度和内存效率方面实现显著改进.算法在处理大规模岩性数据集时展现优异的鲁棒性^[16],在致密砂岩气储层测井高效分类计算中,精度达到84.6%^[17].BP神经网络模型特点在于自动提取并优化特征表示,融合多模态数据,实现端到端的学习过程.模型在复杂数据的抽象特征学习方面展现出独特优势^[18],尤其在陆相页岩地层岩性识别中,预测准确率可达80%^[19]. ...

K最近邻算法理论与应用综述

1

2017

... 机器学习方法采用多层非线性计算单元,表达高度非线性输入数据与输出数据之间关系^[9],可以促进多源地球物理数据的有机融合,可有效应对岩性识别的多解性问题.目前已用于岩性识别的机器学习算法主要有:KNN(聚类算法)、RF(随机森林算法)、SVM(支持向量机算法)、XGBoost(极端梯度提升树算法)、BP(反向传播神经网络算法).KNN算法作为一种基于距离的监督学习方法,在分类和回归任务中都有着良好的预测效果^[10].其中,基于加权余弦距离的KNN聚类方法^[11],是通过将数据属性和模型属性集成到算法模型中,整体预测精度较基线算法提升近10%.RF算法则以其训练速度快、泛化误差小的特点,在基于多光谱数据的出露岩性预测中得到81.8%的分类精度^[12-13].但在高维空间,面对不同地质测井特征,RF算法稳定性明显低于SVM算法,SVM算法通过核函数捕捉复杂的非线性边界和离群数据,可有效识别不同岩性的细微差异^[14],特别在基于SVM算法的岩性识别模型解决火山岩储层岩层预测问题时,界面分辨能力显著提升,识别平均相对误差绝对值为6.3%^[15].XGBoost算法采用加权投票机制,通过迭代优化提高预测精度,并在计算速度和内存效率方面实现显著改进.算法在处理大规模岩性数据集时展现优异的鲁棒性^[16],在致密砂岩气储层测井高效分类计算中,精度达到84.6%^[17].BP神经网络模型特点在于自动提取并优化特征表示,融合多模态数据,实现端到端的学习过程.模型在复杂数据的抽象特征学习方面展现出独特优势^[18],尤其在陆相页岩地层岩性识别中,预测准确率可达80%^[19]. ...

K最近邻算法理论与应用综述

1

2017

... 机器学习方法采用多层非线性计算单元,表达高度非线性输入数据与输出数据之间关系^[9],可以促进多源地球物理数据的有机融合,可有效应对岩性识别的多解性问题.目前已用于岩性识别的机器学习算法主要有:KNN(聚类算法)、RF(随机森林算法)、SVM(支持向量机算法)、XGBoost(极端梯度提升树算法)、BP(反向传播神经网络算法).KNN算法作为一种基于距离的监督学习方法,在分类和回归任务中都有着良好的预测效果^[10].其中,基于加权余弦距离的KNN聚类方法^[11],是通过将数据属性和模型属性集成到算法模型中,整体预测精度较基线算法提升近10%.RF算法则以其训练速度快、泛化误差小的特点,在基于多光谱数据的出露岩性预测中得到81.8%的分类精度^[12-13].但在高维空间,面对不同地质测井特征,RF算法稳定性明显低于SVM算法,SVM算法通过核函数捕捉复杂的非线性边界和离群数据,可有效识别不同岩性的细微差异^[14],特别在基于SVM算法的岩性识别模型解决火山岩储层岩层预测问题时,界面分辨能力显著提升,识别平均相对误差绝对值为6.3%^[15].XGBoost算法采用加权投票机制,通过迭代优化提高预测精度,并在计算速度和内存效率方面实现显著改进.算法在处理大规模岩性数据集时展现优异的鲁棒性^[16],在致密砂岩气储层测井高效分类计算中,精度达到84.6%^[17].BP神经网络模型特点在于自动提取并优化特征表示,融合多模态数据,实现端到端的学习过程.模型在复杂数据的抽象特征学习方面展现出独特优势^[18],尤其在陆相页岩地层岩性识别中,预测准确率可达80%^[19]. ...

Lithology identification using an optimized KNN clustering method based on entropy-weighed cosine distance in Mesozoic strata of Gaoqing field,Jiyang depression

1

2018

... 机器学习方法采用多层非线性计算单元,表达高度非线性输入数据与输出数据之间关系^[9],可以促进多源地球物理数据的有机融合,可有效应对岩性识别的多解性问题.目前已用于岩性识别的机器学习算法主要有:KNN(聚类算法)、RF(随机森林算法)、SVM(支持向量机算法)、XGBoost(极端梯度提升树算法)、BP(反向传播神经网络算法).KNN算法作为一种基于距离的监督学习方法,在分类和回归任务中都有着良好的预测效果^[10].其中,基于加权余弦距离的KNN聚类方法^[11],是通过将数据属性和模型属性集成到算法模型中,整体预测精度较基线算法提升近10%.RF算法则以其训练速度快、泛化误差小的特点,在基于多光谱数据的出露岩性预测中得到81.8%的分类精度^[12-13].但在高维空间,面对不同地质测井特征,RF算法稳定性明显低于SVM算法,SVM算法通过核函数捕捉复杂的非线性边界和离群数据,可有效识别不同岩性的细微差异^[14],特别在基于SVM算法的岩性识别模型解决火山岩储层岩层预测问题时,界面分辨能力显著提升,识别平均相对误差绝对值为6.3%^[15].XGBoost算法采用加权投票机制,通过迭代优化提高预测精度,并在计算速度和内存效率方面实现显著改进.算法在处理大规模岩性数据集时展现优异的鲁棒性^[16],在致密砂岩气储层测井高效分类计算中,精度达到84.6%^[17].BP神经网络模型特点在于自动提取并优化特征表示,融合多模态数据,实现端到端的学习过程.模型在复杂数据的抽象特征学习方面展现出独特优势^[18],尤其在陆相页岩地层岩性识别中,预测准确率可达80%^[19]. ...

随机森林算法研究综述

1

2019

... 机器学习方法采用多层非线性计算单元,表达高度非线性输入数据与输出数据之间关系^[9],可以促进多源地球物理数据的有机融合,可有效应对岩性识别的多解性问题.目前已用于岩性识别的机器学习算法主要有:KNN(聚类算法)、RF(随机森林算法)、SVM(支持向量机算法)、XGBoost(极端梯度提升树算法)、BP(反向传播神经网络算法).KNN算法作为一种基于距离的监督学习方法,在分类和回归任务中都有着良好的预测效果^[10].其中,基于加权余弦距离的KNN聚类方法^[11],是通过将数据属性和模型属性集成到算法模型中,整体预测精度较基线算法提升近10%.RF算法则以其训练速度快、泛化误差小的特点,在基于多光谱数据的出露岩性预测中得到81.8%的分类精度^[12-13].但在高维空间,面对不同地质测井特征,RF算法稳定性明显低于SVM算法,SVM算法通过核函数捕捉复杂的非线性边界和离群数据,可有效识别不同岩性的细微差异^[14],特别在基于SVM算法的岩性识别模型解决火山岩储层岩层预测问题时,界面分辨能力显著提升,识别平均相对误差绝对值为6.3%^[15].XGBoost算法采用加权投票机制,通过迭代优化提高预测精度,并在计算速度和内存效率方面实现显著改进.算法在处理大规模岩性数据集时展现优异的鲁棒性^[16],在致密砂岩气储层测井高效分类计算中,精度达到84.6%^[17].BP神经网络模型特点在于自动提取并优化特征表示,融合多模态数据,实现端到端的学习过程.模型在复杂数据的抽象特征学习方面展现出独特优势^[18],尤其在陆相页岩地层岩性识别中,预测准确率可达80%^[19]. ...

随机森林算法研究综述

1

2019

... 机器学习方法采用多层非线性计算单元,表达高度非线性输入数据与输出数据之间关系^[9],可以促进多源地球物理数据的有机融合,可有效应对岩性识别的多解性问题.目前已用于岩性识别的机器学习算法主要有:KNN(聚类算法)、RF(随机森林算法)、SVM(支持向量机算法)、XGBoost(极端梯度提升树算法)、BP(反向传播神经网络算法).KNN算法作为一种基于距离的监督学习方法,在分类和回归任务中都有着良好的预测效果^[10].其中,基于加权余弦距离的KNN聚类方法^[11],是通过将数据属性和模型属性集成到算法模型中,整体预测精度较基线算法提升近10%.RF算法则以其训练速度快、泛化误差小的特点,在基于多光谱数据的出露岩性预测中得到81.8%的分类精度^[12-13].但在高维空间,面对不同地质测井特征,RF算法稳定性明显低于SVM算法,SVM算法通过核函数捕捉复杂的非线性边界和离群数据,可有效识别不同岩性的细微差异^[14],特别在基于SVM算法的岩性识别模型解决火山岩储层岩层预测问题时,界面分辨能力显著提升,识别平均相对误差绝对值为6.3%^[15].XGBoost算法采用加权投票机制,通过迭代优化提高预测精度,并在计算速度和内存效率方面实现显著改进.算法在处理大规模岩性数据集时展现优异的鲁棒性^[16],在致密砂岩气储层测井高效分类计算中,精度达到84.6%^[17].BP神经网络模型特点在于自动提取并优化特征表示,融合多模态数据,实现端到端的学习过程.模型在复杂数据的抽象特征学习方面展现出独特优势^[18],尤其在陆相页岩地层岩性识别中,预测准确率可达80%^[19]. ...

Accuracy comparison of various remote sensing data in lithological classification based on random forest algorithm

1

2022

... 机器学习方法采用多层非线性计算单元,表达高度非线性输入数据与输出数据之间关系^[9],可以促进多源地球物理数据的有机融合,可有效应对岩性识别的多解性问题.目前已用于岩性识别的机器学习算法主要有:KNN(聚类算法)、RF(随机森林算法)、SVM(支持向量机算法)、XGBoost(极端梯度提升树算法)、BP(反向传播神经网络算法).KNN算法作为一种基于距离的监督学习方法,在分类和回归任务中都有着良好的预测效果^[10].其中,基于加权余弦距离的KNN聚类方法^[11],是通过将数据属性和模型属性集成到算法模型中,整体预测精度较基线算法提升近10%.RF算法则以其训练速度快、泛化误差小的特点,在基于多光谱数据的出露岩性预测中得到81.8%的分类精度^[12-13].但在高维空间,面对不同地质测井特征,RF算法稳定性明显低于SVM算法,SVM算法通过核函数捕捉复杂的非线性边界和离群数据,可有效识别不同岩性的细微差异^[14],特别在基于SVM算法的岩性识别模型解决火山岩储层岩层预测问题时,界面分辨能力显著提升,识别平均相对误差绝对值为6.3%^[15].XGBoost算法采用加权投票机制,通过迭代优化提高预测精度,并在计算速度和内存效率方面实现显著改进.算法在处理大规模岩性数据集时展现优异的鲁棒性^[16],在致密砂岩气储层测井高效分类计算中,精度达到84.6%^[17].BP神经网络模型特点在于自动提取并优化特征表示,融合多模态数据,实现端到端的学习过程.模型在复杂数据的抽象特征学习方面展现出独特优势^[18],尤其在陆相页岩地层岩性识别中,预测准确率可达80%^[19]. ...

支持向量机理论与算法研究综述

1

2011

... 机器学习方法采用多层非线性计算单元,表达高度非线性输入数据与输出数据之间关系^[9],可以促进多源地球物理数据的有机融合,可有效应对岩性识别的多解性问题.目前已用于岩性识别的机器学习算法主要有:KNN(聚类算法)、RF(随机森林算法)、SVM(支持向量机算法)、XGBoost(极端梯度提升树算法)、BP(反向传播神经网络算法).KNN算法作为一种基于距离的监督学习方法,在分类和回归任务中都有着良好的预测效果^[10].其中,基于加权余弦距离的KNN聚类方法^[11],是通过将数据属性和模型属性集成到算法模型中,整体预测精度较基线算法提升近10%.RF算法则以其训练速度快、泛化误差小的特点,在基于多光谱数据的出露岩性预测中得到81.8%的分类精度^[12-13].但在高维空间,面对不同地质测井特征,RF算法稳定性明显低于SVM算法,SVM算法通过核函数捕捉复杂的非线性边界和离群数据,可有效识别不同岩性的细微差异^[14],特别在基于SVM算法的岩性识别模型解决火山岩储层岩层预测问题时,界面分辨能力显著提升,识别平均相对误差绝对值为6.3%^[15].XGBoost算法采用加权投票机制,通过迭代优化提高预测精度,并在计算速度和内存效率方面实现显著改进.算法在处理大规模岩性数据集时展现优异的鲁棒性^[16],在致密砂岩气储层测井高效分类计算中,精度达到84.6%^[17].BP神经网络模型特点在于自动提取并优化特征表示,融合多模态数据,实现端到端的学习过程.模型在复杂数据的抽象特征学习方面展现出独特优势^[18],尤其在陆相页岩地层岩性识别中,预测准确率可达80%^[19]. ...

支持向量机理论与算法研究综述

1

2011

... 机器学习方法采用多层非线性计算单元,表达高度非线性输入数据与输出数据之间关系^[9],可以促进多源地球物理数据的有机融合,可有效应对岩性识别的多解性问题.目前已用于岩性识别的机器学习算法主要有:KNN(聚类算法)、RF(随机森林算法)、SVM(支持向量机算法)、XGBoost(极端梯度提升树算法)、BP(反向传播神经网络算法).KNN算法作为一种基于距离的监督学习方法,在分类和回归任务中都有着良好的预测效果^[10].其中,基于加权余弦距离的KNN聚类方法^[11],是通过将数据属性和模型属性集成到算法模型中,整体预测精度较基线算法提升近10%.RF算法则以其训练速度快、泛化误差小的特点,在基于多光谱数据的出露岩性预测中得到81.8%的分类精度^[12-13].但在高维空间,面对不同地质测井特征,RF算法稳定性明显低于SVM算法,SVM算法通过核函数捕捉复杂的非线性边界和离群数据,可有效识别不同岩性的细微差异^[14],特别在基于SVM算法的岩性识别模型解决火山岩储层岩层预测问题时,界面分辨能力显著提升,识别平均相对误差绝对值为6.3%^[15].XGBoost算法采用加权投票机制,通过迭代优化提高预测精度,并在计算速度和内存效率方面实现显著改进.算法在处理大规模岩性数据集时展现优异的鲁棒性^[16],在致密砂岩气储层测井高效分类计算中,精度达到84.6%^[17].BP神经网络模型特点在于自动提取并优化特征表示,融合多模态数据,实现端到端的学习过程.模型在复杂数据的抽象特征学习方面展现出独特优势^[18],尤其在陆相页岩地层岩性识别中,预测准确率可达80%^[19]. ...

火山岩岩性的支持向量机识别

1

2013

... 机器学习方法采用多层非线性计算单元,表达高度非线性输入数据与输出数据之间关系^[9],可以促进多源地球物理数据的有机融合,可有效应对岩性识别的多解性问题.目前已用于岩性识别的机器学习算法主要有:KNN(聚类算法)、RF(随机森林算法)、SVM(支持向量机算法)、XGBoost(极端梯度提升树算法)、BP(反向传播神经网络算法).KNN算法作为一种基于距离的监督学习方法,在分类和回归任务中都有着良好的预测效果^[10].其中,基于加权余弦距离的KNN聚类方法^[11],是通过将数据属性和模型属性集成到算法模型中,整体预测精度较基线算法提升近10%.RF算法则以其训练速度快、泛化误差小的特点,在基于多光谱数据的出露岩性预测中得到81.8%的分类精度^[12-13].但在高维空间,面对不同地质测井特征,RF算法稳定性明显低于SVM算法,SVM算法通过核函数捕捉复杂的非线性边界和离群数据,可有效识别不同岩性的细微差异^[14],特别在基于SVM算法的岩性识别模型解决火山岩储层岩层预测问题时,界面分辨能力显著提升,识别平均相对误差绝对值为6.3%^[15].XGBoost算法采用加权投票机制,通过迭代优化提高预测精度,并在计算速度和内存效率方面实现显著改进.算法在处理大规模岩性数据集时展现优异的鲁棒性^[16],在致密砂岩气储层测井高效分类计算中,精度达到84.6%^[17].BP神经网络模型特点在于自动提取并优化特征表示,融合多模态数据,实现端到端的学习过程.模型在复杂数据的抽象特征学习方面展现出独特优势^[18],尤其在陆相页岩地层岩性识别中,预测准确率可达80%^[19]. ...

火山岩岩性的支持向量机识别

1

2013

... 机器学习方法采用多层非线性计算单元,表达高度非线性输入数据与输出数据之间关系^[9],可以促进多源地球物理数据的有机融合,可有效应对岩性识别的多解性问题.目前已用于岩性识别的机器学习算法主要有:KNN(聚类算法)、RF(随机森林算法)、SVM(支持向量机算法)、XGBoost(极端梯度提升树算法)、BP(反向传播神经网络算法).KNN算法作为一种基于距离的监督学习方法,在分类和回归任务中都有着良好的预测效果^[10].其中,基于加权余弦距离的KNN聚类方法^[11],是通过将数据属性和模型属性集成到算法模型中,整体预测精度较基线算法提升近10%.RF算法则以其训练速度快、泛化误差小的特点,在基于多光谱数据的出露岩性预测中得到81.8%的分类精度^[12-13].但在高维空间,面对不同地质测井特征,RF算法稳定性明显低于SVM算法,SVM算法通过核函数捕捉复杂的非线性边界和离群数据,可有效识别不同岩性的细微差异^[14],特别在基于SVM算法的岩性识别模型解决火山岩储层岩层预测问题时,界面分辨能力显著提升,识别平均相对误差绝对值为6.3%^[15].XGBoost算法采用加权投票机制,通过迭代优化提高预测精度,并在计算速度和内存效率方面实现显著改进.算法在处理大规模岩性数据集时展现优异的鲁棒性^[16],在致密砂岩气储层测井高效分类计算中,精度达到84.6%^[17].BP神经网络模型特点在于自动提取并优化特征表示,融合多模态数据,实现端到端的学习过程.模型在复杂数据的抽象特征学习方面展现出独特优势^[18],尤其在陆相页岩地层岩性识别中,预测准确率可达80%^[19]. ...

基于XGBoost的特征选择算法

1

2019

... 机器学习方法采用多层非线性计算单元,表达高度非线性输入数据与输出数据之间关系^[9],可以促进多源地球物理数据的有机融合,可有效应对岩性识别的多解性问题.目前已用于岩性识别的机器学习算法主要有:KNN(聚类算法)、RF(随机森林算法)、SVM(支持向量机算法)、XGBoost(极端梯度提升树算法)、BP(反向传播神经网络算法).KNN算法作为一种基于距离的监督学习方法,在分类和回归任务中都有着良好的预测效果^[10].其中,基于加权余弦距离的KNN聚类方法^[11],是通过将数据属性和模型属性集成到算法模型中,整体预测精度较基线算法提升近10%.RF算法则以其训练速度快、泛化误差小的特点,在基于多光谱数据的出露岩性预测中得到81.8%的分类精度^[12-13].但在高维空间,面对不同地质测井特征,RF算法稳定性明显低于SVM算法,SVM算法通过核函数捕捉复杂的非线性边界和离群数据,可有效识别不同岩性的细微差异^[14],特别在基于SVM算法的岩性识别模型解决火山岩储层岩层预测问题时,界面分辨能力显著提升,识别平均相对误差绝对值为6.3%^[15].XGBoost算法采用加权投票机制,通过迭代优化提高预测精度,并在计算速度和内存效率方面实现显著改进.算法在处理大规模岩性数据集时展现优异的鲁棒性^[16],在致密砂岩气储层测井高效分类计算中,精度达到84.6%^[17].BP神经网络模型特点在于自动提取并优化特征表示,融合多模态数据,实现端到端的学习过程.模型在复杂数据的抽象特征学习方面展现出独特优势^[18],尤其在陆相页岩地层岩性识别中,预测准确率可达80%^[19]. ...

基于XGBoost的特征选择算法

1

2019

... 机器学习方法采用多层非线性计算单元,表达高度非线性输入数据与输出数据之间关系^[9],可以促进多源地球物理数据的有机融合,可有效应对岩性识别的多解性问题.目前已用于岩性识别的机器学习算法主要有:KNN(聚类算法)、RF(随机森林算法)、SVM(支持向量机算法)、XGBoost(极端梯度提升树算法)、BP(反向传播神经网络算法).KNN算法作为一种基于距离的监督学习方法,在分类和回归任务中都有着良好的预测效果^[10].其中,基于加权余弦距离的KNN聚类方法^[11],是通过将数据属性和模型属性集成到算法模型中,整体预测精度较基线算法提升近10%.RF算法则以其训练速度快、泛化误差小的特点,在基于多光谱数据的出露岩性预测中得到81.8%的分类精度^[12-13].但在高维空间,面对不同地质测井特征,RF算法稳定性明显低于SVM算法,SVM算法通过核函数捕捉复杂的非线性边界和离群数据,可有效识别不同岩性的细微差异^[14],特别在基于SVM算法的岩性识别模型解决火山岩储层岩层预测问题时,界面分辨能力显著提升,识别平均相对误差绝对值为6.3%^[15].XGBoost算法采用加权投票机制,通过迭代优化提高预测精度,并在计算速度和内存效率方面实现显著改进.算法在处理大规模岩性数据集时展现优异的鲁棒性^[16],在致密砂岩气储层测井高效分类计算中,精度达到84.6%^[17].BP神经网络模型特点在于自动提取并优化特征表示,融合多模态数据,实现端到端的学习过程.模型在复杂数据的抽象特征学习方面展现出独特优势^[18],尤其在陆相页岩地层岩性识别中,预测准确率可达80%^[19]. ...

XGBoost算法在致密砂岩气储层测井解释中的应用

1

2019

... 机器学习方法采用多层非线性计算单元,表达高度非线性输入数据与输出数据之间关系^[9],可以促进多源地球物理数据的有机融合,可有效应对岩性识别的多解性问题.目前已用于岩性识别的机器学习算法主要有:KNN(聚类算法)、RF(随机森林算法)、SVM(支持向量机算法)、XGBoost(极端梯度提升树算法)、BP(反向传播神经网络算法).KNN算法作为一种基于距离的监督学习方法,在分类和回归任务中都有着良好的预测效果^[10].其中,基于加权余弦距离的KNN聚类方法^[11],是通过将数据属性和模型属性集成到算法模型中,整体预测精度较基线算法提升近10%.RF算法则以其训练速度快、泛化误差小的特点,在基于多光谱数据的出露岩性预测中得到81.8%的分类精度^[12-13].但在高维空间,面对不同地质测井特征,RF算法稳定性明显低于SVM算法,SVM算法通过核函数捕捉复杂的非线性边界和离群数据,可有效识别不同岩性的细微差异^[14],特别在基于SVM算法的岩性识别模型解决火山岩储层岩层预测问题时,界面分辨能力显著提升,识别平均相对误差绝对值为6.3%^[15].XGBoost算法采用加权投票机制,通过迭代优化提高预测精度,并在计算速度和内存效率方面实现显著改进.算法在处理大规模岩性数据集时展现优异的鲁棒性^[16],在致密砂岩气储层测井高效分类计算中,精度达到84.6%^[17].BP神经网络模型特点在于自动提取并优化特征表示,融合多模态数据,实现端到端的学习过程.模型在复杂数据的抽象特征学习方面展现出独特优势^[18],尤其在陆相页岩地层岩性识别中,预测准确率可达80%^[19]. ...

XGBoost算法在致密砂岩气储层测井解释中的应用

1

2019

... 机器学习方法采用多层非线性计算单元,表达高度非线性输入数据与输出数据之间关系^[9],可以促进多源地球物理数据的有机融合,可有效应对岩性识别的多解性问题.目前已用于岩性识别的机器学习算法主要有:KNN(聚类算法)、RF(随机森林算法)、SVM(支持向量机算法)、XGBoost(极端梯度提升树算法)、BP(反向传播神经网络算法).KNN算法作为一种基于距离的监督学习方法,在分类和回归任务中都有着良好的预测效果^[10].其中,基于加权余弦距离的KNN聚类方法^[11],是通过将数据属性和模型属性集成到算法模型中,整体预测精度较基线算法提升近10%.RF算法则以其训练速度快、泛化误差小的特点,在基于多光谱数据的出露岩性预测中得到81.8%的分类精度^[12-13].但在高维空间,面对不同地质测井特征,RF算法稳定性明显低于SVM算法,SVM算法通过核函数捕捉复杂的非线性边界和离群数据,可有效识别不同岩性的细微差异^[14],特别在基于SVM算法的岩性识别模型解决火山岩储层岩层预测问题时,界面分辨能力显著提升,识别平均相对误差绝对值为6.3%^[15].XGBoost算法采用加权投票机制,通过迭代优化提高预测精度,并在计算速度和内存效率方面实现显著改进.算法在处理大规模岩性数据集时展现优异的鲁棒性^[16],在致密砂岩气储层测井高效分类计算中,精度达到84.6%^[17].BP神经网络模型特点在于自动提取并优化特征表示,融合多模态数据,实现端到端的学习过程.模型在复杂数据的抽象特征学习方面展现出独特优势^[18],尤其在陆相页岩地层岩性识别中,预测准确率可达80%^[19]. ...

论基于MATLAB语言的BP神经网络的改进算法

1

2003

... 机器学习方法采用多层非线性计算单元,表达高度非线性输入数据与输出数据之间关系^[9],可以促进多源地球物理数据的有机融合,可有效应对岩性识别的多解性问题.目前已用于岩性识别的机器学习算法主要有:KNN(聚类算法)、RF(随机森林算法)、SVM(支持向量机算法)、XGBoost(极端梯度提升树算法)、BP(反向传播神经网络算法).KNN算法作为一种基于距离的监督学习方法,在分类和回归任务中都有着良好的预测效果^[10].其中,基于加权余弦距离的KNN聚类方法^[11],是通过将数据属性和模型属性集成到算法模型中,整体预测精度较基线算法提升近10%.RF算法则以其训练速度快、泛化误差小的特点,在基于多光谱数据的出露岩性预测中得到81.8%的分类精度^[12-13].但在高维空间,面对不同地质测井特征,RF算法稳定性明显低于SVM算法,SVM算法通过核函数捕捉复杂的非线性边界和离群数据,可有效识别不同岩性的细微差异^[14],特别在基于SVM算法的岩性识别模型解决火山岩储层岩层预测问题时,界面分辨能力显著提升,识别平均相对误差绝对值为6.3%^[15].XGBoost算法采用加权投票机制,通过迭代优化提高预测精度,并在计算速度和内存效率方面实现显著改进.算法在处理大规模岩性数据集时展现优异的鲁棒性^[16],在致密砂岩气储层测井高效分类计算中,精度达到84.6%^[17].BP神经网络模型特点在于自动提取并优化特征表示,融合多模态数据,实现端到端的学习过程.模型在复杂数据的抽象特征学习方面展现出独特优势^[18],尤其在陆相页岩地层岩性识别中,预测准确率可达80%^[19]. ...

论基于MATLAB语言的BP神经网络的改进算法

1

2003

... 机器学习方法采用多层非线性计算单元,表达高度非线性输入数据与输出数据之间关系^[9],可以促进多源地球物理数据的有机融合,可有效应对岩性识别的多解性问题.目前已用于岩性识别的机器学习算法主要有:KNN(聚类算法)、RF(随机森林算法)、SVM(支持向量机算法)、XGBoost(极端梯度提升树算法)、BP(反向传播神经网络算法).KNN算法作为一种基于距离的监督学习方法,在分类和回归任务中都有着良好的预测效果^[10].其中,基于加权余弦距离的KNN聚类方法^[11],是通过将数据属性和模型属性集成到算法模型中,整体预测精度较基线算法提升近10%.RF算法则以其训练速度快、泛化误差小的特点,在基于多光谱数据的出露岩性预测中得到81.8%的分类精度^[12-13].但在高维空间,面对不同地质测井特征,RF算法稳定性明显低于SVM算法,SVM算法通过核函数捕捉复杂的非线性边界和离群数据,可有效识别不同岩性的细微差异^[14],特别在基于SVM算法的岩性识别模型解决火山岩储层岩层预测问题时,界面分辨能力显著提升,识别平均相对误差绝对值为6.3%^[15].XGBoost算法采用加权投票机制,通过迭代优化提高预测精度,并在计算速度和内存效率方面实现显著改进.算法在处理大规模岩性数据集时展现优异的鲁棒性^[16],在致密砂岩气储层测井高效分类计算中,精度达到84.6%^[17].BP神经网络模型特点在于自动提取并优化特征表示,融合多模态数据,实现端到端的学习过程.模型在复杂数据的抽象特征学习方面展现出独特优势^[18],尤其在陆相页岩地层岩性识别中,预测准确率可达80%^[19]. ...

A lithology identification method for continental shale oil reservoir based on BP neural network

1

2018

... 机器学习方法采用多层非线性计算单元,表达高度非线性输入数据与输出数据之间关系^[9],可以促进多源地球物理数据的有机融合,可有效应对岩性识别的多解性问题.目前已用于岩性识别的机器学习算法主要有:KNN(聚类算法)、RF(随机森林算法)、SVM(支持向量机算法)、XGBoost(极端梯度提升树算法)、BP(反向传播神经网络算法).KNN算法作为一种基于距离的监督学习方法,在分类和回归任务中都有着良好的预测效果^[10].其中,基于加权余弦距离的KNN聚类方法^[11],是通过将数据属性和模型属性集成到算法模型中,整体预测精度较基线算法提升近10%.RF算法则以其训练速度快、泛化误差小的特点,在基于多光谱数据的出露岩性预测中得到81.8%的分类精度^[12-13].但在高维空间,面对不同地质测井特征,RF算法稳定性明显低于SVM算法,SVM算法通过核函数捕捉复杂的非线性边界和离群数据,可有效识别不同岩性的细微差异^[14],特别在基于SVM算法的岩性识别模型解决火山岩储层岩层预测问题时,界面分辨能力显著提升,识别平均相对误差绝对值为6.3%^[15].XGBoost算法采用加权投票机制,通过迭代优化提高预测精度,并在计算速度和内存效率方面实现显著改进.算法在处理大规模岩性数据集时展现优异的鲁棒性^[16],在致密砂岩气储层测井高效分类计算中,精度达到84.6%^[17].BP神经网络模型特点在于自动提取并优化特征表示,融合多模态数据,实现端到端的学习过程.模型在复杂数据的抽象特征学习方面展现出独特优势^[18],尤其在陆相页岩地层岩性识别中,预测准确率可达80%^[19]. ...

二连盆地中部古河道砂岩型铀矿成矿特征

1

2013

... 图1研究区位于二连盆地中北部次级构造单元马尼特坳陷内,坳陷内为沉积陆相碎屑沉积构造,在沉积盖层中发育的地层主要包括白垩系,古、新近系和第四系^[20].研究区岩性组合主要由泥岩、粉砂质泥岩、含砾细砂岩、含砾中砂岩、砂砾岩组成,含矿含水层厚度在20~60 m之间,矿砂厚度比例特征为1∶10.为优化模型训练效果,依据研究区钻孔岩性记录设计三级岩性分类方案:1类:泥岩和粉砂质泥岩;2类:含砾细砂岩;3类:砂砾岩和含砾中砂岩.对于同一深度区间同时出现多种岩性的情况,采用优势原则进行分类,即根据各类岩性所占比例的大小,将区间划分为占比最高的岩性类别. ...

二连盆地中部古河道砂岩型铀矿成矿特征

1

2013

... 图1研究区位于二连盆地中北部次级构造单元马尼特坳陷内,坳陷内为沉积陆相碎屑沉积构造,在沉积盖层中发育的地层主要包括白垩系,古、新近系和第四系^[20].研究区岩性组合主要由泥岩、粉砂质泥岩、含砾细砂岩、含砾中砂岩、砂砾岩组成,含矿含水层厚度在20~60 m之间,矿砂厚度比例特征为1∶10.为优化模型训练效果,依据研究区钻孔岩性记录设计三级岩性分类方案:1类:泥岩和粉砂质泥岩;2类:含砾细砂岩;3类:砂砾岩和含砾中砂岩.对于同一深度区间同时出现多种岩性的情况,采用优势原则进行分类,即根据各类岩性所占比例的大小,将区间划分为占比最高的岩性类别. ...

统计相关性分析方法研究进展

1

2014

... 本次选择9口具有相对完备的测井数据和岩性编录的勘探井进行模型训练,测井曲线包括自然伽马、电导率、自然电位和井径.选取BC-10号测井作为模型测试集进行测试.各钻孔均包含岩性编录和测井数据(图1b),测井数据的深度间隔为0.1 m,深度均分布在0~120 m,岩性编录按照0.1 m间隔进行统计,在模型训练过程中训练集与验证集数据量的采样比设置为7∶2.同时,模型采用Pearson相关系数量化两个连续变量之间的线性关系强度和方向^[21],图1中自然电位与井径的相关性最好,相关系数为0.39;电导率和自然电位的相关系数为-0.22,表明测井数据之间具有一定的相关性,同时,离散数据与复杂环境下岩层实际环境的关系将更密切. ...

统计相关性分析方法研究进展

1

2014

... 本次选择9口具有相对完备的测井数据和岩性编录的勘探井进行模型训练,测井曲线包括自然伽马、电导率、自然电位和井径.选取BC-10号测井作为模型测试集进行测试.各钻孔均包含岩性编录和测井数据(图1b),测井数据的深度间隔为0.1 m,深度均分布在0~120 m,岩性编录按照0.1 m间隔进行统计,在模型训练过程中训练集与验证集数据量的采样比设置为7∶2.同时,模型采用Pearson相关系数量化两个连续变量之间的线性关系强度和方向^[21],图1中自然电位与井径的相关性最好,相关系数为0.39;电导率和自然电位的相关系数为-0.22,表明测井数据之间具有一定的相关性,同时,离散数据与复杂环境下岩层实际环境的关系将更密切. ...

SMOTE for learning from imbalanced data:Progress and challenges,marking the 15-year anniversary

1

2018

... 在处理分类问题中数据不平衡现象时,SMOTE算法存在独特优势.算法通过生成合成样本来扩充少数类别的数据量,从而有效改善训练数据中类别分布失衡问题,显著提升模型对少数类别的识别准确率^[22].算法采用K值邻近原理,运行机制如图2所示:①数据选取:从测井参数的少数类样本集合中随机抽取一个目标样本;②邻域确定:以目标样本为中心,搜索并确定K个最近邻样本;③样本配对:从已确定的K个邻近样本中随机选择一个配对样本;④数据合成:在目标样本与配对样本间连线上,随机选取一点作为新生成的合成数据点. ...

Learning to forget:Continual prediction with LSTM

1

2000

... LSTM算法创新性引入单元状态机制实现信息的选择性保留和遗忘,从而有效捕捉数据中的长期依赖关系^[23].LSTM算法的结构由遗忘门、输入门、记忆细胞和输出门4个关键组件构成^[24].在每个时间步,LSTM接收当前的测井参数数据输入以及上一时间步的隐藏状态.首先,通过遗忘门对当前时间步的输入和上一时间步的隐藏状态进行处理,决定哪些旧的测井参数信息应该被遗忘;接着输入门利用sigmoid层决定哪些新的测井参数信息值得被接纳,同时tanh层生成新的候选记忆细胞状态,两者结合后更新到记忆细胞中;最后,输出门基于当前时间步的输入、上一时间步的隐藏状态以及更新后的记忆细胞,通过sigmoid层决定哪些信息应被输出为当前时间步的岩性预测隐藏状态^[25].这一过程在整个测井参数序列数据中迭代进行,从而有效地捕捉测井参数与岩性之间的长期依赖关系,实现精准的岩性预测.2.1.3 SMOTE-LSTM模型结构及超参数优化 ...

A review of recurrent neural networks:LSTM cells and network architectures

1

2019

... LSTM算法创新性引入单元状态机制实现信息的选择性保留和遗忘,从而有效捕捉数据中的长期依赖关系^[23].LSTM算法的结构由遗忘门、输入门、记忆细胞和输出门4个关键组件构成^[24].在每个时间步,LSTM接收当前的测井参数数据输入以及上一时间步的隐藏状态.首先,通过遗忘门对当前时间步的输入和上一时间步的隐藏状态进行处理,决定哪些旧的测井参数信息应该被遗忘;接着输入门利用sigmoid层决定哪些新的测井参数信息值得被接纳,同时tanh层生成新的候选记忆细胞状态,两者结合后更新到记忆细胞中;最后,输出门基于当前时间步的输入、上一时间步的隐藏状态以及更新后的记忆细胞,通过sigmoid层决定哪些信息应被输出为当前时间步的岩性预测隐藏状态^[25].这一过程在整个测井参数序列数据中迭代进行,从而有效地捕捉测井参数与岩性之间的长期依赖关系,实现精准的岩性预测.2.1.3 SMOTE-LSTM模型结构及超参数优化 ...

循环神经网络研究综述

1

2022

... LSTM算法创新性引入单元状态机制实现信息的选择性保留和遗忘,从而有效捕捉数据中的长期依赖关系^[23].LSTM算法的结构由遗忘门、输入门、记忆细胞和输出门4个关键组件构成^[24].在每个时间步,LSTM接收当前的测井参数数据输入以及上一时间步的隐藏状态.首先,通过遗忘门对当前时间步的输入和上一时间步的隐藏状态进行处理,决定哪些旧的测井参数信息应该被遗忘;接着输入门利用sigmoid层决定哪些新的测井参数信息值得被接纳,同时tanh层生成新的候选记忆细胞状态,两者结合后更新到记忆细胞中;最后,输出门基于当前时间步的输入、上一时间步的隐藏状态以及更新后的记忆细胞,通过sigmoid层决定哪些信息应被输出为当前时间步的岩性预测隐藏状态^[25].这一过程在整个测井参数序列数据中迭代进行,从而有效地捕捉测井参数与岩性之间的长期依赖关系,实现精准的岩性预测.2.1.3 SMOTE-LSTM模型结构及超参数优化 ...

循环神经网络研究综述

1

2022

... LSTM算法创新性引入单元状态机制实现信息的选择性保留和遗忘,从而有效捕捉数据中的长期依赖关系^[23].LSTM算法的结构由遗忘门、输入门、记忆细胞和输出门4个关键组件构成^[24].在每个时间步,LSTM接收当前的测井参数数据输入以及上一时间步的隐藏状态.首先,通过遗忘门对当前时间步的输入和上一时间步的隐藏状态进行处理,决定哪些旧的测井参数信息应该被遗忘;接着输入门利用sigmoid层决定哪些新的测井参数信息值得被接纳,同时tanh层生成新的候选记忆细胞状态,两者结合后更新到记忆细胞中;最后,输出门基于当前时间步的输入、上一时间步的隐藏状态以及更新后的记忆细胞,通过sigmoid层决定哪些信息应被输出为当前时间步的岩性预测隐藏状态^[25].这一过程在整个测井参数序列数据中迭代进行,从而有效地捕捉测井参数与岩性之间的长期依赖关系,实现精准的岩性预测.2.1.3 SMOTE-LSTM模型结构及超参数优化 ...

A study of standardization of variables in cluster analysis

1

1988

... 模型以自然伽马、井径、自然电位和电导率4种测井数据为模型输入,岩性数据为模型输出,首先对测井数据进行数据清洗,同时排除未定义数据与离群数据,为确保不同测井数据间,尽管存在量纲不同和数值差异的问题,仍能进行有效的比较和加权处理^[26].研究采用的标准化方法为最大最小归一化方法,将数据映射到[0,1]区间.具体公式为: ...

岩性	精确率/%	准确率/%	数目
泥岩粉砂质泥岩	88	87	267
含砾细砂岩	62	77	167
砂砾岩含砾中砂岩	96	88	425
权重平均	87	85	859

基于SMOTE-LSTM算法的测井岩性识别研究

Log-based lithology identification using the SMOTE-LSTM hybrid model

0 引言

1 研究区概况

图1

2 理论和方法

2.1 SMOTE-LSTM模型

图2

2.1.1 SMOTE算法

2.1.2 LSTM算法

图3

2.2 评估指标

3 结果与讨论

3.1 岩性预测

图4

图5

3.2 方法对比

图6

图7

4 结论

参考文献

原文顺序

文献年度倒序

文中引用次数倒序

被引期刊影响因子

基于SMOTE-LSTM算法的测井岩性识别研究

Log-based lithology identification using the SMOTE-LSTM hybrid model

0 引言

1 研究区概况

图1

2 理论和方法

2.1 SMOTE-LSTM模型

图2

2.1.1 SMOTE算法

2.1.2 LSTM算法

图3

2.2 评估指标

3 结果与讨论

3.1 岩性预测

图4

图5

3.2 方法对比

图6

图7

4 结论

参考文献 View Option 原文顺序 文献年度倒序 文中引用次数倒序 被引期刊影响因子

参考文献

原文顺序

文献年度倒序

文中引用次数倒序

被引期刊影响因子