Please wait a minute...
E-mail Alert Rss
 
物探与化探  2024, Vol. 48 Issue (2): 489-497    DOI: 10.11720/wtyht.2024.1492
  方法研究·信息处理·仪器研制 本期目录 | 过刊浏览 | 高级检索 |
基于不同机器学习模型的石油测井数据岩性分类对比研究
江丽1(), 张智谟2, 王琦玮3, 封志兵2, 张博程2, 任腾飞2
1.东华理工大学 放射性地质与勘探国防重点学科实验室,江西 南昌 330013
2.东华理工大学 核资源与环境国家重点实验室,江西 南昌 330013
3.中国石油辽河油田辽兴油气开发公司,辽宁 盘锦 124000
Comparative study on lithology classification of oil logging data based on different machine learning models
JIANG Li1(), ZHANG Zhi-Mo2, WANG Qi-Wei3, FENG Zhi-Bing2, ZHANG Bo-Cheng2, REN Teng-Fei2
1. Fundamental Science on Radioactive Geology and Exploration Technology Laboratory,East China University of Technology,Nanchang 330013,China
2. State Key Laboratory of Nuclear Resources and Environment,East China University of Technology,Nanchang 330013,China
3. Liaoxing Oil and Gas Development Company,Petro China Liaohe Oilfield,Panjing 124000,China
全文: PDF(2671 KB)   HTML
输出: BibTeX | EndNote (RIS)      
摘要 

特定的计算工具帮助地质学家识别和分类油井钻探的岩石岩性,降低成本并提高工作效率。机器学习方法集成了大量信息,能够高效地实现模式识别和准确决策。文章将挪威海5口油井进行岩性分类,通过将数据随机分为训练集(70%)和测试集(30%),利用多变量测井参数数据进行训练和验证,对比多层感知器(MLP)、决策树、随机森林和XGboost等模型的应用效果。研究结果显示,XGBoost模型在数据的泛化性方面表现更佳,其准确率为95%;随机森林模型次之,准确率为94%;而多层感知机(MLP)和决策树模型表现出较好的鲁棒性,准确率分别为92%和90%。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
江丽
张智谟
王琦玮
封志兵
张博程
任腾飞
关键词 岩性识别机器学习石油测井XGBoost算法随机森林    
Abstract

Specific computational tools assist geologists in identifying and classifying the lithology of rocks in oil well exploration,reducing costs,and enhancing operational efficiency. Machine learning methods integrate a vast amount of information,enabling efficient pattern recognition and accurate decision-making. This article categorizes the lithology of five oil wells in the Norwegian Sea,randomly dividing the data into a training set (70%) and a test set (30%). Using multivariate well log parameter data for training and validation,the application effectiveness of models such as Multilayer Perceptron (MLP),Decision Tree,Random Forest,and XGBoost is compared. The research results indicate that the XGBoost model outperforms others in terms of data generalization,achieving an accuracy of 95%. The Random Forest model follows with an accuracy of 94%. Meanwhile,Multilayer Perceptron (MLP) and Decision Tree models exhibit good robustness,with accuracies of 92% and 90%,respectively.

Key wordslithology identification    machine learning    oil logging    XGBoost gorithm    random forest
收稿日期: 2023-11-22      修回日期: 2023-12-26      出版日期: 2024-04-20
ZTFLH:  P631  
基金资助:放射性地质与勘探国防重点学科实验室开放基金(2020RGET06);江西省教育厅科学技术研究项目(GJJ220075);中国铀业有限公司—东华理工大学核资源与环境国家重点实验室联合创新基金项目(2023NRE-LH-08);中国核工业地质局生产中科研项目(202311-5);东华理工大学博士科研启动基金项目(DHBK2019087)
作者简介: 江丽(1988-),女,江西临川人,讲师,博士,从事地球物理数据处理教学与研究工作。Email:jianglifzb@163.com
引用本文:   
江丽, 张智谟, 王琦玮, 封志兵, 张博程, 任腾飞. 基于不同机器学习模型的石油测井数据岩性分类对比研究[J]. 物探与化探, 2024, 48(2): 489-497.
JIANG Li, ZHANG Zhi-Mo, WANG Qi-Wei, FENG Zhi-Bing, ZHANG Bo-Cheng, REN Teng-Fei. Comparative study on lithology classification of oil logging data based on different machine learning models. Geophysical and Geochemical Exploration, 2024, 48(2): 489-497.
链接本文:  
https://www.wutanyuhuatan.com/CN/10.11720/wtyht.2024.1492      或      https://www.wutanyuhuatan.com/CN/Y2024/V48/I2/489
Fig.1  三层感知机示意
岩性 统计量 CALI/
(ft·s-1)
RD/
(Ω·m)
RHOB/
(g·cm-3)
GR/
(API)
CN/% PEF/
(mV)
DTC/
(m·s-1)
SP/
(mV)
样本总数



砂岩
平均值 11.51 1.86 2.20 37.96 0.30 5.29 101.91 71.49


5837
最小值 7.45 0.12 1.49 10.61 0.06 1.12 57.04 15.39
最大值 23.70 87.51 2.84 94.13 0.76 34.19 158.18 132.99


泥质
平均值 9.62 1.35 2.32 58.98 0.28 4.71 94.34 92.82


3338

砂岩
最小值 7.45 0.31 1.56 25.40 0.08 1.16 62.60 24.44
最大值 22.28 11.72 2.77 146.75 0.73 27.35 171.05 135.48



页岩
平均值 13.26 1.08 2.10 75.38 0.44 4.10 132.66 69.11


32491
最小值 5.94 0.33 1.43 24.85 -0.05 1.32 7.41 28.90
最大值 25.71 84.12 2.95 804.29 0.80 39.77 230.43 137.08



泥岩
平均值 10.20 3.16 2.46 34.51 0.19 4.10 80.03 99.51


1512
最小值 7.32 0.70 1.62 8.05 0.07 1.32 60.18 22.89
最大值 16.80 13.33 2.64 81.83 0.46 39.77 110.39 122.81



白云岩
平均值 9.53 5.06 2.45 42.59 0.15 4.18 71.61 102.21 98
最小值 8.47 0.90 1.52 21.10 0.06 2.81 54.73 38.61
最大值 15.07 13.13 2.90 82.36 0.40 7.67 117.03 121.94



石灰岩
平均值 11.52 3.65 2.45 22.24 0.18 5.56 76.26 85.46


6222
最小值 7.48 0.39 1.52 5.59 0.001 1.97 40.76 17.69
最大值 23.71 66.42 2.90 126.06 0.62 166.99 167.77 120.68



白垩岩
平均值 11.70 4.12 2.53 16.03 0.12 8.20 66.47 104.60


1924
最小值 7.75 1.15 1.51 5.78 0.03 3.56 54.26 83.06
最大值 14.22 14.04 2.63 33.26 0.33 86.82 81.83 116.41



盐岩
平均值 11.13 13.45 1.91 49.80 0.16 15.95 60.81 127.01


20
最小值 8.67 2.61 1.60 15.79 0.008 11.99 51.28 121.07
最大值 12.66 41.02 2.28 78.28 0.6 21.35 73.23 130.41



凝灰岩
平均值 14.01 0.81 2.19 45.77 0.41 4.12 118.26 62.12


719
最小值 12.23 0.38 1.57 21.31 0.29 2.73 61.40 36.35
最大值 23.31 1.41 2.36 78.12 0.65 9.67 149.06 97.41



煤炭
平均值 8.56 11.22 1.81 46.55 0.48 2.64 114.47 120.64


49
最小值 8.18 2.32 1.42 26.14 0.26 1.29 77.18 113.24
最大值 9.38 27.73 2.58 67.76 0.60 7.01 127.48 128.37
Table 1  不同岩性的测井数据
Fig.2  交叉验证
Fig.3  决策树模型分析岩性混淆矩阵
Fig.4  随机森林模型分析岩性混淆矩阵
岩性 决策树模型 随机森林模型
精确度
×100/%
召回率
×100/%
F1值
×100/%
支持度 精确度
×100/%
召回率
×100/%
F1值
×100/%
支持度
凝灰岩 0.71 0.70 0.70 220 0.87 0.69 0.77 212
砂岩 0.84 0.84 0.84 1702 0.92 0.92 0.92 1807
泥质砂岩 0.70 0.69 0.69 1022 0.84 0.79 0.81 1037
页岩 0.96 0.96 0.96 9695 0.96 0.99 0.97 9588
泥岩 0.78 0.77 0.77 452 0.89 0.88 0.89 451
白云岩 0.53 0.63 0.58 30 0.80 0.53 0.64 30
石灰岩 0.86 0.87 0.86 1915 0.94 0.87 0.91 1822
白垩岩 0.91 0.88 0.89 608 0.95 0.93 0.94 597
岩盐 0.50 0.50 0.50 6 1.00 0.75 0.86 8
煤炭 0.44 0.62 0.52 13 0.82 0.69 0.75 13
准确率 0.90 15663 0.94 15663
宏平均 0.72 0.75 0.73 15663 0.90 0.80 0.85 15663
加权平均 0.90 0.90 0.90 15663 0.94 0.94 0.94 15663
Table 2  决策树和随机森林模型分类报告
Fig.5  MLP模型分析岩性混淆矩阵
Fig.6  XGBoost模型分析岩性混淆矩阵
岩性 编号 MLP模型 XGBoost
精确度/% 召回率/% F1值/% 支持度 精确度/% 召回率/% F1值/% 支持度
凝灰岩 0 0.76 0.61 0.68 222 0.91 0.73 0.81 206
砂岩 1 0.85 0.90 0.87 1771 0.92 0.92 0.92 1775
泥质砂岩 2 0.77 0.76 0.76 1014 0.84 0.81 0.82 993
页岩 3 0.96 0.97 0.96 9764 0.97 0.99 0.98 9670
泥岩 4 0.80 0.73 0.81 464 0.92 0.91 0.91 476
白云岩 5 0.71 0.68 0.69 25 0.78 0.70 0.74 20
石灰岩 6 0.90 0.82 0.86 1807 0.93 0.90 0.91 1856
白垩岩 7 0.86 0.89 0.88 564 0.95 0.89 0.92 638
岩盐 8 0.67 0.50 0.57 8 1.00 0.60 0.75 10
煤炭 9 0.86 0.79 0.83 24 0.93 0.74 0.82 19
准确率 0.92 15563 0.95 15663
宏平均 0.81 0.78 0.79 15663 0.91 0.82 0.86 15663
加权平均 0.92 0.92 0.92 15663 0.95 0.95 0.95 15663
Table 3  MLP和XGBoost模型分类报告
F1值(综合性能)
凝灰岩 砂岩 泥质砂岩 页岩 泥岩 白云岩 石灰岩 白垩岩 盐岩 煤炭
决策树 70% 84% 69% 96% 77% 58% 86% 89% 50% 52%
随机森林 77% 92% 81% 97% 89% 64% 91% 94% 86% 75%
MLP 68% 87% 76% 96% 81% 69% 86% 88% 57% 83%
XGBoost 81% 92% 82% 98% 91% 74% 91% 92% 75% 82%
Table 4  各类岩性F1值
[1] 徐德龙, 李涛, 黄宝华, 等. 利用交会图法识别国外 M 油田岩性与流体类型的研究[J]. 地球物理学进展, 2012, 27(3):1123-1132.
[1] Xu D L, Li T, Huang B H, et al. Research on the identification of the lithology and fluid type of foreign oilfield by using the crossplot method[J]. Progress in Geophysics, 2012, 27(3):1123-1132.
[2] 刘子云, 王向公. 利用概率统计方法判断岩性[J]. 江汉石油学院学报, 1989, 11(2):35-40.
[2] Liu Z Y, Wang X G. Determination of lithology through probability statistics[J]. Journal of Jianghan Petroleum Institute, 1989, 11(2):35-40.
[3] 寻知锋, 余继峰. 聚类和判别分析在测井岩性识别中的应用[J]. 山东科技大学学报:自然科学版, 2008, 27(5):10-13.
[3] Xun Z F, Yu J F. The application of cluster and discriminant analyses in logging lithology recognition[J]. Journal of Shandong University of Science and Technology:Natural Science, 2008, 27(5):10-13.
[4] 关涛. 基于交会图和贝叶斯聚类分析法的岩性识别方法[J]. 科学技术与工程, 2013, 13(4):976-979.
[4] Guan T. Method of lithologic identification based on crossplot and Bayesian cluster analysis algorithm[J]. Science Technology and Engineering, 2013, 13(4):976-979.
[5] 潘少伟, 王朝阳, 张允, 等. 基于长短期记忆神经网络补全测井曲线和混合优化XGBoost的岩性识别[J]. 中国石油大学学报:自然科学版, 2022, 46(3):62-71.
[5] Pan S W, Wang Z Y, Zhang Y, et al. Lithology identification based on LSTM neural networks completing log and hybrid optimized XGBoost[J]. Journal of China University of Petroleum:Edition of Natural Science, 2022, 46(3):62-71.
[6] 李洪奇, 谭锋奇, 许长福, 等. 基于决策树方法的砾岩油藏岩性识别——以克拉玛依油田六中区克下组油藏为例[J]. 石油天然气学报, 2010, 32(3):73-79,408.
[6] Li H Q, Tan F Q, Xu C F, et al. Lithological identification of conglomerate reservoirs base on decision tree method[J]. Journal of Oil and Gas Technology, 2010, 32(3):73-79,408.
[7] 赖强, 魏伯阳, 吴煜宇, 等. 基于随机森林的K-近邻算法划分火成岩岩性[J]. 特种油气藏, 2021, 28(6):62-69.
doi: 10.3969/j.issn.1006-6535.2021.06.008
[7] Lai Q, Wei B Y, Wu Y Y, et al. Classification of igneous rock lithology with K-nearest neighbor algorithm based on random forest (RF-KNN)[J]. Special Oil & Gas Reservoirs, 2021, 28(6):62-69.
[8] Quinlan J R. Simplifying decision trees[J]. International Journal of Man-Machine Studies, 1987, 27(3):221-234.
doi: 10.1016/S0020-7373(87)80053-6
[9] 杨霞霞, 苏锋, 黄戌霞. 基于改进随机森林算法的不平衡数据分类方法研究[J]. 网络安全技术与应用, 2020(10):70-71.
[9] Yang X X, Su F, Huang X X. Research on imbalanced data classification method based on improved random forest algorithm[J]. Network Security Technology & Application, 2020(10):70-71.
[10] 杜昕, 范廷恩, 董建华, 等. 基于多层感知机网络的薄储层预测[J]. 石油地球物理勘探, 2020, 55(6):1178-1187,1159.
[10] Du X, Fan T E, Dong J H, et al. Characterization of thin sand reservoirs based on a multi-layer perceptron deep neural network[J]. Oil Geophysical Prospecting, 2020, 55(6):1178-1187,1159.
[11] Chen T Q, Guestrin C. XGBoost:A scalable tree boosting system[C]// Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, 2016:785-794.
[12] 张家臣, 邓金根, 谭强, 等. 基于XGBoost的测井曲线重构方法[J]. 石油地球物理勘探, 2022, 57(3):697-705,496.
[12] Zhang J C, Deng J G, Tan Q, et al. Reconstruction of well logs based on XGBoost[J]. Oil Geophysical Prospecting, 2022, 57(3):697-705,496.
[13] 段忠义, 肖昆, 杨亚新, 等. 基于集成学习的松辽盆地砂岩型铀矿地层岩性自动识别研究[J]. 原子能科学技术, 2023, 57(12):2443-2454.
doi: 10.7538/yzk.2023.youxian.0101
[13] Duan Z Y, Xiao K, Yang Y X, et al. Automatic lithology identification of sandstone-type uranium deposit in Songliao basin based on ensemble learning[J]. Atomic Energy Science and Technology, 2023, 57(12):2443-2454.
doi: 10.7538/yzk.2023.youxian.0101
[14] Bormann P, Aursand P, Dilib F, et al. 2020 FORCE machine learning contest. https://github.com/bolgebrygg/Force-2020-Machine-Learning-competition.
[15] 马陇飞, 萧汉敏, 陶敬伟, 等. 基于深度学习岩性分类的研究与应用[J]. 科学技术与工程, 2022, 22(7):2609-2617.
[15] Ma L F, Xiao H M, Tao J W, et al. Research and application of lithology classification based on deep learning[J]. Science Technology and Engineering, 2022, 22(7):2609-2617.
[16] Haykin S. Neural networks and learning machines,3/E[M]. Upper Sanddle River: Pearson Education, 2009.
[17] Maria N J R, Pankaja R. Performance analysis of text classification algorithms using con-fusion matrix[J]. International Journal of Engineering and Technical Research (IJETR), 2016, 6(4):75-78.
[18] 安鹏, 曹丹平. 基于深度学习的测井岩性识别方法研究与应用[J]. 地球物理学进展, 2018, 33(3):1029-1034.
[18] An P, Cao D P. Research and application of logging lithology identification based on deep learning[J]. Progress in Geophysics, 2018, 33(3):1029-1034.
[19] 武中原, 张欣, 张春雷, 等. 基于LSTM循环神经网络的岩性识别方法[J]. 岩性油气藏, 2021, 33(3):120-128.
[19] Wu Z Y, Zhang X, Zhang C L, et al. Lithology identification based on LSTM recurrent neural network[J]. Lithologic Reservoirs, 2021, 33(3):120-128.
[20] 马陇飞, 萧汉敏, 陶敬伟, 等. 基于梯度提升决策树算法的岩性智能分类方法[J]. 油气地质与采收率, 2022, 29(1):21-29.
[20] Ma L F, Xiao H M, Tao J W, et al. Intelligent lithology classification method based on GBDT algorithm[J]. Petroleum Geology and Recovery Efficiency, 2022, 29(1):21-29.
[21] 段忠义, 肖昆, 杨亚新, 等. 松辽盆地砂岩型铀矿钻孔岩性的测井识别[J]. 地球物理学进展, 2023, 38(6):2490-2501.
[21] Duan Z Y, Xiao K, Yang Y X, et al. Logging identification of borehole lithology of sandstone-type uranium deposit in Songliao Basin[J]. Progress in Geophysics, 2023, 38(6):2490-2501.
[1] 郭雨姗, 王万银. 基于特征加权的KNN模型岩性识别方法[J]. 物探与化探, 2024, 48(2): 428-436.
[2] 付兴, 谭捍东, 董岩, 汪茂. 基于监督下降法的大地电磁二维反演及应用研究[J]. 物探与化探, 2024, 48(1): 175-184.
[3] 郑孝诚, 张明华, 任伟. 卷积神经网络在山东金矿勘查预测中的应用[J]. 物探与化探, 2023, 47(6): 1433-1440.
[4] 宫明旭, 白利舸, 曾昭发, 吴丰收. 基于机器学习松辽盆地大地热流计算与特征分析[J]. 物探与化探, 2023, 47(3): 766-774.
[5] 杨朝义, 朱乾坤, 揭绍鹏, 孔垂爱, 沙有财, 钟志勇, 沈啟武, 陈志军, 马火林. 云南普朗铜矿井孔测井资料综合应用[J]. 物探与化探, 2023, 47(1): 14-21.
[6] 王宗仁, 文畅, 谢凯, 盛冠群, 贺建飚. 多尺度时频空三域特征联合下的储层岩性识别方法[J]. 物探与化探, 2023, 47(1): 81-90.
[7] 陈超群, 戴慧敏, 冯雨林, 杨泽, 杨佳佳. 基于Sentinel-2A的孙吴地区土壤有机质反演研究[J]. 物探与化探, 2022, 46(5): 1141-1148.
[8] 郭建宏, 张占松, 张超谟, 周雪晴, 肖航, 秦瑞宝, 余杰. 用地球物理测井资料预测煤层气含量——基于斜率关联度—随机森林方法的工作案例[J]. 物探与化探, 2021, 45(1): 18-28.
[9] 彭刘亚, 解惠婷, 冯伟栋. 基于随机森林算法的砂土液化预测方法[J]. 物探与化探, 2020, 44(6): 1429-1434.
[10] 蔡泽园, 鲁宝亮, 熊盛青, 王万银. 基于自适应核密度的贝叶斯概率模型岩性识别方法研究[J]. 物探与化探, 2020, 44(4): 919-927.
[11] 刘仕友, 宋炜, 应明雄, 孙万元, 汪锐. 基于波形特征向量的凝聚层次聚类地震相分析[J]. 物探与化探, 2020, 44(2): 339-349.
[12] 覃瑞东, 林振洲, 潘和平, 秦臻, 邓呈祥, 纪扬, 徐伟. 木里地区水合物及岩性测井识别方法[J]. 物探与化探, 2017, 41(6): 1088-1098.
[13] 周游, 高刚, 桂志先, 周倩, 蔡伟祥, 龚屹, 杨亚华. 灰质发育背景下识别浊积岩优质储层的技术研究——以东营凹陷董集洼陷为例[J]. 物探与化探, 2017, 41(5): 899-906.
[14] 邓呈祥, 高文利, 潘和平, 孔广胜, 方思南, 林振洲. 庐枞矿集区科学钻探的岩性识别方法[J]. 物探与化探, 2015, 39(6): 1144-1149.
[15] 张莹, 潘保芝. 支持向量机与微电阻率成像测井识别火山岩岩性[J]. 物探与化探, 2011, 35(5): 634-638,642.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
京ICP备05055290号-3
版权所有 © 2021《物探与化探》编辑部
通讯地址:北京市学院路29号航遥中心 邮编:100083
电话:010-62060192;62060193 E-mail:whtbjb@sina.com