基于细菌觅食优化广义回归神经网络的煤层气含量预测
张瑞1, 陈刚2, 潘保芝1, 蒋必辞2, 杨雪1, 刘丹1
1.吉林大学 地球探测科学与技术学院,吉林 长春 130026
2.中煤科工集团 西安研究院,陕西 西安 710077

作者简介: 张瑞(1991-),女,吉林长春人,在读硕士研究生,研究方向为地球物理测井。

摘要

为提高煤层气含量预测的能力,提出了一种基于细菌觅食优化广义回归神经网络(BFA-GRNN)的煤层气含量预测算法。利用已有煤层资料,通过神经网络建立回归模型,采用细菌觅食算法对模型参数进行优化,减少人为因素在网络训练中的影响。据此算法,在聚类分析及灰色关联分析的基础上,选取密度等共7个影响因素,建立煤层气含量预测的BFA-GRNN模型,通过实例分析验证该方法的可行性。结果表明:BFA-GRNN模型预测值与实测值之间相对误差小于6%,采用该模型预测煤层含气量具有较好的应用前景。

关键词: 煤层气含量; 聚类分析; 灰色关联分析; 细菌觅食算法; 广义回归神经网络; BP神经网络
中图分类号:P631 文献标志码:A 文章编号:1000-8918(2016)02-0327-06 doi: 10.11720/wtyht.2016.2.15
The prediction of the coalbed methane content based on bacteria foraging optimizing generalized regression neural network
ZHANG Rui1, Chen Gang2, PAN Bao-Zhi1, JIANG Bi-Ci2, YANG Xue1, LIU Dan1
1.College of Geo-Exploration Science and Technology,Jilin University, Changchun 130026,China
2. CCTEG Xi'an Research Institute, Xi'an 710077, China
Abstract

Coalbed methane is an important part of the natural gas energy, and determination of coal seam gas content is the key to the study of exploration and development of coal seam. In order to improve the capability of coal bed gas content prediction, this paper puts forward a kind of bacteria foraging optimization algorithm and generalized regression neural network (BFA-GRNN) of the coalbed gas content prediction algorithm. Well logging data and core data of coal seam are used by neural network to establish regression model, bacterial foraging algorithm is used to optimize the model parameters, and artificial factor influences on determining the network structure and the process of spreading factor are reduced. According to this algorithm and on the basis of clustering analysis and gray correlation analysis, seven main factors of coal bed gas content are chosen, which include density, resistivity, ash content etc. BFA-GRNN model is set ip by using the data of coal seam, and through the example analysis, the feasibility of this method is verified. The results show that the BFA-GRNN model is a true reflection of the nonlinear relationship between the coal seam gas content and the main control factors, and the relative error between predicted values and the measured values is less than 6%, suggesting that using the model to predict coal bed gas content has a good application prospect.

Keyword: coalbed methane content; clustering analysis; gray correlation analysis; bacterial foraging algorithm; generalized regression neural network; BP neural network

煤层含气量是煤层气储层评价的重要参数, 如何采取切实可行的方法对煤层含气量进行预测一直受到国内外学者的关注。1992年, J.M.Hawkins等人提出了计算煤层含气量的兰氏煤阶方程, 该方法将兰氏常数(兰氏体积和兰氏压力)与煤质组分参数联系起来, 并包含了对煤层灰分、水分、温度和压力的校正[1]。国内方面, 潘和平等[2]通过利用多元回归建立了煤层气含量与煤质参数、测井曲线值之间的关系, 发现煤层含气量与煤层温度、压力及碳分、灰分含量具有密切关系, 并建立了煤层含气量的估算方法; 高绪晨[3]、刘效贤[4]、葛祥[5]等也都探讨过利用多元线性回归方法预测煤层含气量。

由于煤层含气量受到的影响因素非常复杂, 利用传统的方法难以表达它们之间的内在关系, 不少学者提出采用非线性人工智能算法的方法进行预测。目前用到的算法主要有支持向量机、灰色模型、BP神经网络[6, 7, 8, 9, 10]。这些方法在各地煤层含气量预测中取得了不错的成效。但是这些预测方法普遍存在设计参数难以确定的缺点, 其预测结果受人为因素影响较大。广义回归神经网络(GRNN)具有很强的非线性映射能力和高度的容错性, 网络结构设计也简单, 避免了像BP网络那样的“ 黑箱问题” , 在逼近能力和学习速度上有更强的优势, 并且在样本数据较少时预测效果也较好。GRNN目前在各行各业都有较好应用, 但是并没有用于煤层气含量预测。

GRNN网络的结构由样本来确定, 参数就是一个平滑参数, 该常数的确定通常采用人工调整, 不仅效率低, 而且受人为因素的影响[11]。笔者采用细菌觅食优化算法寻找最优的光滑因子, 使得预测值与实际值的均方差最小。首先建立适合煤层含气量预测的优化网络BFA-GRNN模型, 然后采用R型聚类分析, 对测井参数和岩心参数进行降维处理, 选出影响煤层气含量的主要因素作为模型的输入, 对煤层含气量进行预测, 以期探索煤层气含量预测的新方法。

1 煤层含气量影响因素分析

聚类分析就是将物理或抽象对象的集合分组为由类似的对象组成的多个类的分析过程, 其目标就是在相似的基础上收集数据来分类[12]。对已知的测井参数以及岩心参数进行聚类分析(表1)。表1中所列参数为:自然伽马(GR)、深侧向电阻率(LLD)、浅侧向电阻率(LLS)、电阻率差(LLD-LLS)、密度(DEN)、声波(AC)、中子(CNL)、固定碳含量(FCad)、灰分含量(Aad)、挥发分含量(Vad)、水分含量(Mad)。

表1 测井参数、岩心参数各变量近似矩阵

根据表1可以看出, LLS与LLD两个变量相关系数达到0.982, 说明两个变量可以相互替换, 二者选择其一即可。同理, Aad和FCad两个变量中, 也可以去掉一个。

灰色关联分析法是一种多因素统计分析方法, 是根据因素之间发展趋势的相似或相异程度来衡量因素间的关联程度。分别对测井参数及岩心分析参数与煤层气含量之间做关联度分析(表2), 可以看出, LLD-LLS、FCad、CNL、LLD与煤层气含量的关联度很小。

表2 测井参数、岩心参数与煤层气含量的关联度

综合聚类分析与灰色关联分析的结果, 最终选择Aad、Mad、Vad、LLD、GR、DEN、AC共7个变量作为预测煤层含气量的输入参数。

2 BFA-GRNN模型
2.1 广义回归神经网络模型GRNN

广义回归神经网络GRNN是由Specht提出的, 是径向基函数神经网络的一种特殊形式。与目前流行的前馈神经网络相比, 它具有下述几项优点。

1) 网络结构相对简单, 除了输入和输出层外, 只有两个隐藏层, 模式层和求和层。而模式中隐藏单元的个数, 与训练样本的个数是相同的。

2) 网络训练简单。当训练样本通过隐藏层的同时, 网络训练随即完成。而不像前馈神经网络一样, 需要非常长的训练时间和高的计算成本。

3) 不需要对网络的隐藏层数和隐藏单元的个数进行估算和猜测。只有一个自由参数, 即径向基函数的平滑参数。

4) 计算结果具有全局收敛性。标准的前馈神经网络的计算结果则会经常不能达到全局收敛, 而停止在局部收敛。

GRNN 模型的4层网络中, 输入层接收学习样本, 其神经元数等于样本向量的维数; 模式层接收输入层传递的信息并将其转换后传递至求和层; 求和层中有 2 类神经元, 分别对模式层中数据进行求和; 输出层最终计算结果为2类神经元和的比值。网络结果图如图1所示, 具体的公式推导和理论可以参考文献[13, 14]

图1 广义回归神经网络结构

目前, GRNN网络平滑参数的选取主要采用人工调整方法, 存在效率低、精度差的问题。从数学上讲, 该参数的确定实质上是一个优化问题, 即通过寻找一个最优的, 使得训练样本的 GRNN 输出值与实际值的均方差最小。文中采用细菌觅食算法对GRNN模型进行优化。

2.2 细菌觅食优化算法BFA

细菌觅食算法是根据细菌菌落生长演化的基本规律, 通过趋化、复制和驱散三种行为来实现寻优的新型群体智能优化算法。首先, 依据细菌生长繁殖规律, 制定符合算法需要的个体进化机制; 其次, 根据细菌在培养液中的觅食行为, 建立算法中个体泳动、翻滚、停留等运动方式; 最后, 借鉴菌落中细菌信息交互方式, 建立个体信息共享机制。

趋化行为指细菌向食物丰富的区域聚集的行为, 包括翻转和前进两种模式, 翻转指细菌朝任意的方向移动一定距离, 前进是指通过判断翻转后细菌的适应度函数值是否得到改善, 来决定细菌是否要沿当前方向继续移动; 通过趋化行为, 细菌可获得连续局部寻优的能力。复制行为是根据细菌的适应度函数值, 选择让较差的细菌继承较好细菌的位置及步长, 通过该行为可加快细菌的寻优速度。驱散行为是让细菌以一定概率被驱散到搜索空间中的任意位置, 通过该行为可以避免细菌陷入局部极值。

整个菌群通过不断重复这三种行为, 形成高效快速的寻优模式, 其主要步骤包括[15, 16]:

1) 参数初始化, 设置空间维数、菌群规模、行为步长、驱散概率。

菌群规模影响算法效能的发挥, 菌群规模大小, 计算速度快, 但是菌群多样性降低, 影响算法的优化性能, 菌群规模越大, 个体的多样性就越高, 越能避免算法陷入局部极小值, 但是规模太大会导致计算量增加, 收敛速度变慢。行为步长的选取对算法影响比较大, 大的步长使算法迅速收敛, 但精度不足, 小的步长使算法收敛速度慢, 且易陷入局部极值, 但精度高。驱散概率选取适当能够帮助算法跳出局部最小值, 但是不能太大, 否则优化算法就变成了随机搜索算法。

2) 菌群的初始化, 利用随机函数生成细菌初始位置, 并计算初始菌群的适应度函数值Fitness。

3) 趋化操作, 包括翻转和前进两个模式。

a. 翻转:细菌改变运动方向, 并在新方向上移动单位步长, 通过执行

P(i, j+1, k, l)=P(i, j, k, l)+C(i)Δ(i)(1)

进行“ 翻转” 运动, 其中, P(i, j, k, l)表示第i个细菌在经过第l次驱散第k次复制第j次趋化后的状态; P(i, j+1, k, l)表示该细菌翻转后的状态; C(i)为移动步长, Δ (i)表示取值在[-1, 1]之间的随机向量。

b. 前进:细菌翻转后若适应值得到改善, 则继续沿该方向移动若干步, 直到适应值不再改善或者达到规定阈值Ns为止, 通过

P(i, j+1, k, l)=P(i, j+1, k, l)+C(i)Δ(i)(2)

进行“ 前进” 运动, 其中C(i), Δ (i)的值跟a中所使用的值相同。

4) 复制操作, 计算趋化行为完成时各细菌适应度函数Fitness(i, j, k, l)的累加和, 作为细菌的能量SumFitness(i), 其公式为

将所有细菌按照能量由高到低进行排序, 能量较高的半数细菌保留下来并且其中每个细菌复制成两个细菌, 能量较低的半数细菌死亡。

5) 驱散操作, 为避免细菌种群多样化退减, 复制操作后, 算法会随机生成一个概率P, 如果生成的随机概率P小于预先设定的迁移概率, 所有细菌将按照1)被随机分配到空间的任意位置, 避免陷入局部极值点。

6) 循环结束, 输出最优解。

对于 GRNN 模型, 以训练样本的输出值与实际值的均方差作为适应度函数寻找最优平滑参数, 基于BFA算法优化GRNN 模型煤层含气量预测流程见图2。

图2 基于BFA算法优化GRNN 模型煤层含气量预测流程

2.3 预测结果及误差分析

依据聚类分析和灰色关联分析法选择的参数对煤层数据进行整理, 得到60个样本。将其中50个作为训练样本, 另外10个作为检验样本, 进行BFA-GRNN网络训练煤层气含量预测, 其中BFA初始化参数选择按照细菌优化算法各参数的取值范围选定[17]训练样本和检验样本的预测含气量与实测含气量的对比如图3所示。 结果表明, 预测含气量与实测含气量之间相差很小, BFA-GRNN网络预测精度较高。

图3 BFA-GRNN网络预测含气量与实测含气量对比

为检验BFA-GRNN模型的预判能力, 对检验集样本进行运算。计算结果表明, 10个检验样本煤层气含量预测值与实际值之间绝对误差为-1.117~0.551 m3/t, 相对误差为0.039%~14.218%, 平均为 5.791%( 表3) 。

表3 BAF-GRNN网络检验样本煤层气含量预测误差
3 BFA-GRNN模型与其他模型对比

采用同样的数据作为样本分别建立BP网络模型和普通GRNN网络模型, 进行煤层气含量预测。

普通BP模型, 迭代次数取50 000, 训练目标设置为0.005, 通过设置不同的隐含层节点数m考察BP模型预测结果的准确性和稳定性。

表4为不同m情况下的运算时间和训练目标值, 可以看出, 在m达到7以后, 数据输出才达到训练目标值。由不同m下模型含气量预测结果(表5)可见, 与BFA-GRNN 模型相比, BP模型的预测结果对模型参数的变化比较敏感, 预测结果不稳定, 准确性较差。选取准确性最高的m=13, 进行绘图分析, 如图4所示。BP网络预测的10个检验样本煤层含气量绝对误差为-3.464~4.674 m3/t, 平均相对误差为32.139%, 可见预测精度比较低。

表4 BP神经网络不同隐含层节点数m情况下的运算时间与训练目标值
表5 BP网络模型预测检验样本煤层气含量

图4 BP神经网络预测含气量与实测含气量对比

普通GRNN模型, 在0.05~0.5范围内选取10个数(a1~a10)作为网络的平滑参数。10组普通的GRNN模型, 预测结果见表6。由此表可见, 与BFA-GRNN模型相比, 普通GRNN网络预测结果不稳定, 受平滑参数影响很大, 相对来说, BFA-GRNN 模型预测结果更稳定, 更准确。

表6 普通GRNN网络模型预测检验样本煤层气含量
4 结论

1) 基于聚类分析和灰色关联分析, 选取测井参数深侧向电阻率LLD、自然伽马GR、密度DEN、声波AC及岩心参数灰分含量Aad、水分含量Mad、挥发分含量Vad作为神经网络预测含气量的输入向量, 不仅可以凸显出对煤层气含量影响大的参数, 而且可以达到降维的目的, 降低网络模型的复杂程度。

2) 基于细菌觅食优化算法对广义回归神经网络的平滑参数进行优选, 不仅大大减少了人为因素对预测结果的影响, 而且提高了网络的稳定性及预测精度。

3) 实例分析表明, BFA-GRNN对煤层气含量的预测结果与实测结果之间误差很低, 且不受平滑参数的影响。通过与BP网络及普通GRNN神经网络的对比分析, BFA-GRNN模型的预测精度更高, 在煤层气含量预测中具有很好的应用效果。

The authors have declared that no competing interests exist.

参考文献
[1] Hawkins J M, Schraufnagel R A, Olszewski A J. Estimating coalbed gas content and sorption isotherm using well log data[J]. SPE24905, 1992: 491-500. [本文引用:1]
[2] 潘和平, 黄智辉. 煤层含气量测井解释方法探讨[J]. 煤田地质与勘探, 1998, 26(2): 60-62. [本文引用:1]
[3] 高绪晨, 张春才, 锻铁梁. 煤层气测井资料解释初探[J]. 中国煤田地质, 3002, 15(4): 54-56. [本文引用:1]
[4] 刘效贤, 李承华. 测井评价煤层气储层的方法探讨[J]. 中国煤炭地质, 2008, 20(12): 1-3. [本文引用:1]
[5] 葛祥, 何传亮, 董震. 基于动态吸附模型的煤岩吸附气含量测井计算新方法[J]. 测井技术, 2014(6): 740-744. [本文引用:1]
[6] 连承波, 赵永军, 李汉林, . 基于支持向量机回归的煤层含气量预测[J]. 西安科技大学学报, 2008, 28(4): 707-709. [本文引用:1]
[7] 王盼盼, 秦勇, 高弟. 观音山勘探区煤层含气量灰色关联预测[J]. 煤田地质与勘探, 2012(4): 34-38. [本文引用:1]
[8] 孟召平, 郭彦省, 张纪星. 基于测井参数的煤层含气量预测模型与应用[J]. 煤炭科学技术, 2014(6): 25-30. [本文引用:1]
[9] 黄旭钊, 梁月明, 李桐林. 基于BP神经网络的航空物探数据分类方法[J]. 物探与化探, 2010, 34(4): 485-488. [本文引用:1]
[10] 黄金杰, 夏静, 满春涛, . 一种参数优化旋转广义回归神经网络模型[J]. 电机与控制学报, 2009(3): 442-447. [本文引用:1]
[11] 伊良忠, 章超, 裴峥. 广义回归神经网络的改进及在交通预测中的应用[J]. 山东大学学报: 工学版, 2013(1): 9-14. [本文引用:1]
[12] 许丽利. 聚类分析的算法及应用[D]. 长春: 吉林大学, 2010. [本文引用:1]
[13] 罗毅. 基于灰色理论与广义回归神经网络的客运量预测模型研究[D]. 成都: 西南交通大学, 2007. [本文引用:1]
[14] 林喆, 兰生, 张宇航. 基于广义回归神经网络的油纸绝缘变压器的寿命预测[J]. 高压电器, 2015(2): 125-130. [本文引用:1]
[15] 梁建慧, 张健. 细菌觅食算法的研究综述[J]. 科技信息, 2013(16): 7. [本文引用:1]
[16] 周雅兰. 细菌觅食优化算法的研究与应用[J]. 计算机工程与用, 2010(20): 16-21. [本文引用:1]
[17] 李亚楠. 菌群优化算法的研究[D]. 哈尔滨: 哈尔滨工业大学, 2009. [本文引用:1]