机采井组最优产能模型的应用1

引论：我们为您整理了1篇机采井组最优产能模型的应用范文，供您借鉴以丰富您的创作。它们是您写作时的宝贵资源，期望它们能够激发您的创作灵感，让您的文章更具深度。

机采井组最优产能模型的应用

摘要：基于大数据分析的机采井组优化技术，进行了现场应用。按照大数据技术原理确定的井组划分原则，采用“以注定采”的优化方式，实现对抽油机井组产液量准确的预测，给出了井组内各抽油机井1a内的连续调控方案，解决了以单井为基础进行优化的有效周期短、沉没度波动大的问题。有效的延长了检泵周期，降低了机采井能耗及日常维修维护成本，满足了机采井低成本开发的需要，实现开发效益最大化，年创效益111.25万元，为后期油田智能化建设提供技术支撑。

关键词：大数据；产量；井组；优化调控

“十三五”期间某开发区块针对有杆泵抽油机井采油过程中能耗治理问题，通过分析、研究，确定了抽油机井优化以立体节能为主。推广应用北京勘探开发研究院研发的“采油采气工程优化设计与决策支持系统”软件，设计出以相同产液量或目标产液量下有杆泵抽油系统耗能最低为目的的一整套机采系统参数。累计应用了2203井次，年节电量达153.7×104kWh。应用后降低了能耗成本，提高了系统效率，延长了油井检泵周期。累计应用5a，存在一定的不足，优化主要基于单井，未考虑油藏剩余油分布、油水井连通状况及地层物性差异，也未综合考虑采出井间的相互影响和采出井来液方向和流量的变化，出现了注采不平衡，能耗没有得到最佳优化[。因此，开展基于大数据分析的机采井组优化技术研究，该技术适用于某区块水驱机采井组优化。按照大数据确定井组划分原则，实现“以注定采”的优化方式，从粗放型调整到精细化动态协调地面参数，合理匹配拖动装置，降低机采井能耗及日常维修维护成本，满足机采井低成本开发的需要[2]。

1技术研究

大数据运算有一项重要的功能是可以在变量和结果之间通过大数据的运算和推演直接建立逻辑关系，通过采用该技术应用在油水井的对应分析上，能够弥补对油藏精细描述认识的不足，找到井间对应关系，加以调整实现产量最大，能耗最低[3]。

1.1异常数据处理

1.1.1缺失数据的处理采用K近邻算法对缺失数据填补处理，给定实测实例，基于某种距离度量找出训练集中与其最靠近的K个实例点，基于这些最近邻的信息来进行预测。在分类任务中使用“投票法”，选择K个样本中出现最多的类别标记作为预测结果。提供的产油、产水、产液等数据均存在缺失，但无法验证数据的真实值，因此在算法部分采用创造缺失值来验证所采用算法的准确性与可靠性。以区块月产油数据为例，将2011—2021年的日产油和日产水两种数据作为K近邻算法的特征进行提取，2011年区块月产油数据见表1。在实际应用过程中，由于特征矩阵与区块日产油和日产水数据相关，首先将特征进行标准化，然后制造缺失值。假设2011年11月份日产油数据为缺失值，采用K近邻算法对缺失值进行处理并预测其真实值，此时K选择为5，即基于欧式距离度量找出训练集中与其最靠近的5个实例点，然后基于这5个最近邻的信息来进行预测。2011年11月份日产油数据的真实值为569.05t/d，通过采用KNN算法对缺失值进行处理，得到的预测值为543.73t/d，预测的相对误差仅为4.4%。因此，在对区块月产液、月产油数据进行处理时，KNN算法具有一定的适用性。
1.1.2重复数据的处理采用重复数据删除法对重复数进行删除处理，基于数据自身的冗余度来检测数据流中的相同数据的对象，只传输和存储唯一的数据对象副本，并使用指向唯一数据对象副本的指针替换其他重复副本。由于所提供的产油、产水、产液等数据代表数据特征，不需要进行重复数据处理，因此在算法中提供一套采用删除法处理重复数据的方法，具体为删除相同数据。以区块月产油数据为例，将2011—2021年的日产油数据作为特征进行提取，以验证算法的准确性与可靠性。在编程实现上，特征矩阵与区块日产液、日产油数据相关，首先创造重复值，以日产油为例，假设2011年3月、4月的日产油量数据相等，数值均为624.1t/d，然后判断特征矩阵中是否存在重复观测。因此，在对区块月产液、月产油数据进行处理时，删除法具有一定的代表性。

1.1.3异常数据处理法采用孤立森林算法进行异常数据的检测，主要是对数据集进行随机切割，通过集成学习的方式收敛数据切割的过程，正常样本经过多次切割才能被识别出来，而异常样本则很容易被切割出来找到并删除异常值。所提供的产油、产水、产液等数据均存在异常值，主要是泵况造成的。因此在算法部分采用创造异常值来验证所采用算法的准确性与可靠性。以区块月产油数据为例，在2011—2021年的日产油数据中随机设置异常值，基于随机森林算法查找并删除异常值，然后利用K近邻算法对异常数据的真实值进行预测。在实际应用中将缺失值设置在日产油数据中，例如：将2012年5月的日产油数据为674.27t/d，考虑数据存在缺失将其最大上线值设置为3333t/d。设置孤立森林算法查找的异常值数为1，首先利用原始数据随机采样生成100个孤立树，组成孤立森林模型，数据样本遍历孤立树计算出异常分值，训练每个基评估器的样本的数量为50，异常值比例为0.05，成功检测到异常值。其次，采用K近邻算法对异常值进行处理并预测其真实值，K取值为10，即基于欧式距离度量找出训练集中与其最靠近的10个实例点，基于最近邻的信息来进行预测。通过采用K近邻算法对缺失值进行处理，得到的预测值为675.308t/d，预测的相对误差为0.15%。因此，孤立森林算法和K近邻算法在处理油井数据的异常值问题时，具有一定的适用性。

1.2确定最优产能预测模型

1.2.1ARIMA预测模型ARIMA预测模型记作ARIMA(p，d，q)，p为自回归项数，q为滑动平均项数，d为使之成为平稳序列所做的差分次数。“差分”是关键步骤，采用ARIMA模型预测的时序数据，必须是稳定的，不稳定的数据是无法捕捉到时序规律的。利用最终确定的模型进行产液、产油序列预测并得出结果[4]。10口井的ARIMA产液量和产油量预测指标见表2，其中包括产油预测结果的平均绝对百分比误差（MAPE）、均方根误差（RMSE）、预测精度（FA）三个指标，三种预测指标的结果均不理想。

1.2.2LSTM预测模型LSTM神经网络模型具有一个输入层，一个至多个隐藏层以及一个输出层。网络的隐藏层内有许多被称为存储单元的神经元，存储单元都具有三个“门”：遗忘门（ft），输入门（it）和输出门（ot）。对比环节采用的预测方式为逐一预测，即通过历史数据得出的预测数据每次仅为一个，由此可得到通过迭代法预测时的单次预测精度。10口井的LSTM产液量和产油量预测指标见表3。

1.2.3GM灰色预测模型选用GM（1，1）模型，是GM（1，N）模型的特例，仅包含一个微分方程且仅有一个单变量，建模的原始数据序列通常需要满足或近似满足指数型增长，且其增长速度要相对较慢。模型具有相对较高的计算效率，同时只需要拟合求解一个模型参数[5-6]。程序首先对数据进行级比检验，并计算是否在可调区间内，若在则对数据进行平移变换，并再一次进行级比检验；若不在则放弃调整。大部分井组的检验结果为不通过检验，表明灰色预测模型不适合用于该区块内单井及区块的平均日产油量和日产液量的预测。

1.2.4各预测模型精度对比对比ARIMA预测模型、LSTM预测模型和GM灰色预测模型，数据未通过GM的级比检验，说明GM不适用于该项目数据。根据产油量和产液量预测的平均绝对百分比误差、均方根误差、预测精度三个指标，比较LSTM、ARIMA的适用性。通过数据对比分析得出：LSTM预测模型效果优于ARIMA模型，大部分油井的预测精度可以达到95%以上。因此，选择LSTM预测模型作为井组产能的预测模型[7-8]。

1.3实现井组产能预测一次性进行输入多步和输出多步是LSTM算法的一个显著优点，采用1000组历史数据，直接对未来365d的产油和产液量数据进行预测，区块内日产液量预测结果见图1。

2现场应用与效益预计

基于目标区块平均含水率指标，确定井组内单井调整方向，若某个单井含水率低于平均含水率指标，则该单井生产能力较强，应提高该单井的产量[9-10]；若某个单井含水率高于平均含水率指标，则该单井生产能力较差，应减少该单井的产量；同时要保证调整后井组总产油量在目标产油量的范围内[11-12]。

2.1现场应用效果试验区开井79口井。因液面在井口、沉没度较高的22口井，属于泵况问题，暂不实施调整计划。实施的57口井，参数调大18口，冲程与冲次的乘积变化5.81；调小参数28口井，冲程与冲次的乘积变化3.63；不调11口井，平均冲程与冲次的乘积保持不变，2022年10月份参数调整计划见表4。实施后的57口井平均日产液由29.45t下降到29.0t，平均日产油由1.30t上升到1.32t，吨液百米耗电由0.75kWh/100m·t下降到0.69kWh/100m·t，平均节电率达到了8.26%，系统效率由36.32%提高到39.59%，提高了3.27个百分点，2022年参数调整效果见表5。由于有1口井实施后没有达到预期效果，分析原因是电动机无牌，电动机级数不能确定，调后冲次未达到设计冲次，所以方案符合率98.25%，年节电能力达到了25.19×104kWh。随后扩大了现场优化规模，在3个区块17个井组开展了试验，共318口井。实施后平均节电率达到了7.89%，系统效提高了3.47个百分点，年节电能力达到了132.36×104kWh。

2.2效益预计优化后管理与优化前无变化，其它费用不增加也不减少，只计算了节电效益。年节电能力达到157.55×104kWh，电价按0.7061元/kWh计算，年节约电费111.25万元。

3结论

1）确定了采用数据算法中的K近邻算法对缺失数据填补、删除并对重复数据处理、采用孤立森林算法对异常数据进行处理，为产能预测提供数据源。2）采用平均相对误差绝对值、均方根误差和预测精度三种预测性能评价指标，对ARIMA模型（差分自回归移动平均模型）、LSTM预测模型（长短期记忆人工神经网络模型）、GM预测模型（灰色预测模型）进行对比分析，通过对比可以看出LSTM模型为最优的预测模型。3）在区块内“定注”条件下，建立油水井之间存在着某种不确定的关系，根据给出的井组调控方案，开展了现场试验及推广375口井，年创经济效益111.25万元。

作者:孔令维许立红刘树辉单位:大庆油田有限责任公司第四采油厂

机采井组最优产能模型的应用

相关文章

相关期刊

应用化工