Эффективность методики подбора роторно-управляемых систем на основе алгоритма машинного обучения Random Forest Classifier
- Авторы: Никишин В.В.1, Блинов П.А.1, Терехин В.А.1
-
Учреждения:
- Санкт-Петербургский горный университет
- Выпуск: Том 335, № 4 (2024)
- Страницы: 185-199
- Раздел: Статьи
- URL: https://ogarev-online.ru/2500-1019/article/view/258919
- ID: 258919
Цитировать
Полный текст
Аннотация
Актуальность исследования заключается в острой необходимости рассмотрения и определения возможных путей использования методов машинного обучения в буровой отрасли, поскольку искусственный интеллект развивается стремительными шагами. Достижение этой задачи предоставит промышленным предприятиям огромное конкурентное преимущество и внесёт важный вклад в научное сообщество для его будущих исследований. Это подчёркивается такими нормативными актами, как Указ Президента Российской Федерации от 10.10.2019 г. № 490 «О развитии искусственного интеллекта в Российской Федерации» и «Национальной стратегией развития искусственного интеллекта на период до 2030 года».
Цель: исследование эффективности применения метода машинного обучения Random Forest Classifier для разработки методик подбора роторно-управляемых систем, рассмотрения работоспособности машинного обучения для определения целевых параметров при решении поставленной перед ним задачи в рамках буровой отрасли и определению примерного количества времени, которое может быть затрачено алгоритмом для проработки возможного решения. Объект: метод машинного обучения Random Forest Classifier в условиях решения задачи из буровой отрасли по подбору оптимальной роторно-управляемой системы под конкретно заданные условия. Методы. Выполнены два вычислительных эксперимента с применением двух вычислительно электронных машин, а именно ноутбука и удалённого сервера, предпосылкой для которых стали данные, собранные и проанализированные на основе изучения научной литературы по направлению исследования. В данной статье исследуется возможность применения метода машинного обучения Random Forest Classifier для оптимизации процесса строительства скважин на примере разработки методики подбора роторно-управляемых систем. Вычислительные эксперименты выполнены на двух вычислительных машинах с применением языка программирования Python версии 3.8.10, а также следующих библиотек: NumPy, Pandas, Scikit-learn. Результаты. Проведённые вычислительные эксперименты доказали способность рассматриваемого метода машинного обучения решать задачи по выбору подходящего бурового оборудования, примером которого выступали роторно-управляемые системы. Данный метод способен самостоятельно определять необходимые для выполнения поставленной задачи зависимости и затрачивать на этот процесс незначительное количество времени. Совокупность этих выводов позволяет сделать предположение о целесообразности и необходимости разработки новых способов использования методов машинного обучения в буровой отрасли, а также выполнению множественных научных исследований вопросов о возможностях применения машинного обучения в процессе строительства скважин и анализа их эффективности, поскольку данное направление является передовым и может кардинально изменить существующие представления о протекающих во время бурения скважин процессах.
Ключевые слова
Полный текст
Введение
Строительство скважин – многофакторный процесс [1], общая эффективность которого зависит от качества составляющих его элементов [2], к которым можно отнести такие характеристики, как: качество пробуренного ствола скважины [3] и соответствие его траектории [4], предусмотренной рабочим проектом [5]. Качество упомянутых характеристик напрямую зависит от выбранного бурового оборудования [6–8]. На текущий момент самым эффективным таким оборудованием являются роторно-управляемые системы (РУС) [9–11]. В свою очередь, чтобы правильно подобрать РУС, необходимо учитывать множество различных параметров [12, 13], которые в идеале должны корректироваться [14, 15] с учетом постоянно увеличивающегося опыта промыслового бурения [16, 17]. При этом невозможно учитывать все эти параметры лишь с помощью человеческих ресурсов [18, 19]. Даже если и получится вывести ключевые признаки, на основании которых будет составлена специальная методика, она может быть недостаточно точной [20–22], или ее применение будет занимать весьма большое количество времени [23–25], снижая эффективность всего процесса строительства скважин [26–28]. Поэтому каждая разработанная методика должна быть проверена различными испытаниями [29], на основании которых нужно будет вносить определенные правки [30, 31]. При этом могут иметь место особые случаи [32, 33], решить которые можно лишь составлением новой методики [34], что еще больше удлиняет рабочий процесс [35–37].
Возможным решением данной проблемы может быть использование методов машинного обучения [38, 39], основным преимуществом которых является высокая скорость обучения [40, 41] и выполнения вычислительных операций [42, 43], а также возможность работы с большими объемами данных (BigData) [44, 45]. Данные методы уже активно используются для прогнозирования геологии пласта [44, 45] и корректирования траектории бурения [46, 47], ведь она может анализировать параметры, поступающие с бурового оборудования [48, 49], такие как уровень вибрации [50], скорость бурения и вращения ротора [51], нагрузку на долото [52] и т. д., и определять состав породы вокруг скважины [53, 54]. Это позволяет оперативно реагировать на изменения геологии [55] и поддерживать темпы бурения в рамках рабочего проекта [56]. Также существуют разработки по прогнозированию осложнений во время бурения и оценки надёжности оборудования [57], которые позволяют выявлять аномалии [58], свидетельствующие о возможных неисправностях или предпосылках к авариям [59]. Подобные разработки используются в компании British Petroleum. Само собой, в сферу оптимизации работы бурового оборудования также активно интегрируются решения на базе машинного обучения [60, 61].
В настоящее время существует большое количество различных моделей для машинного обучения, но наиболее часто применяемые из них – методы ансамблей [62]. Random Forest Classier (RFC) – один из таких методов, который является более точным, чем большинство существующих моделей, и удобным в применении, так как имеет возможность передачи в его алгоритмы данных не только с численным типом, но и как объекты [63, 64].
Данная работа направлена на исследование эффективности применения метода машинного обучения RFC для разработки различных методик подбора роторно-управляемых систем. Оценка производится по следующим параметрам: скорость выполнения рабочих процессов и точность конечного результата. Граничные области данного исследования обозначены таким образом, чтобы можно было приблизить рабочие параметры к как можно более идеальным условиям, чтобы использовать наиболее успешные подходы как отправную точку в вопросах нахождения взаимосвязи между параметрами.
Методология
Направление исследования – повышение эффективности бурения скважин. Предмет исследования – оптимизация процесса подбора оборудования с применением современных технологий для совершенствования процесса строительства скважин. Задачи исследования: выполнить построение методик подбора РУС на примере датасетов различной информативности с использованием метода машинного обучения RFC; проверить качество составленных методик по показателям точности получаемых результатов и скорости выполнения поставленной задачи; выполнить сравнение используемых подходов к обучению модели между собой и сделать соответствующие выводы.
Идея исследования заключается в том, что применение технологии машинного обучения позволит значительно сократить время на исследование взаимосвязей между характеристиками оборудования и рабочими параметрами технологических процессов, по сути, предсказывая результаты на всех этапах различных версий сценариев проведения буровых работ, в основе чего лежит определение основных параметров, учёт которых и позволяет прийти к видению возможного будущего. Достигается это за счёт подбора оптимального оборудования, условные зависимости для выбора которого алгоритм машинного обучения находит или составляет сам, таким образом создавая новые методики для определения наиболее подходящего рабочего оборудования под конкретную рабочую ситуацию с каждой новой моделью. Поэтому необходимо показать и доказать то, что модели, основанные на машинном обучении, способны самостоятельно находить целевые параметры среди множества заданных, которые являются наиболее важными при выборе того или иного оборудования, и делать это за очень короткие временные промежутки.
Наиболее точная методика выбора оборудования, применимая в реальных промысловых условиях, обязана учитывать большое количество различных факторов, которые можно определить лишь при подробном анализе реальных практических данных, по результатам которого можно породить новые вопросы, и если заранее не обозначить граничные условия применения, то их необходимо будет сразу же проработать. А с учетом задач данного исследования подобное является излишним, соответственно, можно ограничиться данными, сгенерированными с учетом условия их соответствия реальным роторно-управляемым системам, и абстрагироваться от большинства излишних факторов. В результате чего разработка методик подбора РУС будет осуществляться с учетом удовлетворения следующим рабочим характеристикам: диаметр скважины (в миллиметрах и дюймах), интенсивность пространственного искривления (м), скорость вращения долота (об/мин), скорость потока (л/мин), плотность бурового раствора (кг/м3) и рабочая температура на забое скважины (градус C).
Экспериментальная часть была выполнена на двух разных вычислительных машинах: Ноутбуке HP Pavilion Gaming 15-dk0069ur (с использованием вычислительного инструмента Jupyter Notebook) и сервере компании Google Серверный ускоритель Python 3 на базе Google Compute Engine, используемом через сервис Google Colaboratory. Написание кода осуществлялось на языке Python, версия 3.8.10. Используемые библиотеки: NumPy, Pandas, Scikit-learn. Графическая часть выполнена в рабочей среде MS Excel 2016. Кодировка для выгрузки датасетов в рабочие переменные – UTF-8. Средние скорости обучения моделей (погрешность ÷12,5 мс) и выполнения операций подбора оборудования (погрешность ÷1,5 мс) рассчитывались с помощью метода «%%timeit –n200», встроенного в используемые вычислительные инструменты.
Выбор параметров для датасетов осуществлялся по данным рабочих характеристик РУС, которые были взяты из разделов официальных сайтов и документов сервисных компаний, являющихся владельцами этих систем. Часть информации о рабочих моделях одних компаний представлена в более расширенном виде, в то время как другие компании предоставляют более ограниченную информацию о параметрах своих РУС. Поэтому в рамках исследования было принято решение ограничиться выбором нескольких параметров, наиболее часто встречающихся в открытых источниках, рабочих характеристик РУС, которые в действительности учитываются при выборе роторно-управляемых систем под бурение скважин на реальных месторождениях.
Исследование зависимости между точностью обученных моделей и объемом данных
Точность методов машинного обучения напрямую зависит от количества и качества данных в датасете. Именно данная закономерность была рассмотрена в начале работы. При этом необходимо учитывать, что качество модели, обученной на основе алгоритма RFC, напрямую зависит от его начального значения параметра random_state. Выполнив первоначальный анализ всех имеющихся данных, было принято решение о разделении их на три отличимых между собой датасета, на основе которых было поставлено три вычислительных эксперимента, в рамках которых было обучено по 200 моделей, для которых параметр random_state изменялся от 1 до 200 с шагом в единицу.
Основная задача первого эксперимента – проверка работоспособности модели, обученной на наборе данных, в которые входят лишь граничные значения предусмотренных методологией параметров (максимальные и минимальные значения). Так как с подобными условиями тренировочный датасет сильно ограничен количеством данных, было принято решение наполнить его только уникальными моделями РУС, применимость которых можно, в первую очередь, определить по заданному диаметру скважины. Это делается с целью проверки, сможет ли метод RFC понять, что ему переданы именно граничные параметры. Таким образом, тренировочный датасет данного эксперимента включает в себя 9 строк и 7 столбцов. В табл. 1 показаны его первые 5 строк. В рамках этого датасета информативность о применимости каждой модели РУС ограничивается двумя строками, на одной из которых указаны минимальные, а на другой максимальные значения рабочих параметров.
Так как в рамках данного эксперимента тестовый датасет составлен таким образом, что представлены такие модели РУС, которые работают в совершенно разных диапазонах диаметров скважин, то точность модели достаточно полно и просто определяется с применением метрики Accuracy classification score из библиотеки ПО Scikit-learn.
Однако её точность может быть не совсем объективной, поэтому была разработана и реализована в программном коде дополнительная специальная метрика, результаты которой будут сравниваться с результатами Accuracy classification score. Алгоритм работы данной метрики представлен на рис. 1.
Таблица 1. Часть датасета для первого вычислительного эксперимента [составлено авторами]
Table 1. Part of the dataset for the first computational experiment [compiled by the authors]
Ключ/ Key | РУС RSS | Диаметр скважины, мм Hole size, mm | Диаметр скважины, дюйм Hole size, in | Интенсивность искривления, град/30 м DLS, deg/30 m |
0 | RSS-HM-195 | 220,7 | 8,6875 | 0,5 |
1 | RSS-HM-195 | 222,3 | 8,7500 | 7,5 |
2 | PowerDrive Archer 475 RSS | 149,2 | 5,8750 | 0,5 |
3 | PowerDrive Archer 475 RSS | 171,5 | 6,7500 | 18 |
4 | PowerDrive ICE 675 RSS | 215,9 | 8,5000 | 0,5 |
Ключ/ Key | Скорость вращения долота, об/мин Bit speed, RPM | Расход бурового раствора, л/мин Flow range, L/min | Плотность бурового раствора, кг/м3 Mud density kg/m3 | Рабочая температура, °C Temperature, °C |
0 | 0 | 960 | 1000 | 0 |
1 | 200 | 2580 | 1500 | 125 |
2 | 0 | 492 | 1000 | 0 |
3 | 350 | 1343 | 2160 | 150 |
4 | 0 | 1040 | 1000 | 0 |
Рис. 1. Алгоритм работы специальной метрики [составлено авторами]
Fig. 1. Algorithm for a special metric operation [compiled by the authors]
Среди 200 проведенных экспериментов для каждой вычислительной машины при использовании ядер случайной генерации в диапазоне от 1 до 200 включительно были получены следующие результаты о качестве моделей, которые представлены в табл. 2.
Таблица 2. Точность работы полученных моделей из первого вычислительного эксперимента [составлено авторами]
Table 2. Accuracy of the obtained models from the first computational experiment [compiled by the authors]
Вычислительная машина Computing machine | Accuracy score | Разработанная метрика Designed metric | Средняя скорость обучения модели за 200 циклов, мс Average model learning rate for 200 cycles, ms | Средняя скорость операции подбора оборудования за 200 циклов, мс Average speed of the equipment selection operation for 200 cycles, ms | ||
Точност модели Model accuracy, % | Количество моделей Number of models | Точность модели Model accuracy, % | Количество моделей Number of models | |||
Ноутбук/Laptop HP Pavilion Gaming 15-dk0069ur | 92,9 | 20 | 100 | 4 | 135 | 13,5 |
89,3 | 37 | 96,4 | 27 | |||
85,7 | 46 | 92,9 | 56 | |||
82,1 | 52 | 89,3 | 60 | |||
78,6 | 31 | 85,7 | 40 | |||
75 | 10 | 82,1 | 12 | |||
71,4 | 3 | 78,6 | 1 | |||
67,9 | 1 | |||||
Сервер/Server Colaboratory | 92,9 | 20 | 100 | 4 | 131 | 12,9 |
89,3 | 37 | 96,4 | 27 | |||
85,7 | 46 | 92,9 | 56 | |||
82,1 | 52 | 89,3 | 60 | |||
78,6 | 31 | 85,7 | 40 | |||
75 | 10 | 82,1 | 12 | |||
71,4 | 3 | 78,6 | 1 | |||
67,9 | 1 |
После проверки точности моделей, обученных на наборе данных, состоящем только из минимальных и максимальных рабочих значений оборудования, в соответствии с метрикой Accuracy_score, результаты показывают, что ни в одном из случаев оборудование не было правильно подобрано со 100 % точностью. Однако проверка точности построенных моделей с использованием специальной метрики позволила выявить наличие четырех моделей, которые смогли определить все правильные РУС для условий, указанных в тестовом наборе данных. Несмотря на то, что в большинстве случаев точность полученных моделей крайне низка, есть некоторые из них, которые могут решать поставленные задачи с высокой точностью.
Однако получение таких моделей может потребовать больших усилий. В этом случае низкая точность большинства моделей может быть объяснена как сущностью случайной генерации условных признаков модели, на которые она опирается при выполнении операции, так и недостаточной информативностью обучающего набора данных для полноценного обучения модели в рамках задачи. Однако алгоритм RFC является одним из наиболее распространенных и используемых в реальных программных решениях, поэтому давайте рассмотрим второй вариант более подробно.
Набор данных для второго эксперимента представлен в виде списка практических данных, который включает около 68 примеров возможного выбора определенных моделей РУС. В табл. 3 показана часть данных из обучающего набора данных для этого эксперимента. Результаты о качестве моделей представлены в табл. 4.
Таблица 3. Часть данных тренировочного датасета для второго вычислительного эксперимента [составлено авторами]
Table 3. Part of the data of the training dataset for the second computational experiment [compiled by the authors]
Ключ/Key | РУС RSS | Диаметр скважины, мм Hole size, mm | Диаметр скважины, дюйм Hole size, in | Интенсивность искривления, град/30 м DLS, deg/ 30 m | Скорость вращения долота, об/мин Bit speed, RPM | Расход бурового раствора, л/мин Flow range, L/min | Плотность бурового раствора, кг/м3 Mud density kg/m3 | Рабочая температура, °C Temperature, °C |
46 | iCruise XTM 4.75 | 171,0 | 6,750 | 6,5 | 361 | 908 | 1350 | 100 |
47 | iCruise XTM 4.75 | 171,0 | 6,750 | 7,0 | 97 | 1086 | 1160 | 119 |
48 | PowerDrive Orbit G2 825 RSS | 269,9 | 10,625 | 4,0 | 344 | 5075 | 2630 | 106 |
49 | PowerDrive Orbit G2 825 RSS | 269,9 | 10,625 | 1,0 | 201 | 2169 | 2660 | 84 |
50 | PowerDrive Orbit G2 825 RSS | 269,9 | 10,625 | 5,0 | 32 | 5846 | 2380 | 45 |
Таблица 4. Точность работы полученных моделей из второго вычислительного эксперимента [составлено авторами]
Table 4. Accuracy of the obtained models from the second computational experiment [compiled by the authors]
Вычислительная машина Computing machine | Accuracy score | Разработанная метрика Designed metric | Средняя скорость обучения модели за 200 циклов, мс Average model learning rate for 200 cycles, ms | Средняя скорость операции подбора оборудования за 200 циклов, мс Average speed of the equipment selection operation for 200 cycles, ms | ||
Точность модели Model accuracy, % | Количество моделей Number of models | Точность модели Model accuracy, % | Количество моделей Number of models | |||
Ноутбук/Laptop HP Pavilion Gaming 15-dk0069ur | 100 | 22 | 100 | 185 | 13,0 | 13,3 |
96,4 | 81 | |||||
92,9 | 79 | 96,4 | 15 | |||
89,3 | 18 | |||||
Сервер/Server Colaboratory | 100 | 22 | 100 | 185 | 13,1 |
|
96,4 | 81 | |||||
92,9 | 79 | 96,4 | 15 | |||
89,3 | 18 |
По результатам второго вычислительного эксперимента видно, что общая точность моделей стала на порядок лучше. Это особенно заметно по результатам проверки точности работы моделей с использованием специально разработанной для исследования метрики, в которых выявлено, что из 200 обученных моделей 185 сделали абсолютно правильный выбор, и только 15 моделей допустили одну ошибку.
Несмотря на то, что во втором эксперименте были получены хорошие результаты, разница в результатах определения точности обученных моделей между метриками все еще слишком велика. Низкие показатели точности, измеряемые метрикой Accuracy_score, могут быть результатом специфики ее работы, поскольку она определяет правильность выбора РУС по его названию, которое должно совпадать с таковым в тестовом наборе данных, однако рабочие характеристики различных роторно-управляемых систем могут соответствовать одним и тем же условиям работы, но среди всего многообразия оборудования RFC может выбрать только один ответ. Это не проблема, в таких случаях, когда необходимо определить список подходящего оборудования, можно использовать специально обученный алгоритм для поиска нужного кластера потенциальных ответов, предварительно выполнив необходимые операции кластеризации.
Однако в нашем случае рабочий подход заключается в том, чтобы сосредоточиться на характеристиках одной выбранной модели. Именно этот нюанс учитывается в специальной метрике.
Но полагаться только на одну метрику не является достаточно верным подходом, более того, в первом эксперименте метрика Accuracy_score в некоторых случаях могла определять нужные модели со 100 % точностью. Поэтому следует провести третий эксперимент, который будет соединять в себе подходы обоих предыдущих экспериментов.
Соответственно, в третьем эксперименте учитываются как данные по граничным значениям, так и практические данные (все объединено в общий датасет), однако они будут слегка переработаны, а точнее, доля ситуаций, когда под решение задачи подходят сразу несколько правильных ответов, была существенно сокращена. Результаты данного эксперименты представлены в табл. 5.
Таблица 5. Точность работы полученных моделей из третьего вычислительного эксперимента [составлено авторами]
Table 5. Accuracy of the received models from the third computational experiment [compiled by the authors]
Вычислительная машина Computing machine | Accuracy score | Разработанная метрика Designed metric | Средняя скорость обучения модели за 200 циклов, мс Average model learning rate for 200 cycles, ms | Средняя скорость операции подбора оборудования за 200 циклов, мс Average speed of the equipment selection operation for 200 cycles, ms | ||
Точность модели Model accuracy, % | Количество моделей Number of models | Точность модели Model accuracy, % | Количество моделей Number of models | |||
Ноутбук/Laptop HP Pavilion Gaming 15-dk0069ur
| 100 | 178 | 100 | 195 | 144 | 14,1 |
96,4 | 22 | 96,4 | 5 | |||
Сервер/Server Colaboratory | 100 | 178 | 100 | 195 | 137 | 13,2 |
96,4 | 22 | 96,4 | 5 |
По результатам третьего вычислительного эксперимента отчетливо заметно увеличение количества моделей со 100 % точностью работы, измеренной как по метрике Accuracy_score, так и по специальной метрике. Поскольку обе метрики показывают очень хорошие результаты, можно с уверенностью сказать, что наиболее подходящим набором данных для решения задач выбора оптимальной РУС является набор данных, содержащий практические данные в сочетании с данными о минимальных и максимально допустимых рабочих параметрах оборудования, именно такой набор данных и можно назвать наиболее информативным. Однако стоит учитывать, что существует определенный предел объема данных, начиная с которого рост точности работы моделей либо будет незначительным, либо его не будет вовсе.
Исследование зависимости времени обучения моделей от объема данных
Несмотря на повышение точности модели при относительно небольшом изменении объема набора данных, значение средней скорости обучения модели практически не меняется, что делает невозможным точное определение зависимости этого параметра от объема набора данных в рамках данного исследования. Наличие информации об этой зависимости носит важный характер для правильного распределения рабочего времени специалистов при выполнении работ по нахождению зависимостей между заданными параметрами. Поэтому для полноты исследования был проведен дополнительный эксперимент, в котором учитывалось изменение средней скорости обучения модели в зависимости от: количества строк в наборе данных с одинаковым количеством столбцов (рис. 2); количества столбцов с одинаковым количеством строк (рис. 3); количества строк и столбцов с одинаковым объемом набора данных (рис. 4).
Рис. 2. Зависимость между средней скоростью обучения модели и количеством строк в датасете [составлено авторами]
Fig. 2. Dependence between the model average learning rate and the number of rows in the dataset [compiled by the authors]
Несмотря на увеличение времени обучения модели с увеличением объема набора данных, скорость обучения поражает своими низкими значениями. Например, как видно из рис. 2, при общем размере набора данных 8000 строк на 7 столбцов средняя скорость обучения одной модели составляет всего 248 мс. Соответственно, использование такого подхода для разработки методологии выбора рабочего оборудования может сэкономить огромное количество времени, особенно при проверке гипотез о возможных зависимостях между заданными параметрами, предоставляя возможность для более подробного изучения рассматриваемых зависимостей.
Рис. 3. Зависимость между средней скоростью обучения модели и количеством столбцов в датасете [составлено авторами]
Fig. 3. Dependence between the model average learning rate and the number of columns in the dataset [compiled by the authors]
Для более наглядного представления взаимосвязи между объемом обучающего датасета и средней скоростью обучения одной модели (мс) был проведен анализ данных методом множественной линейной регрессии, результаты которого выявили следующую взаимосвязь, записанную ниже с коэффициентом, учитывающим мощность вычислительной машины, на которой выполняется процедура обучения:
где коэффициент, учитывающий мощность вычислительного оборудования; количество строк в датасете, шт; количество столбцов в датасете, шт.
Рис. 4. Зависимость между средней скоростью обучения модели и объемом данных в датасете [составлено авторами]
Fig. 4. Dependence between the model average learning rate and the amount of data in the dataset [compiled by the authors]
Заключение
Точность моделей, обученных алгоритмом RFC, напрямую зависит от количества и качества данных, используемых при обучении. Наилучшие результаты показали модели из третьего вычислительного эксперимента. Это можно объяснить тем фактом, что набор данных для этого эксперимента содержал большое количество примеров, на основе которых модель смогла наилучшим образом выстроить взаимосвязи между параметрами и определить их граничные значения для каждой указанной модели РУС.
Рис. 5. Точность полученных моделей, оцененная по метрике Accuracy_score [составлено авторами]
Fig. 5. Accuracy of the obtained models, estimated by the metric Accuracy_score [compiled by the authors]
Более того, необходимо аккуратно подходить к вопросу выбора подходящей метрики для проверки точности модели, поскольку разные метрики имеют разные целевые характеристики для сравнения, что может определенным образом исказить конечные результаты. Графическое представление точности обученных моделей и их количества для каждого из экспериментов можно увидеть на рис. 5, где точность оценивалась с использованием метрики Accuracy_score, и на рис. 6, где точность оценивалась с использованием специальной метрики.
Рис. 6. Точность полученных моделей, оцененная по специальной метрике [составлено авторами]
Fig. 6. Accuracy of the obtained models, estimated by a special metric [compiled by the authors]
Таблица 6. Средняя скорость обучения и выполнения моделей [составлено авторами]
Table 6. Average learning and execution rates of models [compiled by the authors]
Номер вычислительного эксперимента Number of computational experiment | Вычислительная машина Computing machine | Средняя скорость обучения модели за 200 циклов, мс Average model learning rate for 200 cycles, ms | Средняя скорость операции подбора оборудования за 200 циклов, мс Average speed of the equipment selection operation for 200 cycles, ms |
1 | Ноутбук/Laptop HP Pavilion Gaming 15-dk0069ur | 135 | 13,5 |
Сервер/Server Google Colaboratory | 131 | 12,9 | |
2 | Ноутбук/Laptop HP Pavilion Gaming 15-dk0069ur | 130 | 13,1 |
Сервер/Server Google Colaboratory | 133 | 13,7 | |
3 | Ноутбук / Laptop HP Pavilion Gaming 15-dk0069ur | 144 | 14,1 |
Сервер/Server Google Colaboratory | 137 | 13,2 |
При этом, несмотря на постепенное увеличение количества тренировочных данных, с переходом от одного эксперимента к другому средние скорости выполнения операций создания экземпляров модели, их обучения и использования для решения поставленной задачи изменяются в малом диапазоне и больше зависят от параметров вычислительной машины. В табл. 6 представлены результаты вычисления средних скоростей выполнения всех построенных моделей в рамках проведенных экспериментов.
Полученные результаты вычислительных экспериментов, проведенных в рамках данного исследования, подтверждают целесообразность использования машинного обучения для решения прикладных задач, которые прямо или косвенно направлены на выявление взаимосвязей между исследуемыми параметрами, так как машинно-обученные модели позволяют создавать разнообразные методики за максимально короткие сроки, благодаря чему можно более глубоко изучить влияние рассматриваемых параметров на протекающие процессы.
Об авторах
Вячеслав Валерьевич Никишин
Санкт-Петербургский горный университет
Автор, ответственный за переписку.
Email: Nikishin_VV@pers.spmi.ru
ORCID iD: 0009-0008-7973-1856
Cand. Sc., Associate Professor
Россия, 125993, г. Санкт-Петербург, 21-я линия В.О., 2Павел Александрович Блинов
Санкт-Петербургский горный университет
Email: Blinov_PA@pers.spmi.ru
ORCID iD: 0000-0002-4379-8804
кандидат технических наук, доцент кафедры бурения скважин
Россия, 125993, г. Санкт-Петербург, 21-я линия В.О., 2Вадим Алексеевич Терехин
Санкт-Петербургский горный университет
Email: terekhinvada@mail.ru
магистрант кафедры бурения скважин
Россия, 125993, г. Санкт-Петербург, 21-я линия В.О., 2Список литературы
- New methods for preventing crumbling and collapse of the borehole walls / I.I. Chudyk, Y.M. Femiak, M.I. Orynchak, A.K. Sudakov, A.I. Riznychuk // Scientific Bulletin of National Mining University. – 2021. – № 4. – P. 17–22. doi: 10.33271/nvngu/2021-4/017
- Совершенствование технологии строительства горизонтальных скважин / Д.Л. Бакиров, М.М. Фаттахов, Э.В. Бабушкин, В.Н. Ковалев, А.М. Шурупов, В.В. Фатихов, О.Ф. Терегулов // Нефтепромысловое дело. – 2020. – № 1. – С. 55–59.
- Проблемы и решения, возникающие при бурении скважин в неустойчивых глинисто-аргиллитовых породах / Д.А. Бакирова, Д.В. Шаляпин, Э.В. Бабушкин, Д.Л. Бакиров, В.Г. Кузнецов // Нефть и газ. – 2020. – № 2. – С. 18–25.
- Леушева Е.Л., Алиханов Н.Т., Бровкина Н.Н. Исследование реологических свойств безбаритного бурового раствора повышенной плотности // Записки Горного института. – 2022. – Т. 258. – C. 976–985. DOI: https://doi.org/10.31897/PMI.2022.38
- Кузьмин В.Н., Трефилова Т.В. Ингибирование буровых растворов с целью безаварийной проходки интервалов неустойчивых глинистых пород // Нефтяная провинция. – 2020. – № 1. – С. 73–82.
- Уляшева Н.М., Леушева Е.Л., Галишин Р.Н. Разработка композиции бурового раствора для проводки наклонно направленного ствола скважины с учетом реологических параметров жидкости // Записки Горного института. – 2020. – Т. 244. – C. 454–461. DOI: https://doi.org/10.31897/pmi.2020.4.8
- Шмелев В.А. Автоматизированные системы управления процессом бурения нефтяных и газовых скважин, состояние разработок // Автоматизация, телемеханизация и связь в нефтяной промышленности. – 2021. – № 9. – С. 49–59.
- Николаев Н.И., Леушева Е.Л. Разработка составов промывочных жидкостей для повышения эффективности бурения твердых горных пород // Записки Горного института. – 2016. – Т. 219. – C. 412–420. doi: 10.18454/PMI.2016.3.412
- Литвиненко В.С., Двойников М.В. Обоснование выбора параметров режима бурения скважин роторными управляемыми системами // Записки Горного института. – 2019. – Т. 235. – C. 24–29. DOI: https://doi.org/10.31897/pmi.2019.1.24
- Kadochnikov V.G., Dvoynikov M.V. Development of technology for hydromechanical breakdown of mud plugs and improvement of well cleaning by controlled buckling of the drill string // Appl. Sci. – 2022. – Vol. 12. – 6460. DOI: https://doi.org/10.3390/app12136460
- Drilling in gas hydrates: managing gas appearance risks / R. Gizatullin, M. Dvoynikov, N. Romanova, V. Nikitin // Energies. – 2023. – Vol. 16. – 2387. doi: 10.3390/en16052387
- Двойников М.В. Исследования технико-технологических параметров бурения наклонных скважин // Записки Горного института. – 2017. – Т. 223. – С. 86–92. DOI: https://doi.org/10.18454/pmi.2017.1.86
- Двойников М.В., Куншин А.А. Повышение эффективности бурения наклонных и горизонтальных скважин // Деловой журнал Neftegaz.RU. – 2020. – № 4 (100). – С. 98–101.
- Российские и зарубежные роторно-управляемые системы / В.В. Никишин, П.А. Блинов, В.Г. Гореликов, В.А. Терехин // Деловой журнал NEFTEGAZ.RU. – 2023. – № 1. – С. 52–58.
- Чудинова И.В., Николаев Н.И. Разработка состава и исследование свойств бурового раствора для бурения скважин в неустойчивых глинистых породах // Успехи современного естествознания. – 2019. – № 8. – С. 85–89.
- Gorelikov V.G. et al. Investigation of thermal operational regimes for diamond bit drilling operations // International Journal of Engineering. – 2019. – Vol. 32. – № 5. – P. 790–793. doi: 10.5829/ije.2019.32.05b.21
- Drilling the new 5G-5 branch hole at Vostok Station for collecting a replicate core of old meteoric ice / A.V. Turkeev, N.I. Vasilev, V.Y. Lipenkov, A.V. Bolshunov, A.A. Ekaykin, A.N. Dmitriev, D.A. Vasilev // Annals of Glaciology. – 2021. – Vol. 62. – № 85–86. – P. 305–310. doi: 10.1017/aog.2021.4
- Двойников М.В., Кучин В.Н., Минцаев М.Ш. Разработка вязкоупругих систем и технологии изоляции водоносных горизонтов с аномальными пластовыми давлениями при бурении нефтегазовых скважин // Записки Горного института. – 2021. – Т. 247. – С. 57–65. doi: 10.31897/PMI.2021.1.7
- Кочнев А.А., Зотиков В.И., Галкин С.В. Анализ влияния геолого-технологических показателей на эффективность технологии радиального бурения на примере эксплуатационных объектов Пермского края // Известия Томского политехнического университета. Инжиниринг георесурсов. – 2018. – Т. 329. – № 12. – С. 20–29. DOI: https://doi.org/10.18799/24131830/2018/12/16
- A numerical study on the application of stress cage technology / P. Abdollahpour, Tabatabaee S.S. Moradi, E. Leusheva, V. Morenov // Energies. – 2022. – Vol. 15. – 5439. doi: 10.3390/en15155439
- Leusheva E., Morenov V., Liu T. Dependence of the equivalent circulation density of format drilling fluids on the molecular mass of the polymer reagent // Energies. – 2021. – Vol. 14. – 7639. doi: 10.3390/en14227639
- Кравчук М.В., Уляшева Н.М. Выбор бурового раствора при вскрытии терригенных отложений на месторождениях Тимано-Печорской провинции // Строительство нефтяных и газовых скважин на суше и на море. – 2015. – № 2. – С. 42–44.
- Преимущества применения буровых растворов на углеводородной основе при бурении нефтяных и газовых скважин / В.Ю. Гришковец, Ю.С. Давыдов, Т.А. Редкин, Л.В. Николаева, А.В. Карпиков // Науки о Земле и недропользование. – 2013. – № 2 (43). – С. 95–102.
- Petrakov D., Kupavykh K., Kupavykh A. The effect of fluid saturation on the elastic-plastic properties of oil reservoir rocks // Curved and Layered Structures. – 2020. – Vol. 7. – № 1. – P. 29–34. doi: 10.1515/cls-2020-0003
- Мухаметшин В.В. Устранение неопределенностей при решении задач воздействия на призабойную зону скважин // Известия Томского политехнического университета. Инжиниринг георесурсов. – 2017. – Т. 328. – № 7. – С. 40–50.
- Третьяков И.А. Преимущества применения буровых растворов на углеводородной основе при бурении нефтяных и газовых скважин // Трибуна ученого. – 2020. – № 11. – С. 122–128.
- Тумаев М.О., Ханжигитов Т.Е., Кожина Т.В. Ингибированные буровые растворы для вскрытия терригенных отложений большой толщины с применением силиката натрия // Технологические инновации в современном мире: Сборник статей по материалам международной научно-практической конференции. – Уфа, 28 ноября 2019. – Уфа: Общество с ограниченной ответственностью «Научно-издательский центр "Вестник науки"», 2019. – Т. 1. – С. 11–15. EDN ETNCMF
- Полимерные буровые растворы. Эволюция «из грязи в князи» / В.П. Овчинников, Н.А. Аксенова, Л.А. Каменский, В.А. Федоровская // Бурение и нефть. – 2014. – № 12. – С. 24–29.
- Сидоркин Д.И., Купавых К.С. Обоснование выбора винтовых насосных установок как энергоэффективной технологии механизированной добычи // Энергетика. Известия высших учебных заведений и энергетических объединений СНГ. – 2021. – Т. 64. – № 2. – С. 143–151. doi: 10.21122/1029-7448-2021-64-2-143-151
- Утяжеленный инвертный эмульсионный раствор с регулируемым реологическим профилем для строительства горизонтальных скважин / П.А. Хвощин, И.Л. Некрасова, О.В. Гаршина, Г.В. Конесев // Нефтегазовое дело. – 2015. – Т. 13. – № 1. – С. 35–44.
- Development of hydraulic turbodrills for deep well drilling / M.V. Dvoynikov, D.I. Sidorkin, A.A. Kunshin, D.A. Kovalev // Appl. Sci. – 2021. – Vol. 11. – 7517. doi: 10.3390/app11167517
- Изменение состава и структуры терригенных пород под воздействием буровых растворов / И.Л. Некрасова, К.П. Казымов, А.А. Предеин, П.А. Хвощин, П.А. Клыков, О.В. Гаршина, Б.М. Осовецкий, Н.Е. Молоштанова, В.М. Жданов // Геология, геофизика и разработка нефтяных и газовых месторождений. – 2017. – № 6. – С. 37–43.
- Леушева Е.Л., Алиханов Н.Т. Исследование безбаритных буровых растворов // Вестник Пермского национального исследовательского политехнического университета. Геология, нефтегазовое и горное дело. – 2021. – Т. 21. – № 3. – С. 123–130.
- Николаев Н.И., Леушева Е.Л. Теоретические и экспериментальные исследования эффективности бурения твердых горных пород // Вестник Пермского национального исследовательского политехнического университета. Геология, нефтегазовое и горное дело. – 2015. – № 15. – С. 38–47.
- Нуцкова М.В., Кучин В.Н., Ковальчук В.С. Профилактика и ликвидация осложнений, возникающих при заканчивании скважин // Вестник Пермского национального исследовательского политехнического университета. Геология, нефтегазовое и горное дело. – 2020. – Т. 20. – № 1. – С. 14–26.
- Jia J., Jia Y., Li X. Analysis, design, and experimental verification of a parallel wireless power and data transmission method for rotary steering systems // Energies. – 2022. – Vol. 15. – 6349. DOI: https://doi.org/10.3390/en15176349
- Разработка технологии освоения газовых и газоконденсатных скважин на регулируемом давлении / М.В. Двойников, Н.Ю. Кузнецова, Я.Д. Минаев, Е.В. Крюков // Вестник ассоциации буровых подрядчиков. – 2022. – № 1. – С. 23–29.
- Moazzeni A.R., Khamehchi E. Rain optimization algorithm (ROA): a new metaheuristic method for drilling optimization solutions // Journal of Petroleum Science and Engineering. – 2020. – Vol. 195. – 107512. DOI: https://doi.org/10.1016/j.petrol.2020.107512
- Anya A., Emadi H., Watson M. A novel apparatus and method for lab-scale study of wellbore integrity using CT imaging and analysis // Journal of Petroleum Science and Engineering. – 2023. – Vol. 220. – 111209. DOI: https://doi.org/10.1016/j.petrol.2022.111209
- Experimental simulation of obtaining the reflector azimuth using azimuthal acoustic reflection tool in the underwater environment / J. Ben, W. Qiao, X. Che, X. Ju, J. Lu, B. Men // Journal of Petroleum Science and Engineering. – 2020. – Vol. 195. – 107649. DOI: https://doi.org/10.1016/j.petrol.2020.107649
- Artificial intelligence techniques and their applications in drilling fluid engineering: a review / O.E. Agwu, J.U. Akpabio, S.B. Alabi, A. Dosunmu // Journal of Petroleum Science and Engineering. – 2018. – Vol. 167. – P. 300–315. DOI: https://doi.org/10.1016/j.petrol.2018.04.019
- A study on the contribution of the intermolecular forces to the stabilization of the high internal phase emulsion: a combined experimental and molecular dynamics study / P. Shi, A. Yu, H. Zhang, M. Duan, W. Pu, R. Liu // Journal of Petroleum Science and Engineering. – 2023. – Vol. 220. – 111188. DOI: https://doi.org/10.1016/j.petrol.2022.111188
- Developing new correlations for asphaltene deposition involving SARA fractions and colloidal instability index / A.A. Sulaimon, A. Habineswaran, L. Rajan, A. Qasim, N.P. Christiana, P.I. Murungi // Journal of Petroleum Science and Engineering. – 2023. – Vol. 220. – 111143. DOI: https://doi.org/10.1016/j.petrol.2022.111143
- Field performance and numerical simulation study on the toe to heel air injection (THAI) process in a heavy oil reservoir with bottom water / H. Anbari, J.P. Robinson, M. Greaves, S.P. Rigby // Journal of Petroleum Science and Engineering. – 2023. – Vol. 220. – 111202. DOI: https://doi.org/10.1016/j.petrol.2022.111202
- Modified Laponite synthesized with special wettability as a multifunctional additive in oil-based drilling fluids / X. Ni, H. Shi, J. Zhang, R. Liu, J. Wang, R. Cheng // Journal of Petroleum Science and Engineering. – 2023. – Vol. 220. – 111211. DOI: https://doi.org/10.1016/j.petrol.2022.111211
- Applying massively parallel interface for MPFA scheme with advanced linearization for fluid flow in porous media / L. Li, M. Khait, D. Voskov, K.M. Terekhov, A. Abushaikha // Journal of Petroleum Science and Engineering. – 2023. – Vol. 220. – 111190. DOI: https://doi.org/10.1016/j.petrol.2022.111190
- Evaluating the rock wettability using multi-frequency dielectric measurements: A review on the fundamental concept and experimental approach / A. Oshaish, A. Hassan, M. Mahmoud, A. El-Husseiny, S. Al-Ofi, A. Al-Yaseri // Journal of Petroleum Science and Engineering. – 2023. – Vol. 220. – 111177. DOI: https://doi.org/10.1016/j.petrol.2022.111177
- The heterogeneity of petrophysical and elastic properties in carbonate rocks controlled by strike-slip fault: a case study from Yangjikan outcrop in the Tarim basin / F. Gong, Y. Song, L. Zeng, G. Zou // Journal of Petroleum Science and Engineering. – 2023. – Vol. 220. – 111170. DOI: https://doi.org/10.1016/j.petrol.2022.111170
- Experimental investigation of the effects of silica nanoparticle on hole cleaning efficiency of water-based drilling mud / A.O. Gbadamosi, R. Junin, Y. Abdalla, A. Agi, J.O. Oseh // Journal of Petroleum Science and Engineering. – 2019. – Vol. 172. – P. 1226–1234. DOI: https://doi.org/10.1016/j.petrol.2018.09.097
- Experimental investigation of the effect of drilling fluid on wellbore stability in shallow unconsolidated formations in deep water / X. Zhao, Z. Qiu, M. Wang, J. Xu, W. Huang // Journal of Petroleum Science and Engineering. – 2019. – Vol. 175. – P. 595–603. DOI: https://doi.org/10.1016/j.petrol.2018.12.067
- A new methodology for optimization and prediction of rate of penetration during drilling operations / Y. Zhao, A. Noorbakhsh, M. Koopialipoor, A. Azizi, M.M. Tahir // Engineering with Computers. – 2020. – Vol. 36. – P. 587–595. DOI: https://doi.org/10.1007/s00366-019-00715-2
- A novel approach to pore pressure modeling based on conventional well logs using convolutional neural network / M. Matinkia, A. Amraeiniya, M.M. Behboud, M. Mehrad, M. Bajolvand, M.H. Gandomgoun, M. Gandomgoun // Journal of Petroleum Science and Engineering. – 2022. – Vol. 211. – 110156. DOI: https://doi.org/10.1016/j.petrol.2022.110156
- A comprehensive review of nanoparticles in water-based drilling fluids on wellbore stability / A.H. Abdullah, S. Ridha, D.F. Mohshim, M. Yusuf, H. Kamyab, S. Krishna, M.A. Maoinser // Chemosphere. – 2022. – Vol. 308. – 136274. DOI: https://doi.org/10.1016/j.chemosphere.2022.136274
- Alhemdi A., Gu M. Method to account for natural fracture induced elastic anisotropy in geomechanical characterization of shale gas reservoirs // Journal of Natural Gas Science and Engineering. – 2022. – Vol. 101. – 104478. DOI: https://doi.org/10.1016/j.jngse.2022.104478
- New approach to evaluate the equivalent circulating density (ECD) using artificial intelligence techniques / K.Z. Abdelgawad, M. Elzenary, S. Elkatatny, M. Mahmoud, A. Abdulraheem, S. Patil // Journal of Petroleum Exploration and Production Technology. – 2019. – Vol. 9. – P. 1569–1578. DOI: https://doi.org/10.1007/s13202-018-0572-y
- Ibrahim A. A review of mathematical modelling approaches to tackling wellbore instability in shale formations // Journal of Natural Gas Science and Engineering. – 2021. – Vol. 89. – 103870. DOI: https://doi.org/10.1016/j.jngse.2021.103870
- A numerical approach to investigate the impact of acid-asphaltene sludge formation on wormholing during carbonate acidizing / I. Khurshid, E.W. Al-Shalabi, I. Afgan, H. Al-Attar // Journal of Energy Resources Technology. – 2022. – Vol. 144. – № 6. DOI: https://doi.org/10.1115/1.4051738
- Hassan A., Elkatatny S., Al-Majed A. Coupling rate of penetration and mechanical specific energy to Improve the efficiency of drilling gas wells // Journal of Natural Gas Science and Engineering. – 2020. – Vol. 83. – 103558. DOI: https://doi.org/10.1016/j.jngse.2020.103558
- A new method for determination of optimal borehole drilling location considering drilling cost minimization and sustainable groundwater management / A.N. Khan, B.W. Kim, A. Rizwan, R. Ahmad, N. Iqbal, K. Kim, D.H. Kim // ACS Omega. – 2023. DOI: https://doi.org/10.1021/acsomega.2c06854
- Optimization of drilling parameters using improved play-back methodology / V. Ramba, S. Selvaraju, S. Subbiah, M. Palanisamy, A. Srivastava // Journal of Petroleum Science and Engineering. – 2021. – Vol. 206. – 108991. DOI: https://doi.org/10.1016/j.petrol.2021.108991
- Rajabi M., Ghorbani H., Aghdam K.Y. Sensitivity analysis of effective factors for estimating formation pore pressure using a new method: the LSSVM-PSO algorithm // Journal of Petroleum Geomechanics. – 2022. – Vol. 4. – № 3. – P. 96–113. DOI: https://doi.org/10.22107/JPG.2022.298551.1152
- Reducing the number of trees in a forest using noisy features / Y. Manzali, Y. Akhiat, M. Chahhou, M. Elmohajir, A. Zinedine // Evolving Systems. – 2022. – P. 1–18. doi: 10.1007/s12530-022-09441-5.
- Zhong R., Salehi C., Johnson Jr R. Machine learning for drilling applications: a review // Journal of Natural Gas Science and Engineering. – 2022. – Vol. 108. – 104807. doi: 10.1016/j.jngse.2022.104807.
- Olukoga T.A., Feng Y. Practical machine-learning applications in well-drilling operations // SPE Drilling & Completion. – 2021. – Vol. 36. – № 04. – P. 849–867. doi: 10.2118/205480-PA.
Дополнительные файлы
