Телефон: 8-800-350-22-65
WhatsApp: 8-800-350-22-65
Telegram: sibac
Прием заявок круглосуточно
График работы офиса: с 9.00 до 18.00 Нск (5.00 - 14.00 Мск)

Статья опубликована в рамках: CI Международной научно-практической конференции «Экспериментальные и теоретические исследования в современной науке» (Россия, г. Новосибирск, 27 мая 2024 г.)

Наука: Информационные технологии

Скачать книгу(-и): Сборник статей конференции

Библиографическое описание:
Рысин Р.А. ПОДГОТОВКА И ОБУЧЕНИЕ МОДЕЛИ МАШИННОГО ОБУЧЕНИЯ ПРИ ПРОВЕДЕННИИ МАШИННОГО АНАЛИЗА РИСКОВ РАЗРАБОТКИ НЕФТЕГАЗОВЫХ МЕСТОРОЖДЕНИЙ // Экспериментальные и теоретические исследования в современной науке: сб. ст. по матер. CI междунар. науч.-практ. конф. № 5(93). – Новосибирск: СибАК, 2024. – С. 82-87.
Проголосовать за статью
Дипломы участников
У данной статьи нет
дипломов

ПОДГОТОВКА И ОБУЧЕНИЕ МОДЕЛИ МАШИННОГО ОБУЧЕНИЯ ПРИ ПРОВЕДЕННИИ МАШИННОГО АНАЛИЗА РИСКОВ РАЗРАБОТКИ НЕФТЕГАЗОВЫХ МЕСТОРОЖДЕНИЙ

Рысин Роман Андреевич

студент, кафедра инноватики и интегрированных систем качества, Санкт-Петербургский государственный университет аэрокосмического приборостроения

РФ, г. Санкт-Петербург

PREPARATION OF A MACHINE LEARNING MODEL FOR CONDUCTING RISK ANALYSIS OF OIL AND GAS FIELD DEVELOPMENT

 

Rysin Roman

Student, Department of Innovation and Integration Quality Systems, St. Ptetersburg State University of Aerospace Instrumentation,

Russia, St. Petersburg

 

АННОТАЦИЯ

Эффективное управление ресурсами и принятие стратегических решений являются ключевыми аспектами успешной деятельности в нефтедобывающей отрасли. Одной из важнейших задач является выбор оптимального региона для бурения новых скважин, который обеспечит максимальную прибыль при минимальных рисках. Традиционные методы оценки месторождений требуют значительных временных и финансовых затрат, а также не всегда обеспечивают высокую точность прогнозов.

С развитием машинного обучения и аналитических методов обработки данных открываются новые возможности для улучшения процессов принятия решений. В данной работе предлагается методика выбора региона для бурения новой скважины, основанная на моделях машинного обучения и технике Bootstrap для анализа возможной прибыли и рисков.

Основная цель исследования заключается в разработке и применении модели, способной предсказывать объём запасов нефти на основании измеренных характеристик месторождений, а также в оценке экономической целесообразности разработки месторождений с использованием стохастических методов. Для достижения этой цели проведён комплексный анализ данных из трёх регионов, наполненных синтетическими данными, в каждом из которых имеется информация о 100 000 точек на месторождении.

ABSTRACT

Effective resource management and strategic decision-making are key aspects of successful operations in the oil industry. One of the most important tasks is to choose the optimal region for drilling new wells, which will ensure maximum profit with minimal risks. Traditional methods of estimating deposits require significant time and financial costs, and also do not always provide high accuracy of forecasts.

With the development of machine learning and analytical methods of data processing, new opportunities are opening up to improve decision-making processes. This paper proposes a methodology for selecting a region for drilling a new well, based on machine learning models and Bootstrap techniques for analyzing possible profits and risks.

The main purpose of the study is to develop and apply a model capable of predicting the volume of oil reserves based on the measured characteristics of fields, as well as to assess the economic feasibility of field development using stochastic methods. To achieve this goal, a comprehensive analysis of data from three regions filled with synthetic data was carried out, each of which has information about 100,000 points in the field.

 

Ключевые слова: Интеллектуальный анализ данных, управление рисками, разработка месторождений, нефтегазовая промышленность.

Keywords: Data mining, risk management, field development, oil and gas industry.

 

Определение наилучшего местоположения для бурения новых скважин является ключевым для максимизации экономической эффективности инвестиций в нефтедобычу. Традиционные методы прогнозирования и анализа часто не охватывают весь спектр данных и их вероятностные характеристики. Применение методов машинного обучения значительно улучшает точность прогнозов и эффективность принятия решений, что особенно важно в условиях высокой неопределенности и волатильности на нефтяном рынке.

В ходе проведения исследования будут использованы синтетически сгенерированные данные, на основе реальных значений полученных в регионах Восточной Сибири. Для удобства использования введем сокращения основных полей.

  • id — уникальный идентификатор скважины;
  • f0, f1, f2 — три признака точек (неважно, что они означают, но сами признаки значимы);
  • product — объём запасов в скважине (тыс. баррелей). Является целевым признаком для обучения

Пример выборки данных приведен на Рисунке 1. На рисунке 2 представлена гистограмма распределения объемов. Результаты корреляционной проверки для каждого региона указаны в Рисункх 3 – 5.

 

Рисунок 1. Пример данных

 

Рисунок 2. Гистограмма изначальных объемов

 

Рисунок 3. Результат корреляционного анализа параметров нулевого региона

 

Рисунок 4. Результат корреляционного анализа параметров первого региона

 

Рисунок 5. Результат корреляционного анализа параметров второго регионав

 

На основе корреляционных матриц можно сделать следующие выводы: в нулевом регионе объем практически не зависит от нулевого и второго признаков, а от первого признака он зависит немного больше. Во втором регионе объем не зависит от нулевого и первого признаков, и не сильно зависит от второго признака. В первом регионе объем полностью линейно зависит от второго признака.

После проведения анализа будет выполнена предобработка данных, и все три набора данных будут разделены на обучающие и валидационные выборки в соотношении 3 к 1. Затем обучим три модели, по одной для каждого региона, и выполним предсказания на валидационных выборках. Для каждого предсказания вычислим среднее значение и корень средней квадратичной ошибки. Результаты работы моделей будут представлены в Таблице 1. Все отрицательные значения будут заменены на нулевые, что соответствует логике задачи.

Таблица 1.

Результаты работы моделей

Регион

Средний

Минимальный

Максимальный

RMSE модели

0

92.49
9.99
185.69
37.74

1

69.12
0
139.99
0.89

2

94.95
16.42
174.41
39.86

 

Рисунок 6. Гистограмма объемов полученных моделью

 

Предсказания нулевого и второго регионов имеют примерно одинаковый средний объем (92,5 и 95) и примерно одинаковый корень из средней квадратичной ошибки (37,7 и 39,8). В первом регионе средний объем меньше (69,1), но средняя квадратичная ошибка намного меньше (0,9). Во всех трех регионах предсказанный средний объем меньше действительного, но необходимое количество скважин в 500 раз меньше генеральной совокупности в каждом регионе, следовательно, количество с необходимым объемом в каждом регионе наберется.

Разработанная методика и модель могут быть использованы в реальных условиях для принятия обоснованных решений о выборе мест для бурения новых скважин, что существенно повысит эффективность и рентабельность операций нефтедобывающих компаний. Применение методов машинного обучения и стохастического анализа позволяет учитывать большую вариативность данных и неопределённость, что является значительным преимуществом по сравнению с традиционными методами оценки. Таким образом, данное исследование вносит вклад в область применения аналитических методов и машинного обучения в нефтедобывающей отрасли, предлагая инновационные подходы к решению задач стратегического управления ресурсами.

 

Список литературы:

  1. Стоунбернер Г., Гогуэн А. Руководство по управлению рисками для систем информационных технологий: Руководство. —Гейтерсбург, 2002. — 42с.
  2. В. А. Тушавин. Методы и средства оценки рисков: учеб. пособие – СПб.: ГУАП, 2022. – 123 с
Проголосовать за статью
Дипломы участников
У данной статьи нет
дипломов

Оставить комментарий