Применение комбинаторных оценок переобучения при планировании трассерных исследований в нефтегазовых месторождениях

Обложка

Цитировать

Полный текст

Аннотация

В статье рассматриваются задача построения программы трассерных исследований в виде списка пар нагнетательных-добывающих скважин с использованием деревьев решений. Недостатком известных алгоритмов построения дерева решений является их склонность к переобучению, особенно в условиях малых объёмов выборки. В данной работе предлагается использовать оценки полного скользящего контроля и ожидаемой переобученности, разработанные в рамках комбинаторной теории переобучения, в качестве критериев разделения в узлах дерева решений для повышения обобщающей способности алгоритма. Подход апробирован на примере двух месторождений Западной Сибири. Показано, что использование критериев приводит к статистически значимому улучшению метрик качества дерева решений и снижению переобучения и, таким образом, позволяет более точно выбирать скважины-кандидаты при планировании трассерных исследований с целью оценки наличия гидродинамической связи между нагнетательными и добывающими скважинами. Применение оценок комбинаторной теории переобучения для построения деревьев решений открывает возможности для повышения эффективности трассерных исследований в нефтегазовой отрасли.

Полный текст

Доступ закрыт

Об авторах

Шаура Хабировна Ишкина

ООО «РН-БашНИПИнефть»

Автор, ответственный за переписку.
Email: shaura-ishkina@yandex.ru

Главный специалист Сектора автоматизации и цифровизации бизнес-процессов по исследованиям и разработке

Россия, Уфа, Республика Башкортостан

Константин Вячеславович Воронцов

Московский государственный университет им. М. В. Ломоносова; Федеральный исследовательский центр «Информатика и управление» РАН; Московский физико-технический институт (национальный исследовательский университет)

Email: voron@mlsa-iai.ru

Институт искусственного интеллекта, Доктор физико-математических наук, профессор РАН, профессор, заведующий кафедрой «Математические методы прогнозирования», заведующий лабораторией «Машинное обучение и семантический анализ», профессор, заведующий кафедрой «Машинное обучение и цифровая гуманитаристика» и кафедрой «Интеллектуальные системы», главный научный сотрудник

Россия, Москва; Москва; Долгопрудный, Московская область

Альфред Ядгарович Давлетбаев

ООО «РН-БашНИПИнефть»

Email: DavletbaevAY@bnipi.rosneft.ru

Кандидат физико-математических наук, начальник управления по моделированию и анализу исследований скважин и пластов, доцент кафедры прикладной физики Уфимского университета науки и технологий

Россия, Уфа, Республика Башкортостан

Вадим Петрович Мирошниченко

ООО «РН-Юганскнефтегаз»

Email: VPMiroshnichenko@ung.rosneft.ru

Начальник управления по разработке месторождений

Россия, Нефтеюганск-Югра, ХМАО

Список литературы

  1. Соколовский Э.В., Чижов С.И., Тренчиков Ю.И. и др. Методическое руководство по технологии проведения индикаторных исследований и интерпретации их результатов для регулирования и контроля процесса заводнения нефтяных залежей. РД 39-014-7428-235-89. Грозный: СевКавНИПИнефть, 1989. 79 с.
  2. Michael Shook G., Shannon, L., Wylie, A. Tracers and tracer testing: design, implementation, tracer selection, and interpretation methods. Idaho Falls, Idaho: INL, 2004. 36 p. doi: 10.2172/910642
  3. Patidar A.K., Joshi D., Dristant U. et al. A review of tracer testing techniques in porous media specially attributed to the oil and gas industry // J Petrol Explor Prod Technol. 2022. V. 12. P. 3339–3356. doi: 10.1007/s13202-02201526-w
  4. Dugstad Ø., Viig S., Krognes B., Kleven R., Huseby O. Tracer monitoring of enhanced oil recovery projects. EPJ Web of Conferences. 2013. V. 50. No. 02002. doi: 10.1051/epjconf/20135002002
  5. åberg G. The use of natural strontium isotopes as tracers in environmental studies // Water Air Soil Pollut. 1995. V. 79. No. P. 309–322. doi: 10.1007/BF01100444
  6. Joshi D., Patidar A.K., Mishra A., et al. Prediction of sonic log and correlation of lithology by comparing geophysical well log data using machine learning principles // GeoJournal. 2021. doi: 10.1007/S10708-021-10502-6
  7. Khilrani N., Prajapati P., Patidar A.K. Contrasting machine learning regression algorithms used for the estimation of permeability from well log data // Arab J Geosci. 2021. V. No. 20. P. 1–14. doi: 10.1007/S12517-021-08390-8
  8. Knackstedt M.A, Latham S., Madadi M, et al. Digital rock physics: 3D imaging of core material and correlations to acoustic and flow properties // The Lead Edge, 2009. V. 28. No. 1. P. 28–33. doi: 10.1190/1.3064143
  9. Sprunger C., Muther T., Syed F.I., et al. State of the art progress in hydraulic fracture modeling using AI/ML techniques // Model Earth Syst Environ. 2022. V. 8. P. 1–doi: 10.1007/S40808-021-01111-W
  10. Ишкина Ш. Х. Комбинаторные оценки переобучения пороговых решающих правил // Уфимск. матем. журн. 2018. Т. 10. № 1. С. 50–65. doi: 10.13108/2018-10-1-49
  11. Мирзаянов А.А., Асалхузина Г.Ф., Питюк Ю.А. и др. Матрицы применимости трассерных исследований на примере элемента девятиточечной системы разработки с трещинами гидроразрыва // Нефтегазовое дело. 2021. Т. 19. № 4 С. 41-49. doi: 10.17122/ngdelo-2021-4-41-49
  12. Трофимов А.С., Леонов В.А., Алпатов А.А. Способ исследования и разработки многопластового месторождения углеводородов. Патент РФ №2315863 C2, оп. 27.01.2008.
  13. Ишкина Ш. Х., Питюк Ю.А., Асалхузина Г. Ф. и др. Способ повышения информативности трассерных исследований в нефтегазовых месторождениях. Патент РФ № 2776786 C1, оп. 26.07.2022
  14. Dorogush A. V., Ershov V., Gulin A. CatBoost: gradient boosting with categorical features support. Workshop on ML Systems at NIPS 2017.
  15. Соколовский Э.В., Соловьев Г.Б., Тренчиков Ю.И. Индикаторные методы изучения нефтегазоносных пластов. М.: Недра, 1986. 157 с.
  16. Çetinkaya Z., Horasan F. Decision Trees in Large Data Sets // International Journal of Engineering Research and Development. 2021. V. 13. No. 1. P. 140-151. doi: 10.29137/umagd.763490
  17. Mitchell T. Machine Learning. McGraw Hill, 1997. 414 p.
  18. Breiman L., Friedman J.H., Olshen R.A., Stone C.J. Classification And Regression Trees (1st ed.). Routledge, 1984. doi: 10.1201/9781315139470
  19. Kuhn M., Johnson K. Classification Trees and Rule-Based Models. In: Applied Predictive Modeling. NY:Springer, 2013. doi: 10.1007/978-1-4614-6849-3_14
  20. Maimon O. and Rokach L. Data Mining and Knowledge Discovery Handbook, 2nd ed. Springer, 2010. 1285 p. doi: 10.1007/978-0-387-09823-4
  21. Ишкина Ш. Х., Воронцов К.В. Исследование завышенности оценок переобучения пороговых решающих правил. // Автоматика и телемеханика 2021. № 5. С.151–168. doi: 10.31857/S0005231021050106
  22. Воронцов К. В. Точные оценки вероятности переобучения // Доклады РАН, 2009, Т. 429. №1. С. 15–18.
  23. Vorontsov K. V. Splitting and Similarity Phenomena in the Sets of Classifiers and Their Effect on the Probability of Overfitting // Pattern Recognition and Image Analysis, 2009, Vol. 19, No. 3, pp. 412–420.
  24. Vorontsov K. V. Exact Combinatorial Bounds on the Probability of Overfitting for Empirical Risk Minimization // Pattern Recognition and Image Analysis, 2010, Vol. 20, No. 3, pp. 269–285.
  25. Vorontsov K.V., Ivahnenko A.A. Tight combinatorial generalization bounds for threshold conjunction rules // 4th Int. Conf. on Pattern Recognition and Machine Intelligence, 2011. Lecture Notes in Computer Science. Springer–Verlag, 2011. P. 66–73
  26. GitHub Project https://github.com/shaurushka/thesholdclfs-gen-bound (доступ 01.06.2023)
  27. GitHub Project https://github.com/shaurushka/decisiontree-with-ccv-and-eof (доступ 01.06.2023)
  28. Бухмастова С.В., Фахреева Р.Р., Питюк Ю.А., Давлетбаев А.Я., Азарова Т.П., Фаргер Д.В., Якупов Р.Ф. Апробация методов MLR и CRMIP при исследовании взаимовлияния скважин // Нефтяное хозяйство, 2020. № 8. С. 58-62. doi: 10.24887/0028-2448-2020-8-58-62
  29. Rutherford A. Anova and ANCOVA: a GLM approach. John Wiley & Sons, 2011. 360 p.
  30. Лагутин М. Б. Наглядная математическая статистика: учебное пособие. 2-е изд., испр. М.: БИНОМ, Лаборатория знаний, 2009. 472 с.
  31. Holm, S. A simple sequentially rejective multiple test procedure // Scandinavian Journal of Statistics. 1979. V. 6. No. 2. P. 65–70.
  32. Фахреева, Р. Р., Питюк Ю.А., Асалхузина Г.Ф. Давлетбаев А.Я., Мирошниченко В.П., Гусев Г.П. Развитие метода многопараметрической линейной регрессии для анализа трассерных исследований // Вестник Башкирского университета. 2021. С. 554-558. doi: 10.33184/bulletin-bsu-2021.3.2.

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML
2. Рис. 1. Значения метрики AUC для различных критериев

Скачать (20KB)
3. Рис. 2. Значения переобученности для метрики AUC для различных критериев

Скачать (20KB)

Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».