Применение комбинаторных оценок переобучения при планировании трассерных исследований в нефтегазовых месторождениях
- Авторы: Ишкина Ш.Х.1, Воронцов К.В.2,3,4, Давлетбаев А.Я.1, Мирошниченко В.П.5
-
Учреждения:
- ООО «РН-БашНИПИнефть»
- Московский государственный университет им. М. В. Ломоносова
- Федеральный исследовательский центр «Информатика и управление» РАН
- Московский физико-технический институт (национальный исследовательский университет)
- ООО «РН-Юганскнефтегаз»
- Выпуск: № 1 (2024)
- Страницы: 68-78
- Раздел: Интеллектуальное планирование и управление
- URL: https://journals.rcsi.science/2071-8594/article/view/269784
- DOI: https://doi.org/10.14357/20718594240106
- EDN: https://elibrary.ru/VAUPCE
- ID: 269784
Цитировать
Полный текст
Аннотация
В статье рассматриваются задача построения программы трассерных исследований в виде списка пар нагнетательных-добывающих скважин с использованием деревьев решений. Недостатком известных алгоритмов построения дерева решений является их склонность к переобучению, особенно в условиях малых объёмов выборки. В данной работе предлагается использовать оценки полного скользящего контроля и ожидаемой переобученности, разработанные в рамках комбинаторной теории переобучения, в качестве критериев разделения в узлах дерева решений для повышения обобщающей способности алгоритма. Подход апробирован на примере двух месторождений Западной Сибири. Показано, что использование критериев приводит к статистически значимому улучшению метрик качества дерева решений и снижению переобучения и, таким образом, позволяет более точно выбирать скважины-кандидаты при планировании трассерных исследований с целью оценки наличия гидродинамической связи между нагнетательными и добывающими скважинами. Применение оценок комбинаторной теории переобучения для построения деревьев решений открывает возможности для повышения эффективности трассерных исследований в нефтегазовой отрасли.
Полный текст

Об авторах
Шаура Хабировна Ишкина
ООО «РН-БашНИПИнефть»
Автор, ответственный за переписку.
Email: shaura-ishkina@yandex.ru
Главный специалист Сектора автоматизации и цифровизации бизнес-процессов по исследованиям и разработке
Россия, Уфа, Республика БашкортостанКонстантин Вячеславович Воронцов
Московский государственный университет им. М. В. Ломоносова; Федеральный исследовательский центр «Информатика и управление» РАН; Московский физико-технический институт (национальный исследовательский университет)
Email: voron@mlsa-iai.ru
Институт искусственного интеллекта, Доктор физико-математических наук, профессор РАН, профессор, заведующий кафедрой «Математические методы прогнозирования», заведующий лабораторией «Машинное обучение и семантический анализ», профессор, заведующий кафедрой «Машинное обучение и цифровая гуманитаристика» и кафедрой «Интеллектуальные системы», главный научный сотрудник
Россия, Москва; Москва; Долгопрудный, Московская областьАльфред Ядгарович Давлетбаев
ООО «РН-БашНИПИнефть»
Email: DavletbaevAY@bnipi.rosneft.ru
Кандидат физико-математических наук, начальник управления по моделированию и анализу исследований скважин и пластов, доцент кафедры прикладной физики Уфимского университета науки и технологий
Россия, Уфа, Республика БашкортостанВадим Петрович Мирошниченко
ООО «РН-Юганскнефтегаз»
Email: VPMiroshnichenko@ung.rosneft.ru
Начальник управления по разработке месторождений
Россия, Нефтеюганск-Югра, ХМАОСписок литературы
- Соколовский Э.В., Чижов С.И., Тренчиков Ю.И. и др. Методическое руководство по технологии проведения индикаторных исследований и интерпретации их результатов для регулирования и контроля процесса заводнения нефтяных залежей. РД 39-014-7428-235-89. Грозный: СевКавНИПИнефть, 1989. 79 с.
- Michael Shook G., Shannon, L., Wylie, A. Tracers and tracer testing: design, implementation, tracer selection, and interpretation methods. Idaho Falls, Idaho: INL, 2004. 36 p. doi: 10.2172/910642
- Patidar A.K., Joshi D., Dristant U. et al. A review of tracer testing techniques in porous media specially attributed to the oil and gas industry // J Petrol Explor Prod Technol. 2022. V. 12. P. 3339–3356. doi: 10.1007/s13202-02201526-w
- Dugstad Ø., Viig S., Krognes B., Kleven R., Huseby O. Tracer monitoring of enhanced oil recovery projects. EPJ Web of Conferences. 2013. V. 50. No. 02002. doi: 10.1051/epjconf/20135002002
- åberg G. The use of natural strontium isotopes as tracers in environmental studies // Water Air Soil Pollut. 1995. V. 79. No. P. 309–322. doi: 10.1007/BF01100444
- Joshi D., Patidar A.K., Mishra A., et al. Prediction of sonic log and correlation of lithology by comparing geophysical well log data using machine learning principles // GeoJournal. 2021. doi: 10.1007/S10708-021-10502-6
- Khilrani N., Prajapati P., Patidar A.K. Contrasting machine learning regression algorithms used for the estimation of permeability from well log data // Arab J Geosci. 2021. V. No. 20. P. 1–14. doi: 10.1007/S12517-021-08390-8
- Knackstedt M.A, Latham S., Madadi M, et al. Digital rock physics: 3D imaging of core material and correlations to acoustic and flow properties // The Lead Edge, 2009. V. 28. No. 1. P. 28–33. doi: 10.1190/1.3064143
- Sprunger C., Muther T., Syed F.I., et al. State of the art progress in hydraulic fracture modeling using AI/ML techniques // Model Earth Syst Environ. 2022. V. 8. P. 1–doi: 10.1007/S40808-021-01111-W
- Ишкина Ш. Х. Комбинаторные оценки переобучения пороговых решающих правил // Уфимск. матем. журн. 2018. Т. 10. № 1. С. 50–65. doi: 10.13108/2018-10-1-49
- Мирзаянов А.А., Асалхузина Г.Ф., Питюк Ю.А. и др. Матрицы применимости трассерных исследований на примере элемента девятиточечной системы разработки с трещинами гидроразрыва // Нефтегазовое дело. 2021. Т. 19. № 4 С. 41-49. doi: 10.17122/ngdelo-2021-4-41-49
- Трофимов А.С., Леонов В.А., Алпатов А.А. Способ исследования и разработки многопластового месторождения углеводородов. Патент РФ №2315863 C2, оп. 27.01.2008.
- Ишкина Ш. Х., Питюк Ю.А., Асалхузина Г. Ф. и др. Способ повышения информативности трассерных исследований в нефтегазовых месторождениях. Патент РФ № 2776786 C1, оп. 26.07.2022
- Dorogush A. V., Ershov V., Gulin A. CatBoost: gradient boosting with categorical features support. Workshop on ML Systems at NIPS 2017.
- Соколовский Э.В., Соловьев Г.Б., Тренчиков Ю.И. Индикаторные методы изучения нефтегазоносных пластов. М.: Недра, 1986. 157 с.
- Çetinkaya Z., Horasan F. Decision Trees in Large Data Sets // International Journal of Engineering Research and Development. 2021. V. 13. No. 1. P. 140-151. doi: 10.29137/umagd.763490
- Mitchell T. Machine Learning. McGraw Hill, 1997. 414 p.
- Breiman L., Friedman J.H., Olshen R.A., Stone C.J. Classification And Regression Trees (1st ed.). Routledge, 1984. doi: 10.1201/9781315139470
- Kuhn M., Johnson K. Classification Trees and Rule-Based Models. In: Applied Predictive Modeling. NY:Springer, 2013. doi: 10.1007/978-1-4614-6849-3_14
- Maimon O. and Rokach L. Data Mining and Knowledge Discovery Handbook, 2nd ed. Springer, 2010. 1285 p. doi: 10.1007/978-0-387-09823-4
- Ишкина Ш. Х., Воронцов К.В. Исследование завышенности оценок переобучения пороговых решающих правил. // Автоматика и телемеханика 2021. № 5. С.151–168. doi: 10.31857/S0005231021050106
- Воронцов К. В. Точные оценки вероятности переобучения // Доклады РАН, 2009, Т. 429. №1. С. 15–18.
- Vorontsov K. V. Splitting and Similarity Phenomena in the Sets of Classifiers and Their Effect on the Probability of Overfitting // Pattern Recognition and Image Analysis, 2009, Vol. 19, No. 3, pp. 412–420.
- Vorontsov K. V. Exact Combinatorial Bounds on the Probability of Overfitting for Empirical Risk Minimization // Pattern Recognition and Image Analysis, 2010, Vol. 20, No. 3, pp. 269–285.
- Vorontsov K.V., Ivahnenko A.A. Tight combinatorial generalization bounds for threshold conjunction rules // 4th Int. Conf. on Pattern Recognition and Machine Intelligence, 2011. Lecture Notes in Computer Science. Springer–Verlag, 2011. P. 66–73
- GitHub Project https://github.com/shaurushka/thesholdclfs-gen-bound (доступ 01.06.2023)
- GitHub Project https://github.com/shaurushka/decisiontree-with-ccv-and-eof (доступ 01.06.2023)
- Бухмастова С.В., Фахреева Р.Р., Питюк Ю.А., Давлетбаев А.Я., Азарова Т.П., Фаргер Д.В., Якупов Р.Ф. Апробация методов MLR и CRMIP при исследовании взаимовлияния скважин // Нефтяное хозяйство, 2020. № 8. С. 58-62. doi: 10.24887/0028-2448-2020-8-58-62
- Rutherford A. Anova and ANCOVA: a GLM approach. John Wiley & Sons, 2011. 360 p.
- Лагутин М. Б. Наглядная математическая статистика: учебное пособие. 2-е изд., испр. М.: БИНОМ, Лаборатория знаний, 2009. 472 с.
- Holm, S. A simple sequentially rejective multiple test procedure // Scandinavian Journal of Statistics. 1979. V. 6. No. 2. P. 65–70.
- Фахреева, Р. Р., Питюк Ю.А., Асалхузина Г.Ф. Давлетбаев А.Я., Мирошниченко В.П., Гусев Г.П. Развитие метода многопараметрической линейной регрессии для анализа трассерных исследований // Вестник Башкирского университета. 2021. С. 554-558. doi: 10.33184/bulletin-bsu-2021.3.2.
