Clustering of lithotypes based on visual features of cores using convolutional neural networks and K-Means

Cover Page

Cite item

Full Text

Abstract

Background: Lithology is a vital field of study in both geology and the oil and gas sector that focuses on the properties of geological rocks. The primary objectives of lithology to classify rocks, determine their origin, and investigate the conditions of their formation and changes over time. Lithological core examination employ various methods, encompassing both conventional techniques (e.g., visual inspection of the rock samples or microscopic analysis of slides) and modern technologies. Conventional methods of examination require high qualifications and experience, and can be labour-intensive, especially in visual analysis (description of core material). The application of machine learning methods and automated technologies can enhance the efficiency and accuracy of analysis, save time, and provide quick access to information.

Aim: To develop lithotypes clustering model on core images using machine learning methods.

Materials and methods: The paper discusses an algorithm for clustering lithotypes using K-Means method combined with VGG16, VGG19 and ResNet50 convolutional neural networks to identify key features (similarities and distinctions as determined from photos).

Results: The algorithm for clustering lithotypes using K-Means method and convolutional neural networks is developed. The advantages and limitations of the algorithm when working with core images are determined. Results from experiments conducted using an actual dataset are presented.

Conclusion: The findings of the study offer important practical insights that can be applied to deep learning methods for core analysis as well as geological research. The application of this approach in geology can be broadened and the analysis of alternative machine learning models and techniques can be strengthened with more investigation.

About the authors

Galymzhan S. Abdimanap

KMG Engineering; Satbayev University

Email: g.abdimanap@kmge.kz
ORCID iD: 0000-0003-1676-4075
Kazakhstan, Astana; Almaty

Kairat A. Bostanbekov

KMG Engineering

Email: k.bostanbekov@kmge.kz
ORCID iD: 0000-0003-2869-772X

PhD

Kazakhstan, Astana

Anel N. Alimova

KMG Engineering

Author for correspondence.
Email: a.alimova@kmge.kz
ORCID iD: 0000-0002-5155-2417

PhD

Kazakhstan, Astana

Nurlan B. Saliev

Satbayev University

Email: saliyevnurlan@gmail.com
ORCID iD: 0009-0001-6537-6960
Kazakhstan, Almaty

Daniyar B. Nurseitov

KMG Engineering; Satbayev University

Email: d.nurseitov@kmge.kz
ORCID iD: 0000-0003-1073-4254

Cand. Sc. (Physics and Mathematics), professor (associate)

Kazakhstan, Astana; Almaty

References

  1. Gandhi SM, Sarkar BC. Essentials of mineral exploration and evaluation. Elsevier; 2016. 410 p.
  2. Corina AN, Hovda S. Automatic lithology prediction from well logging using kernel density estimation. Journal of Petroleum Science and Engineering. 2018;170:664–674. doi: 10.1016/j.petrol.2018.06.012.
  3. He J, La Croix AD, Wang J, et al. Using neural networks and the Markov Chain approach for facies analysis and prediction from well logs in the Precipice Sandstone and Evergreen Formation, Surat Basin, Australia. Marine and Petroleum Geology. 2019;101:410–427. doi: 10.1016/j.marpetgeo.2018.12.022.
  4. Zhang P, Sun J, Jiang Y, Gao JS. Deep learning method for lithology identification from borehole images. 79th EAGE conference and exhibition; 2017 Jun; Paris, France. Available from: https://www.earthdoc.org/content/papers/10.3997/2214-4609.201700945.
  5. Caja MA, Pena AC, Campos JR, et al. Image processing and machine learning applied to lithology identification, classification and quantification of thin section cutting samples. SPE Annual technical conference and exhibition; 2019 Sept 30 – Oct 2; Calgary, Alberta, Canada. Available from: https://onepetro.org/SPEATCE/proceedings-abstract/19ATCE/2-19ATCE/D022S083R001/217751.
  6. Wang J, Yang Y, Mao J, et al. CNN-RNN: A unified framework for multi-label image classification. 2016 IEEE conference on computer vision and pattern recognition (CVPR); 2016 Dec 12; Las Vegas, USA. Available from: https://ieeexplore.ieee.org/document/7780620.
  7. Abdallah A, Berendeyev A, Nuradin I, Nurseitov D. TNCR: Table net detection and classification dataset. Neurocomputing. 2022;473:79–97. doi: 10.1016/j.neucom.2021.11.101.
  8. Nurseitov D, Bostanbekov K, Kurmankhojayev D, et al. Handwritten Kazakh and Russian (HKR) database for text recognition. Multimedia tools and applications. 2021;80(21): 33075–33097. doi: 10.1007/s11042-021-11399-6.
  9. Nurseitov D., Bostanbekov K., Kanatov M., et al. Classification of handwritten names of cities and handwritten text recognition using various Deep learning models. Advances in science, technology and engineering systems journal. 2020;5(5):934–943. doi: 10.25046/aj0505114.
  10. Goodfellow I, Bengio Y, Courville A. Deep learning. Cambridge : MIT Press; 2016. 801 p.
  11. LeCun Y, Bengio Y, Hinton G. Deep learning. Nature. 2015;521:436–444. doi: 10.1038/nature14539.
  12. Steinhaus H. Sur la division des corps materiels en parties. Bulletin Lacademie Polonaise des Science. 1957;4:801-804.
  13. scikit-learn.ru/clustering [Internet]. Scikit-learn developers (BSD License) [cited 20.12.2023]. Available from: https://scikit-learn.ru/clustering/.
  14. Dutta A, Zisserman A. The Via Annotation software for images, audio and video. 27th ACM international conference on multimedia; 2019 Oct 21–25; Nice, France. Available from: https://dl.acm.org/doi/10.1145/3343031.3350535.
  15. Simonyan K, Zisserman A. Very deep convolutional networks for large-scale image recognition. International Conference on Learning Representations. 2015. doi: 10.48550/arXiv.1409.1556.
  16. Krizhevsky A, Sutskever I, Hinton G. ImageNet classification with deep convolutional neural networks. Communications of the ACM. 2017;60(6):84–90. doi: 10.1145/3065386.

Supplementary files

Supplementary Files
Action
1. JATS XML
2. Figure 1. Modified meter core marking tool

Download (466KB)
3. Figure 2. Dataset creation process

Download (307KB)
4. Figure 3. VGG16 architecture

Download (113KB)
5. Figure 4. VGG19 architecture

Download (107KB)
6. Figure 5. ResNet50 model architecture

Download (81KB)
7. Figure 6. Original photo of core material

Download (649KB)
8. Figure 7. Silhouette clustering index with 5 clusters

Download (115KB)
9. Figure 8. Silhouette clustering index with 10 clusters

Download (123KB)
10. Figure 9. Silhouette clustering index clustering with 15 clusters

Download (122KB)
11. Figure 10. Silhouette clustering index with 20 clusters

Download (125KB)
12. Figure 11. Silhouette clustering index with 25 clusters

Download (121KB)
13. Figure 12. Silhouette clustering index with 30 clusters

Download (129KB)
14. Figure 13. Clustering results using the VGG16 model

Download (791KB)
15. Figure 14. Clustering results using the VGG19 model

Download (684KB)
16. Figure 15. Clustering results using the ResNet50 model

Download (770KB)

Copyright (c) 2024 Abdimanap G.S., Bostanbekov K.A., Alimova A.N., Saliev N.B., Nurseitov D.B.

Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.

Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».