Clustering of lithotypes based on visual features of cores using convolutional neural networks and K-Means

封面

如何引用文章

全文:

详细

Background: Lithology is a vital field of study in both geology and the oil and gas sector that focuses on the properties of geological rocks. The primary objectives of lithology to classify rocks, determine their origin, and investigate the conditions of their formation and changes over time. Lithological core examination employ various methods, encompassing both conventional techniques (e.g., visual inspection of the rock samples or microscopic analysis of slides) and modern technologies. Conventional methods of examination require high qualifications and experience, and can be labour-intensive, especially in visual analysis (description of core material). The application of machine learning methods and automated technologies can enhance the efficiency and accuracy of analysis, save time, and provide quick access to information.

Aim: To develop lithotypes clustering model on core images using machine learning methods.

Materials and methods: The paper discusses an algorithm for clustering lithotypes using K-Means method combined with VGG16, VGG19 and ResNet50 convolutional neural networks to identify key features (similarities and distinctions as determined from photos).

Results: The algorithm for clustering lithotypes using K-Means method and convolutional neural networks is developed. The advantages and limitations of the algorithm when working with core images are determined. Results from experiments conducted using an actual dataset are presented.

Conclusion: The findings of the study offer important practical insights that can be applied to deep learning methods for core analysis as well as geological research. The application of this approach in geology can be broadened and the analysis of alternative machine learning models and techniques can be strengthened with more investigation.

作者简介

Galymzhan Abdimanap

KMG Engineering; Satbayev University

Email: g.abdimanap@kmge.kz
ORCID iD: 0000-0003-1676-4075
哈萨克斯坦, Astana; Almaty

Kairat Bostanbekov

KMG Engineering

Email: k.bostanbekov@kmge.kz
ORCID iD: 0000-0003-2869-772X

PhD

哈萨克斯坦, Astana

Anel Alimova

KMG Engineering

编辑信件的主要联系方式.
Email: a.alimova@kmge.kz
ORCID iD: 0000-0002-5155-2417

PhD

哈萨克斯坦, Astana

Nurlan Saliev

Satbayev University

Email: saliyevnurlan@gmail.com
ORCID iD: 0009-0001-6537-6960
哈萨克斯坦, Almaty

Daniyar Nurseitov

KMG Engineering; Satbayev University

Email: d.nurseitov@kmge.kz
ORCID iD: 0000-0003-1073-4254

Cand. Sc. (Physics and Mathematics), professor (associate)

哈萨克斯坦, Astana; Almaty

参考

  1. Gandhi SM, Sarkar BC. Essentials of mineral exploration and evaluation. Elsevier; 2016. 410 p.
  2. Corina AN, Hovda S. Automatic lithology prediction from well logging using kernel density estimation. Journal of Petroleum Science and Engineering. 2018;170:664–674. doi: 10.1016/j.petrol.2018.06.012.
  3. He J, La Croix AD, Wang J, et al. Using neural networks and the Markov Chain approach for facies analysis and prediction from well logs in the Precipice Sandstone and Evergreen Formation, Surat Basin, Australia. Marine and Petroleum Geology. 2019;101:410–427. doi: 10.1016/j.marpetgeo.2018.12.022.
  4. Zhang P, Sun J, Jiang Y, Gao JS. Deep learning method for lithology identification from borehole images. 79th EAGE conference and exhibition; 2017 Jun; Paris, France. Available from: https://www.earthdoc.org/content/papers/10.3997/2214-4609.201700945.
  5. Caja MA, Pena AC, Campos JR, et al. Image processing and machine learning applied to lithology identification, classification and quantification of thin section cutting samples. SPE Annual technical conference and exhibition; 2019 Sept 30 – Oct 2; Calgary, Alberta, Canada. Available from: https://onepetro.org/SPEATCE/proceedings-abstract/19ATCE/2-19ATCE/D022S083R001/217751.
  6. Wang J, Yang Y, Mao J, et al. CNN-RNN: A unified framework for multi-label image classification. 2016 IEEE conference on computer vision and pattern recognition (CVPR); 2016 Dec 12; Las Vegas, USA. Available from: https://ieeexplore.ieee.org/document/7780620.
  7. Abdallah A, Berendeyev A, Nuradin I, Nurseitov D. TNCR: Table net detection and classification dataset. Neurocomputing. 2022;473:79–97. doi: 10.1016/j.neucom.2021.11.101.
  8. Nurseitov D, Bostanbekov K, Kurmankhojayev D, et al. Handwritten Kazakh and Russian (HKR) database for text recognition. Multimedia tools and applications. 2021;80(21): 33075–33097. doi: 10.1007/s11042-021-11399-6.
  9. Nurseitov D., Bostanbekov K., Kanatov M., et al. Classification of handwritten names of cities and handwritten text recognition using various Deep learning models. Advances in science, technology and engineering systems journal. 2020;5(5):934–943. doi: 10.25046/aj0505114.
  10. Goodfellow I, Bengio Y, Courville A. Deep learning. Cambridge : MIT Press; 2016. 801 p.
  11. LeCun Y, Bengio Y, Hinton G. Deep learning. Nature. 2015;521:436–444. doi: 10.1038/nature14539.
  12. Steinhaus H. Sur la division des corps materiels en parties. Bulletin Lacademie Polonaise des Science. 1957;4:801-804.
  13. scikit-learn.ru/clustering [Internet]. Scikit-learn developers (BSD License) [cited 20.12.2023]. Available from: https://scikit-learn.ru/clustering/.
  14. Dutta A, Zisserman A. The Via Annotation software for images, audio and video. 27th ACM international conference on multimedia; 2019 Oct 21–25; Nice, France. Available from: https://dl.acm.org/doi/10.1145/3343031.3350535.
  15. Simonyan K, Zisserman A. Very deep convolutional networks for large-scale image recognition. International Conference on Learning Representations. 2015. doi: 10.48550/arXiv.1409.1556.
  16. Krizhevsky A, Sutskever I, Hinton G. ImageNet classification with deep convolutional neural networks. Communications of the ACM. 2017;60(6):84–90. doi: 10.1145/3065386.

补充文件

附件文件
动作
1. JATS XML
2. Figure 1. Modified meter core marking tool

下载 (466KB)
3. Figure 2. Dataset creation process

下载 (307KB)
4. Figure 3. VGG16 architecture

下载 (113KB)
5. Figure 4. VGG19 architecture

下载 (107KB)
6. Figure 5. ResNet50 model architecture

下载 (81KB)
7. Figure 6. Original photo of core material

下载 (649KB)
8. Figure 7. Silhouette clustering index with 5 clusters

下载 (115KB)
9. Figure 8. Silhouette clustering index with 10 clusters

下载 (123KB)
10. Figure 9. Silhouette clustering index clustering with 15 clusters

下载 (122KB)
11. Figure 10. Silhouette clustering index with 20 clusters

下载 (125KB)
12. Figure 11. Silhouette clustering index with 25 clusters

下载 (121KB)
13. Figure 12. Silhouette clustering index with 30 clusters

下载 (129KB)
14. Figure 13. Clustering results using the VGG16 model

下载 (791KB)
15. Figure 14. Clustering results using the VGG19 model

下载 (684KB)
16. Figure 15. Clustering results using the ResNet50 model

下载 (770KB)

版权所有 © Abdimanap G.S., Bostanbekov K.A., Alimova A.N., Saliev N.B., Nurseitov D.B., 2024

Creative Commons License
此作品已接受知识共享署名-非商业性使用-禁止演绎 4.0国际许可协议的许可。

Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».