Clustering of lithotypes based on visual features of cores using convolutional neural networks and K-Means

Capa

Citar

Texto integral

Resumo

Background: Lithology is a vital field of study in both geology and the oil and gas sector that focuses on the properties of geological rocks. The primary objectives of lithology to classify rocks, determine their origin, and investigate the conditions of their formation and changes over time. Lithological core examination employ various methods, encompassing both conventional techniques (e.g., visual inspection of the rock samples or microscopic analysis of slides) and modern technologies. Conventional methods of examination require high qualifications and experience, and can be labour-intensive, especially in visual analysis (description of core material). The application of machine learning methods and automated technologies can enhance the efficiency and accuracy of analysis, save time, and provide quick access to information.

Aim: To develop lithotypes clustering model on core images using machine learning methods.

Materials and methods: The paper discusses an algorithm for clustering lithotypes using K-Means method combined with VGG16, VGG19 and ResNet50 convolutional neural networks to identify key features (similarities and distinctions as determined from photos).

Results: The algorithm for clustering lithotypes using K-Means method and convolutional neural networks is developed. The advantages and limitations of the algorithm when working with core images are determined. Results from experiments conducted using an actual dataset are presented.

Conclusion: The findings of the study offer important practical insights that can be applied to deep learning methods for core analysis as well as geological research. The application of this approach in geology can be broadened and the analysis of alternative machine learning models and techniques can be strengthened with more investigation.

Sobre autores

Galymzhan Abdimanap

KMG Engineering; Satbayev University

Email: g.abdimanap@kmge.kz
ORCID ID: 0000-0003-1676-4075
Cazaquistão, Astana; Almaty

Kairat Bostanbekov

KMG Engineering

Email: k.bostanbekov@kmge.kz
ORCID ID: 0000-0003-2869-772X

PhD

Cazaquistão, Astana

Anel Alimova

KMG Engineering

Autor responsável pela correspondência
Email: a.alimova@kmge.kz
ORCID ID: 0000-0002-5155-2417

PhD

Cazaquistão, Astana

Nurlan Saliev

Satbayev University

Email: saliyevnurlan@gmail.com
ORCID ID: 0009-0001-6537-6960
Cazaquistão, Almaty

Daniyar Nurseitov

KMG Engineering; Satbayev University

Email: d.nurseitov@kmge.kz
ORCID ID: 0000-0003-1073-4254

Cand. Sc. (Physics and Mathematics), professor (associate)

Cazaquistão, Astana; Almaty

Bibliografia

  1. Gandhi SM, Sarkar BC. Essentials of mineral exploration and evaluation. Elsevier; 2016. 410 p.
  2. Corina AN, Hovda S. Automatic lithology prediction from well logging using kernel density estimation. Journal of Petroleum Science and Engineering. 2018;170:664–674. doi: 10.1016/j.petrol.2018.06.012.
  3. He J, La Croix AD, Wang J, et al. Using neural networks and the Markov Chain approach for facies analysis and prediction from well logs in the Precipice Sandstone and Evergreen Formation, Surat Basin, Australia. Marine and Petroleum Geology. 2019;101:410–427. doi: 10.1016/j.marpetgeo.2018.12.022.
  4. Zhang P, Sun J, Jiang Y, Gao JS. Deep learning method for lithology identification from borehole images. 79th EAGE conference and exhibition; 2017 Jun; Paris, France. Available from: https://www.earthdoc.org/content/papers/10.3997/2214-4609.201700945.
  5. Caja MA, Pena AC, Campos JR, et al. Image processing and machine learning applied to lithology identification, classification and quantification of thin section cutting samples. SPE Annual technical conference and exhibition; 2019 Sept 30 – Oct 2; Calgary, Alberta, Canada. Available from: https://onepetro.org/SPEATCE/proceedings-abstract/19ATCE/2-19ATCE/D022S083R001/217751.
  6. Wang J, Yang Y, Mao J, et al. CNN-RNN: A unified framework for multi-label image classification. 2016 IEEE conference on computer vision and pattern recognition (CVPR); 2016 Dec 12; Las Vegas, USA. Available from: https://ieeexplore.ieee.org/document/7780620.
  7. Abdallah A, Berendeyev A, Nuradin I, Nurseitov D. TNCR: Table net detection and classification dataset. Neurocomputing. 2022;473:79–97. doi: 10.1016/j.neucom.2021.11.101.
  8. Nurseitov D, Bostanbekov K, Kurmankhojayev D, et al. Handwritten Kazakh and Russian (HKR) database for text recognition. Multimedia tools and applications. 2021;80(21): 33075–33097. doi: 10.1007/s11042-021-11399-6.
  9. Nurseitov D., Bostanbekov K., Kanatov M., et al. Classification of handwritten names of cities and handwritten text recognition using various Deep learning models. Advances in science, technology and engineering systems journal. 2020;5(5):934–943. doi: 10.25046/aj0505114.
  10. Goodfellow I, Bengio Y, Courville A. Deep learning. Cambridge : MIT Press; 2016. 801 p.
  11. LeCun Y, Bengio Y, Hinton G. Deep learning. Nature. 2015;521:436–444. doi: 10.1038/nature14539.
  12. Steinhaus H. Sur la division des corps materiels en parties. Bulletin Lacademie Polonaise des Science. 1957;4:801-804.
  13. scikit-learn.ru/clustering [Internet]. Scikit-learn developers (BSD License) [cited 20.12.2023]. Available from: https://scikit-learn.ru/clustering/.
  14. Dutta A, Zisserman A. The Via Annotation software for images, audio and video. 27th ACM international conference on multimedia; 2019 Oct 21–25; Nice, France. Available from: https://dl.acm.org/doi/10.1145/3343031.3350535.
  15. Simonyan K, Zisserman A. Very deep convolutional networks for large-scale image recognition. International Conference on Learning Representations. 2015. doi: 10.48550/arXiv.1409.1556.
  16. Krizhevsky A, Sutskever I, Hinton G. ImageNet classification with deep convolutional neural networks. Communications of the ACM. 2017;60(6):84–90. doi: 10.1145/3065386.

Arquivos suplementares

Arquivos suplementares
Ação
1. JATS XML
2. Figure 1. Modified meter core marking tool

Baixar (466KB)
3. Figure 2. Dataset creation process

Baixar (307KB)
4. Figure 3. VGG16 architecture

Baixar (113KB)
5. Figure 4. VGG19 architecture

Baixar (107KB)
6. Figure 5. ResNet50 model architecture

Baixar (81KB)
7. Figure 6. Original photo of core material

Baixar (649KB)
8. Figure 7. Silhouette clustering index with 5 clusters

Baixar (115KB)
9. Figure 8. Silhouette clustering index with 10 clusters

Baixar (123KB)
10. Figure 9. Silhouette clustering index clustering with 15 clusters

Baixar (122KB)
11. Figure 10. Silhouette clustering index with 20 clusters

Baixar (125KB)
12. Figure 11. Silhouette clustering index with 25 clusters

Baixar (121KB)
13. Figure 12. Silhouette clustering index with 30 clusters

Baixar (129KB)
14. Figure 13. Clustering results using the VGG16 model

Baixar (791KB)
15. Figure 14. Clustering results using the VGG19 model

Baixar (684KB)
16. Figure 15. Clustering results using the ResNet50 model

Baixar (770KB)

Declaração de direitos autorais © Abdimanap G.S., Bostanbekov K.A., Alimova A.N., Saliev N.B., Nurseitov D.B., 2024

Creative Commons License
Este artigo é disponível sob a Licença Creative Commons Atribuição–NãoComercial–SemDerivações 4.0 Internacional.

Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».