Application of machine learning methods to classify quartzites by chemical composition: the influence of trace elements and geochemical identification

Мұқаба

Дәйексөз келтіру

Толық мәтін

Аннотация

   Research subject. Quartzites from Different Sites of the East Sayan Quartz-Bearing Region.   Aim. The aim of this study is to apply machine learning methods to effectively classify quartzite samples by their chemical composition, including the identification of key trace elements such as manganese and the detection of geochemical differences between samples.   Materials and methods. The study used chemical analysis data from 776 quartzite samples, which were interpreted using machine learning methods. Standard data preprocessing techniques such as normalization were applied as well as data augmentation using SMOTE to solve the class imbalance problem. As a result, the CatBoost algorithm was selected, which showed high classification accuracy.   Results. Cross-validation results showed that the CatBoost algorithm achieved classification accuracy of up to 97 %. The importance of features indicates that manganese is a key element in the classification of samples, while elements such as aluminum and potassium have a supporting effect. The analysis of the classification by color of quartzites with an accuracy of 0.94 was also successfully carried out.   Conclusions. The study demonstrates the effectiveness of applying machine learning methods to the analysis of the chemical composition of quartzites, providing new opportunities for geochemical and archaeological research.

Авторлар туралы

A. Myasnikova

A.P. Vinogradov Institute of Geochemistry, SB RAS

Email: sasham@igc.irk.ru

R. Shendrik

A.P. Vinogradov Institute of Geochemistry, SB RAS

I. Eliseev

A.P. Vinogradov Institute of Geochemistry, SB RAS

O. Chachanagova

A.P. Vinogradov Institute of Geochemistry, SB RAS

A. Fedorov

A.P. Vinogradov Institute of Geochemistry, SB RAS

A. Nepomniyschikh

A.P. Vinogradov Institute of Geochemistry, SB RAS

Әдебиет тізімі

  1. Аюржанаева Д.Ц., Федоров А.М., Мазукабзов А.М., Непомнящих А.И., Очирова Э.А. Посохов В.Ф. (2020) Механизмы формирования химически чистых кварцитов Бурал-Сардыкского месторождения. Геология и геофизика, 61(10), 1316-1330. doi: 10.15372/GiG2023128
  2. Непомнящих А.И., Федоров А.М., Жабоедов А.П., Волкова М.Г. (2023) Высокочистые кварциты Восточного Саяна. Геология и геофизика, 64(8), 1205-1215. doi: 10.15372/GiG2023128
  3. Федоров А.М., Макрыгина В.А., Мазукабзов А.М., Непомнящих А.И., Аюржанаева Д.Ц., Волкова М.Г. (2021) Ресурсы кварцевого сырья Гарганской зоны Восточносаянского кварцитоносного района. Георесурсы, 23(4), 96-106. doi: 10.18599/grs.2021.4.11
  4. Юдович Я.Э., Кетрис М.П. (2013) Геохимия марганца в процессах гипергенеза : обзор. Биосфера, 5(1) 21-36.
  5. Baak M., Koopman R., Snoek H., Klous S. (2020) A new correlation coefficient between categorical, ordinal and interval variables with Pearson characteristics. Comput. Stat. Data Anal., 152, 107043. doi: 10.1016/j.csda.2020.107043
  6. Bajpai J., Singh S. (2019) On orthogonal hypergeometric groups of degree five. Transact. Amer. Math. Soc., 372(11), 7541. doi: 10.1090/tran/7677
  7. Breiman L. (2001) Random Forests. Machine Learning, 45(1), 5-32. doi: 10.1023/A:1010933404324
  8. Chawla N.V., Bowyer K.W., Hall L.O., Kegelmeyer W.P. (2002) SMOTE: Synthetic minority over-sampling technique. J. Artific. Intellig. Res., 321-357. doi: 10.1613/jair.953
  9. Fedorov A.M., Makrygina V.A., Nepomnyaschikh A.I., Zhaboedov A.P., Parshin A.V., Posokhov V.F., Sokolnikova Yu.V. (2019) Geochemistry and petrology of superpure quartzites from East Sayan Mountains, Russia. Acta Geochim. 38(1), 22-39. doi: 10.1007/s11631-018-0268-5
  10. Götze J., Möckel R. (2012) Quartz: Deposits, Mineralogy and Analytics. Spring. Geol., Ó Springer-Verlag Berlin Heidelberg.
  11. Hnila P., Frahm E., Gilibert A. et al. (2025) “Open Sourcing” Workflow and Machine Learning Approaches for Attributing Obsidian Artifacts to Their Volcanic Origins: A Feasibility Study from the South Caucasus. J. Archaeol. Method. Theory, 32(28).
  12. Ke G., Meng Q., Finley Th., Wang T., Chen W., Ma W., Ye Q., Liu T. (2017) LightGBM: A Highly Efficient Gradient Boosting Decision Tree. Proceedings of the 31sup>st Conference on Neural Information Processing Systems (NIPS 2017), Long Beach, 4-9 December 2017, 314s9-3157. https://dl.acm.org/doi/10.5555/3294996.3295074
  13. Lundberg S.M., Lee S.-I. (2017) A Unified Approach to Interpreting Model Predictions. Advances in Neural Information Processing Systems, 30.
  14. Manning C.D., Raghavan P., Schütze H. (2008) Introduction to Information Retrieval. Cambridge University Press, 234-265.
  15. Müller A., Wanvik J.E., Ihlen P.M. (2012) Petrological and Chemical Characterisation of High-Purity Quartz Depo sits with Examples from Norway. (Eds J. Götze, R. Möckel). Quartz: Deposits, Mineralogy and Analytics. Springer Geology. Springer, Berlin, Heidelberg.
  16. Pitblado B.L., Dehler C., Neff H., Nelson S.T. (2008) Pilot study experiments sourcing quartzite, Gunnison Basin, Colorado. Geoarchaeology, 23(6), 742-778. doi: 10.1002/gea.20240
  17. Pitblado B.L., Cannon M.B., Neff H., Dehler C.M., Nelson S.T. (2013) LA-ICP-MS analysis of quartzite from the Upper Gunnison Basin, Colorado. J. Archaeol. Sci., 40(4), 2196-2216. doi: 10.1016/j.jas.2012.11.016
  18. Prokhorenkova L., Gusev G., Vorobev A., Dorogush A.V., Gulin A. (2017) CatBoost: Unbiased boosting with cate gorical features. arXiv:1706.09516v5. doi: 10.48550/arXiv.1706.09516
  19. Shah S.A., Shao Y., Zhang Y., Zhao H., Zhao L. (2022) Texture and Trace Element Geochemistry of Quartz : A Review. Minerals, 12, 1042. doi: 10.3390/min12081042
  20. van der Maaten L.J.P. (2014) Accelerating t-SNE using Tree-Based Algorithms. J. Mach. Learn. Res., 15(93), 3221-3245.
  21. Wang Y., Qiu K.-F., Müller A., Hou Z.-L., Zhu Z.-H., Yu H.-C. (2021) Machine learning prediction of quartz forming-environments. J. Geophys. Res.: Solid Earth, 126, e2021JB021925. doi: 10.1029/2021JB021925
  22. Yu H.F., Huang F.L., Lin C.J. (2011) Dual coordinate descent methods for logistic regression and maximum entropy models. Mach. Learn., 85, 41-75. doi: 10.1007/s10994-010-5221-8
  23. Zhu G.-D., Niu Y.-Y., Liao S.-B., Ruan L., Zhang X.-H. (2023) Discrimination of Quartz Genesis Based on Explainable Machine Learning. Minerals, 13, 997. doi: 10.3390/min13080997

Қосымша файлдар

Қосымша файлдар
Әрекет
1. JATS XML

© Myasnikova A.S., Shendrik R.Y., Eliseev I.A., Chachanagova O.I., Fedorov A.M., Nepomniyschikh A.I., 2025

Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».