Применение методов машинного обучения для классификации кварцитов по химическому составу: влияние микроэлементов и геохимическая идентификация

Обложка

Цитировать

Полный текст

Аннотация

   Объект исследования. Кварциты из различных участков Восточно-Саянского кварценосного района.   Цель. Целью данного исследования является применение методов машинного обучения для эффективной классификации образцов кварцитов по их химическому составу, включая идентификацию ключевых микроэлементов, таких как марганец, и выявление геохимических различий между образцами.   Материалы и методы. В исследовании использовались данные химического анализа 776 образцов кварцита, которые были подвергнуты интерпретации с помощью методов машинного обучения. В качестве методов были применены стандартные техники предварительной обработки данных, такие как нормализация, а также аугментация данных с использованием SMOTE для решения проблемы дисбаланса классов. В итоге был выбран алгоритм CatBoost, который показал высокую точность классификации.   Результаты. Результаты кросс-валидации показали, что алгоритм CatBoost достиг точности классификации до 97 %. Важность признаков указывает на то, что марганец является ключевым элементом в классификации образцов, в то время как такие элементы, как алюминий и калий, оказывают вспомогательное влияние. Также успешно проведен анализ классификации по цвету кварцитов с точностью до 0.94.   Выводы. Исследование демонстрирует эффективность применения методов машинного обучения для анализа химического состава кварцитов, предоставляя новые возможности для геохимических и археологических исследований.

Об авторах

А. С. Мясникова

Институт геохимии им. А.П. Виноградова СО РАН

Email: sasham@igc.irk.ru

Р. Ю. Шендрик

Институт геохимии им. А.П. Виноградова СО РАН

И. А. Елисеев

Институт геохимии им. А.П. Виноградова СО РАН

О. И. Чачанагова

Институт геохимии им. А.П. Виноградова СО РАН

А. М. Федоров

Институт геохимии им. А.П. Виноградова СО РАН

А. И. Непомнящих

Институт геохимии им. А.П. Виноградова СО РАН

Список литературы

  1. Аюржанаева Д.Ц., Федоров А.М., Мазукабзов А.М., Непомнящих А.И., Очирова Э.А. Посохов В.Ф. (2020) Механизмы формирования химически чистых кварцитов Бурал-Сардыкского месторождения. Геология и геофизика, 61(10), 1316-1330. doi: 10.15372/GiG2023128
  2. Непомнящих А.И., Федоров А.М., Жабоедов А.П., Волкова М.Г. (2023) Высокочистые кварциты Восточного Саяна. Геология и геофизика, 64(8), 1205-1215. doi: 10.15372/GiG2023128
  3. Федоров А.М., Макрыгина В.А., Мазукабзов А.М., Непомнящих А.И., Аюржанаева Д.Ц., Волкова М.Г. (2021) Ресурсы кварцевого сырья Гарганской зоны Восточносаянского кварцитоносного района. Георесурсы, 23(4), 96-106. doi: 10.18599/grs.2021.4.11
  4. Юдович Я.Э., Кетрис М.П. (2013) Геохимия марганца в процессах гипергенеза : обзор. Биосфера, 5(1) 21-36.
  5. Baak M., Koopman R., Snoek H., Klous S. (2020) A new correlation coefficient between categorical, ordinal and interval variables with Pearson characteristics. Comput. Stat. Data Anal., 152, 107043. doi: 10.1016/j.csda.2020.107043
  6. Bajpai J., Singh S. (2019) On orthogonal hypergeometric groups of degree five. Transact. Amer. Math. Soc., 372(11), 7541. doi: 10.1090/tran/7677
  7. Breiman L. (2001) Random Forests. Machine Learning, 45(1), 5-32. doi: 10.1023/A:1010933404324
  8. Chawla N.V., Bowyer K.W., Hall L.O., Kegelmeyer W.P. (2002) SMOTE: Synthetic minority over-sampling technique. J. Artific. Intellig. Res., 321-357. doi: 10.1613/jair.953
  9. Fedorov A.M., Makrygina V.A., Nepomnyaschikh A.I., Zhaboedov A.P., Parshin A.V., Posokhov V.F., Sokolnikova Yu.V. (2019) Geochemistry and petrology of superpure quartzites from East Sayan Mountains, Russia. Acta Geochim. 38(1), 22-39. doi: 10.1007/s11631-018-0268-5
  10. Götze J., Möckel R. (2012) Quartz: Deposits, Mineralogy and Analytics. Spring. Geol., Ó Springer-Verlag Berlin Heidelberg.
  11. Hnila P., Frahm E., Gilibert A. et al. (2025) “Open Sourcing” Workflow and Machine Learning Approaches for Attributing Obsidian Artifacts to Their Volcanic Origins: A Feasibility Study from the South Caucasus. J. Archaeol. Method. Theory, 32(28).
  12. Ke G., Meng Q., Finley Th., Wang T., Chen W., Ma W., Ye Q., Liu T. (2017) LightGBM: A Highly Efficient Gradient Boosting Decision Tree. Proceedings of the 31sup>st Conference on Neural Information Processing Systems (NIPS 2017), Long Beach, 4-9 December 2017, 314s9-3157. https://dl.acm.org/doi/10.5555/3294996.3295074
  13. Lundberg S.M., Lee S.-I. (2017) A Unified Approach to Interpreting Model Predictions. Advances in Neural Information Processing Systems, 30.
  14. Manning C.D., Raghavan P., Schütze H. (2008) Introduction to Information Retrieval. Cambridge University Press, 234-265.
  15. Müller A., Wanvik J.E., Ihlen P.M. (2012) Petrological and Chemical Characterisation of High-Purity Quartz Depo sits with Examples from Norway. (Eds J. Götze, R. Möckel). Quartz: Deposits, Mineralogy and Analytics. Springer Geology. Springer, Berlin, Heidelberg.
  16. Pitblado B.L., Dehler C., Neff H., Nelson S.T. (2008) Pilot study experiments sourcing quartzite, Gunnison Basin, Colorado. Geoarchaeology, 23(6), 742-778. doi: 10.1002/gea.20240
  17. Pitblado B.L., Cannon M.B., Neff H., Dehler C.M., Nelson S.T. (2013) LA-ICP-MS analysis of quartzite from the Upper Gunnison Basin, Colorado. J. Archaeol. Sci., 40(4), 2196-2216. doi: 10.1016/j.jas.2012.11.016
  18. Prokhorenkova L., Gusev G., Vorobev A., Dorogush A.V., Gulin A. (2017) CatBoost: Unbiased boosting with cate gorical features. arXiv:1706.09516v5. doi: 10.48550/arXiv.1706.09516
  19. Shah S.A., Shao Y., Zhang Y., Zhao H., Zhao L. (2022) Texture and Trace Element Geochemistry of Quartz : A Review. Minerals, 12, 1042. doi: 10.3390/min12081042
  20. van der Maaten L.J.P. (2014) Accelerating t-SNE using Tree-Based Algorithms. J. Mach. Learn. Res., 15(93), 3221-3245.
  21. Wang Y., Qiu K.-F., Müller A., Hou Z.-L., Zhu Z.-H., Yu H.-C. (2021) Machine learning prediction of quartz forming-environments. J. Geophys. Res.: Solid Earth, 126, e2021JB021925. doi: 10.1029/2021JB021925
  22. Yu H.F., Huang F.L., Lin C.J. (2011) Dual coordinate descent methods for logistic regression and maximum entropy models. Mach. Learn., 85, 41-75. doi: 10.1007/s10994-010-5221-8
  23. Zhu G.-D., Niu Y.-Y., Liao S.-B., Ruan L., Zhang X.-H. (2023) Discrimination of Quartz Genesis Based on Explainable Machine Learning. Minerals, 13, 997. doi: 10.3390/min13080997

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML

© Мясникова А.С., Шендрик Р.Ю., Елисеев И.А., Чачанагова О.И., Федоров А.М., Непомнящих А.И., 2025

Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».