🔧На сайте запланированы технические работы
25.12.2025 в промежутке с 18:00 до 21:00 по Московскому времени (GMT+3) на сайте будут проводиться плановые технические работы. Возможны перебои с доступом к сайту. Приносим извинения за временные неудобства. Благодарим за понимание!
🔧Site maintenance is scheduled.
Scheduled maintenance will be performed on the site from 6:00 PM to 9:00 PM Moscow time (GMT+3) on December 25, 2025. Site access may be interrupted. We apologize for the inconvenience. Thank you for your understanding!

 

Artificial intelligence technologies in the formation of the archival environment: problems and prospects

Cover Page

Cite item

Full Text

Abstract

The authors studied the prospects of using artificial intelligence (AI) technologies to create and develop a digital archival environment, as well as their impact on the optimization and automation of archived data management processes. The main purpose of the work is to analyze modern digital solutions aimed at improving the processes of storing, searching and processing archival documents (including handwritten, damaged, multilingual). The paper explores key technologies used in digital archives, including intelligent scanning, natural language processing (NLP), computer vision, machine learning, and intelligent search methods. Special attention is paid to the problems of loss of archival materials, the need to restore them, ensure data security and accessibility, which is especially important in an unstable political situation and limited resources for new territories. The research is based on a systematic analysis of modern information technologies and their application in the archival business. The work uses methods of comparative analysis, classification and forecasting, which allows us to identify key areas of AI implementation in the archival field. The novelty of the work lies in an integrated approach to analyzing the use of AI in the archival field, identifying problematic aspects of archive digitalization, and proposing automation of the processes of storing, processing, and searching archival data. It is concluded that artificial intelligence technologies can significantly improve the efficiency of archives, providing accelerated document processing, intelligent classification, data protection and convenient access to information. In addition, the need to develop new algorithms based on machine learning is emphasized, which will improve the recognition of handwritten texts, the processing of corrupted documents and multilingual archival materials. The introduction of such technologies is becoming an important part of the digital transformation strategy of archival affairs and plays a key role in preserving historical heritage.

References

  1. Мащенко Н. Е. Формирование архивной среды как элемента социокультурного пространства // Донецкие чтения 2023: Образование, наука, инновации, культура и вызовы современности: Материалы VIII Международной научной конференции. Донецк, 2023. С. 91-93.
  2. Гайдарь Е. В. Современные информационные системы и технологии в условиях цифровой трансформации бизнеса // Экономика: Сб. науч. работ ГОУ ВПО «ДОНАУИГС». 2022. Вып. 25. С. 47-57.
  3. Белов И. И. Роль технологий искусственного интеллекта в цифровой трансформации делопроизводства и архивного дела // Научный вестник Крыма, 2022. № 4 (39). С. 1-6.
  4. Лобачев С. Л. Место искусственного интеллекта в подготовке специалистов по документоведению и архивоведению // Вестник Юридического института МИИТ. 2021. № 2 (34). С. 135-142.
  5. Ильина К. Б. Искусственный интеллект в архивах: опыт применения в Российской Федерации, проблемы и перспективы // Архивы и электронные документы: вызовы времени : Доклады и сообщения Международной научно-практической конференции, Самарканд, 20 сентября 2023 года. Москва: ВНИИДАД, 2024. С. 144-152.
  6. Шалков Д. Ю. Искусственный интеллект в документоведении: эргономика профессиональной деятельности // Управление информацией и документацией в цифровой среде: сб. науч. ст. по материалам III Всероссийской научно-практической конференции (Донецк, 21-22 ноября 2024 г.) / ред. коллегия: Пономаренко Н. Ш. (председатель) [и др.]; ФГБОУ ВО «Донецкий государственный университет» [и др.]. Донецк: ДонГУ, 2024. С. 124-132.
  7. Киселев И. Н. О применении искусственного интеллекта в распознавании текстов // Вестник ВНИИДАД. 2024. № 1. С. 84-95.
  8. Давлетов А. Р. Современные методы машинного обучения и технология OCR для автоматизации обработки документов // Вестник науки. 2023. Т. 5, № 10 (67). С. 676-698. – DOI: https://doi.org/10.24412/2712-8849-2023-1067-676-698.
  9. Terras M. Inviting AI into the archives: The reception of handwritten recognition technology into historical manuscript transcription // "em"Archives, Access and Artificial Intelligence"/em". 2022. December. Pp. 179-204. – DOI: https://doi.org/10.1515/9783839455845-008.
  10. Shang E., Liu X., Wang H., Rong Y., & Liu Y. Research on the application of artificial intelligence and distributed parallel computing in archives classification // 2019 IEEE 4th Advanced Information Technology, Electronic and Automation Control Conference (IAEAC). 2020. February. Pp. 1267-1271. – DOI: https://doi.org/10.1109/IAEAC47372.2019.8997992
  11. Haffenden C., Fano E., Malmsten M., & Börjeson L. Making and using AI in the library: Creating a BERT model at the National Library of Sweden // "em"College & Research Libraries"/em". 2023. № 84(1). – DOI: https://doi.org/10.5860/crl.84.1.30
  12. Carter K., Gondek A., Underwood W., Randby T., & Marciano R. Using AI and ML to optimize information discovery in under-utilized, Holocaust-related records // "em"AI & Society"/em". 2022. № 37. May. Pp. 837-858. – DOI: https://doi.org/10.1007/s00146-021-01368-w
  13. Männistö A., Seker M., Iosifidis A., & Raitoharju J. Automatic image content extraction: Operationalizing machine learning in humanistic photographic studies of large visual archives // "em"arXiv"/em". 2022. April. – DOI: https://doi.org/10.48550/arXiv.2204.02149
  14. Alothman A., & Sait A. Managing and retrieving bilingual documents using artificial intelligence-based ontological framework // "em"Computational Intelligence and Neuroscience"/em". 2022. August. Pp. 1-15. – DOI: https://doi.org/10.1155/2022/4636931
  15. Modiba M. User perception on the utilization of artificial intelligence for the management of records at the Council for Scientific and Industrial Research // Collection and Curation. 2023. № 42(3). Pp. 81-87. – DOI: https://doi.org/10.1108/CC-11-2021-0033
  16. Yang Y. Write what you want: Applying text-to-video retrieval to audiovisual archives // "em"arXiv"/em". 2023. October. – DOI: https://doi.org/10.48550/arXiv.2310.05825

Supplementary files

Supplementary Files
Action
1. JATS XML


Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».