🔧На сайте запланированы технические работы
25.12.2025 в промежутке с 18:00 до 21:00 по Московскому времени (GMT+3) на сайте будут проводиться плановые технические работы. Возможны перебои с доступом к сайту. Приносим извинения за временные неудобства. Благодарим за понимание!
🔧Site maintenance is scheduled.
Scheduled maintenance will be performed on the site from 6:00 PM to 9:00 PM Moscow time (GMT+3) on December 25, 2025. Site access may be interrupted. We apologize for the inconvenience. Thank you for your understanding!

 

Monuments in Mongolian Writing: An Experience of Creating a Parallel Corpus

Abstract

This article highlights the results of the work on creating a parallel corpus of Buryat sources in Mongolian script. The project is being carried out with the support of the Russian Science Foundation, based on the archival materials from the Center for Eastern Manuscripts and Xylographs of the IMBT SB RAS. The subject of the research is the process of creating a database for the corpus, the specifics of compiling it, particularly the selection of materials. Currently, the developing corpus includes the following documents from the archival funds of the CVRK IMBT SB RAS: texts of historical content—"A Brief Outline of the History of Khori-Mongolian Buryats," "On the History of the Zugalai Region"; an official document "Protocol of the All-Buryat Assembly in Chita in 1917"; an ethnographic composition "Narrative of Samdan Noyon," a medical work "Notes of Tibetan Doctor Donduba Munkuyev"; a work of Buddhist didactic literature "Subhashita" translated by Galsan-Jimba Tuguldur. General scientific and source study methods were applied to the analysis of handwritten, printed, and xylographic texts in Mongolian script. The processes of material selection, their transliteration and translation, as well as substantive (thematic, lexical) and technical aspects (typos, pagination, numerals) were examined. The parallel Russian-language version is being created by the research group. The authors emphasize the significance of creating a parallel corpus as a resource for further research in the field of Buryat linguistics, translation studies, and cultural studies, as well as its role in promoting Old Mongolian script among the general public and preserving the intangible heritage of the Baikal region. The corpus represents a unique database for further research in various fields of science, etc. The texts considered will serve as a basis for the development of machine translation algorithms, and the work being conducted at this stage will help future developers create more effective algorithms. The creation of a specialized database that is open not only to researchers but also to representatives of the educational sector, professional translators, and anyone showing a scientific or cultural interest in written heritage appears promising.

References

  1. Бурятский корпус [Электронный ресурс]. – Режим доступа: https://buryat.web-corpora.net/ (дата обращения: 16.09.2024).
  2. Диахронический корпус бурятского языка [Электронный ресурс]. – Режим доступа: http://annals.imbtarchive.ru/ (дата обращения: 16.09.2024).
  3. Ринчинов О.С. Диахронический корпус бурятского языка как цифровой инструмент исторических исследований: подходы, решения, экспериментальные исследования // Историческая информатика. 2020. № 2. С. 26-34. doi: 10.7256/2585-7797.2020.2.33446 URL: https://nbpublish.com/library_read_article.php?id=33446
  4. Ринчинов О. С., Абаева Ю. Д. Геоинформационный веб-ресурс "Диалектный корпус бурятского языка" // Филологические науки. Вопросы теории и практики. 2023. Т. 16, № 1. С. 328-334. doi: 10.30853/phil20230006. EDN: KTPPAM.
  5. Национальный корпус калмыцкого языка [Электронный ресурс]. – Режим доступа: http://kalmcorpora.ru/ (дата обращения: 16.09.2024).
  6. Монгольский корпус [Электронный ресурс]. – Режим доступа: http://web-corpora.net/MongolianCorpus/search/index.php?interface_language=ru (дата обращения: 16.09.2024).
  7. Бадмаева Л. Д. Монголоязычные корпуса: современное состояние // Вестник Бурятского государственного университета. Филология. 2015. № 10. С. 148-152.
  8. Бадмаева Л. Б. Языковое пространство бурятского летописного текста / Л. Б. Бадмаева ; отв. ред. Л. Д. Шагдаров ; Федеральное гос. бюджетное учреждение науки Ин-т монголоведения, буддологии и тибетологии Сибирского отд-ния РАН. Улан-Удэ : Изд-во Бурятского науч. центра СО РАН, 2012. ISBN 978-5-7925-0340-3.
  9. Цыренова Н. Д. История хоринских бурят: рукопись Даши Бубеева // Гуманитарный вектор. 2020. Т. 15, № 3. С. 153-160. doi: 10.21209/1996-7853-2020-15-3-153-160. EDN: NWQLEX.
  10. Цыренова Н. Д., Ван И. Д. Об одном историческом сочинении бурятского летописца Д. Бубеева // Духовное наследие народов Центральной Азии. Улан-Удэ : Изд-во БНЦ СО РАН, 2020. С. 212-214.
  11. Цыренова Н. Д. Краевед Даши Бубеев и его рукопись "Об истории местности Зугалай" как источник по истории Агинского округа // Вестник Бурятского научного центра Сибирского отделения Российской академии наук. 2023. № 1(49). С. 97-103. doi: 10.31554/2222-9175-2023-49-97-103. EDN: UFBUBV.
  12. Центр восточных рукописей и ксилографов Института монголоведения, буддологии и тибетологии Сибирского отделения Российской академии наук. MII-680.
  13. Центр восточных рукописей и ксилографов Института монголоведения, буддологии и тибетологии Сибирского отделения Российской академии наук. МI-32.
  14. Галданова Г. Р., Дашибалов Б.-Ц. Рукописное наследие Ц. Самданова // Культура Центральной Азии: письменные источники. Вып. 2. Сб. ст. Улан-Удэ: Изд-во БНЦ СО РАН, 1998. С. 145-166.
  15. Ванчикова Ц. П., Жабон Ю. Ж., Цыренова Н. Д., Дашиева С. Б. Рукопись бурятского эмчи-ламы Д. Ендонова из монгольской коллекции ЦВРК ИМБТ Сибирского отделения РАН // Вестник архивиста. 2020. № 4. С. 1255-1266. doi: 10.28995/2073-0101-2020-4-1255-1266. EDN: MNRCML.
  16. Центр восточных рукописей и ксилографов Института монголоведения, буддологии и тибетологии Сибирского отделения Российской академии наук. MII-269.
  17. Базаров Б. В., Ринчинов О. C., Базаров А. А. Цифровая трансформация письменного наследия тибетского буддизма: состояние и перспективы // Oriental Studies. 2022. Vol. 15, No. 4. P. 740-750. doi: 10.22162/2619-0990-2022-61-4-740-750. EDN: VPYBAW.

Supplementary files

Supplementary Files
Action
1. JATS XML


Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».