Сферы применения корпусных менеджеров в российском и зарубежном научном пространстве

Обложка

Цитировать

Полный текст

Аннотация

Статья посвящена обзору сфер применения корпусных менеджеров в российских и зарубежных научных публикациях за последние 10 лет. Установлено, что корпусные менеджеры и программное обеспечение на основе искусственного интеллекта применяются для анализа изменений, происходящих в языке в течение времени (десемантизации, дизамбигуации, транстерминологизации), тематических исследований конкретных типов текстов, составления терминологических словарей и баз данных, обучения иностранному языку.

Об авторах

Светлана Андреевна Романова

Московский государственный лингвистический университет

Автор, ответственный за переписку.
Email: s.a.romanova@linguanet.ru

специалист отдела научного менеджмента и наукометрии

Россия

Список литературы

  1. Gorozhanov A. I., Guseynova I. A. Korpusanalyse der Konstituenten Grammatischer Kategorien im Literarischen Text mit Berücksichtigung der Linguoregionalen Komponente // Журнал Сибирского федерального университета. Серия: Гуманитарные науки. 2020. Vol. 13. № 12. P. 2035–2048. doi: 10.17516/1997-1370-0702. EDN KFHPJI.
  2. Палийчук Д. А. Корпусные технологии в лингвистических исследованиях // Гуманитарные исследования. История и филология. 2022. № 6. С. 72–79. doi: 10.24412/2713-0231-2022-6-72-79. EDN VLMGJT.
  3. Горожанов А. И., Гусейнова И. А., Степанова Д. В. Стандартизированная процедура получения статистических параметров текста (на материале цикла рассказов Дж. Лондона «Смок Белью. Смок и Малыш») // Вестник Минского государственного лингвистического университета. Серия 1: Филология. 2022. № 4 (119). С. 7–13. EDN PXAVUX.
  4. Титова С. В., Игнатова С. Д. Технология применения мультимодальных лингвистических корпусов для развития умений иноязычной интеракции // Вестник Тамбовского университета. Серия: Гуманитарные науки. 2024. Т. 29. № 6. С. 1539–1549. doi: 10.20310/1810-0201-2024-29-6-1539-1549. EDN CBJDQP.
  5. Баранов В. А. Кирилло-Мефодиевская и Восточноболгарская лексика в рукописях X–XV вв. (корпусное исследование) // Вестник Волгоградского государственного университета. Серия 2: Языкознание. 2023. Т. 22. № 6. С. 5–20. doi: 10.15688/jvolsu2.2023.6.1. EDN CRRTSY.
  6. Клочихин В. В. Корпусные технологии искусственного интеллекта в обучении сочетаемости слов и исследовательской работе // Иностранные языки в школе. 2024. № 3. С. 39–46. EDN JFYLHF.
  7. Беляева Т. Р. Атрибутивное существительное во множественном числе в многокомпонентных синтагмах английской научной речи // Ученые записки национального общества прикладной лингвистики. 2021. № 1 (33). С. 57–72. EDN NZQDSU.
  8. Беляева Т. Р. Корпусный подход к изучению общенаучной лексики английского языка: имя прилагательное // Казанская наука. 2022. № 3. С. 91–97. EDN WCSSBE.
  9. Шпит Е. И., Куровский В. Н. Англоязычное научное письмо: затруднения начинающих русскоязычных авторов // Вестник Красноярского государственного педагогического университета имени В. П. Астафьева. 2022. № 3 (61). С. 193–219. doi: 10.25146/1995-0861-2022-61-3-363. EDN EXQKUF.
  10. Беспалова Ю. Е., Тастемирова З. К., Волкова М. В. Корпусный анализ перефразирования в научном дискурсе: закономерности, стратегии и последствия для улучшения письма и общения в академических текстах // Гуманитарные исследования. 2024. № 1 (89). С. 23–29. EDN MRAPDZ.
  11. Uchida S. Using early LLMs for corpus linguistics: Examining ChatGPT’s potential and limitations. Applied Corpus Linguistics. 2024. Vol. 4. Iss. 1. P. 100089. doi: 10.1016/j.acorp.2024.100089.
  12. Горожанов А. И. Архитектура сбалансированного лингвистического корпуса, полученного автоматическим путем (опыт Московского государственного лингвистического университета) // Вестник Московского государственного лингвистического университета. Гуманитарные науки. 2024. № 11 (892). С. 24–30. EDN BCSCXQ.
  13. Горожанов А. И., Красикова Е. А. Получение значимых данных из неподготовленного текста путем его автоматической обработки авторскими лингвистическими инструментами (на материале электронных китайских СМИ) // Вопросы прикладной лингвистики. 2024. № 54. С. 115–138. doi: 10.25076/vpl.54.05. EDN GGUQXL.
  14. Горожанов А. И., Гусейнова И. А. Применение элементов технологии управляемого искусственного интеллекта для наполнения онлайн-курса иностранного языка // Язык в эпоху цифровых трансформаций и развития искусственного интеллекта: сб. науч. ст. Международной научной конф., Минск, 23–24 октября. 2024 года. Минск: Минский государственный лингвистический университет, 2024. С. 26–32. EDN RQRSJA.
  15. Горожанов А. И., Степанова Д. В. Лингводидактический потенциал сбалансированного корпуса текстов (на материале английского языка) // Актуальные проблемы лингвистики и лингводидактики иностранного языка делового и профессионального общения: сб. материалов XI Международной науч.-практ. конф. Москва, 17–18 апреля 2024 года. М.: РУДН, 2024. С. 343–345. EDN TNKAPX.
  16. Васильева Т. В., Салимов Ф. Н. Предпосылки создания цифрового переводного терминологического словаря тезаурусного типа для иностранных пользователей вузов инженерного профиля // Русский язык за рубежом. 2023. № 1 (296). С. 38–45. doi: 10.37632/PI.2023.296.1.006. EDN OPTNFC.
  17. Шмелева О. Н. Краткий обзор переводных словарей противопожарной лексики (на материале немецкого и русского языков) // Культура и безопасность. 2021. № 4. С. 64–70. doi: 10.25257/KB.2021.4.64-70. EDN IPPZAH.
  18. Мусаева А. С., Сложеникина Ю. В. Когнитивная обработка термина в процессе транстерминологизации (на примере терминов искусственного интеллекта) // Вестник Череповецкого государственного университета. 2024. № 6 (123). С. 103–113. doi: 10.23859/1994-0637-2024-6-123-9. EDN VBWFAM.
  19. Гаджиев А. А., Хмелев А. К. Алгоритм Леска и система Babelfy для дизамбигуации // Вопросы прикладной лингвистики. 2019. № 4 (36). С. 54–77. doi: 10.25076/vpl.36.03. EDN PVWXOG.
  20. Зарипова Д. А., Лукашевич Н. В. Подходы к автоматическому разрешению многозначности на основе неравномерности распределения значений слов в корпусе // Вестник Московского университета. Серия 9: Филология. 2023. № 6. С. 40–51. doi: 10.55959/MSU0130-0075-9-2023-47-06-4. EDN ALEVII.
  21. Большина А. С. Методы автоматического формирования семантически размеченных корпусов // Вестник Московского университета. Серия 9: Филология. 2022. № 2. С. 173–183. EDN QHGJLK.
  22. Awotunde J. B. Chapter 28 – Word sense disambiguation in biomedical applications // Mining Biomedical Text, Images and Visual Features for Information Retrieval. Editor(s): Sujata Dash, Subhendu Kumar Pani, Wellington Pinheiro Dos Santos, Jake Y. Chen. Academic Press. 2025. P. 587–605. doi: 10.1016/B978-0-443-15452-2.00028-5.
  23. Коврижкин А. А. Семантические проблемы машинного перевода // Роль и место лингвокультурной адаптации художественного текста в теории и практике перевода. Переводческие стратегии и тактики: материалы Всероссийской науч.-практ. конф. с международным участием, Москва, 23 декабря 2021 года. М.: МГОУ, 2022. С. 295–302. EDN EZPPCR.
  24. Alexeyevsky D. A., Temchenko A. V. WSD in monolingual dictionaries for Russian Word Net: Proceedings of the 8th Global Word Net Conference, GWC 2016: 8, Bucharest, 27–30 January 2016. Bucharest, 2016. P. 10–15. EDN WSTVXB.
  25. Säily T. et al. Changing styles of letter-writing? Evidence from 400 years of early English letters in a POS-tagged corpus / Säily T., Vartiainen T., Siirtola H., Nevalainen T. // Unlocking the History of English: Pragmatics, prescriptivism and text types. Ed. by Luisella Caon, Moragh S. Gordon and Thijs Porck. Amsterdam: John Benjamins Publishing Company, 2024. P. 154–179. doi: 10.1075/cilt.364.07sai.
  26. Sadia B. et al. Meeting the challenge: A benchmark corpus for automated Urdu meeting summarization / Sadia B., Adeeba F., Shams S., Javed K. // Information Processing & Management. 2024. Vol. 61. Iss. 4. P. 103734. doi: 10.1016/j.ipm.2024.103734.
  27. Hassanein H. S. A., Moustafa B. S. M. Sequential order of antonym pairs in Modern Standard Arabic: A corpus-based analysis // Lingua. 2024. Vol. 306. P. 103742. doi: 10.1016/j.lingua.2024.103742.
  28. Sene-Mongaba B. The Making of Lingala Corpus: An Under-resourced Language and the Internet // Procedia – Social and Behavioral Sciences. 2015. Vol. 198. P. 442–450. doi: 10.1016/j.sbspro.2015.07.464.
  29. Aurora F. DĀMOS (Database of Mycenaean at Oslo). Annotating a Fragmentarily Attested Language // Procedia – Social and Behavioral Sciences. 2015. Vol. 198. P. 21–31. doi: 10.1016/j.sbspro.2015.07.415.
  30. Curry N., Baker P., Brookes G. Generative AI for corpus approaches to discourse studies: A critical evaluation of ChatGPT // Applied Corpus Linguistics. 2024. Vol. 4. Iss. 1. P. 100082. doi: 10.1016/j.acorp.2023.100082.
  31. Crosthwaite P., Baisa V. Generative AI and the end of corpus-assisted data-driven learning? Not so fast! // Applied Corpus Linguistics. 2023. Vol. 3. Iss. 3. P. 100066. doi: 10.1016/j.acorp.2023.100066.

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML


Creative Commons License
Эта статья доступна по лицензии Creative Commons Attribution 4.0 International License.

Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».