Linguodidactic properties of corpus technologies

Cover Page

Cite item

Full Text

Abstract

For the last two decades, corpus technologies, understood as a combination of means and methods of processing and analyzing data of electronic linguistic corpora, as a type of information and communication technology, have attracted great interest of researchers and teachers of foreign languages.We explain the concepts of corpus linguistics, corpus technology, linguistic corpus, concordance. The methods of studying case technologies, which are an annotation, abstraction, and analysis, are considered. The advantages of linguistic corpora are given. The history of the emergence and development of linguistic electronic cases from the pre-digital to digital period is described. Minimum requirements for the corpus of texts are presented. They include representativeness, known volume of the corpus, electronic form, annotation and balance. We consider the typology of linguistic corpora. According to the language of the texts in corpora, there are monolingual and multilingual corpora, which in turn are divided into mixed and parallel ones. According to language data, there are written, oral and mixed corpora. Corpora can be annotated and non-annotated. There are three types of annotation: linguistic, metatextual, and extralinguistic. According to the parameter of representation of the language material of a corpus, there are fragmented and non-fragmented ones. According to the type of access, they are classified as open and restricted. According to the genre representation, linguistic corpora are diverse. The size of a corpus should distinguish between representative, illustrative and monitoring types of corpora. The didactic properties of corpus technologies in the field of teaching a foreign language are studied. The division of the linguodidactic properties of case technologies into mandatory and optional is proposed.

About the authors

P. Y. Zolotov

Derzhavin Tambov State University

Author for correspondence.
Email: pitirim93@gmail.com
ORCID iD: 0000-0002-3886-1952

Assistant of Linguistics and Humanitarian Pedagogic Education Department

33 Internatsionalnaya St., Tambov 392000, Russian Federation

References

  1. Rykov V.V. Pragmaticheski oriyentirovannyy korpus tekstov [Pragmatically oriented corpus of texts]. Trudy Mezhdunarodnogo seminara «Dialog-99» [Proceedings of International Seminar “Dialogue-99”]. Moscow, Tarusa, 1999, no. 1, pp. 89-96. (In Russian).
  2. Sysoyev P.V. Lingvisticheskiy korpus v metodike obucheniya ino-strannym yazykam [Linguistic corpus in teaching foreign languages]. Yazyk i kul'tura – Language and Culture, 2010, no. 1 (9), pp. 99-111. (In Russian).
  3. Kokoreva A.A. Metodika obucheniya studentov professional’noy leksike na osnove korpusa parallel’nykh teks-tov (angliyskiy yazyk, napravleniye podgotovki «Ekonomika»): avtoref. dis. … kand. ped. nauk [Methods of Teaching Professional Lexicon to Students on the Basis of Parallel Texts Corpus (the English Language, “Eco-nomics” Programme). Cand. ped. sci. diss. abstr.]. Moscow, Sholokhov Moscow State University for Humani-ties, 2013. (In Russian).
  4. Semich Y.I. Didakticheskiye svoystva i metodicheskiye funktsii korpusnykh tekhnologiy [Didactic properties and methodical functions of corpus technologies]. Vestnik Tambovskogo universiteta. Seriya: Gumanitarnye nauki – Tambov University Review. Series: Humanities, 2018, vol. 23, no. 177, pp. 39-49. doi: 10.20310/1810-0201-2018-23-177-39-49. (In Russian).
  5. McEnery T., Xiao R., Tono Y. Corpus Based Language Studies. New York, Routledge Publ., 2007.
  6. Wallis S.A., Nelson G. Knowledge discovery in grammatically analysed corpora. Data Mining and Knowledge Discovery, 2001, vol. 5(4), pp. 305-336.
  7. Jan Svartvik (ed.). Directions in Corpus Linguistics. Proceedings of Nobel Symposium 82 Stockholm, 4–8 August 1991. Berlin, Mouton de Gruyter Publ., 1992, 487 p.
  8. Kopotev M.V. Vvedeniye v korpusnuyu lingvistiku [Introduction to Corpus Linguistics]. Praha, Animedia Publ., 2014.
  9. Sysoyev P.V. Sovremennyye informatsionnyye i kommunikatsionnyye tekhnologii: didakticheskiye svoystva i funktsii [Modern information and communication technologies: didactic characteristics and functions]. Yazyk i kul'tura – Language and Culture, 2012, no. 1 (17), pp. 120-133. (In Russian).

Supplementary files

Supplementary Files
Action
1. JATS XML

Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».