Структурные модели англоязычных терминов для автоматической обработки корпусов научно-технических текстов

Обложка

Цитировать

Полный текст

Аннотация

В статье рассмотрены структурные модели английских многокомпонентных терминов из предметной области «Welding types» как основа для разметки корпуса научно-технических текстов. Обозначено место корпусов научно-технических текстов в корпусной лингвистике и перспективы дальнейших научных исследований на их основе. Актуальность исследования обусловлена необходимостью создания корпусов научно-технических текстов в целом и средств автоматической разметки терминов в частности. Обосновано, что основной проблемой при создании корпусов научно-технических текстов является автоматическая разметка терминологических словосочетаний. Проведен анализ современного состояния терминосистемы предметной области «Welding types». Рассмотрена формальная структура элементов терминосистемы «Welding types». Представлены результаты анализа двух-, трех, четырехкомпонентных английских терминологических словосочетаний предметной области «Welding types», а также их структурные модели. Все структурные модели английских терминологических словосочетаний проиллюстрированы примерами. Выделены наиболее продуктивные модели английских терминологических словосочетаний. Показано, что наиболее продуктивная модель - сочетание ядерного элемента с именем существительным или прилагательным в функции препозитивного определения - прослеживается у двухкомпонентных словосочетаний, но анализ более сложных образований показывает, что модель «левое определение, присоединенное к ядру термина» присутствует и в них, демонстрируя родовые признаки. Обоснована необходимость перечисления всех возможных структурных моделей терминологических сочетаний предметной области «Welding types». Новизна исследования видится в формировании базы данных структурных моделей терминологических словосочетаний как основы надкорпусной базы данных о структуре терминов для повышения качества автоматической разметки корпусов научно-технических текстов и обработки терминов-кандидатов при проведении корпусных исследований.

Об авторах

Юлия Ивановна Бутенко

Российский университет дружбы народов

Автор, ответственный за переписку.
Email: iubutenko@bmstu.ru
кандидат технических наук, доцент кафедры «Романо-германские языки» факультета «Лингвистика», Московский государственный технический университет им. Н.Э. Баумана; ассистент кафедры иностранных языков факультета гуманитарных и социальных наук, Российский университет дружбы народов 117198, Российская Федерация, Москва, ул. Миклухо-Маклая, 6

Наталия Сергеевна Николаева

Московский государственный технический университет им. Н.Э. Баумана

Email: natalynic@yandex.ru
кандидат филологических наук, доцент кафедры «Английский язык для машиностроительных специальностей» факультета «Лингвистика» 105005, Российская Федерация, Москва, 2-я Бауманская, д. 5, стр. 1

Елена Юрьевна Карцева

Российский университет дружбы народов

Email: kartseva_eyu@rudn.ru
кандидат исторических наук, доцент кафедры иностранных языков факультета гуманитарных и социальных наук 117198, Российская Федерация, Москва, ул. Миклухо-Маклая, 6

Список литературы

  1. Nagel’, O.V. (2008). Corpus linguistics and its use in computer-based language teaching. Language and culture, 4, 53—59. (In Russ.).
  2. Zakharov, V.P. (2015). Corpora of the Russian Language. Proceedings of the V.V. Vinogradov Russian Language Institute, 6, 20—65. (In Russ.).
  3. Kruzhkov, M.G. (2015). Information resources for contrastive studies: electronic text corpora. Systems and means of informatics, 25(2), 140—159. (In Russ.).
  4. Lesnikov, S.V. (2019). The types of marking of text corpora of the Russian language. Scientific and Technical Information. Series 2. Information Processes and Systems, 9, 27—30. (In Russ.).
  5. Zakharov, V.P. & Khokhlova, M.V. (2014). Automatic extracting of terminological phrases. Structural and Applied Linguistics, 10, 182—200. (In Russ.).
  6. Zakharov, V.P. & Khokhlova, M.V. (2012). Automatic term extraction and statistical analysis in a special text corpus as a tool for thesaurus construction. Structural and Applied Linguistics, 9, 222—233. (In Russ.).
  7. Loukachevitch, N. & Dobrov, B. (2018). Ontological Resources for Representing Security Domain in Information-Analytical System. Open Semantic Technology for Intelligent Systems, 8, 185—191.
  8. Morev, N.A. (2012). To the problem of linguistic analysis of terminology in the field of nanotechnology (on the need to develop a research corpus of terminological units). Vestnik of Moscow State Linguistic University. Humanities, 13(646), 115—124. (In Russ.).
  9. Sidnyaev, N.I., Butenko, I.I. & Bolotova, E.E. (2020). Formal Grammar Theory in Recognition Methods of Unknown Objects. Automatic Documentation and Mathematical Linguistics, 54(4), 215—225.
  10. Nikolaeva, N.S. (2011). Peculiarities of origin of the basic terms of the “Welding” system (on the material of English and Russian terminology). Bulletin of the Moscow Region State University. Series: Linguistics, 1, 132—138. (In Russ.).
  11. Lejchik, V.M. (1986). About the language substrate of the term. Topics in the study of language, 5, 87—97. (In Russ.).
  12. Lejchik, V.M. (1994). Original concepts, basic provisions, definitions of modern terminology and terminology. Bulletin of Kharkiv Polytechnic Institute, 1, 147—180. (In Russ.).
  13. Lotte, D.S. (1961). Basics of building scientific and technical terminology. Moscow: Izdatel’stvo AN SSSR. (In Russ.).
  14. Tsitkina, F.A. (1988). Terminology and translation. L’vov: Vysshaya shkola. (In Russ).
  15. Nikolaeva, N.S. (2013). Peculiarities of the initial stage in the formation of the terminology (the prescientific and protoscientific periods). Humanities Bulletin of BMSTU. URL: http://hmbul.bmstu.ru/catalog/pedagog/engped/87.html. (accessed: 25.10.2020). (In Russ.).
  16. Lejchik, V.M. (1981). Optimal length and structure of the term Voprosy Jazykoznanija (Topics in the study of language), 2, 63—73. (In Russ.).
  17. Grinev-Grinevich, S.V. (2020). On terminology aspects of scientific and technical translation. Bulletin of the Moscow Region State University. Series: Linguistics, 6(2), 74—78. (In Russ.).
  18. Zolotykh, V.T. (1967). English-Russian dictionary of welding production, A.A. Erokhin (ed.). Moscow: Sovetskaya Encyclopedia. (In Russ.).
  19. Nikolaeva, N.S. (2015). Teaching reading literature in English in the specialty “Welding”: a lexical guide. Moscow: MSTU named after N.E. Bauman publ. (In Russ.).
  20. Cordovi, Marcel A. (1944). Glossary of Foreign Welding Terms, M.A. Cordovi (comp.). New York: American Welding Society.
  21. Extensive Experience with Both Consumable Guide and High Speed ​​Conventional Electroslag Welding [Electronic resource]. URL: http://www.netwelding.com/serv04.htm#Background Details (accessed: 06.17.2020).
  22. Friction Stir Welding. In: Wikipedia: the free encyclopedia [Electronic resource]. URL: http://en.wikipedia.org/wiki/Friction_stir_welding (accessed: 05.11.2020).
  23. Fusion Splicing. In: Wikipedia: the free encyclopedia [Electronic resource]. URL: http://en.wikipedia.org/wiki/Fusion_splicing (accessed: 05.11.2020).
  24. History of MIG (GMAW) Welding [Electronic resource]. URL: http://www.netwelding.com/History_MIG%201.htm#Atomic Hydrogen (accessed: 05.14.2020).
  25. History of Welding — in the Beginning [Electronic resource]. URL: http://www.netwelding.com/History%20of%20Welding.htm (accessed: 05.11.2020).
  26. Laser-Hybrid Welding. In: Wikipedia: the free encyclopedia. [Electronic resource]. URL: http://en.wikipedia.org/wiki/Laser-hybrid_welding (accessed: 05.12.2020).
  27. Mackenzie, L.B. (1951). The Welding Encyclopedia, T.B. Jefferson (ed.). New York: McGray-Hill.
  28. Terms and Definitions (1969). AWS A 3.0-69, prep. By AWS Com. On definitions and symbols. Under the dir. of AWS Technical activities com. New York: American Welding Society.
  29. Welding handbook (1976). In: Fundamentals of welding. Vol. 1. Miami: American Welding Society.

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML

Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».