Некоторые особенности литературных текстов при их сопоставлении для определения их авторства

Обложка

Цитировать

Полный текст

Открытый доступ Открытый доступ
Доступ закрыт Доступ предоставлен
Доступ закрыт Только для подписчиков

Аннотация

Разработан метод анализа литературных авторских текстов на основе выбора наиболее частотных, характерных для определенного авторского стиля служебных частей речи, и вычисления их весовых коэффициентов (базируется на вычислении наиболее часто используемых в литературных произведениях предлогов, союзов и частиц). Сам процесс вычисления весовых коэффициентов, определяемых отношениями величин служебных частей речи в тексте к общему объему слов, подробно проанализирован. Приводятся экспериментальные результаты по установлению авторства литературных текстов для двух авторов. Результаты получены путем сопоставлений числовых значений однотипных весовых коэффициентов, выраженных в процентах. Полученные теоретические и практические результаты могут быть использованы для анализа, выявления лингвистических особенностей, отличий не только художественных текстов, но, в дальнейшем, текстов любого жанра и стиля.

Об авторах

Гурами Николаевич Ахобадзе

Институт проблем управления им. В. А. Трапезникова РАН

Автор, ответственный за переписку.
Email: ahogur@ipu.ru

Ведущий научный сотрудник, доктор технических наук

Россия, Москва

Елена Ю. Русяева

Институт проблем управления им. В. А. Трапезникова РАН

Email: rusyaeva@ipu.ru

Старший научный сотрудник, кандидат философских наук

Россия, Москва

Список литературы

  1. Михеев М.Ю., Эрлих Л.И. Идиостилевой профиль и определение авторства текста по частотам служебных слов // Научно-техническая информация. Серия 2: Информационные процессы и системы. 2018. №2. С. 25-34
  2. Михеев М.Ю., Эрлих Л.И. Текстовые скрепы и их частоты как различительный признак авторских идиостилей Электронный ресурс. Дата обращения 15.03.2024. https://ruslang.ru/sites/default/files/doc/grigoriev2022/M ish.pdf
  3. Орлова, М. В. Михеев М.Ю., Эрлих Л.И. Об отличиях русского научного идиостиля от художественного по частотам употребления текстовых скреп / Вопросы литературы. 2022. № 1. с.118-140.
  4. Кукушкина О.В., Поликарпов А.А. Частотные и распределительные характеристики русских предлогов и синтаксем, с ними связанных (по «Ядерному компьютерному корпусу текстов русских газет конца ХХ-ого века») // Язык, сознание, коммуникация. Выпуск 47. М.: МАКС Пресс. том 47. 2013. с. 341-362
  5. Всеволодова М.В., Кукушкина О.В., Поликарпов А.А. Русские предлоги и средства предложного типа. Материалы к функционально-грамматическому описанию реального употребления. Книга 1. Введение в объективную грамматику и лексикографию русских пред- ложных единиц. М.: URSS, 2013. 304 с.
  6. Большакова Е.И., Воронцов К.В., Ефремова Н.Э., Клышинский Э.С., Лукашевич Н.В., Сапин А.С. Автоматическая обработка текстов на естественном языке и ана- лиз данных. М.: НИУ ВШЭ. 2017. 269 с.
  7. Смирнов И.В., Шелманов А.О. Семантико-синтаксический анализ естественных языков // Искусственный интеллект и принятие решений. 2013. № 1. С. 41-54.
  8. Морозов Н.А. Лингвистические спектры: Средство для отличения плагиатов от истинных произведений того или другого известного автора: Стилеметрический этюд // Известия Отдела русского языка и словесности Императорской Академиинаук. 1915. Т. 20, кн. 4. С. 93-127.
  9. Марков А.А. Об одном применении статистического ме- тода // Изв.Имп.акад.наук. Серия 6. 1916. N4. с. 239-242.
  10. Атрибуция текста: теория и практика (festivalnauki.ru). Электронный ресурс. Дата обращения 12.02.2024.
  11. Smith Peter, Aldrigde W. (2011): Improving Authorship Attribution: Optimizing Burrows’s Delta Method // Journal of Quantitative Linguistics 18. Рр. 63–88.
  12. Рыжкович А.Ч. К вопросу о треминологическом статусе предлога // Universum: Филология и искусствоведение: электронный научный журнал. 2018. № 9(55). URL: http://7universum.com/ru/ philology/archive/item/6385
  13. Shalymov D, Granichin O, Klebanov L, Volkovich Z. Literary writing style recognition via a minimal spanning tree- based approach // Expert Systems with Applications 61, 145-153, 2016 doi: 10.1016/j.eswa.2016.05.032
  14. Суетин В. Ю. Применение частотных характеристик для определения авторства литературных текстов // Вестник ТвГУ. Серия: Прикладная математика. 2022, выпуск 2. с. 84–89 doi: 10.26456/vtpmk637
  15. Воронина, М. Ю. Орлов Ю. Н. Определение автора текста методом сегментации. Федеральный исследовательский центр «Институт прикладной математики им. М. В. Келдыша Российской академии наук», 2022. DOI: https://doi.org/10.20537/2076-7633-2022-14-5- 1199-1210
  16. Кислицын А.А., Кислицына М.Ю. Распознавание выборочных распределений среди системы эталонов: метод ближайшего соседа // Препринты ИПМ им. М.В.Келдыша. 2023. № 29. 21с. https://doi.org/10.20948/prepr-2023-29 https://library.keldysh.ru/preprint.asp?id=2023-2
  17. Горожанов А. И. Создание лингвистического корпуса на основе инструментов обработки естественного языка: планирование программных решений // Филологические науки. Вопросы теории и практики. 2023. Том 16. Выпуск 5. С. 1616-1620.
  18. Гаспаров М.Л. Лингвистика стиха // Известия PAH.Сер. лит. и языка. – М., 1994. Т. 53. № 6. с. 28-35.
  19. Федянин Д. Н., Русяева Е. Ю., Ахобадзе Г. Н. Лингвистический анализатор текста: Свидетельство о государственной регистрации программы для ЭВМ № 2023668307 РФ; Зарег. 25.08.2023.
  20. Литрес. Электронный ресурс: https://www.litres.ru/book/maks-alekseevich- glebov/chernyy-staratel-67077536/ Дата обращения 10.01.2024.

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML


Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».