Применение NLP-моделей для извлечения ценовой информации из неструктурированных диалогов

Обложка

Цитировать

Полный текст

Открытый доступ Открытый доступ
Доступ закрыт Доступ предоставлен
Доступ закрыт Только для подписчиков

Аннотация

Цель. В данной статье рассмотрены теоретические и практические аспекты применения моделей обработки естественного языка (NLP) в бизнес-процессах организаций различного масштаба. Целью исследования является систематизация и анализ основных направлений применения NLP-моделей в современном бизнесе, а также разработка практических рекомендаций по их эффективному внедрению. Модель. Исследование опирается на работы зарубежных авторов, концептуально изучавших применение NLP-моделей применительно к различным бизнес-процессам. Методология исследования основана на системном анализе научных публикаций и отраслевых отчетов, сравнительном анализе технологических решений и структурно-функциональном подходе к систематизации областей применения NLP. Выводы. Проведен анализ основных задач, решаемых с помощью NLP-моделей в бизнесе, среди которых отмечены генерация текстового контента, классификация текстов, автоматизация клиентской поддержки, саммаризация информации, машинный перевод и персонализация маркетингового взаимодействия. Исследован технологический пайплайн создания и обучения NLP-моделей с детальным рассмотрением процессов токенизации, векторного представления данных и применения механизма внимания. Проведен эксперимент по применению NLP-моделей для решения бизнес-задачи извлечения ценовой информации из неструктурированных диалогов, который показал значительное превосходство языковых моделей (точность 75%) над традиционными подходами. Показан пример пошаговой интеграции трех методов обработки русскоязычных текстов с увеличением точности с 22,4 до 75% при идентификации финансовых параметров сделок». Результаты исследования демонстрируют высокий потенциал NLP-технологий для оптимизации бизнес-процессов. Выявлено, что, несмотря на растущий интерес к данным технологиям, их полноценное внедрение в бизнес-процессы отечественных компаний остается ограниченным. Практическое значение. Сформулированы практические рекомендации по стратегическому подходу к внедрению NLP-технологий, включающие поэтапную интеграцию с измеримыми результатами, фокус на решении конкретных бизнес-задач и необходимость инвестиций в обучение персонала. Показан пример применения модели для решения задачи по извлечению информации из корпусов текста на русском языке. Социальные последствия. Широкое внедрение NLP-технологий в бизнесе ведет к значительным изменениям в структуре занятости, требуя переквалификации специалистов и создания новых компетенций на рынке труда. Оригинальность/ценность. Исследование представляет ценность для руководителей бизнеса, ИТ-специалистов и специалистов по цифровой трансформации, предложен комплексный анализ возможностей применения NLP-технологий в различных отраслях экономики. Новизна работы заключается в систематизации направлений применения NLP-моделей в бизнесе с учетом российской специфики и текущих рыночных тенденций.

Об авторах

Дмитрий Вячеславович Бокарев

Российская академия народного хозяйства и государственной службы при Президенте Российской Федерации

Автор, ответственный за переписку.
Email: dbokarevv@gmail.com
ORCID iD: 0009-0005-9883-9772

аспирант

Россия, Москва

Cергей Иванович Никишов

Российская академия народного хозяйства и государственной службы при Президенте Российской Федерации

Email: nikishov-si@ranepa.ru
ORCID iD: 0000-0001-7407-2515
SPIN-код: 2004-3380

доктор экономических наук, доцент, заведующий кафедры системной и программной инженерии

Россия, Москва

Список литературы

  1. Атоев В.В., Чувенков А.Ф. Применение технологий искусственного интеллекта для анализа удовлетворенности клиентов в сфере доставки еды // Научный вектор: сборник научных трудов. Ростов-н/Д.: Ростовский гос. экон. ун-т «РИНХ», 2024. С. 304–306. EDN: NVZEPI.
  2. Батищев А.В., Мамедов Р.С., Кондратенко Н.А., Волков А.В. Достижение бизнес-целей посредством использования NLP // Естественно-гуманитарные исследования. 2023. № 6 (50). С. 596–600. EDN: PGNTXJ.
  3. Мартынова И.Р., Платонов Е.Н. Семантический анализ отзывов об организациях методами машинного обучения // Моделирование и анализ данных. 2024. Т. 14. № 1. С. 7–26. doi: 10.17759/mda.2024140101. EDN: FWXPLF.
  4. Рогаткин А.В. Использование технологий искусственного интеллекта для автоматизации процессов обслуживания клиентов и повышения качества сервиса // Хлебопечение России. 2024. Т. 68. № 2. С. 100–107. EDN: OGCJXG.
  5. Arif W. Leveraging Natural Language Processing (NLP) for automated customer support systems. 2024. URL: https://www.researchgate.net/publication/384678656_Leveraging_Natural_Language_Processing_NLP_for_Automated_Customer_Support_Systems
  6. Bahja M. Natural Language Processing applications in business. 2021. doi: 10.5772/intechopen.92203. URL: https://www.intechopen.com/chapters/71990
  7. Cappel J., Chasin F. Bridging enterprise knowledge management and Natural Language Processing – integration framework and a prototype // Design Science research for a resilient future. Proceedings of 19th International Conference on Design Science Research in Information Systems and Technology, DESRIST 2024 (Trollhättan, Sweden, June 3–5, 2024). 2024. Pp. 278–294. doi: 10.1007/978-3-031-61175-9_19.
  8. Collobert R., Weston J. A unified architecture for natural language processing: Deep neural networks with multitask learning // Proceedings of the 25th international conference on machine learning. 2008. Pp. 160–167.
  9. Devlin J., Chang M.W., Lee K., Toutanova K. BERT: Pre-training of deep bidirectional transformers for language understanding // Proceedings of the 2019 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies. 2019. Pp. 4171–4186.
  10. Fisher I.E., Garnsey M.R., Hughes M.E. Natural language processing in accounting, auditing and finance: A synthesis of the literature with a roadmap for future research // Intelligent Systems in Accounting, Finance and Management. 2016. No. 23 (3). Pp. 157–214.
  11. Følstad A., Nordheim C.B., Bjørkli C.A. What makes users trust a chatbot for customer service? An exploratory interview study // International Conference on Internet Science. 2018. Pp. 194–208.
  12. Howard J., Ruder S. Universal language model fine-tuning for text classification // Proceedings of the 56th Annual Meeting of the Association for Computational Linguistics. 2018. Pp. 328–339.
  13. Hutchins J. Machine translation: Past, present, future. N.Y.: Ellis Horwood, 1986. 382 p. (Ellis Horwood Series in Computers and their Applications)
  14. Jelinek F. Self-organized language modeling for speech recognition // Readings in speech recognition. 1990. Pp. 450–506.
  15. Liu Y., Ott M., Goyal N. et al. RoBERTa: A robustly optimized BERT pretraining approach // arXiv preprint arXiv:1907.11692. 2019.
  16. Mikolov T., Chen K., Corrado G., Dean J. Efficient estimation of word representations in vector space // arXiv preprint arXiv:1301.3781. 2013.
  17. Pennington J., Socher R., Manning C.D. GloVe: Global vectors for word representation // Proceedings of the 2014 conference on empirical methods in natural language processing (EMNLP). 2014. Pp. 1532–1543.
  18. Sintoris K., Vergidis K. Extracting business process models using Natural Language Processing (NLP) techniques. 2017. Pp. 135–139. doi: 10.1109/CBI.2017.41.
  19. Turing A.M. Computing machinery and intelligence // Mind. 1950. No. 59 (236). Pp. 433–460.
  20. Vaswani A., Shazeer N., Parmar N. et al. Attention is all you need // Advances in neural information processing systems. 2017. Pp. 5998–6008.

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML
2. Рис. 1. Структура рынка искусственного интеллекта в России в 2023 г.: 1 – обработка естественного языка; 2 – анализ данных; 3 – генеративный ИИ; 4 – компьютерное зрение; 5 – финансовые технологии; 6 – реклама; 7 – промышленность; 8 – робототехника; 9 – распознавание речи

Скачать (107KB)


Ссылка на описание лицензии: https://www.urvak.ru/contacts/

Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».