Методы разработки и внедрения больших языковых моделей в здравоохранении: проблемы и перспективы в России

Обложка

Цитировать

Полный текст

Аннотация

Большие языковые модели (LLM) трансформируют здравоохранение, позволяя анализировать клинические тексты, поддерживать диагностику и упрощать принятие решений. В этом систематическом обзоре рассматривается эволюция LLM от рекуррентных нейронных сетей (RNN) до основанных на трансформаторах и многомодальных архитектур (например, BioBERT, Med-PaLM), с акцентом на их применение в медицинской практике и проблемы, с которыми они сталкиваются в России. Согласно 40 рецензируемым статьям из Scopus, PubMed и других надёжных источников (2019-2025 гг.), LLM демонстрируют высокую производительность (например, Med-PaLM: F1-критерий 0,88 для бинарной классификации пневмонии на MIMIC-CXR; Flamingo-CXR: предпочтение 77,7% для стационарных/амбулаторных рентгенологических заключений). Однако к ограничениям относятся дефицит данных, трудности с интерпретацией и вопросы конфиденциальности. Адаптация архитектуры «Смесь экспертов» (MoE) для диагностики редких заболеваний и автоматизированного создания отчётов по радиологии дала многообещающие результаты на синтетических наборах данных. В России существуют такие проблемы, как ограниченный объём аннотированных данных и соблюдение Федерального закона № 152-ФЗ. LLM улучшают клинические рабочие процессы, автоматизируя рутинные задачи, такие как создание отчётов и сортировка пациентов, благодаря передовым моделям, таким как KARGEN, повышающим качество отчётов по радиологии. Ориентация России на здравоохранение на основе ИИ соответствует мировым тенденциям, однако лингвистические и инфраструктурные барьеры требуют разработки индивидуальных решений. Разработка надёжных фреймворков валидации для LLM обеспечит их надёжность в различных клинических сценариях. Совместные усилия с международными исследовательскими сообществами в области ИИ могут ускорить внедрение в России передовых медицинских технологий ИИ, особенно в области автоматизации радиологии. Перспективы включают интеграцию LLM с системами здравоохранения и разработку специализированных моделей для российского медицинского контекста. Данное исследование закладывает основу для развития здравоохранения на основе ИИ в России.

Об авторах

Е. Ю. Щетинин

Севастопольский государственный университет

Автор, ответственный за переписку.
Email: riviera-molto@mail.ru
ORCID iD: 0000-0003-3651-7629
Scopus Author ID: 16408533100
ResearcherId: O-8287-2017

Doctor of Physical and Mathematical Sciences, Professor at the Department of Information Technology and Systems

ул. Университетская, д. 33, Севастополь, 299053, Российская Федерация

Т. Р. Велиева

Российский университет дружбы народов

Email: velieva-tr@rudn.ru
ORCID iD: 0000-0003-4466-8531

Candidate of Physical and Mathematical Sciences, Assistent Professor of Department of Probability Theory and Cyber Security

ул. Миклухо-Маклая, д. 6, Москва, 117198, Российская Федерация

Л. А. Юргина

Российский университет дружбы народов

Email: yurgina_la@pfur.ru
ORCID iD: 0009-0004-4661-5059

Ph.D. of Pedagogical Sciences, Head of the Department of Mathematics and Information Technology of the Sochi branch

ул. Куйбышева, д. 32, Сочи, 354340, Российская Федерация

А. В. Демидова

Российский университет дружбы народов

Email: demidova-av@rudn.ru
ORCID iD: 0000-0003-1000-9650

Candidate of Physical and Mathematical Sciences, Associate Professor of Department of Probability Theory and Cyber Security

ул. Миклухо-Маклая, д. 6, Москва, 117198, Российская Федерация

Л. А. Севастьянов

Российский университет дружбы народов; Объединённый институт ядерных исследований

Email: sevastianov-la@rudn.ru
ORCID iD: 0000-0002-1856-4643

Professor, Doctor of Sciences in Physics and Mathematics, Professor at the Department of Computational Mathematics and Artificial Intelligence of RUDN University, Leading Researcher of Bogoliubov Laboratory of Theoretical Physics, Joint Institute for Nuclear Research

ул. Миклухо-Маклая, д. 6, Москва, 117198, Российская Федерация; ул. Жолио-Кюри, д. 6, Дубна, 141980, Российская Федерация

Список литературы

  1. Tu, T., Azizi, S., Singhal, K., et al. Med-PaLM M: A multimodal generative foundation model for health 2024.
  2. Thirunavukarasu, A. J., Ting, D. S. J., Elangovan, K., et al. Large language models in medicine: Opportunities and challenges. Nature Medicine 29, 1930-1940. doi: 10.1038/s41591-023-02448-8 (2023).
  3. Sultan, I. Revolutionizing precision oncology: The role of artificial intelligence in personalized pediatric cancer care. Frontiers in Medicine 12, 1555893. doi: 10.3389/fmed.2025.1555893 (2025).
  4. Lee, J., Yoon, W., Kim, S., Kim, D., Kim, S., So, C. H. & Kang, J. BioBERT: A pre-trained biomedical language representation model for biomedical text mining. Bioinformatics 36, 1234-1240. doi: 10.1093/bioinformatics/btz682 (2020).
  5. Huang, K., Altosaar, J. & Ranganath, R. ClinicalBERT: Modeling clinical notes and predicting hospital readmission 2019.
  6. Li, B., Zhang, Y., Chen, L., Wang, J., Yang, J. & Liu, Z. BLIP-2: Bootstrapping language-image pre-training with frozen image encoders and large language models in Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (2023), 197-208. doi: 10.1109/CVPR52729. 2023.00025.
  7. Lin, T. Y., Zhang, Y. & Chen, X. Mixture of experts for medical imaging and text. Medical Physics 51, 1234-1245. doi: 10.1002/mp.16890 (2024).
  8. Jumper, J., Evans, R., Pritzel, A., Green, T., Figurnov, M., Ronneberger, O., Hassabis, D., et al. AlphaFold for drug discovery: Protein-ligand interaction prediction. Nature 614, 709-716. doi:10. 1038/s41586-023-05788-0 (2023).
  9. Thériault-Lauzier, P. et al. Temporal learning for longitudinal imaging-based recurrence prediction in pediatric gliomas. NEJM AI 2. doi: 10.1056/AIra2400123 (2025).
  10. Li, Y., Wang, Z., Liu, Y., Zhou, L., et al. KARGEN: Knowledge-enhanced automated radiology report generation using large language models 2024.
  11. Liu, Z., Zhang, Y. & Chen, X. BioBART for accelerated biomedical literature review. Bioinformatics doi: 10.1093/bioinformatics/btad456 (2023).
  12. Grisoni, F. ChemBERTa: A chemical language model for drug discovery. Journal of Chemical Information and Modeling 63, 1345-1353. doi: 10.1021/acs.jcim.2c01567 (2023).
  13. Van Veen, D. et al. Collaboration between clinicians and vision-language models in radiology report generation. Nature Medicine 30, 3056-3064. doi: 10.1038/s41591-024-03208-y (2024).
  14. Bannur, S. et al. RaDialog: A large vision-language model for radiology report generation and conversational assistance 2025.
  15. Kasakewitch, J. P. G., Lima, D. L., Balthazar, C. A., et al. The Role of Artificial Intelligence Large Language Models in Literature Search Assistance to Evaluate Inguinal Hernia Repair Approaches. Journal of Laparoendoscopic & Advanced Surgical Techniques 35, 437-444. doi: 10.1089/lap.2024.0277 (2025).
  16. Wu, X., Zhang, Y. & Chen, L. Visual ChatGPT: Multimodal dialogue for medical applications in Medical Image Computing and Computer Assisted Intervention 14221 (2023), 345-354. doi:10.1007/ 978-3-031-43901-8_33.
  17. Delgado, D. Artificial Intelligence-Enabled Analysis of Thermography to Diagnose Acute Decompensated Heart Failure. JACC: Advances 4, 101888. doi: 10.1016/j.jacadv.2025.101888 (2025).
  18. Arora, A. & Arora, A. The promise of large language models in health care. The Lancet 401, 641. doi: 10.1016/S0140-6736(23)00217-6 (2023).
  19. Thirunavukarasu, A. J., Ting, D. S. J., Elangovan, K., Gutierrez, L., Tan, T. F. & Ting, D. S. W. Federated learning for medical AI: A practical approach. Nature Machine Intelligence 5, 389-398. doi: 10.1038/s42256-023-00645-8 (2023).
  20. Namiri, N. K., Puglisi, C. E. & Lipsky, P. E. Machine learning in rheumatic autoimmune inflammatory diseases. Nature Reviews Rheumatology 17, 669-680. doi: 10.1038/s41584-02100692-7 (2021).
  21. Touvron, H., Martin, L., Stone, K., Albert, P., Almahairi, A., Babaei, Y., Scialom, T., et al. Llama 2: Open foundation and fine-tuned chat models 2023.
  22. Meskó, B. & Görög, M. A short guide for medical professionals in the era of artificial intelligence. NPJ Digital Medicine 3, 126. doi: 10.1038/s41746-020-00333-z (2020).
  23. Beltagy, I., Lo, K. & Cohan, A. SciBERT: A pretrained language model for scientific text in Proceedings of the 2023 Conference on Empirical Methods in Natural Language Processing (2023), 1234-1245. doi: 10.18653/v1/2023.emnlp-main.76.
  24. Wang, J., Zhang,Y. & Li, X. Multimodal LLMs for scientific trend prediction. JournalofInformetrics doi: 10.1016/j.joi.2024.101345 (2024).
  25. Chen, Y., Zhang, L. & Wang, J. GPT-3 for drug repurposing in infectious diseases. Journal of Medical Chemistry 66, 2345-2353. doi: 10.1021/acs.jmedchem.2c01567 (2023).
  26. Khader, F., Müller-Franzes, G. & Wang, S. Synthetic data generation for medical imaging using GANs. Medical Image Analysis 78. doi: 10.1016/j.media.2022.102399 (2022).
  27. Rajpurkar, P., Chen, E., Banerjee, O. & Topol, E. J. AI in health and medicine. Nature Medicine 28, 31-38. doi: 10.1038/s41591-021-01614-0 (2022).
  28. Loaiza-Bonilla, A. & Penberthy, S. Challenges in integrating artificial intelligence into health care: Bias, privacy, and validation. NEJM AI 2. doi: 10.1056/AIp2400789 (2025).
  29. Che, J., Zhang, X. & Liu, Y. Ensemble methods for improving LLM reliability. Journal of Artificial Intelligence Research 68, 567-580. doi: 10.1613/jair.1.13845 (2023).
  30. Chowdhery, A., Narang, S., Devlin, J., Bosma, M., Mishra, G., Roberts, A., Fiedel, N., et al. PaLM: Scaling language modeling with pathways 2022.
  31. Radanliev, P. & De Roure, D. The ethics of shared Covid-19 risks: An epistemological framework for ethical health technology assessment of risk in vaccine supply chain infrastructures. Health and Technology 11, 1083-1091. doi: 10.1007/s12553-021-00587-3 (2021).
  32. Pang, T., Li, P. & Zhao, L. A survey on automatic generation of medical imaging reports based on deep learning. BioMedical Engineering Online 22, 48. doi: 10.1186/s12938-023-01113-y (2023).
  33. Kim, S. et al. Large language models: A guide for radiologists. Korean Journal of Radiology 25, 126-133. doi: 10.3348/kjr.2023.0997 (2024).
  34. Fink, M. A. et al. Automatic structuring of radiology reports with on-premise open-source large language models. European Radiology 34, 6285-6294. doi: 10.1007/s00330-024-09876-5 (2024).
  35. López-Úbeda, P., Martín-Noguerol, T., Díaz-Angulo, C. & Luna, A. Evaluation of large language models performance against humans for summarizing MRI knee radiology reports: A feasibility study. International Journal of Medical Informatics 187, 105443. doi: 10.1016/j.ijmedinf.2024.105443 (2024).
  36. Jorg, T. et al. Automated integration of AI results into radiology reports using common data elements. Journal of Imaging Informatics in Medicine 38, 45-53. doi: 10.1007/s10278-024-01023-4 (2025).
  37. Gertz, R. J., Bunck, A. C., Lennartz, S., et al. GPT-4 for automated determination of radiological study and protocol based on radiology request forms: A feasibility study. Radiology 307, e230877. doi: 10.1148/radiol.230877 (2023).

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML

Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».