№ 3 (2024)

Обложка

Весь выпуск

Машинное обучение, нейронные сети

Причины искажения контента: анализ и классификация галлюцинаций в больших языковых моделях GPT

Маджумдер М.Ш., Бегунова Д.Д.

Аннотация

В статье исследуются галлюцинации, возникающие в двух версиях большой языковой модели GPT – GPT-3.5-turbo и GPT-4. Основная цель работы заключается в изучении возможных источников и классификации галлюцинаций, а также в разработке стратегий для их решения. Выявлены проблемы, которые могут привести к генерации контента, не соответствующего фактологическим данным и вводящего пользователей в заблуждение. Результаты исследования имеют практическую значимость для разработчиков и пользователей языковых моделей, ввиду предоставленных подходов, повышающих качество и достоверность генерируемого контента.

Искусственный интеллект и принятие решений. 2024;(3):32-41
pages 32-41 views

Многослойные искусственные нейронные сети с функцией активации типа s-парабола и их приложения

Хачумов М.В., Емельянова Ю.Г.

Аннотация

Выполнен анализ современных работ в области построения быстродействующих нейронов и нейронных сетей. Приведен алгоритм настройки многослойной нейронной сети прямого распространения с функцией активации типа s-парабола. Рассмотрены примеры применения s-параболы в составе искусственных нейронных сетей для решения задач распознавания и прогнозирования временных рядов. Дано сравнение качества решений, полученных предложенным подходом, с решениями на основе нейронных сетей с традиционным сигмоидом. Показано наличие преимущества s-параболы по скорости обучения и последующего решения прикладной задачи.

Искусственный интеллект и принятие решений. 2024;(3):42-53
pages 42-53 views

Алгоритм вычисления значений весов сверточной нейронной сети без обучения

Гейдаров П.Ш.

Аннотация

Приведено описание алгоритма, на основе которого аналитически вычисляются весовые и пороговые значения, а также количество каналов слоев сверточной нейронной сети. Результаты экспериментов показали, что время вычисления весов сверточных нейронных сетей сравнительно мало и составляет доли секунды или минуты. Уже при использовании всего 10 выбранных изображений (эталонов) из базы MNIST, аналитически вычисленные сверточные нейронные сети способны распознавать более половины изображений контрольной базы MNIST, без использования алгоритмов обучений нейронных сетей. Предварительное аналитическое вычисление весов сверточной нейронной сети позволяет ускорить процедуру ее обучения, поскольку оно заменяется на процесс до обучения.

Искусственный интеллект и принятие решений. 2024;(3):54-70
pages 54-70 views

Анализ текстовой и графической информации

Алгоритм построения ориентированного ациклического графа слов

Шиян В.И.

Аннотация

Алгоритм, представленный в статье, позволяет эффективно строить и модифицировать минимальные детерминированные конечные автоматы для распознавания заданного множества слов, в том числе при обработке большого объёма информации в реальном времени. Ключевой особенностью алгоритма является возможность добавления новых слов в автомат и его последующая минимизация «на лету». Алгоритм основан на лексикографическом упорядочении множества входных слов и обладает низкой вычислительной сложностью по сравнению с традиционными алгоритмами, такими как алгоритм Хопкрофта или алгоритм, использующий построение пар различимых состояний. Разработка данного алгоритма направлена на повышение скорости построения минимальных детерминированных конечных автоматов и их модификации для эффективной обработки естественного языка и анализа web-контента в реальном времени.

Искусственный интеллект и принятие решений. 2024;(3):104-112
pages 104-112 views

Извлечение номенклатурных наименований из англо- и русскоязычных научно-технических текстов

Бутенко Ю.И.

Аннотация

В статье предложен метод извлечения англо- и русскоязычных номенклатурных наименований из научно-технических текстов на основе структурных моделей специальной лексики. Проанализированы их структурные и семантические особенности, а на основе проведенного анализа созданы модели англо- и русскоязычных номенклатурных наименований. Предложен метод автоматического извлечения номенклатурных наименований из англо- и русскоязычных научно-технических текстов. Результаты исследований могут быть использованы при разработке различных систем обработки научно-технических текстов, разметке специальных корпусов, сборе языкового материала при создании терминологических словарей и баз данных за счет учета большего числа моделей специальной лексики и применения методов обработки научно-технических текстов на русском и английском языках.

Искусственный интеллект и принятие решений. 2024;(3):113-121
pages 113-121 views

Интеллектуальное планирование и управление

Точная многоклассовая сегментация пожаров: подходы, нейронные сети, схемы сегментации

Бочков В.С., Катаева Л.Ю., Масленников Д.А.

Аннотация

В статье представлено решение задачи многоклассовой сегментации пламени с разделением по цвету горения. Сформулированы математические задачи частичной (без выделения класса фона в отдельный компонент вектора поиска) и полной (с выделением) сегментации. Проведено сравнение сверточных нейросетевых методов классов UNet, Deeplab и их современных вариаций, в том числе метода wUUNet, разработанного специально для рассматриваемой задачи. Сделан акцент на влиянии размера матрицы вычислений сегментации с исходным кадром. Предложены схемы как сегментации с потерями (сжатие кадра до размеров матрицы вычисления с последующим разжатием в исходный), так и без потерь (применяя однооконную схему размера кадра или многооконные схемы его разбиения на сетку подобластей). Отобраны лучшие методы и схемы сегментации с точки зрения качества.

Искусственный интеллект и принятие решений. 2024;(3):71-86
pages 71-86 views

Система предиктивной аналитики технического состояния эксгаустера агломашины с помощью методов искусственного интеллекта

Чернухин А.В., Богданова Е.А., Савицкая Т.В., Кулаков Д.Г., Павлов И.Р.

Аннотация

В статье описаны подходы к построению программной системы, позволяющей прогнозировать возможные отказы и неисправности промышленного оборудования на основе данных о его состоянии. Для задачи прогнозирования неисправностей оборудования предложена модель, основанная на «мягком голосовании» между тремя алгоритмами, имеющими различные подходы к классификации: сверточная нейронная сеть, логистическая регрессия и метод опорных векторов. Для прогнозирования отказов показана модель, основанная на алгоритме изолирующего леса и нейронной сети на базе LSTM. Разработан веб-сервис, реализующий основные функции программной системы предиктивной аналитики на базе методов искусственного интеллекта: мониторинг технического состояния эксгаустеров в режиме реального времени, статистический анализ произошедших неисправностей, прогнозирование неисправностей и обучение моделей.

Искусственный интеллект и принятие решений. 2024;(3):87-103
pages 87-103 views

Представление знаний

Доверие к технологиям искусственного интеллекта

Кобринский Б.А.

Аннотация

Доверие к искусственному интеллекту является ключевым фактором широкого внедрения интеллектуальных технологий в экономику и социальную сферу. В статье рассматриваются различные аспекты данной проблемы. Это доверие к знаниям и данным, к моделям искусственного интеллекта и машинного обучения; риски и границы применимости используемых методов и технологий; объяснимость выдаваемых решений и человеко-ориентированность искусственного интеллекта; первичная валидация и вторичная валидация (верификация) создаваемых систем; галлюцинации и фальсификации ChatGPT; этические, юридические и организационные аспекты применения искусственного интеллекта.

Искусственный интеллект и принятие решений. 2024;(3):3-17
pages 3-17 views

Понятийная модель знаний

Выхованец В.С.

Аннотация

В статье рассмотрены известные методы представления и обработки знаний. Предлагается использование новой модели, названной понятийной, отличающейся тем, что отношения (связи) между понятиями рассматриваются как обычные понятия. Понятие определено как форма мысли, выражаемая именованным множеством сущностей. Конкретные понятия идентифицируют одну сущность, а абстрактные образуются путем обобщения (объединения) или ассоциации (декартова произведения) других понятий. Декларативные знания задаются перечислимыми множествами сущностей, а процедурные – разрешимыми, где разрешающие процедуры выражаются формулами одноместного исчисления предикатов. Приведено описание прикладного языка представления и обработки знаний. Доказано, что запросы к понятийной модели выполняются за полиномиальное время от логарифма среднего числа сущностей у понятий. Обоснована возможность обучения понятийных моделей без учителя. Показано, что понятийная модель позволяет наглядно представлять и эффективно обрабатывать как декларативные, так и процедурные знания.

Искусственный интеллект и принятие решений. 2024;(3):18-31
pages 18-31 views

Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».