№ 3 (2024)
Машинное обучение, нейронные сети
Причины искажения контента: анализ и классификация галлюцинаций в больших языковых моделях GPT
Аннотация
В статье исследуются галлюцинации, возникающие в двух версиях большой языковой модели GPT – GPT-3.5-turbo и GPT-4. Основная цель работы заключается в изучении возможных источников и классификации галлюцинаций, а также в разработке стратегий для их решения. Выявлены проблемы, которые могут привести к генерации контента, не соответствующего фактологическим данным и вводящего пользователей в заблуждение. Результаты исследования имеют практическую значимость для разработчиков и пользователей языковых моделей, ввиду предоставленных подходов, повышающих качество и достоверность генерируемого контента.



Многослойные искусственные нейронные сети с функцией активации типа s-парабола и их приложения
Аннотация
Выполнен анализ современных работ в области построения быстродействующих нейронов и нейронных сетей. Приведен алгоритм настройки многослойной нейронной сети прямого распространения с функцией активации типа s-парабола. Рассмотрены примеры применения s-параболы в составе искусственных нейронных сетей для решения задач распознавания и прогнозирования временных рядов. Дано сравнение качества решений, полученных предложенным подходом, с решениями на основе нейронных сетей с традиционным сигмоидом. Показано наличие преимущества s-параболы по скорости обучения и последующего решения прикладной задачи.



Алгоритм вычисления значений весов сверточной нейронной сети без обучения
Аннотация
Приведено описание алгоритма, на основе которого аналитически вычисляются весовые и пороговые значения, а также количество каналов слоев сверточной нейронной сети. Результаты экспериментов показали, что время вычисления весов сверточных нейронных сетей сравнительно мало и составляет доли секунды или минуты. Уже при использовании всего 10 выбранных изображений (эталонов) из базы MNIST, аналитически вычисленные сверточные нейронные сети способны распознавать более половины изображений контрольной базы MNIST, без использования алгоритмов обучений нейронных сетей. Предварительное аналитическое вычисление весов сверточной нейронной сети позволяет ускорить процедуру ее обучения, поскольку оно заменяется на процесс до обучения.



Анализ текстовой и графической информации
Алгоритм построения ориентированного ациклического графа слов
Аннотация
Алгоритм, представленный в статье, позволяет эффективно строить и модифицировать минимальные детерминированные конечные автоматы для распознавания заданного множества слов, в том числе при обработке большого объёма информации в реальном времени. Ключевой особенностью алгоритма является возможность добавления новых слов в автомат и его последующая минимизация «на лету». Алгоритм основан на лексикографическом упорядочении множества входных слов и обладает низкой вычислительной сложностью по сравнению с традиционными алгоритмами, такими как алгоритм Хопкрофта или алгоритм, использующий построение пар различимых состояний. Разработка данного алгоритма направлена на повышение скорости построения минимальных детерминированных конечных автоматов и их модификации для эффективной обработки естественного языка и анализа web-контента в реальном времени.



Извлечение номенклатурных наименований из англо- и русскоязычных научно-технических текстов
Аннотация
В статье предложен метод извлечения англо- и русскоязычных номенклатурных наименований из научно-технических текстов на основе структурных моделей специальной лексики. Проанализированы их структурные и семантические особенности, а на основе проведенного анализа созданы модели англо- и русскоязычных номенклатурных наименований. Предложен метод автоматического извлечения номенклатурных наименований из англо- и русскоязычных научно-технических текстов. Результаты исследований могут быть использованы при разработке различных систем обработки научно-технических текстов, разметке специальных корпусов, сборе языкового материала при создании терминологических словарей и баз данных за счет учета большего числа моделей специальной лексики и применения методов обработки научно-технических текстов на русском и английском языках.



Интеллектуальное планирование и управление
Точная многоклассовая сегментация пожаров: подходы, нейронные сети, схемы сегментации
Аннотация
В статье представлено решение задачи многоклассовой сегментации пламени с разделением по цвету горения. Сформулированы математические задачи частичной (без выделения класса фона в отдельный компонент вектора поиска) и полной (с выделением) сегментации. Проведено сравнение сверточных нейросетевых методов классов UNet, Deeplab и их современных вариаций, в том числе метода wUUNet, разработанного специально для рассматриваемой задачи. Сделан акцент на влиянии размера матрицы вычислений сегментации с исходным кадром. Предложены схемы как сегментации с потерями (сжатие кадра до размеров матрицы вычисления с последующим разжатием в исходный), так и без потерь (применяя однооконную схему размера кадра или многооконные схемы его разбиения на сетку подобластей). Отобраны лучшие методы и схемы сегментации с точки зрения качества.



Система предиктивной аналитики технического состояния эксгаустера агломашины с помощью методов искусственного интеллекта
Аннотация
В статье описаны подходы к построению программной системы, позволяющей прогнозировать возможные отказы и неисправности промышленного оборудования на основе данных о его состоянии. Для задачи прогнозирования неисправностей оборудования предложена модель, основанная на «мягком голосовании» между тремя алгоритмами, имеющими различные подходы к классификации: сверточная нейронная сеть, логистическая регрессия и метод опорных векторов. Для прогнозирования отказов показана модель, основанная на алгоритме изолирующего леса и нейронной сети на базе LSTM. Разработан веб-сервис, реализующий основные функции программной системы предиктивной аналитики на базе методов искусственного интеллекта: мониторинг технического состояния эксгаустеров в режиме реального времени, статистический анализ произошедших неисправностей, прогнозирование неисправностей и обучение моделей.



Представление знаний
Доверие к технологиям искусственного интеллекта
Аннотация
Доверие к искусственному интеллекту является ключевым фактором широкого внедрения интеллектуальных технологий в экономику и социальную сферу. В статье рассматриваются различные аспекты данной проблемы. Это доверие к знаниям и данным, к моделям искусственного интеллекта и машинного обучения; риски и границы применимости используемых методов и технологий; объяснимость выдаваемых решений и человеко-ориентированность искусственного интеллекта; первичная валидация и вторичная валидация (верификация) создаваемых систем; галлюцинации и фальсификации ChatGPT; этические, юридические и организационные аспекты применения искусственного интеллекта.



Понятийная модель знаний
Аннотация
В статье рассмотрены известные методы представления и обработки знаний. Предлагается использование новой модели, названной понятийной, отличающейся тем, что отношения (связи) между понятиями рассматриваются как обычные понятия. Понятие определено как форма мысли, выражаемая именованным множеством сущностей. Конкретные понятия идентифицируют одну сущность, а абстрактные образуются путем обобщения (объединения) или ассоциации (декартова произведения) других понятий. Декларативные знания задаются перечислимыми множествами сущностей, а процедурные – разрешимыми, где разрешающие процедуры выражаются формулами одноместного исчисления предикатов. Приведено описание прикладного языка представления и обработки знаний. Доказано, что запросы к понятийной модели выполняются за полиномиальное время от логарифма среднего числа сущностей у понятий. Обоснована возможность обучения понятийных моделей без учителя. Показано, что понятийная модель позволяет наглядно представлять и эффективно обрабатывать как декларативные, так и процедурные знания.


