Обработка данных для индуктивного вывода на основе нестрогой вероятности

Обложка

Цитировать

Полный текст

Открытый доступ Открытый доступ
Доступ закрыт Доступ предоставлен
Доступ закрыт Только для подписчиков

Аннотация

На основе методов индуктивной логики рассматривается подход к выявлению импликативных взаимосвязей вида «Если A, то b» в больших данных в условиях их низкой достоверности и противоречивости. Для работы с данными используются логики с векторной семантикой в форме VTF-логик. Наличие или отсутствие явлений в таблицах их совместной встречаемости формализуется векторами истинности с компонентами v+ и v-, где v+ мера истинности утверждения о наличии явления, v- - мера его ложности. На основе статистической индукции вычисляется показатель обоснованности причинно-следственной связи как усредненное значение векторов истинности соответствующих нестрогих высказываний. Получившееся значение трактуется как нестрогая вероятность связи, которая выступает векторным показателем ее обоснованности. Обсуждается применимость подхода для обработки качественных и количественных данных, а также данных, содержащих артефакты.

Об авторах

Леонид Вадимович Aршинский

Иркутский государственный университет путей сообщения

Автор, ответственный за переписку.
Email: larsh@mail.ru

Профессор, доктор технических наук, доцент

Россия, Иркутск

Вадим Сергеевич Лебедев

Иркутский государственный университет путей сообщения

Email: lebedevvs97@yandex.ru

Аспирант

Россия, Иркутск

Список литературы

  1. Формула Big Data: семь «V» + неординарная задача. URL: https://www.fsight.ru/blog/formula-big-data-sem-v- neordinarnaja-zadacha-2/
  2. Лобанов А.А. Большие данные: проблемы обработки //
  3. Вестник МГТУ МИРЭА. 2014. № 3(4). С. 51-58.
  4. Абрамова А.А. Анализ использования больших данных для принятия решений в промышленной сфере // Эко- номика и качество систем связи. 2023, № 3. С. 13-21.
  5. Кельчевская Н.Р., Колясников М.С. Использование больших данных в стратегическом управлении знаниями компании, следующей трендам Индустрии 4.0 // Лидерство и менеджмент. 2020. Том 7. № 3. С. 405-426. doi: 10.18334/lim.7.3.110662.
  6. Fosso Wamba S. et al. How ‘big data’ can make big impact: Findings from a systematic review and a longitudinal case study // International Journal of Production Economics.2015.Vol.165.pp.234-246.doi: 10.1016/j.ijpe.2014.12.031.
  7. Орешков В.И. Интеллектуальный анализ данных как современный инструмент поддержки управленческих решений // Вестник Рязанского государственного агро- технологического университета имени П.А. Костычева. 2011. № 4 (12). С. 55-59.
  8. Емельченков Е.П. Большие данные. Методы интеллектуального анализа // Системы компьютерной математики и их приложения. 2013. № 14. С. 75-79.
  9. Есауленко А.С., Никоненко Н.Д. Большие данные. Реальность и перспективы // Управление инновациями: теория, методология, практика. 2016. № 17. С. 74-79.
  10. Медведев Д.А. Большие данные: причины появления и как их можно использовать // Наука и образование сегодня. 2019. № 4(39). С. 14-16.
  11. Кузора C.С., Натаров И.П. Цифровая трансформация и большие данные // Вестник Российского университета дружбы народов. Серия: Государственное и муниципальное управление. 2022. Т. 9. № 2. C. 150–161. doi: 10.22363/2312-8313-2022-9-2-150-161.
  12. Магеррамов З.Т., Абдуллаев В.Г., Магеррамова А.З. Big Data: проблемы, методы анализа, алгоритмы // Радиоэлектроника и информатика, 2017. №3. С. 42-52.
  13. Арустамов А. Критерии качества данных, 2023. URL: https://loginom.ru/blog/data-quality-criteria.
  14. Дударев В.А. Подход к заполнению пропусков в обучающих выборках для компьютерного конструирования неорганических соединений // Вестник МИТХТ. 2014, Т.9, №1. С. 73-75.
  15. Финн В.К. Об интеллектуальном анализе данных // Новости искусственного интеллекта, 2004, №3. С. 1-20.
  16. Финн В. К. Об определении эмпирических закономерностей посредством ДСМ - метода автоматического по- рождения гипотез // Искусственный интеллект и принятие решений, 2010. №4. С. 41-48.
  17. Виноградов Д.В. Анализ результатов применения ВКФ-системы: успехи и открытая проблема // Научно- техническая информация. Серия 2: Информационные процессы и системы, 2017. № 5. С. 1-4.
  18. Панов А. И. Выявление причинно-следственных связей в данных психологического тестирования логическими методами // Искусственный интеллект и принятие решений, 2013. №1. С. 24–32.
  19. ДСМ-метод автоматического порождения гипотез: Логические и эпистемологические основания / Сост. О.М. Аншаков, Е.Ф. Фабрикантова. М.: Книжный дом «ЛИБРИКОМ», 2009. – 432 с.
  20. Dunn J.M. Algebra of Intensional Logics. Doctoral Disser- tation University of Pittsburg, Ann Arbor, 1966.Dunn J.M. Intuitive semantics for first-degree entailment and “coupled trees” // Philosophical Studies.Vol. 29, 1976.pp.149-158.
  21. Belnap N. A useful four-valued logic // J.M.Dunn and G.Epstein (eds.). Modern Uses of Multiple-Valued Logic. Dordrecht: D. Reidel Publish. Co., 1977.  pp. 8-37.
  22. Belnap N. How a computer should think // G. Ryle (ed.). Contemporary Aspects of Philosophy.  Stocksfield: Oriel Press Ltd., 1977.  P. 30-55.
  23. Аршинский Л.В. Методы обработки нестрогих высказываний. Иркутск: изд-во ВСИ МВД России, 1998. 40 с.
  24. Ивлев Ю.В. Логика: Учебник 3-е изд. М.: ТК Велби, Изд-во Проспект, 2004. 288 с.
  25. Голенков В.В. Статистические основы индуктивного вывода: учеб. пособие. Минск: БГУИР, 2009. 202 с.
  26. Кайберг Г. Вероятность и индуктивная логика / Пер. с англ. – М.: Изд-во «Прогресс», 1978. 373 с. (Kyburg H.E. Probability and Inductive Logic. – L.: Macmillan, 1970. 272 p.).
  27. Inductive Inference. URL: https://www.sciencedi- rect.com/topics/mathematics/inductive-inference
  28. Аршинский Л.В., Лебедев В.С. Объективизация баз знаний интеллектуальных систем на основе индуктивного вывода с использованием нестрогих вероятностей // Информационные и математические технологии в науке и управлении. 2022. № 4(28). С. 190-200. doi: 10.38028/ESI.2022.28.4.015.
  29. Аршинский Л.В. Приложение логик с векторной семантикой к описанию случайных событий и оценке риска // Проблемы анализа риска. 2005. Т.2. № 3. С.231-248.
  30. Нечеткая логика в моделях управления и искусственного интеллекта / под ред. Д.А. Поспелова. М.: Наука. Гл. ред. физ.-мат. лит., 1986. 312 с.
  31. Gottwald S. Treatise on Many-Valued Logics. Leipzig, 2000. 604 p.
  32. Аршинский Л.В. Оценка истинности взаимоисключаю- щих гипотез средствами векторной логики // Информационные и математические технологии/ Труды Байкальской Всероссийской конференции «Информационные и математические технологии». Иркутск: ИСЭМ СО РАН, 2004. С. 188-194.
  33. Pima Indians Diabetes – EDA & Prediction (0.906). URL: https://www.kaggle.com/code/vincentlugat/pima-indians- diabetes-eda-prediction-0-906/input.
  34. Уровень сахара в крови: норма, установленная ВОЗ для здоровых людей. URL: https://yandex.ru/health/turbo/articles?id=4419.

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML


Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».