О задаче применимости синтетических данных при тестировании интеллектуальных транспортных систем

Обложка

Цитировать

Полный текст

Открытый доступ Открытый доступ
Доступ закрыт Доступ предоставлен
Доступ закрыт Только для подписчиков

Аннотация

В настоящее время для обеспечения оптимальности и безопасности дорожного движения внедряют интеллектуальные транспортные системы (ИТС). Все чаще в данных системах для получения характеристик о транспортных потоках применяют искусственный интеллект. Количество сенсоров и датчиков сильно возрастает, что приводит к повышению нагрузок на ИТС. В связи с этим необходимо разрабатывать распределенные системы мониторинга с учетом масштабирования и отказоустойчивости. Однако перед внедрением в эксплуатацию необходимо проводить обширное тестирование. В полной мере провести такое тестирования на реальных данных невозможно ввиду различных факторов. В связи с этим в данной работе предлагается инструмент генерации синтетических данных о транспортных потоках с учетом особенностей предметной области. Система генерации разработана с учетом интеграции в различные системы, что позволит различным производителям ИТС ее использовать. Данный сервис удовлетворяет требованиям масштабирования, и приближены к реальным данным. В исследовании предлагается масштабируемая архитектура интеллектуальной транспортной подсистемы, отвечающей требованиям масштабирования и отказоустойчивости. В рамках данной работы собран стенд и проведено тестирование предлагаемой архитектуры посредством разработанного сервиса генерации синтетических данных о состоянии транспортного потока.

Об авторах

Михаил Геннадьевич Городничев

Московский технический университет связи и информатики

Автор, ответственный за переписку.
Email: m.g.gorodnichev@mtuci.ru
ORCID iD: 0000-0003-1739-9831
Scopus Author ID: 55836031600
ResearcherId: D-3256-2019

кандидат технических наук, доцент, декан факультета «Информационные технологии»

Россия, Москва

Список литературы

  1. Rabchevsky A.N. Review of methods and systems for generating synthetic training data. Applied Mathematics and Control Sciences. 2023. No. 4. Pp. 6–45. (In Rus.). doi: 10.15593/2499-9873/2023.4.01.
  2. Lundin E., Kvarnström H., Jonsson E.A. Synthetic fraud data generation methodology. In: Information and Communications Security. Deng Robertand Bao, Fengand Zhou Jianyingand, Qing Sihan (eds.). Berlin; Heidelberg: Springer Berlin Heidelberg, 2002. Рp. 265–277. doi: 10.1007/3-540-36159-6_23.
  3. McKenna R., Miklau G., Sheldon D. Winning the NIST Contest: A scalable and general approach to differentially private synthetic data. CoRR. 2021. Art. abs/2108.04978.
  4. Awan J., Cai Z. One step to efficient synthetic data. arXiv. 2020. Art. bs/2006.02397. doi: 10.48550/ARXIV.2006.02397.
  5. Mukherjee M., Khushi M. SMOTE-ENC: A novel SMOTE-based method to generate synthetic data for nominal and continuous features. Applied System Innovation. 2021. Vol. 4. Issue 1. Art. 18. doi: 10.3390/asi4010018.
  6. Bernstein D. Containers and cloud: From LXC to docker to Kubernetes. IEEE Cloud Computing. 2014. No. 3. Pp. 81– 84.
  7. Barletta M., Cinque M., Simone L.D., Corte R.D. Introducing k4.0s: A model for mixed-criticality container orchestration in Industry 4.0. In: IEEE Intl. Conf. on Dependable, Autonomic and Secure Computing, 2022.
  8. Polyantseva K., Gorodnichev M., Moseva M. Ensuring the reliability of a highly loaded vehicle monitoring and traffic control platform. In: Systems of signals generating and processing in the field of on board communications. Moscow, 2023. Pp. 1–8. doi: 10.1109/IEEECONF56737.2023.10092031
  9. Slamnik-Krijestorac N., Yilma G.M., Zarrar Y.F. et al. Multi-domain mech orchestration platform for enhanced back situation awareness. In: IEEE Conference on Computer Communications Workshops, 2021.
  10. Mason K., Vejdan S., Grijalva S. An “On the Fly” framework for efficiently generating synthetic big data sets. CoRR. 2019. Art. abs/1903.06798.
  11. Gesmundo A., Tomeh N. HadoopPerceptron: A toolkit for distributed perceptron training and prediction with MapReduce. In: Conference of the European Chapter of the Association for Computational Linguistics. 2012.

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML
2. Рис. 1. Сценарии взаимодействия с системой

Скачать (148KB)
3. Рис. 2. Организация компонентов системы

Скачать (173KB)
4. Рис. 3. Даталогическая схема базы данных

Скачать (107KB)
5. Рис. 4. Диаграмма классов доменных моделей

Скачать (171KB)
6. Рис. 5. UML-диаграмма классов

Скачать (125KB)
7. Рис. 6. Диаграмма последовательности добавления пользователем сервиса

Скачать (117KB)
8. Рис. 7. Последовательность создания таблицы и отправки новой метрики

Скачать (195KB)
9. Рис. 8. Распределение нагрузки

Скачать (60KB)


Ссылка на описание лицензии: https://www.urvak.ru/contacts/

Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».