On the Problem of Applicability of Synthetic Data in Testing Intelligent Transport Systems

Mikhail G. Gorodnichev; Городничев Михаил Геннадьевич

doi:10.33693/2313-223X-2025-12-1-105-115

О задаче применимости синтетических данных при тестировании интеллектуальных транспортных систем

Авторы: Городничев М.Г.¹
Учреждения:
1. Московский технический университет связи и информатики
Выпуск: Том 12, № 1 (2025)
Страницы: 105-115
Раздел: ИНФОРМАТИКА И ИНФОРМАЦИОННЫЕ ПРОЦЕССЫ
URL: https://bakhtiniada.ru/2313-223X/article/view/309705
DOI: https://doi.org/10.33693/2313-223X-2025-12-1-105-115
EDN: https://elibrary.ru/MLHIWR
ID: 309705

Цитировать

Полный текст

Открытый доступ
Доступ закрыт

Доступ предоставлен
Доступ закрыт

Только для подписчиков

Аннотация
Полный текст
Об авторах
Список литературы
Дополнительные файлы
Статистика

Аннотация

В настоящее время для обеспечения оптимальности и безопасности дорожного движения внедряют интеллектуальные транспортные системы (ИТС). Все чаще в данных системах для получения характеристик о транспортных потоках применяют искусственный интеллект. Количество сенсоров и датчиков сильно возрастает, что приводит к повышению нагрузок на ИТС. В связи с этим необходимо разрабатывать распределенные системы мониторинга с учетом масштабирования и отказоустойчивости. Однако перед внедрением в эксплуатацию необходимо проводить обширное тестирование. В полной мере провести такое тестирования на реальных данных невозможно ввиду различных факторов. В связи с этим в данной работе предлагается инструмент генерации синтетических данных о транспортных потоках с учетом особенностей предметной области. Система генерации разработана с учетом интеграции в различные системы, что позволит различным производителям ИТС ее использовать. Данный сервис удовлетворяет требованиям масштабирования, и приближены к реальным данным. В исследовании предлагается масштабируемая архитектура интеллектуальной транспортной подсистемы, отвечающей требованиям масштабирования и отказоустойчивости. В рамках данной работы собран стенд и проведено тестирование предлагаемой архитектуры посредством разработанного сервиса генерации синтетических данных о состоянии транспортного потока.

Ключевые слова

интеллектуальные транспортные системы (ИТС), синтетические данные, масштабируемость, отказоустойчивость, мониторинг трафика, генерация данных

Полный текст

Открыть статью на сайте журнала

Об авторах

Михаил Геннадьевич Городничев

Московский технический университет связи и информатики

Автор, ответственный за переписку.
Email: m.g.gorodnichev@mtuci.ru
ORCID iD: 0000-0003-1739-9831
Scopus Author ID: 55836031600
ResearcherId: D-3256-2019

кандидат технических наук, доцент, декан факультета «Информационные технологии»

Россия, Москва

Список литературы

Rabchevsky A.N. Review of methods and systems for generating synthetic training data. Applied Mathematics and Control Sciences. 2023. No. 4. Pp. 6–45. (In Rus.). doi: 10.15593/2499-9873/2023.4.01.
Lundin E., Kvarnström H., Jonsson E.A. Synthetic fraud data generation methodology. In: Information and Communications Security. Deng Robertand Bao, Fengand Zhou Jianyingand, Qing Sihan (eds.). Berlin; Heidelberg: Springer Berlin Heidelberg, 2002. Рp. 265–277. doi: 10.1007/3-540-36159-6_23.
McKenna R., Miklau G., Sheldon D. Winning the NIST Contest: A scalable and general approach to differentially private synthetic data. CoRR. 2021. Art. abs/2108.04978.
Awan J., Cai Z. One step to efficient synthetic data. arXiv. 2020. Art. bs/2006.02397. doi: 10.48550/ARXIV.2006.02397.
Mukherjee M., Khushi M. SMOTE-ENC: A novel SMOTE-based method to generate synthetic data for nominal and continuous features. Applied System Innovation. 2021. Vol. 4. Issue 1. Art. 18. doi: 10.3390/asi4010018.
Bernstein D. Containers and cloud: From LXC to docker to Kubernetes. IEEE Cloud Computing. 2014. No. 3. Pp. 81– 84.
Barletta M., Cinque M., Simone L.D., Corte R.D. Introducing k4.0s: A model for mixed-criticality container orchestration in Industry 4.0. In: IEEE Intl. Conf. on Dependable, Autonomic and Secure Computing, 2022.
Polyantseva K., Gorodnichev M., Moseva M. Ensuring the reliability of a highly loaded vehicle monitoring and traffic control platform. In: Systems of signals generating and processing in the field of on board communications. Moscow, 2023. Pp. 1–8. doi: 10.1109/IEEECONF56737.2023.10092031
Slamnik-Krijestorac N., Yilma G.M., Zarrar Y.F. et al. Multi-domain mech orchestration platform for enhanced back situation awareness. In: IEEE Conference on Computer Communications Workshops, 2021.
Mason K., Vejdan S., Grijalva S. An “On the Fly” framework for efficiently generating synthetic big data sets. CoRR. 2019. Art. abs/1903.06798.
Gesmundo A., Tomeh N. HadoopPerceptron: A toolkit for distributed perceptron training and prediction with MapReduce. In: Conference of the European Chapter of the Association for Computational Linguistics. 2012.