The Comparison of Machine Learning Methods for Urban Noise Classification

D. A. Kuzin; Кузин Денис Александрович; L. G. Statsenko; Стаценко Любовь Григорьевна; M. M. Smirnova; Смирнова Мария Михайловна; S. V. Brylina; Брылина Светлана Владимировна

doi:10.17277/voprosy.2024.02.pp.037-043

Сравнение методов машинного обучения для классификации шумов городской среды

Авторы: Кузин Д.А.¹, Стаценко Л.Г.¹, Смирнова М.М.¹, Брылина С.В.¹
Учреждения:
1. ФГАОУ ВО «Дальневосточный федеральный университет»
Выпуск: № 2 (2024)
Страницы: 37-43
Раздел: ЭКОЛОГИЯ
URL: https://bakhtiniada.ru/1990-9047/article/view/278247
DOI: https://doi.org/10.17277/voprosy.2024.02.pp.037-043
ID: 278247

Цитировать

Полный текст

Аннотация
Полный текст
Об авторах
Список литературы
Дополнительные файлы
Статистика

Аннотация

Современная городская среда постоянно развивается и изменяется. С ростом городов увеличивается и уровень шума, который может оказывать негативное влияние на здоровье жителей. Важность определения и контроля шума городской среды становится все более актуальной задачей для городских властей, а также для ученых и инженеров, занимающихся вопросами экологии и охраны окружающей среды. Приведен сравнительный анализ методов машинного обучения, включающих и нейронную сеть для автоматизации решения задачи классификации шумов, присутствующих в городе. Даны описания спектральных признаков шумов, на основе которых реализованные модели принимают решения о классе шума.

Ключевые слова

городская среда, классификация шумов, машинное обучение, спектральный анализ, шумы

Полный текст

Введение

Анализ, мониторинг и контроль шума в городской среде являются важными составляющими для поддержания комфортного и здорового окружения людей [1]. Чрезмерный шум в городе может негативно влиять на их физическое и психическое здоровье. Постоянный мониторинг шума позволит городским службам своевременно принимать меры по снижению его уровня, что в свою очередь улучшит качество жизни горожан [2]. Одним из перспективных подходов к решению проблемы определения и классификации источника шума в городской среде является применение методов машинного обучения [3]. Использование обученных с помощью таких методов моделей позволит автоматизировать процесс обнаружения и анализа шумов, а в дальнейшем упростит работу специалистов и улучшит качество мониторинга.

Записи шумов городской среды

Существуют открытые источники с наборами акустических записей шумов, присутствующих в городской среде [4, 5]. В работе использовался один из самых больших наборов данных Urban Sounds 8k, состоящий из размеченных звуковых файлов формата .wav. Обучение и тестирование моделей производилось на шумах кондиционеров, строительных работ, двигателей автомобилей, гудков автомобилей, сирен автомобилей городских служб. В каждом классе использовали 100 записей (итого 500 записей для пяти исследуемых классов) с частотой дискретизации 44 100 Гц, разрядностью 16 бит, длительностью от 1 до 4 с. Общий размер данных составил 362 МБ, дисбаланс классов отсутствует.

Используемые признаки шумов

Предлагаемые модели машинного обучения при обучении и принятии решения о классе объекта используют спектральные признаки акустических шумов. Существует несколько подходов к анализу акустического шума: вычисление признаков и представление их в численном виде, а также вычисление спектра и представление его в виде изображения с последующим анализом моделями машинного обучения, которые могут работать с изображениями. Второй подход в работе рассматриваться не будет, так как требует больше вычислительных ресурсов и объема памяти для хранения шумов, представленных в виде изображений спектрограмм. В качестве признаков использовались гамматон-частотные и мел-частотные кепстральные коэффициенты, хромаграмма. Данные признаки широко используются исследователями для решения задачи классификации различных акустических звуков и шумов [6 – 8]. Вычисление всех признаков из всего набора записей шумов в формате .wav занимает 27,67 с на ноутбуке с процессором AppleM1 и 8 ГБ оперативной памяти.

Модели машинного обучения

В исследовании обучили и протестировали четыре модели машинного обучения, которые хорошо себя зарекомендовали при решении технических задач классификации акустических данных. Алгоритмы обучения и тестирования всех моделей реализованы на языке программирования Python, а в качестве основной библиотеки машинного обучения использовалась scikit-learn. Проанализированы результаты предсказания следующих моделей: случайного леса [9], k-ближайших соседей [10], опорных векторов [10], многослойного персептрона (искусственная нейронная сеть) [11]. Каждая модель обучалась на 80 % от общего набора данных и проверялась на 20 %. Использовали метод кросс-валидации (перекрестной проверки) с десятью итерациями для оценки качества работы моделей.

Сравнение точности классификации шумов реализованными моделями машинного обучения

При использовании пятнадцати мел-частотных кепстральных коэффициентов в качестве признаков получили результаты предсказания моделей, которые демонстрируют преимущество в 1,5 % модели случайного леса перед моделью многослойного персептрона и преимущество в 2 % перед моделью опорных векторов (рис. 1, а). Модель k-ближайших соседей показывает точность 91,10 %, что является самым низким результатом среди всех моделей.

Рис. 1. Сравнения моделей при использовании мел-частотных (а) и гамматон-частотных (б) кепстральных коэффициентов, хромаграммы (в):
1 – многослойного перцептрона; 2 – случайного леса; 3 – опорных векторов; 4 – k-ближайших соседей

Рис. 2. Матрицы ошибок трех моделей машинного обучения при использовании мел-частотных кепстральных коэффициентов:
а – k-ближайших соседей; б – опорных векторов; в – случайного леса

Если анализировать результаты моделей, представленные в виде матриц ошибок, то можно увидеть, что все модели в основном ошибаются, включая в классификацию шумов строительных работ шумы сирены специальных служб и гудки автомобилей (рис. 2).

Больше всего времени на обучение и предсказание необходимо модели многослойного персептрона. Обучение и перекрестная проверка при 10 итерациях занимает 5,27 с, при этом затраты времени для других моделей составляют от 0,17 до 0,50 с.

При использовании гамматон-частотных кепстральных коэффициентов в качестве признаков шумов (см. рис. 1, б), средняя точность предсказания всех четырех моделей ниже, чем при использовании мел-частотных коэффициентов.

Если использовать 12 составляющих хромаграммы в качестве признаков для моделей, то получим еще более низкую точность предсказания всеми моделями машинного обучения (см. рис. 1, в).

Рис. 3. Сравнение точности классификации шумов при использовании комбинаций признаков:
1 – 15 MFCC + 15 GFCC + 12 Chroma; 2 – 15 MFCC + 12 Chroma; 3 – 15 GFCC + 12 Chroma; 4 – 15 MFCC + 15 GFCC

Использование комбинаций признаков зачастую позволяет добиться лучших результатов точности предсказания. В данной работе также удалось получить большую точность классификации шумов городской среды при использовании набора признаков, состоящего из 15 мел-частотных и 15 гамматон-частотных кепстральных коэффициентов. Использование других сочетаний признаков показывали точность, схожую с точностью при использовании отдельных признаков или даже более низкую точность, чем демонстрировали модели, использующие отдельные признаки (рис. 3).

Заключение

Современные методы классификации шумов городской среды, реализованные на основе моделей машинного обучения, позволяют автоматически с высокой скоростью и точностью определять класс источника шума. Модели машинного обучения способны обрабатывать большие объемы данных, в том числе в режиме реального времени, что актуально в городе из-за присутствующего большого числа разнообразных источников шума. В результате проведенного анализа наивысшую точность классификации и стабильность продемонстрировала модель случайного леса (98,58 %). Наилучших результатов точности удалось достичь, используя вектор признаков, состоящий из 15 мел-частотных и 15 гамматон-частотных кепстральных коэффициентов.

Работа выполнена в рамках государственного задания Минобрнауки России в сфере научной деятельности по проекту № FZNS-2023-0008.

Об авторах

Денис Александрович Кузин

ФГАОУ ВО «Дальневосточный федеральный университет»

Автор, ответственный за переписку.
Email: kuzin_da@dvfu.ru

кандидат технических наук, доцент департамента электроники, телекоммуникации и приборостроения

Россия, Владивосток

Любовь Григорьевна Стаценко

ФГАОУ ВО «Дальневосточный федеральный университет»

Email: kuzin_da@dvfu.ru

доктор физико-математических наук, профессор департамента элек- троники, телекоммуникации и приборостроения

Россия, Владивосток

Мария Михайловна Смирнова

ФГАОУ ВО «Дальневосточный федеральный университет»

Email: kuzin_da@dvfu.ru

старший преподаватель департамента электроники, телекоммуникации и приборостроения

Россия, Владивосток

Светлана Владимировна Брылина

ФГАОУ ВО «Дальневосточный федеральный университет»

Email: kuzin_da@dvfu.ru

заведующий лабораторией департамента электроники, телекоммуникации и приборостроения

Россия, Владивосток

Список литературы

Городничев, С. С. Мониторинг состояния акустической среды городской территории / С. С. Городничев, К. В. Левшина, В. В. Васильева // Современные автомобильные материалы и технологии (САМИТ – 2019) : сб. ст. XI Междунар. науч.-техн. конф., Курск, 25 окт. 2019 г. – Курск, 2019. – С. 58 – 62.
Интеллектуальный анализ звукового ландшафта городской территории / Н. М. Рашевский, Д. С. Парыгин, К. Р. Назаров, И. С. Синицын, В. А. Феклистов // Социология города. – 2023. – № 1. – С. 125 – 139. doi: 10.35211/19943520_ 2023_1_125
Дятлов, К. А. Использование нейросетей для оценки качества городского шума / К. А. Дятлов, И. С. Синицын // XXVII Регион. конф. молодых ученых и исследователей Волгоградской области : сб. материалов конф., Волгоград, 02 – 15 ноября 2022 г. – Волгоград, 2022. – С. 448 – 449.
Piczak, K. J. ESC: Dataset for Environmental Sound Classification / K. J. Piczak // Proceedings of the 23rd ACM International Conference on Multimedia. – 2015. – Р. 1015 – 1018. doi: 10.1145/2733373.2806390
Salamon, J. A Dataset and Taxonomy for Urban Sound Research / J. Salamon, C. Jacoby, J. P. Bello // Proceedings of the 22nd ACM International Conference on Multimedia. – Orlando, USA, 2014. – P. 1041 – 1044. doi: 10.1145/2647868.2655045
Применение методов машинного обучения для классификации акустических сигналов по спектральным характеристикам / Д. А. Кузин, Л. Г. Стаценко, П. Н. Анисимов, М. М. Смирнова // Известия СПбГЭТУ ЛЭТИ. – 2021. – № 3. – С. 48 – 54.
Passive Acoustic Monitoring as a Tool to Investigate the Spatial Distribution of Invasive Alien Species / J. W. Ribeiro Jr, K. Harmon, G. A. Leite [et al.] // Remote Sensing. – 2022. – Vol. 14, No. 14. – P. 4565. doi: 10.3390/rs14184565
Kumar, L. K. COVID-19 Disease Diagnosis with Light-Weight CNN Using Modified MFCC and Enhanced GFCC from Human Respiratory Sounds / L. K. Kumar, P. J. A. Alphonse // European Physical Journal Special Topics. – 2022. – Vol. 231, No. 18-20. – P. 3329 – 3346. doi: 10.1140/epjs/s11734-022-00432-w
Чистяков, С. П. Случайные леса: обзор / С. П. Чистяков // Труды Карельского научного центра Российской академии наук. – 2013. – № 1. – С. 117 – 136.
Демидова, Л. А. Классификация данных на основе SVM-алгоритма и алгоритма k-ближайших соседей / Л. А. Демидова, Ю. С. Соколова // Вестник Рязанского государственного радиотехнического университета. – 2017. – № 62. – С. 119 – 132. doi: 10.21667/1995-4565-2017-62-4-119-132
Марченко, Б. И. Нейронные сети в задачах аналитического обеспечения систем социально-гигиенического и экологического мониторинга / Б. И. Марченко, Н. К. Плуготаренко, О. А. Семина //Здоровье населения и среда обитания. – 2021. – №. 11 – С. 23 – 30.

Дополнительные файлы

Доп. файлы

Действие

1. JATS XML

Скачать

2. Рис. 1. Сравнения моделей при использовании мел-частотных (а) и гамматон-частотных (б) кепстральных коэффициентов, хромаграммы (в): 1 – многослойного перцептрона; 2 – случайного леса; 3 – опорных векторов; 4 – k-ближайших соседей

Скачать (31KB)

Метаданные

3. Рис. 2. Матрицы ошибок трех моделей машинного обучения при использовании мел-частотных кепстральных коэффициентов: а – k-ближайших соседей; б – опорных векторов; в – случайного леса

Скачать (20KB)

Метаданные

4. Рис. 3. Сравнение точности классификации шумов при использовании комбинаций признаков: 1 – 15 MFCC + 15 GFCC + 12 Chroma; 2 – 15 MFCC + 12 Chroma; 3 – 15 GFCC + 12 Chroma; 4 – 15 MFCC + 15 GFCC

Скачать (39KB)

Метаданные

Имя пользователя
Пароль
Запомнить меня

Забыли пароль?	Регистрация

Имя пользователя
Пароль
Запомнить меня

Забыли пароль?	Регистрация

№ 3 (2024)

№ 3 (2024)

Сравнение методов машинного обучения для классификации шумов городской среды

Полный текст

Аннотация

Ключевые слова

Полный текст

Введение

Записи шумов городской среды

Используемые признаки шумов

Модели машинного обучения

Сравнение точности классификации шумов реализованными моделями машинного обучения

Заключение

Об авторах

Денис Александрович Кузин

Любовь Григорьевна Стаценко

Мария Михайловна Смирнова

Светлана Владимировна Брылина

Список литературы

Дополнительные файлы