Сравнение методов машинного обучения для классификации шумов городской среды

Обложка

Цитировать

Полный текст

Аннотация

Современная городская среда постоянно развивается и изменяется. С ростом городов увеличивается и уровень шума, который может оказывать негативное влияние на здоровье жителей. Важность определения и контроля шума городской среды становится все более актуальной задачей для городских властей, а также для ученых и инженеров, занимающихся вопросами экологии и охраны окружающей среды. Приведен сравнительный анализ методов машинного обучения, включающих и нейронную сеть для автоматизации решения задачи классификации шумов, присутствующих в городе. Даны описания спектральных признаков шумов, на основе которых реализованные модели принимают решения о классе шума.

Полный текст

Введение

Анализ, мониторинг и контроль шума в городской среде являются важными составляющими для поддержания комфортного и здорового окружения людей [1]. Чрезмерный шум в городе может негативно влиять на их физическое и психическое здоровье. Постоянный мониторинг шума позволит городским службам своевременно принимать меры по снижению его уровня, что в свою очередь улучшит качество жизни горожан [2]. Одним из перспективных подходов к решению проблемы определения и классификации источника шума в городской среде является применение методов машинного обучения [3]. Использование обученных с помощью таких методов моделей позволит автоматизировать процесс обнаружения и анализа шумов, а в дальнейшем упростит работу специалистов и улучшит качество мониторинга.

Записи шумов городской среды

Существуют открытые источники с наборами акустических записей шумов, присутствующих в городской среде [4, 5]. В работе использовался один из самых больших наборов данных Urban Sounds 8k, состоящий из размеченных звуковых файлов формата .wav. Обучение и тестирование моделей производилось на шумах кондиционеров, строительных работ, двигателей автомобилей, гудков автомобилей, сирен автомобилей городских служб. В каждом классе использовали 100 записей (итого 500 записей для пяти исследуемых классов) с частотой дискретизации 44 100 Гц, разрядностью 16 бит, длительностью от 1 до 4 с. Общий размер данных составил 362 МБ, дисбаланс классов отсутствует.

Используемые признаки шумов

Предлагаемые модели машинного обучения при обучении и принятии решения о классе объекта используют спектральные признаки акустических шумов. Существует несколько подходов к анализу акустического шума: вычисление признаков и представление их в численном виде, а также вычисление спектра и представление его в виде изображения с последующим анализом моделями машинного обучения, которые могут работать с изображениями. Второй подход в работе рассматриваться не будет, так как требует больше вычислительных ресурсов и объема памяти для хранения шумов, представленных в виде изображений спектрограмм. В качестве признаков использовались гамматон-частотные и мел-частотные кепстральные коэффициенты, хромаграмма. Данные признаки широко используются исследователями для решения задачи классификации различных акустических звуков и шумов [6 – 8]. Вычисление всех признаков из всего набора записей шумов в формате .wav занимает 27,67 с на ноутбуке с процессором AppleM1 и 8 ГБ оперативной памяти.

Модели машинного обучения

В исследовании обучили и протестировали четыре модели машинного обучения, которые хорошо себя зарекомендовали при решении технических задач классификации акустических данных. Алгоритмы обучения и тестирования всех моделей реализованы на языке программирования Python, а в качестве основной библиотеки машинного обучения использовалась scikit-learn. Проанализированы результаты предсказания следующих моделей: случайного леса [9], k-ближайших соседей [10], опорных векторов [10], многослойного персептрона (искусственная нейронная сеть) [11]. Каждая модель обучалась на 80 % от общего набора данных и проверялась на 20 %. Использовали метод кросс-валидации (перекрестной проверки) с десятью итерациями для оценки качества работы моделей.

Сравнение точности классификации шумов реализованными моделями машинного обучения

При использовании пятнадцати мел-частотных кепстральных коэффициентов в качестве признаков получили результаты предсказания моделей, которые демонстрируют преимущество в 1,5 % модели случайного леса перед моделью многослойного персептрона и преимущество в 2 % перед моделью опорных векторов (рис. 1, а). Модель k-ближайших соседей показывает точность 91,10 %, что является самым низким результатом среди всех моделей.

 

Рис. 1. Сравнения моделей при использовании мел-частотных (а) и гамматон-частотных (б) кепстральных коэффициентов, хромаграммы (в):
1 – многослойного перцептрона; 2 – случайного леса; 3 – опорных векторов; 4 – k-ближайших соседей

 

Рис. 2. Матрицы ошибок трех моделей машинного обучения при использовании мел-частотных кепстральных коэффициентов:
а – k-ближайших соседей; б – опорных векторов; в – случайного леса

 

Если анализировать результаты моделей, представленные в виде матриц ошибок, то можно увидеть, что все модели в основном ошибаются, включая в классификацию шумов строительных работ шумы сирены специальных служб и гудки автомобилей (рис. 2).

Больше всего времени на обучение и предсказание необходимо модели многослойного персептрона. Обучение и перекрестная проверка при 10 итерациях занимает 5,27 с, при этом затраты времени для других моделей составляют от 0,17 до 0,50 с.

При использовании гамматон-частотных кепстральных коэффициентов в качестве признаков шумов (см. рис. 1, б), средняя точность предсказания всех четырех моделей ниже, чем при использовании мел-частотных коэффициентов.

Если использовать 12 составляющих хромаграммы в качестве признаков для моделей, то получим еще более низкую точность предсказания всеми моделями машинного обучения (см. рис. 1, в).

 

Рис. 3. Сравнение точности классификации шумов при использовании комбинаций признаков:
1 – 15 MFCC + 15 GFCC + 12 Chroma; 2 – 15 MFCC + 12 Chroma; 3 – 15 GFCC + 12 Chroma; 4 – 15 MFCC + 15 GFCC

Использование комбинаций признаков зачастую позволяет добиться лучших результатов точности предсказания. В данной работе также удалось получить большую точность классификации шумов городской среды при использовании набора признаков, состоящего из 15 мел-частотных и 15 гамматон-частотных кепстральных коэффициентов. Использование других сочетаний признаков показывали точность, схожую с точностью при использовании отдельных признаков или даже более низкую точность, чем демонстрировали модели, использующие отдельные признаки (рис. 3).

Заключение

Современные методы классификации шумов городской среды, реализованные на основе моделей машинного обучения, позволяют автоматически с высокой скоростью и точностью определять класс источника шума. Модели машинного обучения способны обрабатывать большие объемы данных, в том числе в режиме реального времени, что актуально в городе из-за присутствующего большого числа разнообразных источников шума. В результате проведенного анализа наивысшую точность классификации и стабильность продемонстрировала модель случайного леса (98,58 %). Наилучших результатов точности удалось достичь, используя вектор признаков, состоящий из 15 мел-частотных и 15 гамматон-частотных кепстральных коэффициентов.

 

Работа выполнена в рамках государственного задания Минобрнауки России в сфере научной деятельности по проекту № FZNS-2023-0008.

×

Об авторах

Денис Александрович Кузин

ФГАОУ ВО «Дальневосточный федеральный университет»

Автор, ответственный за переписку.
Email: kuzin_da@dvfu.ru

кандидат технических наук, доцент департамента электроники, телекоммуникации и приборостроения

Россия, Владивосток

Любовь Григорьевна Стаценко

ФГАОУ ВО «Дальневосточный федеральный университет»

Email: kuzin_da@dvfu.ru

доктор физико-математических наук, профессор департамента элек- троники, телекоммуникации и приборостроения

Россия, Владивосток

Мария Михайловна Смирнова

ФГАОУ ВО «Дальневосточный федеральный университет»

Email: kuzin_da@dvfu.ru

старший преподаватель департамента электроники, телекоммуникации и приборостроения

Россия, Владивосток

Светлана Владимировна Брылина

ФГАОУ ВО «Дальневосточный федеральный университет»

Email: kuzin_da@dvfu.ru

заведующий лабораторией департамента электроники, телекоммуникации и приборостроения

Россия, Владивосток

Список литературы

  1. Городничев, С. С. Мониторинг состояния акустической среды городской территории / С. С. Городничев, К. В. Левшина, В. В. Васильева // Современные автомобильные материалы и технологии (САМИТ – 2019) : сб. ст. XI Междунар. науч.-техн. конф., Курск, 25 окт. 2019 г. – Курск, 2019. – С. 58 – 62.
  2. Интеллектуальный анализ звукового ландшафта городской территории / Н. М. Рашевский, Д. С. Парыгин, К. Р. Назаров, И. С. Синицын, В. А. Феклистов // Социология города. – 2023. – № 1. – С. 125 – 139. doi: 10.35211/19943520_ 2023_1_125
  3. Дятлов, К. А. Использование нейросетей для оценки качества городского шума / К. А. Дятлов, И. С. Синицын // XXVII Регион. конф. молодых ученых и исследователей Волгоградской области : сб. материалов конф., Волгоград, 02 – 15 ноября 2022 г. – Волгоград, 2022. – С. 448 – 449.
  4. Piczak, K. J. ESC: Dataset for Environmental Sound Classification / K. J. Piczak // Proceedings of the 23rd ACM International Conference on Multimedia. – 2015. – Р. 1015 – 1018. doi: 10.1145/2733373.2806390
  5. Salamon, J. A Dataset and Taxonomy for Urban Sound Research / J. Salamon, C. Jacoby, J. P. Bello // Proceedings of the 22nd ACM International Conference on Multimedia. – Orlando, USA, 2014. – P. 1041 – 1044. doi: 10.1145/2647868.2655045
  6. Применение методов машинного обучения для классификации акустических сигналов по спектральным характеристикам / Д. А. Кузин, Л. Г. Стаценко, П. Н. Анисимов, М. М. Смирнова // Известия СПбГЭТУ ЛЭТИ. – 2021. – № 3. – С. 48 – 54.
  7. Passive Acoustic Monitoring as a Tool to Investigate the Spatial Distribution of Invasive Alien Species / J. W. Ribeiro Jr, K. Harmon, G. A. Leite [et al.] // Remote Sensing. – 2022. – Vol. 14, No. 14. – P. 4565. doi: 10.3390/rs14184565
  8. Kumar, L. K. COVID-19 Disease Diagnosis with Light-Weight CNN Using Modified MFCC and Enhanced GFCC from Human Respiratory Sounds / L. K. Kumar, P. J. A. Alphonse // European Physical Journal Special Topics. – 2022. – Vol. 231, No. 18-20. – P. 3329 – 3346. doi: 10.1140/epjs/s11734-022-00432-w
  9. Чистяков, С. П. Случайные леса: обзор / С. П. Чистяков // Труды Карельского научного центра Российской академии наук. – 2013. – № 1. – С. 117 – 136.
  10. Демидова, Л. А. Классификация данных на основе SVM-алгоритма и алгоритма k-ближайших соседей / Л. А. Демидова, Ю. С. Соколова // Вестник Рязанского государственного радиотехнического университета. – 2017. – № 62. – С. 119 – 132. doi: 10.21667/1995-4565-2017-62-4-119-132
  11. Марченко, Б. И. Нейронные сети в задачах аналитического обеспечения систем социально-гигиенического и экологического мониторинга / Б. И. Марченко, Н. К. Плуготаренко, О. А. Семина //Здоровье населения и среда обитания. – 2021. – №. 11 – С. 23 – 30.

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML
2. Рис. 1. Сравнения моделей при использовании мел-частотных (а) и гамматон-частотных (б) кепстральных коэффициентов, хромаграммы (в): 1 – многослойного перцептрона; 2 – случайного леса; 3 – опорных векторов; 4 – k-ближайших соседей

Скачать (31KB)
3. Рис. 2. Матрицы ошибок трех моделей машинного обучения при использовании мел-частотных кепстральных коэффициентов: а – k-ближайших соседей; б – опорных векторов; в – случайного леса

Скачать (20KB)
4. Рис. 3. Сравнение точности классификации шумов при использовании комбинаций признаков: 1 – 15 MFCC + 15 GFCC + 12 Chroma; 2 – 15 MFCC + 12 Chroma; 3 – 15 GFCC + 12 Chroma; 4 – 15 MFCC + 15 GFCC

Скачать (39KB)

Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».