Оптимизация производительности алгоритмов распознавания изображений на основе машинного обучения для мобильных устройств на базе операционной системы iOS

Обложка

Цитировать

Полный текст

Аннотация

На сегодняшний день мобильные устройства играют важную роль в повседневной жизни каждого человека, и одной из ключевых технологий, приводящих к значительным преимуществам для мобильных приложений, является машинное обучение. Оптимизация алгоритмов машинного обучения для мобильных устройств является актуальной и важной задачей, она направлена на разработку и применение методов, которые позволят эффективно использовать ограниченные вычислительные ресурсы мобильных устройств. В работе рассматриваются различные способы оптимизации алгоритмов распознания изображений на мобильных устройствах, такие как квантизация и сжатие моделей, оптимизация изначальных вычислений. Помимо способов оптимизации самой модели машинного обучения рассматриваются также различные библиотеки и инструменты для применения данной технологии на мобильных устройствах. Каждый из описанных способов имеет свои преимущества и недостатки, в связи с чем в итогах работы предлагается использовать не только комбинацию описанных вариантов, а также дополнительный способ – параллелизацию процессов обработки изображений. В статье рассмотрены примеры конкретных инструментов и фреймворков, доступных для оптимизации производительности машинного обучения на iOS, проведены собственные эксперименты для проверки эффективности различных методов оптимизации. А также приведен анализ полученных результатов и сравнение производительности алгоритмов. Практическая значимость данной статьи заключается в следующем: – Улучшение производительности алгоритмов машинного обучения на мобильных устройствах iOS приведет к более эффективному использованию вычислительных ресурсов и повышению производительности системы, что является весьма важным в контексте ограниченных вычислительных мощностей и энергетических ресурсов мобильных устройств. – Оптимизация производительности машинного обучения на iOS-платформе способствует развитию более быстрых и отзывчивых приложений, что также улучшит пользовательский опыт и позволит разработчикам создавать новые и инновационные функции и возможности. – Расширение применимости машинного обучения на мобильных устройствах iOS открывает новые возможности для разработки приложений в различных областях, таких как распознавание образов, обработка естественного языка, анализ данных и другие.

Об авторах

Ибрагим Магомедович Мамадаев

ООО "Мэйл.Ру"

Email: ibragim.m115@gmail.com
Разработчик;

Алина Мажитовна Минитаева

Московский Государственный Технический Университет им. Н.Э. Баумана

Email: aminitaeva@mail.ru
преподаватель; кафедра Информатика и Вычислительная Техника (ИУ-6);

Список литературы

  1. Чжан Я., Лю Я., Чэнь Т., Генг У. "Мобильное глубокое обучение для интеллектуальных мобильных приложений: Обзор." // "em"IEEE Access, 8"/em", 103, 586-103, 607.
  2. Документация Apple Developer [Электронный ресурс] // "Core ML – Оптимизация производительности на устройствах." // URL: https://developer.apple.com/documentation/coreml/optimizing_for_on-device_performance. Дата обращения: [29.06.2023].
  3. Растегари М., Ордонес В., Редмон Дж., Фархади А. "XNOR-Net: Классификация изображений ImageNet с использованием бинарных сверточных нейронных сетей." // Сборник материалов Европейской конференции по компьютерному зрению (ECCV) (стр. 525-542).
  4. Сихотан Х.., Марк А., Риандари Ф. и Ренделл Л. "Эффективные алгоритмы оптимизации для различных задач машинного обучения, включая классификацию, регрессию и кластеризацию. " // IEEE Access, 1, 14-24. doi: 10.35335/idea.v1i1.3
  5. Сандлер М., Ховард А., Чжу М., Жмогинов А., Чен Л. Ц. "MobileNetV2: Инвертированные остаточные блоки и линейные узкие места." // Сборник материалов конференции по компьютерному зрению и обработке изображений // IEEE (стр. 4510-4520).
  6. Ховард А. Г., Чжу М., Чен Б., Калениченко Д., Ванг В., Веанд Т. И др. "MobileNets: Эффективные сверточные нейронные сети для мобильных приложений компьютерного зрения." // IEEE 1704.04861.
  7. Хан С., Мао Х., Дэлли У. Дж. "Глубокая компрессия: Сжатие глубоких нейронных сетей с помощью отсечения, квантования обучения и кодирования Хаффмана." // IEEE 1510.00149.
  8. Документация Google TensorFlow Lite. [Электронный ресурс]. «TensorFlow» // URL: https://www.tensorflow.org/lite. Дата обращения: [29.06.2023].
  9. Таккар М. "Начало машинного обучения в iOS: CoreML Framework." // IEEE Access. doi: 10.1007/978-1-4842-4297-1. ISBN: 978-1-4842-4296-4
  10. Минитаева, А. М. Принятие решений в условиях интервального задания предпочтений лиц, принимающих решений // Материалы конференции «Информационные технологии в управлении» (ИТУ-2022): 15-я МУЛЬТИКОНФЕРЕНЦИЯ ПО ПРОБЛЕМАМ УПРАВЛЕНИЯ, Санкт-Петербург, 04 06 октября 2022 года. – Санкт-Петербург: Концерн; Центральный научно-исследовательский институт ;Электроприбор;, 2022. – С. 197-200. – EDN RNGSXI.
  11. Минитаева, А. М. Многомодельный подход к прогнозированию нелинейных нестационарных процессов в задачах оптимального управления // Необратимые процессы в природе и технике : Труды Двенадцатой Всероссийской конференции. В 2-х томах, Москва, 31 января – 03 2023 года. – Москва: Московский государственный технический университет имени Н.Э. Баумана (национальный исследовательский университет), 2023. – С. 438-447. – EDN FBVVXS.
  12. Кочнев А., «Концептуальные основы практического использования нейронных сетей: проблемы и перспективы» // «Общество и инновации» // doi: 10.47689/2181-1415-vol4-iss1-pp1-10
  13. Курбариа М., Бенгио Й., Дэвид Ж. П. "BinaryNet: Обучение глубоких нейронных сетей с ограничениями на веса и активации +1 или -1." // IEEE: 1602.02830.
  14. Ли Г., Вэй Гао, Вуэн Г., «Техники квантизации». doi: 10.1007/978-981-97-1957-0_5
  15. Самсиана С., Сьямсул А. «Алгоритмы машинного обучения с использованием метода векторного квантования обучения». doi: 10.1051/e3sconf/202450003010
  16. Адереми А. Атайеро, Сэмюэл Аджани «Обзор машинного обучения на встроенных и мобильных устройствах: оптимизация и приложения». doi: 10.3390/s21134412
  17. Сандлер М., Ховард А., ЛеКун Й. "Mobilenetv3: Высокоэффективная масштабируемая модель мобильного компьютерного зрения." // Сборник материалов конференции по компьютерному зрению и обработке изображений // IEEE/CVF (стр. 13840-13848).
  18. Чен Б., Данда Р. Юан Ч. «На пути к краже глубоких нейронных сетей на мобильных устройствах» // Безопасность и конфиденциальность в сетях связи (стр. 495-508). doi: 10.1007/978-3-030-90022-9_27
  19. Джармуни Ф., Фавзи А. «Запуск нейронных сетей в Android» // Университет Оттавы. Введение в глубокое обучение и нейронные сети с Python (cnh/ 247-280). doi: 10.1016/B978-0-323-90933-4.00001-2
  20. Быков К., Мюллер К. «Опасности изображений с водяными знаками в ImageNet» // Искусственный интеллект. Международные семинары ECAI 2023 (стр. 426–434). doi: 10.1007/978-3-031-50396-2_24

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML

Согласие на обработку персональных данных

 

Используя сайт https://journals.rcsi.science, я (далее – «Пользователь» или «Субъект персональных данных») даю согласие на обработку персональных данных на этом сайте (текст Согласия) и на обработку персональных данных с помощью сервиса «Яндекс.Метрика» (текст Согласия).