Нейросетевая классификация видеороликов по малому числу кадров
- Авторы: Смирнов А.В.1, Парфенов Д.Д.2, Тищенко И.П.1
-
Учреждения:
- Институт программных систем им. А. К. Айламазяна РАН
- ГУМРФ имени адмирала С.О. Макарова
- Выпуск: Том 15, № 4 (2024)
- Страницы: 79-96
- Раздел: Статьи
- URL: https://bakhtiniada.ru/2079-3316/article/view/299213
- DOI: https://doi.org/10.25209/2079-3316-2024-15-4-79-96
- ID: 299213
Цитировать
Полный текст
Аннотация
Ключевые слова
Об авторах
Александр Владимирович Смирнов
Институт программных систем им. А. К. Айламазяна РАН
Email: asmirnov_1991@mail.ru
Младший научный сотрудник Лаборатории методов обработки и анализа изображений, Институт Программных Систем имени А. К. Айламазяна РАН. Научные интересы: компьютерное зрение; нейронные сети; робототехника; автоматизация и управление
Дмитрий Денисович Парфенов
ГУМРФ имени адмирала С.О. Макарова
Email: parfecto@yandex.ru
Студент 3 курса по специализации «Прикладная информатика в экономике». Научные интересы: компьютерное зрение; нейронные сети
Игорь Петрович Тищенко
Институт программных систем им. А. К. Айламазяна РАН
Email: igor.p.tishchenko@gmail.com
Кандидат технических наук, ИО директора, Институт Программных Систем имени А. К. Айламазяна РАН. Научные интересы: компьютерное зрение; нейронные сети; робототехника; автоматизация и управление
Список литературы
- Duvvuri K., Kanisettypalli H., Jaswanth K., Murali K.. “Video classification using CNN and ensemble learning”, 2023 9th International Conference on Advanced Computing and Communication Systems. 1, ICACCS 2023 (17-18 March 2023, Coimbatore, India), IEEE, 2023, ISBN 9798350397383, pp. 66–70.
- Tang H., Ding L., Wu S., Ren B., Sebe N., Rota P.. “Deep unsupervised key frame extraction for efficient video classification”, ACM Transactions on Multimedia Computing, Communications and Applications, 19:3 (2023), 119, 17 pp.
- Savran K. R., Gan J. Q., Escobar J. J.. “A novel keyframe extraction method for video classification using deep neural networks”, Neural Computing and Applications, 35:34 (2023), pp. 24513–24524.
- Das M., Raj R., Saha P., Mathew B., Gupta M., Mukherjee A.. “HateMM: a multi-modal dataset for hate video classification”, Proceedings of the International AAAI Conference on Web and Social Media, 17, Proceedings of the Seventeenth International AAAI Conference on Web and Social Media (ICWSM 2023) (2023), pp. 1014–1023.
- Lei J., Sun W., Fang Y., Ye N., Yang S., Wu J.. “A model for detecting abnormal elevator passenger behavior based on video classification”, Electronics, 13:13 (2024), 2472, 15 pp.
- Amin J., Anjum M. A., Ibrar K., Sharif M., Kadry S., Crespo R. G.. “Detection of anomaly in surveillance videos using quantum convolutional neural networks”, Image and Vision Computing, 135 (2023), 104710.
- Cong I., Choi S., Lukin M. D.. “Quantum convolutional neural networks”, Nature Physics, 15 (2019), pp. 1273–1278.
- Jianmin H., Jie L.. “A video action recognition method via dual-stream feature fusion neural network with attention”, International Journal of Uncertainty, Fuzziness and Knowledge-Based Systems, 32:04 (2024), pp. 673–694.
- Trędowicz M., Struski Ł., Mazur M., Janusz S., Lewicki A., Tabor J.. PrAViC: probabilistic adaptation framework for real-time video classification, 2024, 12 pp.
- Gao T., Zhang M., Zhu Y., Zhang Y., Pang X., Ying J., Liu W.. “Sports video classification method based on improved deep learning”, Applied Sciences, 14:2 (2024), 948, 13 pp.
- Kanwal Y., Tabassam N.. “An attention mechanism-based CNN-BiLSTM classification model for detection of inappropriate content in cartoon videos”, Multimedia Tools and Applications, 83:11 (2024), pp. 31317–31340.
- He K., Zhang X., Ren S., Sun J.. “Deep residual learning for image recognition”, 2016 IEEE Conference on Computer Vision and Pattern Recognition, CVPR 2016 (27-30 June 2016, Las Vegas, NV, USA), IEEE, 2016, ISBN 978-1-4673-8850-4, pp. 770–778.
- Ren S., He K., Girshick R., Sun J.. “Faster R-CNN: towards real-time object detection with region proposal networks”, Proceedings of the 28th International Conference on Neural Information Processing Systems. 1, NIPS'15 (December 7–12, 2015, Montreal, Canada), MIT Press, Cambridge, 2015, ISBN 9781510825024, pp. 91–99.
- Tan M., Le Q. V.. “EfficientNet: rethinking model scaling for convolutional neural networks”, Proceedings of the 36th International Conference on Machine Learning, ICML 2019 (9-15 June 2019, Long Beach, California, USA), Proceedings of Machine Learning Research, vol. 97, ICML, 2019, ISBN 9781510886988, pp. 6105–6114.
Дополнительные файлы
