Два метода оценки оптического потока по видеоряду изображений
- Авторы: Бутакова М.А.1, Щербань И.В.2, Мишин Н.А.2, Белявский Г.И.2
-
Учреждения:
- Научно-исследовательский и проектно-конструкторский институт информатизации, автоматизации и связи на железнодорожном транспорте
- Южный федеральный университет
- Выпуск: № 1 (2025)
- Страницы: 115-127
- Раздел: Анализ сигналов, аудио и видео информации
- URL: https://journals.rcsi.science/2071-8594/article/view/293510
- DOI: https://doi.org/10.14357/20718594250110
- EDN: https://elibrary.ru/GUJXEK
- ID: 293510
Цитировать
Полный текст
Аннотация
Статья посвящена оценке оптического потока по видеоряду изображений. Основное внимание уделено двум методам решения этой сложной вычислительной задачи, играющей ключевую роль во многих разделах компьютерного зрения, например, таких как отслеживание объектов, анализ сцен, определения микрои макродвижений для распознавания эмоций по выражению лица и многих других. Предложенные методы взаимно дополняют друг друга. По своей природе они относятся к вариационным методам вычисления видеопотока, однако существенно отличаются от описанных в литературе скоростью и надежностью. Данные методы не требуют глубокого машинного обучения, поэтому могут использоваться при отсутствии обучающей выборки требуемого объема, необходимой для методов, в которых при вычислении видеопотока применяются глубокие нейронные сети. Показали конкурентную точность и надежность.
Об авторах
Мария Александровна Бутакова
Научно-исследовательский и проектно-конструкторский институт информатизации, автоматизации и связи на железнодорожном транспорте
Автор, ответственный за переписку.
Email: m.a.butakova@yandex.ru
доктор технических наук, профессор, главный научный сотрудник
Россия, Ростов-на-ДонуИгорь Васильевич Щербань
Южный федеральный университет
Email: shcheri@mail.ru
доктор технических наук, доцент, ведущий научный сотрудник лаборатории «Нейротехнологий и психофизиологии»
Россия, Ростов-на-ДонуНикита Александрович Мишин
Южный федеральный университет
Email: nmishin@sfedu.ru
аспирант кафедры Методов оптимизации и машинного обучения Института математики, механики и компьютерных наук им. И. И. Воровича
Россия, Ростов-на-ДонуГригорий Исаакович Белявский
Южный федеральный университет
Email: gbelyavski@sfedu.ru
доктор технических наук, профессор, профессор кафедры Методов оптимизации и машинного обучения Института математики, механики и компьютерных наук им. И. И. Воровича, ведущий научный сотрудник лаборатории «Нейротехнологий и психофизиологии»
Россия, Ростов-на-ДонуСписок литературы
- Lucas B. D., Kanade T. An iterative image registration technique with an application to stereo vision // IJCAI'81: 7th international joint conference on Artificial intelligence. 1981. V. 2. P. 674-679.
- Leonida K. L., Sevilla K. V., Manlises C. O. A MotionBased Tracking System Using the Lucas-Kanade Optical Flow Method // 2022 14th International Conference on Computer and Automation Engineering (ICCAE). IEEE, 2022. P. 86-90.
- Horn B. K. P., Schunck B. G. Determining optical flow // Artificial intelligence. 1981. V. 17. No 1-3. P. 185-203.
- NVIDIA Optical Flow SDK // Electronic resource. URL: https://developer.nvidia.com/optical-flow-sdk (accessed 07.01.2024).
- Dosovitskiy A. et al. Flownet: Learning optical flow with convolutional networks // Proceedings of the IEEE international conference on computer vision. 2015. P. 2758-2766.
- Tehrani A. K. Z., Rivaz H. MPWC-Net++: evolution of optical flow pyramidal convolutional neural network for ultrasound elastography // Medical Imaging 2021: Ultrasonic Imaging and Tomography. SPIE, 2021. V. 11602. P. 14-23.
- Sun D. et al. Pwc-net: Cnns for optical flow using pyramid, warping, and cost volume // Proceedings of the IEEE conference on computer vision and pattern recognition. 2018. P. 8934-8943.
- Kavitha K. K., Venkatapur R. B. Motion Estimation using Optical Flow Through A CNN based Pyramidal Warping and Cost Volume Approach: An Optimized PWC-Net Model // Grenze International Journal of Engineering & Technology (GIJET). 2024. V. 10.
- Teed Z., Deng J. Raft: Recurrent all-pairs field transforms for optical flow // Computer Vision–ECCV 2020: 16th European Conference. Glasgow, UK. Proceedings, Part II 16. Springer International Publishing, 2020. P. 402-419.
- Sui X. et al. Craft: Cross-attentional flow transformer for robust optical flow // Proceedings of the IEEE/CVF conference on Computer Vision and Pattern Recognition. 2022. P. 17602-17611.
- Turin G. An introduction to matched filters // IRE transactions on Information theory. 1960. V. 6. No 3. P. 311-329.
- Болдин М. В., Симонова Г. И., Тюрин Ю. Н. Знаковый статистический анализ линейных моделей. 1997.
- Durrani S. et al. Accelerating fourier and number theoretic transforms using tensor cores and warp shuffles // 2021 30th International conference on parallel architectures and compilation techniques (PACT). IEEE, 2021. P. 345-355.
- Cheon B. W., Kim N. H. Modified gaussian filter based on fuzzy membership function for awgn removal in digital images // Journal of information and communication convergence engineering. 2021. V. 19. No 1. P. 54-60.
- Wang Z., Wende-von Berg S., Braun M. Fast parallel Newton–Raphson power flow solver for large number of system calculations with CPU and GPU // Sustainable Energy, Grids and Networks. 2021. V. 27. P. 100483.
- Тихонов А. Н. О некорректных задачах линейной алгебры и устойчивом методе их решения // ДАН СССР. 1965. Т. 163. № 3.
- HD1K Benchmark Suite // Electronic resource. URL: http://hci-benchmark.iwr.uni-heidelberg.de/ (accessed 07.01.2024).
- About MPI-Sintel Flow // Electronic resource. URL: http://sintel.is.tue.mpg.de/about (accessed 07.01.2024).
- Otte M., Nagel H. H. Optical flow estimation: advances and comparisons // Computer Vision–ECCV'94: Third European Conference on Computer Vision. Stockholm, Sweden. Proceedings, Volume I 3. Springer Berlin Heidelberg, 1994. P. 49-60.
- Barron J. L., Fleet D. J., Beauchemin S. S. Performance of optical flow techniques // International journal of computer vision. 1994. V. 12. P. 43-77.
Дополнительные файлы
