Два метода оценки оптического потока по видеоряду изображений

Обложка

Цитировать

Полный текст

Аннотация

Статья посвящена оценке оптического потока по видеоряду изображений. Основное внимание уделено двум методам решения этой сложной вычислительной задачи, играющей ключевую роль во многих разделах компьютерного зрения, например, таких как отслеживание объектов, анализ сцен, определения микрои макродвижений для распознавания эмоций по выражению лица и многих других. Предложенные методы взаимно дополняют друг друга. По своей природе они относятся к вариационным методам вычисления видеопотока, однако существенно отличаются от описанных в литературе скоростью и надежностью. Данные методы не требуют глубокого машинного обучения, поэтому могут использоваться при отсутствии обучающей выборки требуемого объема, необходимой для методов, в которых при вычислении видеопотока применяются глубокие нейронные сети. Показали конкурентную точность и надежность.

Об авторах

Мария Александровна Бутакова

Научно-исследовательский и проектно-конструкторский институт информатизации, автоматизации и связи на железнодорожном транспорте

Автор, ответственный за переписку.
Email: m.a.butakova@yandex.ru

доктор технических наук, профессор, главный научный сотрудник

Россия, Ростов-на-Дону

Игорь Васильевич Щербань

Южный федеральный университет

Email: shcheri@mail.ru

доктор технических наук, доцент, ведущий научный сотрудник лаборатории «Нейротехнологий и психофизиологии»

Россия, Ростов-на-Дону

Никита Александрович Мишин

Южный федеральный университет

Email: nmishin@sfedu.ru

аспирант кафедры Методов оптимизации и машинного обучения Института математики, механики и компьютерных наук им. И. И. Воровича

Россия, Ростов-на-Дону

Григорий Исаакович Белявский

Южный федеральный университет

Email: gbelyavski@sfedu.ru

доктор технических наук, профессор, профессор кафедры Методов оптимизации и машинного обучения Института математики, механики и компьютерных наук им. И. И. Воровича, ведущий научный сотрудник лаборатории «Нейротехнологий и психофизиологии»

Россия, Ростов-на-Дону

Список литературы

  1. Lucas B. D., Kanade T. An iterative image registration technique with an application to stereo vision // IJCAI'81: 7th international joint conference on Artificial intelligence. 1981. V. 2. P. 674-679.
  2. Leonida K. L., Sevilla K. V., Manlises C. O. A MotionBased Tracking System Using the Lucas-Kanade Optical Flow Method // 2022 14th International Conference on Computer and Automation Engineering (ICCAE). IEEE, 2022. P. 86-90.
  3. Horn B. K. P., Schunck B. G. Determining optical flow // Artificial intelligence. 1981. V. 17. No 1-3. P. 185-203.
  4. NVIDIA Optical Flow SDK // Electronic resource. URL: https://developer.nvidia.com/optical-flow-sdk (accessed 07.01.2024).
  5. Dosovitskiy A. et al. Flownet: Learning optical flow with convolutional networks // Proceedings of the IEEE international conference on computer vision. 2015. P. 2758-2766.
  6. Tehrani A. K. Z., Rivaz H. MPWC-Net++: evolution of optical flow pyramidal convolutional neural network for ultrasound elastography // Medical Imaging 2021: Ultrasonic Imaging and Tomography. SPIE, 2021. V. 11602. P. 14-23.
  7. Sun D. et al. Pwc-net: Cnns for optical flow using pyramid, warping, and cost volume // Proceedings of the IEEE conference on computer vision and pattern recognition. 2018. P. 8934-8943.
  8. Kavitha K. K., Venkatapur R. B. Motion Estimation using Optical Flow Through A CNN based Pyramidal Warping and Cost Volume Approach: An Optimized PWC-Net Model // Grenze International Journal of Engineering & Technology (GIJET). 2024. V. 10.
  9. Teed Z., Deng J. Raft: Recurrent all-pairs field transforms for optical flow // Computer Vision–ECCV 2020: 16th European Conference. Glasgow, UK. Proceedings, Part II 16. Springer International Publishing, 2020. P. 402-419.
  10. Sui X. et al. Craft: Cross-attentional flow transformer for robust optical flow // Proceedings of the IEEE/CVF conference on Computer Vision and Pattern Recognition. 2022. P. 17602-17611.
  11. Turin G. An introduction to matched filters // IRE transactions on Information theory. 1960. V. 6. No 3. P. 311-329.
  12. Болдин М. В., Симонова Г. И., Тюрин Ю. Н. Знаковый статистический анализ линейных моделей. 1997.
  13. Durrani S. et al. Accelerating fourier and number theoretic transforms using tensor cores and warp shuffles // 2021 30th International conference on parallel architectures and compilation techniques (PACT). IEEE, 2021. P. 345-355.
  14. Cheon B. W., Kim N. H. Modified gaussian filter based on fuzzy membership function for awgn removal in digital images // Journal of information and communication convergence engineering. 2021. V. 19. No 1. P. 54-60.
  15. Wang Z., Wende-von Berg S., Braun M. Fast parallel Newton–Raphson power flow solver for large number of system calculations with CPU and GPU // Sustainable Energy, Grids and Networks. 2021. V. 27. P. 100483.
  16. Тихонов А. Н. О некорректных задачах линейной алгебры и устойчивом методе их решения // ДАН СССР. 1965. Т. 163. № 3.
  17. HD1K Benchmark Suite // Electronic resource. URL: http://hci-benchmark.iwr.uni-heidelberg.de/ (accessed 07.01.2024).
  18. About MPI-Sintel Flow // Electronic resource. URL: http://sintel.is.tue.mpg.de/about (accessed 07.01.2024).
  19. Otte M., Nagel H. H. Optical flow estimation: advances and comparisons // Computer Vision–ECCV'94: Third European Conference on Computer Vision. Stockholm, Sweden. Proceedings, Volume I 3. Springer Berlin Heidelberg, 1994. P. 49-60.
  20. Barron J. L., Fleet D. J., Beauchemin S. S. Performance of optical flow techniques // International journal of computer vision. 1994. V. 12. P. 43-77.

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML

Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».