Information and analytical system for detecting the movement of objects on a pedestrian crossing

封面

如何引用文章

全文:

详细

To manage pedestrian and vehicle flows at intersections, systems are implemented that use adaptive traffic light models, adjusting time intervals based on the volume of pedestrians and vehicles. These systems include video cameras that monitor road user movements, enhancing real-time traffic control. This paper introduces an information and analytical system for managing transport and pedestrian flows using the YOLO neural model, which enables object recognition. The system performs several operations: converting the original image to gray scale, applying Gaussian blurring, detecting object boundaries through the Canny filter and fuzzy logic for edge detection, and contour processing, where each identified contour is assigned a unique number. The neural network then compares detected contours to the training sample data, determining whether the object is a person or a vehicle. The paper presents experimental results for these algorithms in object recognition. Modified software and images of intersections with pedestrian crossings captured from street video cameras in Kursk were used in the experiments. The recognition accuracy rate from the experiments was 72.4%.

全文:

Введение

Задачи идентификации объектов рассматриваются в различных предметных областях (ПрО): медицина [1], авиация [2], дистанционное зондирование Земли [3], дорожное движение [4, 5]. С целью выявления нарушений правил дорожного движения, фиксирования дорожно-транспортных происшествий, поиска автотранспортных средств или установления местоположения человека может использоваться информация о распознавании лиц участников дорожного движения [6], номерных знаков [7], а также автомобилей и пешеходов.

В данной работе рассматривается распознавание автомобилей и пешеходов с целью управления их потоками. В [8] предложена система управления светофором, которая в зависимости от количества участников движения, находящихся на пешеходном переходе, на основе нечётких правил регулирует время работы зелёных и красных сигналов светофора. Разработано специализированное программное обеспечение (СПО) «Программа для регулирования светофора на основе нечёткой логики» [9], алгоритм работы которого модифицирован в данной работе.

Существуют отрытые решения типа OpenCV (Open Computer Vision Library, библиотека алгоритмов компьютерного зрения, обработки изображений и алгоритмов общего назначения), которые позволяют решать подобные задачи. Наиболее распространённым из этих библиотек является нейронная сеть (НС) YOLO (от англ. You Only Look Once), которая способна детектировать объекты в режиме реального времени [10, 11]. Другими известными моделями машинного обучения, используемыми для детектирования объектов, являются конволюционные НС [12, 13].

Алгоритмы на основе глубоких и рекуррентных НС могут улучшить детектирование пешеходов, особенно в сложных условиях, таких как плохое освещение или интенсивное движение [14]. Методы ансамблевого обучения используются для улучшения точности детектирования путём объединения результатов нескольких моделей [15]. Комбинированные модели создаются путём соединения различных методов компьютерного зрения, с помощью которых строятся гиперплоскости в n-мерном пространстве с целью разделения объектов, относящихся к разным классам [16]. Общим недостатком данных моделей является использования фильтра Канни [17] для выделения контуров на изображении. В работе [18] показано, что данный детектор плохо реагирует на градиент изменения выпуклой и вогнутой формы.

В данной работе используется модифицированный алгоритм нечётко-логического метода выделения контуров объектов, реализованный на первом уровне двухуровневой информационно-аналитической системы управления транспортным потоком (ДИАСУТП), позволяющий детектировать участников дорожного движения с целью расчёта времени задержек сигналов светофоров на перекрёстке.

1 Методическая основа ДИАСУТП

1.1 Онтология предметной области

Структура вычислительных процессов детектирования объектов в ДИАСУТП, позволяющей распознать объекты на перекрёстке в режиме реального времени представлена на рисунке 2. Система состоит из двух уровней: детекция числа автомобилей и пешеходов; расчёт времени задержки сигналов светофора. Первый уровень содержит следующие вычислительные процессы: преобразование исходного изображения в градации серого; размытие изображения по Гауссу; детектирование границ объектов с помощью алгоритма Канни или нечётко-логического метода детектирования контуров объектов [18]; выявление необходимых объектов по выделенным признакам с помощью алгоритма YOLO; принятие решений об итоговом количестве автомобилей и пешеходов.

 

Рисунок 1 – Фрагмент онтологии управления транспортным потоком (ТС – транспортное средство)

 

Рисунок 2 – Структура вычислительных процессов в двухуровневой информационно-аналитической системе управления транспортным потоком

 

Второй уровень ДИАСУТП содержит пять этапов: определение чётких входных переменных; фаззификация значений входных переменных; выборка решений на основе нечётких правил; дефаззификация значений; определение времени задержки сигналов светофора. Подробно данный уровень описан в работах [8, 9].

 

Таблица 1 – Фрагмент спецификации понятий онтологической модели управления транспортным потоком

Table 1 – Specification of concepts in the ontological model for traffic flow management

Понятия

Атрибуты

Отношения с атрибутами

Сбор данных

Данные о пешеходном переходе, поведение транспорта и пешеходов, вид дорожных условий

ДИАСУТП

Свойства и отношения

Детектирование объектов на пешеходном переходе и определение данных о их перемещении

ДИАСУТП

Создание прототипа

База данных и классификация объектов на основе машинного обучения и нейронных сетей

ДИАСУТП

Применение алгоритмов

Использование специализированных устройств для анализа данных на пешеходном переходе, применение нейронных сетей для классификации объектов на пешеходном переходе

ДИАСУТП

Тестирование

Анализ данных о работе ДИАСУТП

Применение алгоритмов

Верификация

Оценка точности работы ДИАСУТП

Применение алгоритмов

Пешеход

Скорость, направление движения, возраст

Свойства и отношения

Транспорт

Скорость, тип, направление движения

Свойства и отношения

Пешеходный переход

Тип, расположение

Свойства и отношения

Направление движения

Находится на…, приближается к…

Свойства и отношения

 

1.2 Преобразование в градации серого цвета

На начальном этапе работы ДИАСУТП происходит получение исходного изображения, полученного с видеокамеры. На втором этапе осуществляется преобразование исходного изображения в формате RGB в градации серого. Для этой цели требуется рассчитать значение интенсивности каждого отдельного пикселя, используя формулу [19]:

Ix,y=0,299Rx,y+0,587Gx,y+0,114Bx,y,

где Ix,y – интенсивность яркости градации серого в пикселе (Ix,y Î[0, 255]) на изображении с координатами вдоль оси абсцисс (x=1…w) и вдоль оси ординат (y=1…h); w – ширина изображения в пикселях; h – высота изображения в пикселях; R – значение интенсивности красного цвета в пикселе; G – значение интенсивности зелёного цвета в пикселе; B – значение интенсивности синего цвета в пикселе.

Преобразованное изображение подаётся на третий блок 1.3 первого уровня ДИАСУТП (рисунок 2), где происходит размытие по Гауссу.

1.3 Размытие изображения по Гауссу

Третий этап работы ДИАСУТП позволяет уменьшить влияние шума на изображение. Сглаживание полутонового изображения происходит с помощью поэлементного умножения матриц Ix,y и Гаусса с размером окна 5×5.

1.4 Детекторы границ объектов

1.4.1 Детектор Канни

Алгоритм Канни используется для обнаружения границ искомых объектов на изображении [17]. Недостаток алгоритма Канни заключается в том, что он распознаёт только линейные области изображения. Это связано с тем, что в данном методе анализируется рамка на изображении с размером окна 3×3. Поэтому целесообразно использовать нечётко-логический метод детектирования границ объектов [18], который позволяет распознавать вогнуто-выпуклую форму объектов благодаря анализу рамки в окне с размером 5×5.

1.4.2 Нечётко-логический метод детектирования границ объектов

Нечётко-логический метод основан на модификации детектора Канни и использовании нечётких правил для определения градиента границ. Вычисления, соответствующие алгоритму Канни, повторяются до этапа определения угла направления градиента яркости. Далее осуществляется фаззификация входных переменных, которыми являются разности градиентов между центральной и смежными ячейками, и формирование базы нечётких правил [20]. Сформированная база состоит из четырёх или шестнадцати нечётких правил в зависимости от выбранной модификации рассматриваемого метода. Дефаззификация чёткого значения выполняется при помощи метода центра тяжести. С помощью нечётких α-срезов производится бинаризация полученного изображения и выделение границ объектов на нём. В отличие от детектора Канни данный метод реагирует на различные изменения градиента относительно центральной ячейки, что позволяет распознавать вогнутые и выпуклые формы объектов. Использование описанного метода позволяет повысить производительность вычислительных операций во время распознавания границ объектов посредством сокращения числа проходов по исходному изображению.

В процессе обработки изображений после операции детектирования границ осуществляется распознавание контуров. Изображения контуров подаются на вход НС. Для выделения контуров используется алгоритм Suzuki-Abe [21].

1.5 Алгоритм YOLO

Назначение алгоритма YOLO – распознать класс объекта и выделить его ограничивающей рамкой на финальном изображении. По завершении работы алгоритма выходное изображение содержит объекты, выделенные рамкой.

Ограничением точности предлагаемого метода является ухудшение погодных условий, например, возникновение тумана или метели, во время которых видеокамеры не могут передать качественное изображение из-за изменения интенсивности света. В таких случаях могут возникать погрешности распознавания объектов.

1.6 Циклограмма формирования управляющего сигнала

Циклограмма работы для двух светофоров включает четыре режима регулирования, два из которых являются основными и два промежуточными. В первом режиме предполагается, что на Светофоре_1 включается красный свет, а на Светофоре_2 – зелёный свет. Второй режим является промежуточным перед сменой сигналов устройства. При этом к лампам, горящим в режиме 1, добавляется лампа с мигающим жёлтым светом. Происходит пять коротких включений сигнала жёлтого света, после чего устройства переходят в третий режим, который полностью противоположен первому. В четвёртом режиме происходит переход на режим 1, после чего цикл повторяется. Циклограмма работы двух светофоров сведена в таблицу 2.

 

Таблица 2 – Циклограмма работы светофоров

Table 2 – Traffic light operation cyclogram

Светофор

Светофор_1

Светофор_2

Режим

Цвет лампы

красный

жёлтый

зелёный

зелёный

жёлтый

красный

1

 

1

0

0

1

0

0

Время свечения

tрег = tmin + tdelay

2

 

1

1/0

10 тактов

0

1

1/0

10 тактов

0

Время мигания

tyellow (10 тактов мигания за 2 с)

3

 

0

0

1

0

0

1

Время свечения

tрег = tmin + tdelay

4

 

0

1/0

10 тактов

1

0

1/0

10 тактов

1

Время мигания

tyellow (10 тактов мигания за 2 с)

 

Расчёт времени работы первого и третьего режимов светофоров осуществляется по формуле: tрег=tmin+tdelay, где tmin – минимальное время задержки управляющего сигнала светофора; tdelay – время задержки управляющего сигнала. Переменная tdelay определяется на выходе второго уровня ДИАСУТП, детальный расчёт представлен в работах [8, 9]. Переменная tmin является настраиваемым параметром (по умолчанию tmin=10 с) и используется для работы светофора в ситуации, когда время задержки tdelay равно нулю. Время полного цикл работы светофора, состоящего из четырёх режимов, определяется по формуле: tц=tрег+tyellow+tрег+tyellow=2 (tрег+tyellow), где tyellow – время задержки жёлтого сигнала светофора (настраиваемый параметр, по умолчанию tyellow=2 с).

2 Экспериментальные исследования

По представленному алгоритму создано модифицированное СПО на языке C# в среде Microsoft Visual Studio 2022. На вход СПО подаются изображения с видеокамер, выходными данными являются обработанные изображения, на которых детектируемый объект выделен рамкой. Для экспериментальных исследований были взяты изображения с видеокамер, установленных на перекрёстках города Курска (пересечение ул. Карла Маркса и ул. Хуторской (см. рисунок 3), площадь Перекальского (см. рисунок 4).

 

Рисунок 3 – Результаты первого экспериментального исследования: а) исходное изображение; б) преобразованное в градации серого и размытое по Гауссу изображение; в) детектированные границы объектов; г) результирующее изображение с распознанными объектами (выделены рамками)

 

Рисунок 4 – Результаты второго экспериментального исследования: а) исходное изображение; б) преобразованное в градации серого и размытое по Гауссу изображение; в) детектированные границы объектов; г) результирующее изображение с распознанными объектами (выделены рамками)

 

Экспериментальные исследования показали хорошие результаты работы ДИАУСТП, что видно на результирующих изображениях, на которых обнаруженные объекты выделены рамкой. Однако выявлены некоторые погрешности распознавания, например, при частичной видимости объекта НС YOLO не распознаёт его наличие. В этих случаях распознавание осуществлялось визуально. Для этого каждый кадр из видеопоследовательности, на котором рамками были выделены распознанные объекты, сохранялся в базе данных и оценивался вручную. В ходе этого эксперимента на каждом кадре визуально оценивалось количество правильно и неправильно распознанных объектов, а также оценивалось, пропущен объект или нет. Результаты экспериментов сведены в таблицу 3.

 

Таблица 3 – Результаты экспериментальных исследований

Table 3 – Results of experimental studies

Эксперимент

Объекты

Всего

Кол-во верно обнаруженных объектов, TP

Кол-во ложно обнаруженных объектов, FP

Кол-во пропущенных объектов, FN

1

Пешеходы

3

2

0

1

Автомобили

4

4

1

0

2

Пешеходы

10

7

1

3

Автомобили

10

8

0

2

Итого

27

21

2

6

 

Точность распознавания объектов на изображениях в экспериментах вычисляется по формуле

N=TPTP+FP+FN×100%,

где TP – количество верно обнаруженных объектов; FP – количество ложно обнаруженных объектов; FN – количество пропущенных объектов.

Согласно значениям из таблицы 3 точность составляет 72,4%.

Заключение

В данной работе представлена ДИАСУТП, позволяющая распознавать автомобили и пешеходов на перекрёстке в режиме реального времени для решения задачи регулирования городского потока. Для экспериментальных исследований использовалось модифицированное СПО и изображения перекрёстков с пешеходными переходами, взятые с видеокамер, установленных на улицах города Курска. Результаты экспериментов показали работоспособность предложенного алгоритма детектирования объектов.

×

作者简介

Maxim Bobyr

Southwest State University

编辑信件的主要联系方式.
Email: fregat_mn@rambler.ru
ORCID iD: 0000-0002-5400-6817
Scopus 作者 ID: 57191724301
Researcher ID: G-2604-2013

Doctor of Technical Sciences, Professor at the Department of Software Engineering, Chairman of the first dissertation Council of Southwestern State University in Russia in the specialty "Cognitive modeling" (technical sciences)

俄罗斯联邦, Kursk

Natalia Khrapova

Southwest State University

Email: KhrapovaNI@yandex.ru
ORCID iD: 0000-0001-7947-1427
Researcher ID: KFT-1075-2024

postgraduate student of the Department of Software Engineering

俄罗斯联邦, Kursk

参考

  1. Soynikova ES, Batishchev DS, Mikhelev VM. On the recognition of shaped blood objects based on medical imag-es [In Russian]. Scientific result. Information technology. 2018; 3: 54-65. doi: 10.18413/2518-1092-2018-3-3-0-7.
  2. Yakovlev EL. A model for estimating the computational complexity of intelligent object recognition in images on board unmanned aerial vehicles [In Russian]. Intelligent technologies in transport. 2018; 3(15): 27-32.
  3. Shoshina KV, Aleshko RA, Berezovsky VV., Vasendina IS., Shoshin AS., Guryev AT. Thematic interpretation of aerial photographs of forest areas based on conceptual modeling [In Russian]. Ontology of designing. 2023; 3(49): 437-454. doi: 10.18287/2223-9537-2023-13-3-437-454.
  4. Morev KI, Tselykh AN. A system for analyzing car traffic at an object (in logistics) based on image recognition from a video surveillance camera [In Russian]. Almanac of Modern Science and Education. 2017; 2(116): 93-96.
  5. Kopeikin RE, Glazkov VV, Pasheva TA. Comparative characteristics of image recognition methods for the task of recognizing road signs [In Russian]. Scientific and Technical Bulletin of the Volga region. 2023; 3: 63-67.
  6. Kolodenkova AE. Ontology of human identification by body movements and face in video surveillance [In Rus-sian]. Ontology of designing. 2023; 1(47): 55-74. doi: 10.18287/2223-9537-2023-13-1-55-74.
  7. Ubozhenko NV. Analysis of the effectiveness of character recognition methods within the framework of the task of recognizing a vehicle license plate [In Russian]. Prospects for the development of information technology. 2013; 12: 41-45.
  8. Bobyr MV, Khrapova NI, Lamonov MA. Intelligent traffic light control system based on fuzzy logic [In Russian]. Izvestiya Yugo-Zapadnogo gosudarstvennogo universiteta. 2021; 4: 162-176. doi: 10.21869/2223-1560-2021-25-4-162-176.
  9. Certificate of state registration of a computer program No. 2021661796 [In Russian]. Bobyr MV, Milostnaya NA, Khrapova NI. [et al.]. Application No. 2021660730. Date of receipt 08.07.2021. It was registered in the Register of Computer Programs on 07.15.2021.
  10. Astapova MA, Uzdyaev MY. Detection of defects in faulty elements of power lines using neural networks of the YOLO family [In Russian]. Modeling, optimization and information technology. 2021; 4(35). doi: 10.26102/2310-6018/2021.35.4.035.
  11. Nikitin DV, Taranenko IS, Kataev AV. Detection of road signs based on the YOLO neural network model [In Russian]. Engineering Bulletin of the Don. 2023; 7(103): 91-99.
  12. Chuikov RY, Yudin DA. Detection of vehicles on images of suburban highways based on the Single shot multibox Detector method [In Russian]. Scientific result. Information technology. 2017; 2(4): 50-58. doi: 10.18413/2518-1092-2017-2-4-50-58.
  13. Yaskelainen YS, Khakimov AA, Muthanna MSA, Muthanna ASA, Kirichek RV. Development of a pedestrian recognition system in real time for its application in the concept of a smart city [In Russian]. Information tech-nologies and telecommunications. 2018; 6(3): 123-136.
  14. Lysanov MK, Sai SV. Recognition of traffic objects using a deep neural network [In Russian]. Information tech-nologies of the XXI century. 2019. P. 263-268.
  15. Hossain A, Sun X, Das S, Jafari M, Codjoe J. Investigating older driver crashes on high-speed roadway seg-ments: a hybrid approach with extreme gradient boosting and random parameter model. Transportmetrica A Transport Science, 2024. doi: 10.1080/23249935.2024.2362362.
  16. Bobyr MV, Milostnaya NA, Khrapova NI. On the approach to detecting pedestrian movement using the method of histograms of directed gradients[In Russian]. Electronic libraries. 2024; 27(4): 429-447. doi: 10.26907/1562-5419-2024-27-4-429-447.
  17. Canny JA. computational approach to edge detection. IEEE Trans Pattern Anal Mach Intell, 1986, № 8(6), p. 679–98. doi: 10.1109/TPAMI.1986.4767851.
  18. Bobyr MV, Arkhipov AE, Gorbachev SV, Cao Ts Bhattacharya SB. Fuzzy logic methods in the problem of detect-ing object boundaries [In Russian]. Informatics and Automation. 2022; 21(2): 376-404. doi: 10.15622/ia.21.2.6.
  19. Sala FA. Design of false color palettes for grayscale reproduction. Displays, 2017; 46: 9-15.
  20. Kolodenkova AE, Vereshchagina SS, Favorskaya EA, Osipova EA. An approach to assessing the technical con-dition of electrical equipment using weighted fuzzy rules [In Russian]. Ontology of designing. 2024; 1(51): 134-144. doi: 10.18287/2223-9537-2024-14-1-134-144.
  21. Suzuki S, Keiichi A. Topological structural analysis of digitized binary images by border following. Comput. Vis. Graph. Image Process. 1985; 30: 32-46.

补充文件

附件文件
动作
1. JATS XML
2. Figure 1 – Fragment of the traffic flow control ontology

下载 (734KB)
3. Figure 2 – The structure of computational processes in a two-level information and analytical system for traffic flow management

下载 (451KB)
4. Figure 3 – The results of the first experimental study: a) the original image; b) the image converted to grayscale and Gaussian blurring of the image; c) detecting objects edges; d) the resulting image with recognized objects which are highlighted with frames.

下载 (1MB)
5. Figure 4 – Results of the second experimental study: a) the original image; b) the image converted to grayscale and Gaussian blurring of the image; c) t detecting objects edges; d) the resulting image with recognized objects which are highlighted with frames.

下载 (1MB)

版权所有 © Bobyr M.V., Khrapova N.I., 2024

Creative Commons License
此作品已接受知识共享署名 4.0国际许可协议的许可

Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».