БЫСТРОЕ И ВЫСОКОТОЧНОЕ ПРЕОБРАЗОВАНИЕ ХАФА С ВЫЧИСЛИТЕЛЬНОЙ СЛОЖНОСТЬЮ Θ(wh log3 w) ДЛЯ ОБРАБОТКИ ПРЯМОУГОЛЬНЫХ ИЗОБРАЖЕНИЙ ПРОИЗВОЛЬНОГО РАЗМЕРА

Обложка
  • Авторы: Казимиров Д.Д1,2,3, Николаев Д.П3,4
  • Учреждения:
    1. Институт проблем передачи информации им. А.А. Харкевича РАН
    2. Московский государственный университет им. М.В. Ломоносова
    3. ООО «Смарт Энджинс Сервис»
    4. Федеральный исследовательский центр «Информатика и управление» РАН
  • Выпуск: Том 61, № 4 (2025)
  • Страницы: 41-58
  • Раздел: Обработка изображений
  • URL: https://journals.rcsi.science/0555-2923/article/view/363551
  • DOI: https://doi.org/10.7868/S3034583925040032
  • ID: 363551

Цитировать

Полный текст

Открытый доступ Открытый доступ
Доступ закрыт Доступ предоставлен
Доступ закрыт Только для подписчиков

Аннотация

Преобразование Хафа (ПХ) является ключевым инструментом цифровой обработки изображений, применяемым в широком спектре научных задач – от распознавания документов до компьютерной томографии. Алгоритмические реализации ПХ традиционно оцениваются по двум параметрам: вычислительной сложности и точности, которая определяется как ошибка аппроксимации непрерывных прямых дискретными, формируемыми в ходе выполнения алгоритма. Быстрые алгоритмы ПХ (БПХ) с оптимальной линейно-логарифмической вычислительной сложностью хорошо изучены – примером является классический алгоритм Брейди – Ёна, применимый исключительно к изображениям с линейными размерами, равными степеням двойки. Его обобщения, такие как алгоритм FHT2DT, позволяют обрабатывать прямоугольные изображения произвольного размера, но точность реализуемого ими ПХ низкая, причем она уменьшается при увеличении размера обрабатываемого изображения. Существуют также алгоритмы ПХ, сохраняющие ограниченную сверху ошибку аппроксимации для изображений любого размера. Они обеспечивают более высокую точность, но их вычислительная сложность приближается к кубической, что делает их малопригодными при обработке больших изображений. В настоящей статье предложен алгоритм FHT2SP, сочетающий скорость, близкую к оптимальной, с высокой точностью. Алгоритм характеризуется вычислительной сложностью вида Θ(wh log3 w) при обработке изображений размера w × h. При этом предложенный алгоритм гарантирует ортотропную ошибку аппроксимации непрерывных прямых не более λ + 1/2, независимо от размера изображения и регулируемую управляющим метапараметром λ ∈ (0; 1]. В статье представлена сводная таблица экспериментальных результатов, которая может служить практическим ориентиром для выбора значения метапараметра λ с целью обеспечения баланса между точностью и вычислительной сложностью.

Об авторах

Д. Д Казимиров

Институт проблем передачи информации им. А.А. Харкевича РАН; Московский государственный университет им. М.В. Ломоносова; ООО «Смарт Энджинс Сервис»

Email: d.kazimirov@smartengines.com
Москва, Россия; Москва, Россия; Москва, Россия

Д. П Николаев

ООО «Смарт Энджинс Сервис»; Федеральный исследовательский центр «Информатика и управление» РАН

Email: d.p.nikolaev@smartengines.com
Москва, Россия; Москва, Россия

Список литературы

  1. Hough P.V.C. Machine Analysis of Bubble Chamber Pictures // Proc. 2nd Int. Conf. on High-Energy Accelerators and Instrumentation (HEACC 1959). CERN, Geneva, Switzerland. Sept. 14–19, 1959. P. 554–558.
  2. Rahmdel P.S., Comley R., Shi D., McElduff S. A Review of Hough Transform and Line Segment Detection Approaches // Proc. 10th Int. Conf. on Computer Vision Theory and Applications (VISAPP 2015). Berlin, Germany. Mar. 11–14, 2015. V. 2. P. 411–418. https://doi.org/10.5220/0005268904110418
  3. Hassanein A.S., Mohammad S., Sameer M., Ragab M.E. A Survey on Hough Transform, Theory, Techniques and Applications, https://arxiv.org/abs/1502.02160 [cs.CV], 2015.
  4. Mukhopadhyay P., Chaudhuri B.B. A Survey of Hough Transform // Pattern Recognit. 2015. V. 48. № 3. P. 993–1010. https://doi.org/10.1016/j.patcog.2014.08.027
  5. Алиев М.А., Николаев Д.П., Сараев А.А. Построение быстрых вычислительных схем настройки алгоритма бинаризации Ниблэка // Тр. ИСА РАН. 2014. Т. 64. №3. С. 25–34.
  6. Saha S., Basu S., Nasipuri M., Basu D. A Hough Transform Based Technique for Text Segmentation // J. Comput. 2010. V. 2. № 2. P. 134–141.
  7. Ershova D., Gayer A., Sheshkus A., Arlazarov V.V. An Ultra-lightweight Approach for Machine Readable Zone Detection via Semantic Segmentation and Fast Hough Transform // Document Analysis and Recognition – ICDAR 2024 (Proc. 18th Int. Conf. Athens, Greece. Aug 30 – Sept. 4, 2024. Part IV). Lect. Notes Comput. Sci. V. 14807. Cham: Springer, 2024. P. 359–374. https://doi.org/10.1007/978-3-031-70546-5_21
  8. Безматерных П.В. Нормализация изображения текста с помощью быстрого преобразования Хафа // ИТиВС. 2024. № 4. С. 3–16. https://doi.org/10.14357/20718632240401
  9. Li H., Ma Y., Bao H., Zhang Y. Probabilistic Hough Transform for Rectifying Industrial Nameplate Images: A Novel Strategy for Improved Text Detection and Precision in Difficult Environments // Appl. Sci. 2023. V. 13. № 7. P. 4533 (16 pp.). https://doi.org/10.3390/app13074533
  10. Polevoy D., Gilmanov M., Kazimirov D., Chukalina M., Ingacheva A., Kulagin P., Nikolaev D. Tomographic Reconstruction: General Approach to Fast Back-Projection Algorithms // Mathematics. 2023. V. 11. №23. P. 4759 (37 pp.). https://doi.org/10.3390/math11234759
  11. Polevoy D.V., Kazimirov D.D., Chukalina M.V., Nikolaev D.P. Complexity-Preserving Transposition of Summing Algorithms: A Data Flow Graph Approach // Probl. Inf. Transm. 2024. V. 60. № 4. P. 344–362. https://doi.org/10.1134/S0032946024040057
  12. Polevoy D., Kazimirov D., Gilmanov M., Nikolaev D. No Reproducibility, No Progress: Rethinking CT Benchmarking // J. Imaging. 2025. V. 11. № 10. P. 344 (36 pp.). https://doi.org/10.3390/jimaging11100344
  13. Sheshkus A.V., Chirvonaya A.N., Matveev D.M., Nikolaev D.P., Arlazarov V.L. Vanishing Point Detection with Direct and Transposed Fast Hough Transform Inside the Neural Network // Компьютерная оптика. 2020. Т. 44. № 5. С. 737–745. https://doi.org/10.18287/2412-6179-CO-676
  14. Zhao K., Han Q., Zhang C.-B., Xu J., Cheng M.-M. Deep Hough Transform for Semantic Line Detection // IEEE Trans. Pattern Anal. Mach. Intell. 2021. V. 44. № 9. P. 4793–4806. https://doi.org/10.1109/TPAMI.2021.3077129
  15. Brady M.L., Yong W. Fast Parallel Discrete Approximation Algorithms for the Radon Transform // Proc. 4th Annu. ACM Symp. on Parallel Algorithms and Architectures (SPAA’92). San Diego, California, USA. June 29 – July 1, 1992. P. 91–99. https://doi.org/10.1145/140901.140911
  16. Kazimirov D.D., Rybakova E.O., Gulevskiy V.V., Terekhin A.P., Limonova E.E., Nikolaev D.P. Generalizing the Brady–Yong Algorithm: Efficient Fast Hough Transform for Arbitrary Image Sizes // IEEE Access. 2025. V. 13. P. 20101–20132. https://doi.org/10.1109/ACCESS.2025.3534405
  17. Khanipov T. Computational Complexity Lower Bounds of Certain Discrete Radon Transform Approximations, https://arxiv.org/abs/1801.01054 [cs.CC], 2018.
  18. Карпенко С.М., Ершов Е.И. Исследование свойств диадического паттерна быстрого преобразования Хафа // Пробл. передачи информ. 2021. Т. 57. № 3. С. 102–111. https://doi.org/10.31857/S0555292321030074
  19. Smirnov G., Karpenko S. Analyzing Deviations of Dyadic Lines in Fast Hough Transform, https://arxiv.org/abs/2311.10064 [cs.CV], 2023.
  20. Nikolaev D., Ershov E., Kroshnin A., Limonova E., Mukovozov A., Faradzhev I. On a Fast Hough/Radon Transform as a Compact Summation Scheme over Digital Straight Line Segments // Mathematics. 2023. V. 15. № 15. P. 3336 (22 pp.). https://doi.org/10.3390/math11153336
  21. Khanipov T.M. Ensemble Computation Approach to the Hough Transform, https://arxiv.org/abs/1802.06619 [cs.CC], 2018.
  22. G´omez-C´ardenes ´O., Marichal-Hern´andez J.G., Phillip L¨uke J., Rodr´ıguez-Ramos, J.M. Central and Periodic Multi-Scale Discrete Radon Transforms // Appl. Sci. 2021. V. 11. № 22. P. 10606 (27 pp.). https://doi.org/10.3390/app112210606
  23. Rosenfeld A. Digital Straight Line Segments // IEEE Trans. Comput. 1974. V. 23. № 12. P. 1264–1269. https://doi.org/10.1109/T-C.1974.223845
  24. Brady M.L. A Fast Discrete Approximation Algorithm for the Radon Transform // SIAM J. Comput. 1998. V. 27. № 1. P. 107–119. https://doi.org/10.1137/S0097539793256673
  25. Kazimirov D., Nikolaev D., Rybakova E., Terekhin A. Generalization of Brady–Yong Algorithm for Fast Hough Transform to Arbitrary Image Size // Proc. 5th Symp. on Pattern Recognition and Applications (SPRA 2024). Istanbul, Turkey. Nov. 11–13, 2024. Proc. SPIE. V. 13540. P. 67–72.
  26. Kazimirov D.D., Nikolaev D.P. Fast Hough Transform with Linear-Log-Cubed Computational Complexity for High-Accuracy Processing of Arbitrary-Shaped Images // Probl. Inf. Transm. 2025. V. 61. № 3 (to appear).
  27. Kazimirov D.D., Nikolaev D.P., Rybakova E.O., Terekhin A.P. Efficient In-Place Hough Transform Algorithm for Arbitrary Image Sizes // Probl. Inf. Transm. 2024. V. 60. № 4. P. 363–391. https://doi.org/10.1134/S0032946024040069
  28. Shepp L.A., Logan B.F. The Fourier Reconstruction of a Head Section // IEEE Trans. Nucl. Sci. 1974. V. 21. № 3. P. 21–43. https://doi.org/10.1109/TNS.1974.6499235
  29. IITP Vision Lab., adrt: Approximate Discrete Radon Transform, GitHub repository https://github.com/iitpvisionlab/adrt; Python Package Index (PyPI) https://pypi.org/project/adrtlib. Accessed 2025-05-09.

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML

© Российская академия наук, 2025

Согласие на обработку персональных данных

 

Используя сайт https://journals.rcsi.science, я (далее – «Пользователь» или «Субъект персональных данных») даю согласие на обработку персональных данных на этом сайте (текст Согласия) и на обработку персональных данных с помощью сервиса «Яндекс.Метрика» (текст Согласия).