Machine-Synthesized Control of Nonlinear Dynamic Object Based on Optimal Positioning of Equilibrium Points

Мұқаба

Дәйексөз келтіру

Толық мәтін

Аннотация

When solving an optimal control problem with both direct and indirect approaches, the main technique is to transfer the optimal control problem from the class of infinite-dimensional optimization to a finite-dimensional one. However, with all these approaches, the result is an open-loop program control that is sensitive to uncertainties, and for the implementation of which in a real object it is necessary to build a stabilization system. The introduction of the stabilization system changes the dynamics of the object, which means that the optimal control and the optimal trajectory should be calculated for the object already taking into account the stabilization system. As a result, it turns out that the initial optimal control problem is complex, and often the possibility of solving it is extremely dependent on the type of object and functionality, and if the object becomes more complex due to the introduction of a stabilization system, the complexity of the problem increases significantly and the application of classical approaches to solving the optimal control problem turns out to be time-consuming or impossible. In this paper, a synthesized optimal control method is proposed that implements the designated logic for developing optimal control systems, overcoming the computational complexity of the problem posed through the use of modern machine learning methods based on symbolic regression and evolutionary optimization algorithms. According to the approach, the object stabilization system is first built relative to some point, and then the position of this equilibrium point becomes a control parameter. Thus, it is possible to translate the infinite-dimensional optimization problem into a finite-dimensional optimization problem, namely, the optimal location of equilibrium points. The effectiveness of the approach is demonstrated by solving the problem of optimal control of a mobile robot.

Авторлар туралы

E. Shmalko

Federal Research Center "Computer Science and Control" of the Russian Academy of Sciences (FRC CSC RAS)

Email: e.shmalko@gmail.com
Vavilova St. 44/2

Әдебиет тізімі

  1. Pontryagin L.S., Boltyanskii V.G., Gamkreidze R.V., Mishchenko E.F. The Mathematical Theory of Optimal Processes. New York: Division of John Wiley and Sons Inc. 1962. 360 p.
  2. Hartl R.F., Sethi S.P., Vickson R.G. A survey of the maximum principles for optimal control problems with state constraints // SIAM Review. 1995. vol. 37. no. 2. pp. 181–218.
  3. Dmitruk A.V. Maximum principle for the general optimal control problem with phase and regular mixed constraints // Computational Mathematics and Modeling. 1993. vol. 4. no. 4. pp. 364–377.
  4. Karamzin D., Antunes de Oliveira V., Lobo Pereira F.M., Nunes Silva G. Minimax optimal control problem with state constraints // Eur. J. Control. 2016. vol. 32. pp. 24–31.
  5. Schwarzkopf A.B. Optimal controls with equality state constraints // J. Optim. Theory Appl. 1976. vol. 19. pp. 455–468.
  6. Gao X., Zhang X., Wang Ya. A Simple Exact Penalty Function Method for Optimal Control Problem with Continuous Inequality Constraints // Abstract and Applied Analysis. 2014. vol. 2014. p. 12.
  7. Diveev A., Shmalko E. Optimal control design for a group of mobile robots with uncertainties // Proceedings of the 15th IEEE Conference on Industrial Electronics and Applications. 2020. vol. 15. pp. 308-313.
  8. Sullivan T.J. Introduction to Uncertainty Quantification. Texts in Applied Mathematics. Springer, Cham. 2015. vol. 63. 356 p.
  9. Moe S., Rustad A.M., Hanssen K.G. Machine Learning in Control Systems: An Overview of the State of the Art // 38th SGAI International Conference on Artificial Intelligence (Eds.: Bramer M., Petridis M.). Springer, Cham. 2018.
  10. Chertovskih R., Karamzin D., Khalil N.T., Lobo Pereira F. Regular path-constrained time-optimal control problems in three-dimensional flow fields // Eur. J. Control. 2020. vol. 56. pp. 98–106.
  11. Arutyunov A., Karamzin D.A. Survey on Regularity Conditions for State-Constrained Optimal Control Problems and the Non-degenerate Maximum Principle // J. Optim. Theory Appl. 2020. vol. 184. 697–723.
  12. Gill P.E., Murray W., Wright M.H. Practical Optimization. Academic Press: Cambridge. 1981. 402 p.
  13. Евтушенко Ю.Г. Оптимизация и быстрое автоматическое дифференцирование. М.: Научное издание ВЦ РАН. 2013.
  14. Betts J.T. Survey of Numerical Methods for Trajectory Optimization // J. Guid. Control. Dyn. 1998. vol. 21. pp. 193–207.
  15. Газизов Т.Т. Методы глобальной оптимизации: учебное пособие. Томск: В-Спектр. 2017.
  16. Amirkhanova G., Gorchakov A., Duysenbaeva A., Posypkin M. Multistart method with deterministic restart mechanism // Vestnik of Saint Petersburg University. Applied Mathematics. Computer Science. Control Processes. 2020. vol. 16 (2). pp. 100-111.
  17. Евтушенко Ю.Г., Посыпкин М.А. Варианты метода неравномерных покрытий для глобальной оптимизации частично-целочисленных нелинейных задач // Докл. Академии наук. 2011. Т. 437(2). С. 168–172.
  18. Карпенко А.П. Современные алгоритмы поисковой оптимизации. Алгоритмы, вдохновленные природой: учебное пособие. М.: Издательство МГТУ им. Н.Э. Баумана. 2014.
  19. Saunders B.R. Optimal Trajectory Optimization under Uncertainty. Massachusetts Institute of Technology. 2012.
  20. Seywald H., Kumar R. Desensitized Optimal Trajectories // AIAA/AAS Spaceflight Mechanics Meeting. 1996. vol. 96 (107). pp. 103-115. doi: 10.2514/6.2019-0651.
  21. Makkapati V.R., Dor M., Tsiotras P. Trajectory desensitization in optimal control problems // Proceedings of the IEEE Conference on Decision and Control. 2018. pp. 2478–2483.
  22. Zhou B., Shi Y. Prescribed-Time Stabilization of a Class of Nonlinear Systems by Linear Time-Varying Feedback // IEEE Transactions on Automatic Control. 2021. vol. 66. no. 12. pp. 6123-6130.
  23. Chen C.C., Qian C., Sun Z.Y., Liang Y.W. Global output feedback stabilization of a class of nonlinear systems with unknown measurement sensitivity // IEEE Trans. Autom. Control. 2018. vol. 63. no. 7. pp. 2212-2217.
  24. Колмогоров А.Н., Фомин С.В. Элементы теории функций и функционального анализа. M.: Наука.1976.
  25. Walsh G., Tilbury D., Sastry S., Murray R., Laumond J.P. Stabilization of trajectories for systems with nonholonomic constraints // IEEE Transactions on Automatic Control. 1994. vol. 39. no. 1. pp. 216-222. doi: 10.1109/9.273373.
  26. Diveev A.I., Shmalko E.Yu., Serebrenny V.V., Zentay P. Fundamentals of Synthesized Optimal Control // Mathematics. 2021. vol. 9(21). pp. 1-18.
  27. Малкин И.Г. Теория устойчивости движения. Изд. 4. URSS. 2017.
  28. Diveev A., Shmalko E. Machine Learning Control by Symbolic Regression. Springer, Cham. 2021.
  29. Duriez T., Brunton S.L., Noack B.R. Machine Learning Control–Taming Nonlinear Dynamics and Turbulence. Springer: Switzerland. 2017.
  30. Deisenroth M.P., Faisal A.A., Ong C.S. Mathematics for Machine Learning. Cambridge: Cambridge University Press. 2020.
  31. Burkov A. The Hundred-Page Machine Learning Book. 2019. 160 p.
  32. Geron A. Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow: Concepts, Tools, and Techniques to Build Intelligent Systems. Sebastopol: O’Reilly Media Inc. 2019. 856 p.
  33. Diveev A.I., Shmalko E.Y. Machine-Made Synthesis of Stabilization System by Modified Cartesian Genetic Programming // IEEE Transactions on Cybernetics. 2022. vol. 52. no. 7. pp. 6627-6637.
  34. Savchenko A.V. Probabilistic Neural Network With Complex Exponential Activation Functions in Image Recognition // IEEE Transactions on Neural Networks and Learning Systems. 2020. vol. 31. no. 2. pp. 651-660.
  35. Zhang W., Wang J., Lan F. Dynamic hand gesture recognition based on short-term sampling neural networks // IEEE/CAA Journal of Automatica Sinica. 2021. vol. 8. no. 1. pp. 110-120.
  36. Xiao J., Jia Y., Jiang X., Wang S. Circular Complex-Valued GMDH-Type Neural Network for Real-Valued Classification Problems // IEEE Transactions on Neural Networks and Learning Systems. 2020. vol. 31. no. 12. pp. 5285-5299.
  37. Pelchat N., Gelowitz C.M. Neural Network Music Genre Classification // Canadian Journal of Electrical and Computer Engineering. 2020. vol. 43. no. 3. pp. 170-173.
  38. Shmalko E., Diveev A. Control Synthesis as Machine Learning Control by Symbolic Regression Methods // Applied Sciences. 2021. vol. 11. p. 5468. doi: 10.3390/app11125468.
  39. Дивеев А.И. Гибридный эволюционный алгоритм для решения задачи оптимального управления // Вопросы теории безопасности и устойчивости систем. 2021. T. 23. С. 3-12.
  40. Дивеев А.И., Константинов С.В. Исследование практической сходимости эволюционных алгоритмов оптимального программного управления колесным роботом // Известия РАН. Теория и системы управления. 2018. Т. 57(4). С. 80-106.
  41. Дивеев А.И. Метод сетевого оператора. М.: Изд-во ВЦ РАН. 2010.
  42. Программный пакет расчета значений управляющих сигналов по матрице сетевого оператора https://github.com/urock/network_operator

Қосымша файлдар

Қосымша файлдар
Әрекет
1. JATS XML

Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».