Logarithmic spirals in optimal control problems with control in a disk

Cover Page
  • Authors: Ronzhina M.I.1, Manita L.A.2,3
  • Affiliations:
    1. Российский государственный университет нефти и газа (национальный исследовательский университет) имени И. М. Губкина
    2. Национальный исследовательский университет «Высшая школа экономики»
    3. Московский институт электроники и математики им. А. Н. Тихонова
  • Issue: Vol 233 (2024)
  • Pages: 75-88
  • Section: Статьи
  • URL: https://journals.rcsi.science/2782-4438/article/view/257509
  • DOI: https://doi.org/10.36535/2782-4438-2024-233-75-88
  • ID: 257509

Cite item

Full Text

Abstract

We study a neighborhood of singular second-order extremals in optimal control problems that are affine in a two-dimensional control in a disk. We study the stabilization problem for a linear system of second-order differential equations for which the origin is a singular second-order extremal. This problem can be considered as a perturbation of an analog of the Fuller problem with two-dimensional control in a disk. We prove that for this class of problems, optimal solutions keep their form of logarithmic spirals that arrive at a singular point in a finite time, while optimal controls make an infinite number of revolutions along the circle. Finally, we present a brief review of problems whose solutions have the form of such logarithmic spirals.

Full Text

1. Введение

Решения в виде логарифмических спиралей могут возникать в задачах оптимального управления, аффинных по ограниченному управлению, содержащих особые экстремали второго порядка. Особые экстремали — это траектории, в точках которых значение управления с помощью непосредственного применения условия принципа максимума Понтрягина определяется неоднозначно.

Для задач, аффинных по скалярному управлению u, т.е. для задач с гамильтонианом вида Hq,p,u=H0q,p+uH1q,p, где q и p — фазовая и сопряженная переменные соответственно, экстремаль является особой, если функция H1 обращается в ноль на непустом промежутке времени. Особая экстремаль второго порядка определяется из условий

adH1(adH0)kH1=0, k=0,1,2, adH1(adH0)3H10                      

(см. [13]), где adFG=F,G — скобка Пуассона функций F и G. Для оптимальной особой экстремали второго порядка также должно быть выполнено условие Келли (см. [17]):

adH1(adH0)3H1<0.

Простейший пример задачи со скалярным управлением, содержащей особую экстремаль второго порядка — задача Фуллера:

0x2tdtinf, x˙=y, y˙=u, u1, x0=x0, y0=y0, u,x,y.

Здесь начало координат является особой экстремалью второго порядка. Для задачи Фуллера построен полный синтез оптимальных траекторий (см., например, [1]). Доказано, что оптимальные траектории попадают в 0 за конечное время, при этом управление на оптимальной траектории имеет счетное число неустранимых разрывов, а именно, счетное число переключений с 1 на -1 (феномен Фуллера, см. рис. 1). Такие траектории называют четтеринг-траекториями.

 

Рис.1. Оптимальные четтеринг-траектории

 

Было доказано (см. [1, 14]), что для систем аффинных по скалярному управлению, содержащих особые экстремали 2-го порядка, наличие оптимальных четтеринг-траекторий является ситуацией общего положения. В работах М. И. Зеликина и В. Ф. Борисова показано, что асимптотика решений в таких задачах в окрестности особых точек определяется решениями задачи Фуллера. Именно, было доказано, что фазовое пространство расслаивается над многообразием особых траекторий на двумерные слои, в которых поле оптимальных траекторий устроено аналогично полю оптимальных траекторий задачи Фуллера.

В [24] было доказано, что для произвольной управляемой системы дифференциальных уравнений, линейной по скалярному управлению, с каноническим лагранжианом, в котором кинетическая энергия зависит только от обобщенных импульсов, особые режимы имеют порядок 2 и в окрестности многообразия особых траекторий второго порядка в расширенном фазовом пространстве имеется расслоение с двумерными слоями, являющимися интегральными многообразиями гамильтоновой системы, заполненными траекториями с накоплением переключений. Такая структура лагранжиана типична для задач управления механическими системами. Наличие четтеринг-решений было доказано для задач управления космическими аппаратами (см. [11, 20, 21, 23]), манипулятором (см. [4, 23]), многозвенным перевернутым маятником (см. [6]), балкой Тимошенко (см. [25]), колебаниями струны (см. [5]) и многими другими механическими системами.

Естественно предположить, что для задач с двумерным управлением структура решений в окрестности особых траекторий второго порядка определяется аналогом задачи Фуллера с двумерным управлением. Для аналога задачи Фуллера с управлением из правильного треугольника построен полный синтез оптимальных траекторий, содержащий особые экстремали второго порядка, четтеринг-траектории (см. [3]) и хаотическое поведение оптимальных траекторий на конечных промежутках времени (см. [2]). Доказано, что такое поведение решений в окрестности особой экстремали второго порядка типично для гамильтоновых систем общего вида, аффинных по управлению из треугольника, близкого к правильному (см. [2]).

В настоящей работе рассматриваются задачи, аффинные по двумерному управлению из круга. Мы предполагаем, что и в этом случае структура оптимального синтеза должна определяться решениями аналога задачи Фуллера, для которой на данный момент найдены некоторые оптимальные решения: четтеринг-решения и логарифмические спирали (см. [9, 23]). Полный синтез оптимальных траекторий для аналога задачи Фуллера с управлением из круга пока не построен. В данной работе показано, что при линейных возмущениях модельной задачи в окрестности особой точки второго порядка имеются оптимальные логарифмические спирали.

Изложение построено следующим образом. В разделе 2 приводится обзор полученных результатов для задач, аффинных по управлению из круга, содержащих особые экстремали второго порядка. В разделе 2.1 описано семейство логарифмических спиралей для аналога задачи Фуллера с управлением из круга. В разделе 2.2 описаны результаты для системы общего вида большой размерности. В разделе 2.3 приведены примеры систем малой размерности, в которых найдено семейство экстремалей в виде логарифмических спиралей. В разделе 3 рассмотрена линейно-квадратичная задача стабилизации для системы второго порядка малой размерности общего вида. Для нее в разделе 3.1 приведены необходимые и достаточные условия оптимальности. В разделе 3.2 доказана теорема о существовании решений задачи в форме логарифмических спиралей.

2. Особые экстремали второго порядка в задачах с двумерным управлением

Для задач оптимального управления, аффинных по двумерному управлению u=u1,u2, гамильтонова система принципа максимума Понтрягина

q˙=Hp, p˙=Hq, (1)

имеет гамильтониан следующего вида:

Hq,p=H0q,p+H1q,pu10+H2q,pu20, (2)

где qtn, pt(n)*. Управление выбирается из условия максимума на ограничивающем множестве управлений U

u0=argmaxuUH1q,pu1+H2q,pu2. (3)

Заметим, что как и в скалярном случае, векторные особые управления характеризуются тем, что не определяются однозначно из условия максимума. Однако в случае векторного управления особые управления могут быть разного типа: только по одной компоненте, по нескольким компонентам или по всем компонентам сразу.

Нас будут интересовать, во-первых, особые управления по всем компонентам, а во-вторых, те, что имеют порядок 2. Приведем формальное определение особых экстремалей второго порядка для системы (1)–(3), с которым мы будем работать далее.

Для системы (1)–(3) точка qs,psособая точка (особая экстремаль) второго порядка, если:

(i) функции

Hi, adHkHi, adHladHkHi,adHjadHladHkHi, i=1,2, j,k,l=0,2¯,

обращаются в нуль в точке qs,ps, а набор их дифференциалов в точке qs,ps имеет постоянный ранг;

(ii) билинейная форма

Bij=adHi(adH0)3Hj|qs,ps, i,j=1,2,

имеет ранг 2, симметрична и отрицательно определена;

(iii) остальные (не зависящие от перечисленных) скобки пятого порядка от функций Hj, j=0,2¯, обращаются в нуль в точке qs,ps.

В данной работе мы рассматриваем задачи, в которых ограничивающее множество для управлений является кругом в 2, поэтому далее мы сформулируем базовую модель с двумерным управлением из круга, которая является аналогом задачи Фуллера.

2.1 Модельная задача с двумерным управлением из круга

Задача (P1):

0xt,xtdtinf, x˙=y, y˙=u, u1, x0=x0, y0=y0, u,x,y2

Здесь , и · — скалярное произведение и евклидова норма в 2.

Далее приведем необходимые результаты для задачи (P1) (см. [9, 23]). Следуя стандартной схеме, применим принцип максимума Понтрягина, выпишем для модельной задачи гамильтонову систему принципа максимума Понтрягина

ψ˙=ϕ, ϕ˙=x, x˙=y, y˙=u, u=ψ/ψ. (4)

Введем новые координаты, сводящие гамильтонову систему (4) модельной задачи к удобному виду:

z1i=Hi, z2i=adH0Hi, z3i=(adH0)2Hi, z4i=(adH0)3Hi, i=1,2,

где

H0=12x,x+ϕ,y, H1=ψ1, H2=ψ2.

В координатах z=z1,z2,z3,z48 система (4) примет вид

z˙1=z2, z˙2=z3, z˙3=z4, z˙4=u, u=z1/z1. (5)

Доказано (см. [9, 23]), что начало координат z=0 есть единственная особая экстремаль, причем ее порядок равен двум (т.е. z=0 удовлетворяет определению особой точки второго порядка, приведенному выше). Было показано, что любая оптимальная траектория за конечное время приходит в начало координат. Однако в задаче (P1) полный синтез оптимальных решений до сих не построен. Только для некоторых классов начальных условий известны два семейства решений: семейство четтеринг-траекторий и семейство логарифмических спиралей. Оптимальные решения являются четтеринг-траекториями, если векторы x0 и y0 коллинеарны. Оптимальные логарифмические спирали возникают, если выполняются некоторые конкретные условия на x0 и y0, а именно, на угол между x0 и y0 и на отношение их длин (эти условия мы приведем ниже). Особенность логарифмических спиралей состоит в том, что они входят в начало координат за конечное время, при этом и в плоскости x, и в плоскости  траектории совершают счетное число оборотов вокруг начала координат (аналог феномена Фуллера, см. рис. 2). Управление на таких траекториях за конечное время совершает счетное число оборотов по окружности (границе круга).

 

Рис.2. Логарифмические спирали в модельной задаче.

 

Заметим, что семейство решений (5) в форме логарифмических спиралей было найдено благодаря тому, что система (5) однородна относительно специальной группы симметрий (группы Фуллера). Приведем эти решения в явном виде:

zm*t=Am1(T*t)5meαlogT*t, u*t=eα logT*t, 0t<T*, m=1,4¯. (6)

Здесь A0=1/126, Al+1=Al4l+α, l=0,1,2, угол между z30 и z40 равен 2arctgα, α2=5, и |z40|2=6z30/2. Траектории zm*t попадают в ноль за конечное время T*, и оптимальное управление u*t совершает бесконечное число оборотов вдоль окружности S1.

Оказывается, что наличие аналогичных логарифмических спиралей типичная ситуация для гамильтоновых систем (без предположения об однородности относительно группы симметрий), аффинных по двумерному управлению из круга, и которые обладают особой точкой второго порядка. А именно, если размерность гамильтоновой системы достаточно велика (не менее 32), то в окрестности особой точки второго порядка имеется семейство экстремалей в виде логарифмических спиралей. В следующем разделе мы приведем результаты, полученные для этого случая.

2.2. Общий случай с двумерным управлением

Рассмотрим гамильтонову систему (1)–(3) размерности 32 или выше. Предположим, что имеется особая точка qs,ps второго порядка. Для того, чтобы исследовать ее окрестность, мы введем удобные локальные координаты (см. [7, 8]). Применим технику, развитую в работах Л. В. Локуциевского (см., например, [2]), для чего выпишем ниспадающую систему скобок Пуассона:

ddtKm=adH0Km+adHlKmul, m4.

Здесь Km=adKmadKm1adK2K1 — скобка порядка m, где K1=H1 или H2, и Kr, r=2,m¯, равно H0, H1 или H2.

Обозначим через K=Km, m4 множество всех скобок не более 4-го порядка, т.е.

K=Hi, adHkHi, adHladHkHi, adHjadHladHkHi, i=1,2, j,k,l=0,2¯.

Набор K состоит из 80 элементов, но в силу свойств антисимметричности и тождества Якоби является зависимым. Число Nm независимых скобок порядка m в K может быть вычислено с помощью формулы Витта (см. [22])

Nm=1md|mμd3m/d,

где μd — функция Мёбиуса. Таким образом, число независимых скобок в K равно 31 (две скобки первого порядка, три — второго порядка, восемь — третьего порядка, и 18 скобок четвертого порядка).

Размерность гамильтоновой системы (1)–(3) больше 31, поэтому дополним K до полного набора локальных координат в окрестности qs,ps гладкими функциями ωq,p2n31, так что ωqs,ps=0. В координатах K,ω точка qs,ps — начало координат. В новых координатах K,ω гамильтонова система для (1)–(3) примет вид

ddtKm=adH0Km+adHlKmulm4,

ddtω=ηK,ω+βK,ωu, (7)

K1umaxuU

где η:2n2n31 и β:2n2n31×2 — некоторые гладкие функции.

Решения системы (7) удобнее описывать в терминах главных и неглавных скобок. Скобки Hl, adH0Hl, (adH0)2Hl, (adH0)3Hl, l=1,2, в ниспадающей системе называются главными, остальные скобки не более 4 порядка — неглавными скобками. Неглавные скобки имеют больший порядок малости по сравнению с главными, поэтому они не влияют на принципиальное поведение системы (см. [2]).

Теорема 1 (см.[7, 8]) В достаточно малой окрестности начала координат существует решение системы (7) следующего вида:

главные скобки: Kmt=kmt (Tt)5meαlogTt eφmt, m=1,4¯,

неглавные скобки: Kmt=gmt(Tt)6m, m=1,4¯,

другие координаты: ωt=gωtTt,

управление: ut=eαlogTt eφ0t.

Здесь gmt и gωt — ограниченные функции, α=±5, T>0,

kmt=km0(1+oTt)σ, φlt=φl0+o(Tt)σ при tT0,

km0,φl0, m=1,4¯, l=0,4¯, σ>0.

Найденные экстремали совершают счетное число оборотов вокруг начала координат и приходят в 0 за конечное время T.

Теорема 1 доказана для задач, у которых размерность гамильтоновых систем 32 и больше. Однако имеются конкретные гамильтоновы системы меньшей размерности, для которых были получены аналогичные результаты. Далее мы приведем примеры некоторых таких задач.

2.3. Примеры задач малой размерности

В данном разделе кратко перечислим задачи небольшой размерности, для которых были найдены экстремали в виде логарифмических спиралей. Заметим, все эти примеры относятся к задачам управления механическими системам: задача быстродействия для космической ракеты, задача стабилизации колебаниями перевернутого сферического маятника и балки Тимошенко.

Задача управления космической ракетой:

tfmin, (8)

v˙x=asinθcosψ+gx, θ˙=ωxsinϕ+ωycosϕsecψ, ω˙x=bu1,v˙y=asinψ+gy, ψ˙=ωxcosϕωysinϕ, ω˙y=bu2,v˙z=acosθcosψ+gz, ϕ=ωxsinϕ+ωycosϕtgψ,˙ u12+u221. (9)

Уравнения движения ракеты состоят из уравнений орбитальной динамики (уравнения на скорости vx, vy, vz), кинематических уравнений Эйлера (уравнения на углы Эйлера θ, ψ, ϕ) и динамических уравнений Эйлера (уравнения на угловые скорости ωx, ωy). Ракета управляется моментом силы тяги u=u1,u2, управление u ограничено единичным кругом.

В задаче (8)–(9) описана особая поверхность второго порядка, и доказано существование четтеринг-экстремалей [26].

Гамильтонова система для задачи (8)–(9) состоит из 16 уравнений: 8 уравнений на фазовые переменные, 8 уравнений на сопряженные переменные. В силу размерности теорема 1 для общей задачи здесь не применима. Однако при использовании той же схемы было найдено семейство экстремалей в виде логарифмических спиралей (см. [19]).

Ниже сформулированы еще две задачи малой размерности: задача управления перевернутым сферическим маятником и задача управления балкой Тимошенко (точнее, ее двумя модами, которые возникают при применении метода Галеркина к исходной задаче управления системой уравнений в частных производных). В обоих примерах управление двумерно и лежит в единичном круге.

Перевернутый сферический маятник:

0xt,xt dtinf,    x˙=y,    y˙=kx+u,    u1,    u,x,y2,    k>0. (10)

Данная задача возникает при изучении линеаризованной модели перевернутого сферического маятника. Маятник может перемещаться по горизонтальной плоскости (см. рис. 4) под действием ограниченной по величине внешней силы u. Предполагается, что сила приложена к основанию маятника. Целевой функционал представляет собой среднеквадратичное отклонение маятника от верхнего неустойчивого положения равновесия, через x1, x2 обозначены углы отклонения маятника от вертикали.

 

Рис.3. Выбор углов Эйлера в задаче управления ракетой.

 

Рис.4. Перевернутый сферический маятник

 

Балка Тимошенко:

0xt,xt dtinf,    x˙=y,    y˙=Kx+u,    u1,    u,x,y2,    K=diagk1,k2. (11)

Задача (11) оптимального управления балкой Тимошенко записана в терминах коэффициентов x=x1,x2 разложения функции ws,t,ξs,t (поперечное смещение центральной линии балки относительно положения покоя и угол поворота поперечных сечений; см. рис. 5) в ряд Фурье по двум собственным функциям эллиптического оператора, соответствующего гиперболической системе уравнений, описывающей колебания балки (k1,k2>0  — соответствующие собственные значения).

 

Рис.5. Балка Тимошенко

 

Задачи (10) и (11) отличаются от модельной наличием слагаемых kx и Kx (k>0 для маятника и диагональная матрица K для балки Тимошенко). Размерность гамильтоновых систем в этих задачах равна 8, поэтому теорема 1 здесь неприменима. С использованием аналогичных рассуждений нами было показано, что семейство логарифмических спиралей является оптимальным в этих задачах (см. [16, 18]).

Замечание. Далеко не все задачи малой размерности обладают семействами экстремалей в виде логарифмических спиралей. Например, в задаче наибыстрейшей переориентации спутника, которая отличается от задачи управления ракетой отсутствием уравнений на скорости, особое управление второго порядка имеется только по одной компоненте управления (см. [20, 23]). Особого управления по всем компонентам нет, так как не выполняется условие на ранг билинейной формы из определения особой точки. Поэтому в окрестности особой (по одной компоненте управления) экстремали второго порядка имеется семейство четтеринг-экстремалей (см. [20, 23]), но не может быть семейства решений в форме логарифмических спиралей.

В следующем разделе рассмотрим задачу управления линейной системой второго порядка с квадратичным целевым функционалом, для которой размерность гамильтоновой системы равна 8 (как и для задач (10) и (11)) и которая является обобщением (в классе линейных управляемых систем) модельной задачи.

3. Задача стабилизации для линейной системы второго порядка малой размерности.

Задача (P2):

0xt,xt dtinf,    x˙=y,    y˙=Kx+u,    u1,    x0=x0,    y0=y0.

Здесь u,x,y2K — произвольная невырожденная 2×2-матрица. Допустимые решения в задаче (P2) — абсолютно непрерывные функции, допустимые управления — ограниченные измеримые функции.

Нетрудно показать, что для начальных условий из достаточно малой окрестности начала координат решение задачи (P2) существует, единственно и стремится к началу координат при t. Доказательство аналогично доказательству, приведенному в [23] для задачи со скалярным управлением.

3.1. Необходимые и достаточные условия оптимальности.

Если xt,yt,uoptt — оптимальное решение, то, согласно принципу максимума Понтрягина, существуют такие непрерывные 2-значные функции ϕt, ψt и неотрицательная константа λ0, что

ϕ˙=Hx=λ0xKTψ,    ψ˙=Hy=ϕ,    x˙=Hϕ=y,    y˙=Hψ=Kx+uopt. (12)

Здесь H — гамильтониан

Hx,y,ϕ,ψ=λ02x,x+ϕ,y+ψ,Kx+ψ,u.

Управление на оптимальной траектории uoptt определяется из условия максимума:

Hxt,ϕt,ψt,uoptt=λ02x,x+ϕ,y+ψ,Kx+maxu1ψ,u. (13)

Для задачи (12)–(13) нетрудно показать, что λ00, поэтому в дальнейшем полагаем λ0=1.

Условие максимума (13) дает явное выражение для управления на оптимальной траектории, если ψt0: uoptt=ψt/ψt. Если же ψ=0, то любое допустимое управление удовлетворяет условию максимума (13).

Приведем достаточные условия оптимальности для задачи (P2), которые будут необходимы для доказательства оптимальности логарифмических спиралей. Отметим, что далее будем предполагать, что начальные условия взяты из окрестности начала координат, для которой решения задачи (P2) существуют (и единственны).

Предложение 1. Пусть x¯t,y¯t,ϕ¯t,ψ¯t,u¯t  — решение системы (12)-(13), удовлетворяющее условиям x¯0=x0 , y¯0=y0 , и

x¯0,    y¯t0,    ϕ¯t0,    ψ¯t0    при t+.

Тогда x¯t,y¯t,u¯t является оптимальным решением задачи (P2).

Доказательство. Предположим, что для начальной точки x0,y0 оптимальным является решение x^t,y^t,u^t. Докажем, что

Δ=120x^,x^x¯,x¯dt0.

Так как в силу неравенства Коши– Буняковского x^,x^x¯,x¯2x¯,x^x¯, то

ΔΔ1=0x¯,x^x¯dt

Используя (12), получим

x¯=ϕ¯˙+KTψ¯

и подставим в Δ1:

Δ1=0ϕ¯˙+KTψ¯,x^x¯dt

Отсюда, интегрируя по частям, получаем

Δ1=ϕ¯,x^x¯|00ϕ¯,y^y¯dt+0KTψ¯, x^-x¯dt

Первое слагаемое равно 0, так как x¯0=x^0=x0 и функции x¯t, x^t, ϕ¯t стремятся к нулю при t. Вычисляя первый интеграл по частям и учитывая, что ψ¯˙=ϕ¯, получаем:

Δ1=ψ¯,y^y¯|00ψ¯,Kx^x¯+u^u¯dt+0ψ¯, K(x^-x)¯dt

Первое слагаемое опять же обращается в 0, так как y¯0=y^0=y0 и функции y¯t, y^t, ψ¯t стремятся к 0 при t. Отсюда

Δ1=0ψ¯,u¯u^dt

В силу того, что управление u¯t удовлетворяет условию максимума (13) вдоль траектории x¯t,y¯t,ϕ¯t,ψ¯t, имеем <ψ¯,u¯u^, так что Δ10 и Δ0. Таким образом, значение функционала задачи (P2) на траектории x¯t,y¯t не хуже, чем на оптимальной траектории x^t,y^t.

3.2. Решения гамильтоновой системы принципа максимума Понтрягина.

Положим

H0=12x,x+ϕ,y+ψ,Kx,    H1=ψ1,    H2=ψ2.

Введем новую систему координат, следуя той же схеме, что и для модельной задачи. Положим

z1i=Hi,    z2i=adH0Hi,    z3i=(adH0)2Hi,    z4i=(adH0)3Hi    i=1,2.

Тогда, в силу системы (12),

z1=ψ,    z2=ϕ,    z3=x+KTψ,    z4=yKTϕ

В координатах z=z1,z2,z3,z4, z8, система (12)–(13) примет вид:

z˙1=z2,    z˙2=z3,    z˙3=z4,    z˙4=uKKTz1+K+KTz3,    u=z1/z1. (14)

Заметим, что zki (в наших определениях) есть главная скобка порядка k (k=1,4¯). Таким образом, для рассматриваемой задачи размерность гамильтоновой системы совпадает с числом главных скобок порядка не более 4.

Приведем утверждение о существовании экстремалей типа спиралей в терминах координат z (в исходных координатах формулы будут иметь более громозкий вид).

Теорема 2. В достаточно малой окрестности начала координат существует семейство решений системы (14) в форме логарифмических спиралей:

2zmt=kmt (Tt)5meαlogTt eφmt,    m=1,4¯,

ut=eα logTt eφ0t,    tT,

zmt=ut=0,    tT,

и все их возможные повороты. Здесь

kmt=km0(1+oTt)σ,    φmt=φm0+o(Tt)σ,    φ0t=φ00+o(Tt)σ    при tT0,

α=±5, km0, φm0, φ00, σ>0

Схема доказательства теоремы 2. В целом схема доказательства теоремы аналогична схеме доказательства соответствующего результата для гамильтоновой системы общего вида большой размерности. Отличие состоит в том, что гамильтонова система (14) записана в терминах главных скобок, отсутствуют неглавные скобки и дополнительные функции ω.

  1. Для гамильтоновой системы задачи (P2) проводим разрешение особенности (раздутие особенности) в окрестности особой точки.
  2. Показываем, что существует инвариантное подпространство, на котором раздутие системы для задачи (P2) совпадает с раздутием системы для задачи (P1).
  3. Доказываем, что периодическое решение для задачи (P1) есть также гиперболический цикл для задачи (P2).

Раздутие особенности. Раздутием особенности в начале координат для системы (14) назовем следующее отображение B:zμ,z~:

z~4=z4μ,    z~3=z3μ2,    z~2=z2μ3,    z~1=z1μ4,    μ24=14z4A324+z3A212+z2A18+z1A06,  (15)

 где μ+, Aj, j=0,3¯, определены в (6) и z~8 лежит на многообразии

S=z~4A324+z~3A212+z~2A18+z~1A06=4.

Система (14) обыкновенных дифференциальных уравнений в координатах μ,z~ имеет вид

μ'=μM, u=z~1/z~1,z~1'=z~24z~1M,z~3'=z~42z~3M,z~2'=z~33z~2M,z~4'=uμ4KKTz~1+μ2K+KTz~3z~4M, (16)

 где ' обозначает дифференцирование по переменной s:

ds=1μdt, (17)

и

Mμ,z~=196(24|A3|24z~4|22z~4,z~1z~1+12|A2|12z~3|10z~3,z~4+8|A1|8|z~2|6z~2,z~3+

+6|A0|6z~1|4z~1,z~2+μ224|A3|24z~4|22z~4,K+KTz~3μ424|A3|24|z~4|22z~4,KKTz~1).

Решения системы (16) лежат на цилиндре Q=S×μ. Положим

M0z~=19624|A3|24z~4|22z~4,z~1z~1+12|A2|12z~3|10z~3,z~4+8|A1|8z~2|6z~2,z~3+6|A0|6z~1|4z~1,z~2,

M1z~=141|A3|24|z~4|22z~4,K+KTz~3μ2KKTz~1;

тогда

Mμ,z~=M0z~+μ2M1z~.

Для задачи (P1) K=0 и, следовательно, M1z~=0. Гамильтонова система задачи (P1) в координатах μ,z~ примет вид

μ'=μM0z~,u=z~1/z~1,z~1'=z~24z~1M0z~,z~3'=z~42z~3M0z~,z~2'=z~33z~2M0z~,z~4'=uz~4M0z~. (18)

 Следовательно, система (16) является малым возмущением системы (18). Заметим, что на невом сечении цилиндра Q0=Qμ=0 системы (16) и (18) совпадают и имеют вид

μ=0,u=z~1/z~1,~z~1'=z~24M0z~1,z~3'=z~42M0z~3,z~2'=z~33M0z~2,z~4'=u~M0z~4. (19)

Периодическое решение.  Используя известные явные решения в виде логарифмических спиралей (6) для задачи (P1), выражения (15) и (17), получим решение системы (19)

μ*s=0,    z~m*s=Am1eαs,  m=1,4¯,    u~*s=eαs,

которое является частным решением систем (16) и (18). Заметим, что это решение является циклом; обозначим его через ξ0s=0,z~*s. С помощью непосредственных вычислений (аналогично доказательству теоремы для общей задачи; см. [8]) получим характеристические показатели цикла ξ0s:

λ1=1,    λ2=0,    λ3=4,    λ4=5,    λ5=24,

λ6,7=125+47±12344,65903±4,0511,

λ8,9=12547±12340,340974±4,0511.

Периодическое решение ξ0s имеет ровно один характеристический показатель с отрицательной действительной частью, 7 характеристических показателей с положительной действительной частью и ровно один нулевой характеристический показатель. Это приводит к следующему результату.

Лемма 1. Периодическое решение ξ0s  является гиперболическим циклом.

Таким образом, цикл ξ0s не является орбитально устойчивым: имеет место сжатие вдоль направления μ и расширение вдоль остальных направлений (см. [10]). Применяя к ξ0s теорему об инвариантных многообразиях (см. [12]), получим, что система (16) имеет решение ξs=μs,z~s9, удовлетворяющее условию

ξs+s0ξ0secs0    при    s+ (20)

для некоторых s0 и c>0 (параметр c может быть выбран сколь угодно близким к 1).

Таким образом, построено двумерное устойчивое многообразие цикла ξ0s для системы (16) (см. рис. 6). В следующем пункте покажем, что это многообразие соткано из логарифмических спиралей.

 

Рис.6. Решения системы (16).

 

Обратный ход процедуры раздутия особенности. Пусть T — момент попадания решения zt системы (14) в начало координат и ξs — решение системы (16), удовлетворяющее условию (20). Из условия (20) могут быть получены [16] следующие оценки:

μs=κes1+oecμs при s,est=κ1Tt1+oecμst при tT0,eαst=eαlogTteαlogκ+o(Tt)cμ при tT0, (21)

где κ и cμ — некоторые положительные постоянные.

Применяя (21) (аналогично [8]) к решению ξs системы (16), получим окончательные асимптотические формулы для решения zt гамильтоновой системы (14) в форме логарифмических спиралей:

zmt=Am1(Tt)5m(1+oTt)σeArgAm1eαlogTteα(γ+oTt)σ,

ut=eArgA0eαlogTteα(γ+oTt)σ,    при tT0,

где σ>0, γ=s0logκ. Таким образом, теорема 2 доказана.

4. Заключение

 В работе исследовалась окрестность особой экстремали второго порядка в задаче стабилизации для линейной системы второго порядка малой размерности. Управление двумерно и лежит в круге. Задача является линейным возмущением аналога задачи Фуллера с двумерным управлением. Показано, что для данного класса задач сохраняются оптимальные решения в виде логарифмических спиралей. Заметим, что на настоящий момент данный класс задач является максимально широким классом, для которого доказана оптимальность решений в форме логарифмических спиралей. Мы надеемся, что полученные результаты могут быть полезны как с теоретической точки зрения, так и для приложений.

×

About the authors

M. I. Ronzhina

Российский государственный университет нефти и газа (национальный исследовательский университет) имени И. М. Губкина

Author for correspondence.
Email: ronzhina.m@gubkin.ru
Russian Federation, Москва

L. A. Manita

Национальный исследовательский университет «Высшая школа экономики»; Московский институт электроники и математики им. А. Н. Тихонова

Email: lmanita@hse.ru
Russian Federation, Москва; Москва

References

  1. Zel-Bor1990 Зеликин М. И., Борисов В. Ф. Режимы учащающихся переключений в задачах оптимального управления Тр. МИАН СССР. 1991 197 85–166
  2. ZLH-SMFN-2015 Зеликин М. И., Локуциевский Л. В., Хильдебранд Р. Типичность фрактально-хаотической структуры интегральных воронок в гамильтоновых системах с разрывной правой частью Совр. мат. Фундам. направл. 2015 56 5–128
  3. ZMH-trMIAN-2001 Зеликин М. И., Мельников Н. Б., Хильдебранд Р. Топологическая структура фазового портрета типичного слоя оптимального синтеза для задач с накоплением переключений Тр. Мат. ин-та им. В. А. Стеклова РАН. 2001 233 125–152
  4. M-PMM-2000 Манита Л. А. Оптимальные режимы с учащающимися переключениями в задачах управления манипуляторами Прикл. мат. мех. 2000 64 1 19–28
  5. M-PMM-2010 Манита Л. А. Оптимальный особый режим и режим с учащающимися переключениями в задаче управления колебаниями струны с закрепленными концами Прикл. мат. мех. 2010 74 5 856–863
  6. R-PMM-2016 Ронжина М. И. Оптимальные режимы с учащающимися переключениями в задаче управления перевернутым двухзвенным маятником Прикл. мат. мех. 2016 80 1 24–33
  7. RML-UMN-2021 Ронжина М. И. , Манита Л. А., Локуциевский Л. В. Решения гамильтоновой системы с двумерным управлением в окрестности особой экстремали второго порядка Усп. мат. наук. 2021 76 5 (461) 201–202
  8. RML-trMIAN-2021 Ронжина М. И. , Манита Л. А., Локуциевский Л. В. Окрестность особого режима второго порядка в задачах с управлением из круга Тр. Мат. ин-та им. В. А. Стеклова РАН. 2021 315 222–236
  9. ChM-JMPh-1994 Chukanov S. V., Milyutin A. A. Qualitative study of singularities for extremals of quadratic optimal control problem Russ. J. Math. Phys. 1994 2 1 31–48
  10. Farkas-1994 Farkas M. Periodic Motions New York Springer-Verlag 1994
  11. Goh-2008 Goh B. S. Optimal singular rocket and aircraft trajectories Proc. 2008 Chinese Control and Decision Conference Yantai, China, July 2-4, 2008 IEEE 2008 1531–1536
  12. Hartman-1964 Hartman P. Ordinary Differential Equations New York Wiley 1964
  13. KKM-1967 Kelley H. J., Kopp R. E., Moyer H. G. Singular extremals Topics in Optimization Leitmann G. New York Academic Press 1967 63–101
  14. Kupka-1990 Kupka I. The ubiquity of Fuller’s phenomenon Nonlinear Controllability and Optimal Control Marcel Dekker New York 1990 313–350
  15. Lawden-1963 Lawden D. F. Optimal Trajectories for Space Navigation London Butterworths 1963
  16. MR-DCDS-2022 Manita L. A., Ronzhina M. I. Optimal spiral-like solutions near a singular extremal in a two-input control problem Discr. Cont. Dyn. Syst. B. 2022 27 6 3325–3343
  17. Rob-IBM-1967 Robbins H. M. A generalized Legendre–Clebsh condition for the singular cases of optimal control IBM J. Res. Develop. 1967 11 4 361–372
  18. RM-JPhys-2021 Ronzhina M. I., Manita L. A. Singularity of optimal control for a Timoshenko beam J. Phys. Conf. Ser. 2021 1740 012068
  19. RM-RCD-2023 Ronzhina M. I., Manita L. A. Spiral-like extremals near a singular surface in a rocket control problem Regul. Chaotic Dyn. 2023 28 2 148–161
  20. SK-JGuid-1993 Seywald, H., Kumar R. R. Singular control in minimum time spacecraft reorientation J. Guid. Control Dyn. 1993 16 4 686–694
  21. ST-JGuid-1999 Shen H., Tsiotras P. Time-optimal control of axi-symmetric rigid spacecraft using two controls J. Guid. Control Dyn. 1999 22 5 682–694
  22. Witt-1956 Witt E. Die Unterringe der freien Lieschen Ringe Math. Z. 1956 64 195–216
  23. Zel-Bor1994 Zelikin M. I., Borisov V. F. Theory of Chattering Control with Applications to Astronautics, Robotics, Economics and Engineering Boston Birkhäuser 1994
  24. Zel-Bor2003 Zelikin M. I., Borisov V. F. Optimal chattering feedback control J. Math. Sci. 2003 114 1227–1344
  25. ZM-CRMec-2006 Zelikin M. I., Manita L. A. Optimal control for a Timoshenko beam C. R. Méc. Acad. Sci. 2006 334 5 292–297
  26. ZTC-SIAM-2016 Zhu J., Trélat E., Cerf M. Minimum time control of the rocket attitude reorientation associated with orbit dynamics SIAM J. Control Optim. 2016 54 1 391–422

Supplementary files

Supplementary Files
Action
1. JATS XML
2. Fig. 1. Optimal chattering trajectories

Download (111KB)
3. Fig. 2. Logarithmic spirals in a model problem.

Download (52KB)
4. Fig.3. Selection of Euler angles in the rocket control problem.

Download (86KB)
5. Fig.4. Inverted spherical pendulum

Download (77KB)
6. Fig. 5. Timoshenko beam

Download (17KB)
7. Fig.6. Solutions of system (16).

Download (47KB)

This website uses cookies

You consent to our cookies if you continue to use our website.

About Cookies