Synthesis of Time-Optimal Control for One Fourth-Order Linear System

封面

如何引用文章

全文:

详细

A linear fourth-order control system is studied, describing in the first approximation the dynamics of an inverted pendulum with an active dynamic damper. Based on Pontryagin’s maximum principle and the method proposed by A.A. Feldbaum for constructing sets on which control switching occurs, the problem of synthesizing optimal control that brings the system to a state of rest in minimal time is solved. The properties of the system under consideration make it possible to reduce the solution of the optimal response problem to the solution of a similar problem for a system of lower dimension.

全文:

  1. Введение. Исследуется задача управления системой четвертого порядка, которая описывает в линейном приближении динамику следующей двухмассовой механической системы (рис. 1, а): шарнирно закрепленный на неподвижном основании вертикально стоящий невесомый жесткий стержень с грузом m1 на верхнем конце (обратный маятник) взаимодействует с массой m2, которая может поступательно перемещаться вдоль горизонтальной направляющей (активный динамический гаситель). Управляющей переменной служит ограниченная по модулю сила взаимодействия между грузом m1 и массой m2 гасителя. Требуется построить закон управления в форме обратной связи, который из произвольного начального состояния за минимальное время приведет маятник в вертикальное состояние, а массу гасителя  остановит в заданном положении.

 

Рис. 1

 

Особенность изучаемой системы состоит в том, что ее первые два уравнения не содержат третьей и четвертой переменной, а четвертая переменная не входит в первые три уравнения. Это обстоятельство позволяет сначала решить задачу оптимального управления для редуцированной системы, состоящей только из первых двух уравнений. Затем, используя полученное решение, найти закон оптимального управления для системы, состоящей из первых трех уравнений, и применить результаты решения этих вспомогательных задач меньшей размерности для нахождения оптимального по быстродействию управления полной системой. Излагаемый ниже подход основан на принципе максимума Понтрягина [1, 2] и методе построения поверхностей переключения, предложенном А.А. Фельдбаумом [3].

Задачи управления движением неустойчивых объектов, таких как перевернутый маятник, рассматривались ранее [4–6]. Изучена [7] задача оптимального быстродействия для двухмассовой системы, содержащей обычный линейный маятник. Предложены [8, 9] методы управления, обеспечивающие остановку колебаний маятника с помощью активного динамического гасителя без минимизации времени движения. Исследована [10] аналогичная рассматриваемой ниже задача для системы третьего порядка и построен закон оптимального управления, обеспечивающий наискорейшую остановку системы в состоянии равновесия в предположении, что конечное положение массы гасителя несущественно.

  1. Постановка задачи и уравнения движения. Динамика системы, изображенной на рис. 1,а, в линейном приближении описывается теми же уравнениями, что и динамика механической системы, состоящая из двух точечных масс и m1, перемещающихся вдоль горизонтальной прямой (рис. 1, б). Первая масса соединена с неподвижным основанием пружиной отрицательной жесткости m2, а вторая соединена с первой посредством привода, который генерирует силу k < 0. Уравнения движения такой системы имеют вид

m1ξ¨1+kξ1=u0, m2ξ¨2=u0, (2.1)

где ξi – координат i-й массы, i = 1, 2, k < 0. Управляющая сила предполагается ограниченной по модулю:

|u0|U; U>0 (2.2)

Необходимо найти управление в форме обратной связи, приводящее систему в начало координат за минимальное время.

Используя безразмерные переменные

t'=tkm1, η1=kUξ1, η2=dη1dt', z=km2Um1ξ2, v=dzdt', u=u0U

и замену x = η2 − η1, y = η1 + η2, перепишем уравнения (2.1) в форме

x˙=xu, y˙=yu, v˙=u, z˙=v (2.3)

Здесь и ниже точками обозначены производные по новому времени t'. Ограничение (2.2) примет вид

u1 (2.4)

С помощью критерия Калмана [11], можно показать, что система (2.3) вполне управляема. Исходная задача теперь формулируется следующим образом.

Задача 1. Построить закон управления в форме обратной связи, т.е. как функцию переменных (x, y, v, z), который подчиняется ограничению (2.4) и приводит систему (2.3) в начало координат за минимальное время.

Из принципа максимума Понтрягина следует, что для любого начального состояния оптимальное управление представляет собой кусочно-постоянную функцию времени, принимающую значения 1 и –1. Оптимальная траектория при этом состоит из чередующихся отрезков траекторий, отвечающих этим значениям управляющей функции. В дальнейшем будем называть траектории движения системы с управлением u = 1 положительными, а с управлением u = –1 – отрицательными.

Замечание 1. Преобразование центральной симметрии относительно начала координат, что соответствует смене знака у фазовых переменных (x, y, v, z) и управления u, переводит положительные траектории в отрицательные и наоборот.

Известно [1], что оптимальное по быстродействию управление для линейной системы порядка n, собственные числа которой вещественны, при ограничении вида (2.4) имеет не более n – 1 переключений. Собственные числа системы (2.3) равны –1, 1, 0, 0, поэтому оптимальное управление имеет не более трех переключений. Ниже дается описание множеств, на которых происходит переключение управления, а также указываются области фазового пространства, в которых управление принимает значение +1 или –1.

  1. Подсистема второго порядка. Рассмотрим сначала задачу синтеза оптимального быстродействия для подсистемы второго порядка, содержащую только два первых уравнения (2.3):

x˙=xu, y˙=yu (3.1)

Задача 2. Построить управление u (x, y), которое удовлетворяет ограничению (2.4) и приводит систему (3.1) в начало координат за минимальное время.

Обозначим через G полосу, заключенную между прямыми y = –1 и y = 1:

G={(x,y)R2:|y|<1}

При ограничении (2.4) вне полосы имеет место неравенство

ddty22=y˙y=y2uyy2y0

Следовательно, величина y2 вне полосы G при любых допустимых значениях управляющей функции не убывает, а область начальных состояний, из которых возможно приведение системы в начало координат, совпадает с полосой G.

Поскольку собственные числа системы (3.1) вещественны, то искомое оптимальное управление имеет одно переключение, принимает значения 1 и –1, а приведение системы в начало координат состоит из двух этапов: на первом этапе u = –1, а на втором u = 1 (первый сценарий), либо наоборот, сначала u = 1, затем u = –1 (второй сценарий). В соответствии с замечанием 1 преобразование центральной симметрии относительно начала координат переводит один сценарий движения в другой.

Решение системы (3.1), начинающееся в точке (x¯,y¯), имеет вид

x(t)=(x¯1)et+1, y(t)=(y¯+1)et1, если u=1x(t)=(x¯+1)et1, y(t)=(y¯1)et+1, если u=1 (3.2)

Отрицательные траектории, вдоль которых система (3.1) приходит в начало координат, лежат на кривой Γ2, заданной уравнением

x=y1+y; y<0,

а положительные траектории, идущие в начало координат, лежат на кривой Γ+2, заданной уравнением

x=y1y; y>0

Вместе эти кривые составляют кривую Γ2=Γ2Γ+2, на которой происходит переключение управления.

Замечание 2. Здесь и далее верхний индекс в обозначениях для кривой Γ и поверхности S, которая появится ниже, указывает на размерность фазового пространства задачи.

По первому сценарию оптимального движения сначала система (3.1) вдоль отрицательной траектории, т.е. при u = –1, приходит на кривую Γ+2, а затем вдоль этой кривой под действием управления u = 1 – в начало координат. Множество начальных состояний (x0, y0) для такого движения составляет область G, заключенную между прямой y = –1 и кривой Γ2. По второму сценарию сначала система вдоль положительной траектории, т.е. при u = 1, приходит на кривую Γ2, а затем вдоль этой кривой под действием управления u = –1 – в начало координат. Множество начальных состояний (x0, y0) для второго сценария составляет область G+, заключенную между прямой y = 1 и кривой Γ2.

Зададим на множестве GΓ2 функции C и D:

C(x, y)=(x1)(y+1)+1, D(x, y)=C(x, y)(C(x, y)+8); (x, y)GΓ2, (3.3)

а на множестве G+Γ+2 – функции C+ и D+:

C+(x, y)=(x+1)(y1)+1, D+(x, y)=C+(x, y)(C+(x, y)+8); (x, y)G+Γ+2 (3.4)

Эти функции обладают следующими свойствами:

C=0, если (x, y)Γ20<C<1, если (x, y)G, x<1C=1, если (x, y)G, x=1C>1, если (x, y)G, x>1 (3.5)

Из (3.2) следует, что при первом сценарии на первом этапе оптимальная траектория, идущая из точки (x0, y0), лежит на гиперболе (x1)(y+1)+1=C(x0, y0). Обозначим через x1 = x (t1), y1 = y (t1) координаты точки пересечения этой траектории с кривой переключений Γ+2, где t1 – время движения на первом этапе. Тогда

x1=y11y1, (x11)(y1+1)+1=C(x0, y0),

откуда вытекает, что

y1=C(x0,y0)+D(x0,y0)4>0, (3.6)

а время движения на первом этапе как функция начального состояния (x0, y0) задается выражением

t1(x0, y0)=lny1+1y0+1=ln4C(x0, y0)+D(x0, y0)4(1+y0) (3.7)

На втором этапе система движется из точки (x1, y1) в начало координат с управлением u = 1 вдоль положительной ветви кривой переключений Γ+2. Время движения здесь как функция переменных x0, y0 вычисляется с использованием соотношений (3.2) и (3.6) так:

t2(x0, y0)=ln(1y1)=ln4+C(x0, y0)+D(x0, y0)4 (3.8)

Полное время движения T = t1 + t2 до начала координат как функция начального состояния (x0, y0) при первом сценарии управления равно:

T(x0,y0)=ln(4C+D)(4+C+D)16(1+y0)==ln(4+D)2C216(1+y0)=ln2+C+D2(1+y0) (3.9)

Второй сценарий применяется, если начальное состояние (x0, y0) лежит в области G+. В этом случае время движения t1 до отрицательной ветви кривой переключений Γ2, время движения t2 вдоль этой кривой и полное время движения T до начала координат находятся аналогично и задаются выражениями

t1=ln4C++D+4(1y0), t2=ln4+C++D+4, T=ln2+C++D+2(1y0) (3.10)

В выражениях (3.9) и (3.10) аргументы x0, y0 у функций C, C+, D и D+ опущены.

  1. Подсистема третьего порядка. Рассмотрим теперь задачу синтеза оптимального быстродействия для системы, состоящей из первых трех уравнений (2.3):

x˙=xu, y˙=yu, v˙=u (4.1)

Задача 3. Построить управление u (x, y, v), которое удовлетворяет ограничению (2.4) и приводит систему (4.1) в начало координат за минимальное время.

Собственные числа данной системы вещественны, поэтому оптимальное управление имеет не более двух переключений и состоит из трех этапов: на первом этапе u = 1, на втором u = –1, на третьем u = 1 (первый сценарий), или на первом этапе u = –1, на втором u = 1 и на заключительном этапе u = –1 (второй сценарий).

Изучим первый сценарий движения. Пусть (x0, y0, v0) – начальное состояние системы, (x1, y1, v1) – точка, в которой заканчивается первый этап и управление меняется с u = 1 на u = –1, (x2, y2, v2) – точка, в которой заканчивается второй этап и управление вновь переключается на u = 1, ti ≥ 0 – время движения на i-м этапе, i = 1, 2, 3.

Решение системы (4.1) с начальным состоянием (x¯, y¯, v¯) имеет вид

x(t)=(x¯1)et+1, y(t)=(y¯+1)et1, v(t)=v¯t, если u=1x(t)=(x¯+1)et1, y(t)=(y¯1)et+1, v(t)=v¯+t, если u=1 (4.2)

Первые два уравнения систем (3.1) и (4.1) совпадают, следовательно, совпадают и координаты x (t), y (t) решений (3.2) и (4.2) этих систем. Отсюда вытекает, что траектории системы (3.1) представляют собой проекции на плоскость v = 0 траекторий системы (4.1).

На третьем, заключительном, этапе система (4.1) приходит в начало координат под действием управления u = 1, т.е. вдоль положительной траектории. Все положительные траектории, проходящие через начало координат, лежат на кривой Γ+3, которая задается уравнениями

x=y1y, v=ln(1y); y0 (4.3)

Отметим, что кривая Γ+2, которая фигурировала ранее в задаче для подсистемы второго порядка, представляет собой проекцию кривой Γ+3 на плоскость v = 0.

На третьем этапе система (4.1) переходит из точки (x2, y2, v2) в начало координат вдоль положительной траектории за время t3, поэтому

x(t3)=(x2+1)et31=0, y(t3)=(y21)et3+1=0, v(t3)=v2+t3=0,

откуда получаем следующую параметризацию кривой Γ+3:

x2(t3)=et31, y2(t3)=1et3, v2(t3)=t3 (4.4)

На втором этапе система переходит из точки (x1, y1, v1) в точку (x2, y2, v2) за время t2 вдоль отрицательной траектории, поэтому

x2=(x11)et2+1, y2=(y1+1)et21, v2=t2+v1 (4.5)

Из (4.4) и (4.5) вытекают соотношения

x1(t2,t3)=et2+t32et2+1y1(t2,t3)=e(t2+t3)+2et21v1(t2,t3)=t2t3; t2>0, t30 (4.6)

которые параметризуют с помощью t2 и t3 множество точек (x1, y1, z1), из которых можно попасть на кривую Γ+3 вдоль отрицательных траекторий. Это множество представляет собой поверхность, образованную семейством полутраекторий системы (4.1) с управлением u = –1, оканчивающихся на кривой Γ+3.

Обозначим данную поверхность через S3 и найдем ее уравнение в декартовых координатах. Траектория системы (3.1) на первом этапе представляет собой проекцию на плоскость v = 0 траектории системы (4.1) на втором этапе. Поэтому время движения t2 системы (4.1) на втором этапе равно времени движения системы (3.1) на первом этапе и задается равенством (3.7), в которое вместо x0, y0 следует подставить x1, y1 – координаты начального состояния для второго этапа движения системы (4.1):

t2(x1, y1)=ln4C(x1, y1)+D(x1, y1)4(1+y1) (4.7)

Траектория системы (3.1) на втором этапе представляет собой проекцию на плоскость v = 0 траектории системы (4.1) на третьем этапе, поэтому время движения t3 системы (4.1) на третьем этапе равно времени движения системы (3.1) на втором и задается равенством (3.8) с заменой x0, y0 на x1, y1:

t3(x1, y1)=ln4+C(x1, y1)+D(x1, y1)4 (4.8)

Подставляя (4.7) и (4.8) в последнее соотношение (4.6), получаем уравнение поверхности S3 в декартовых координатах

v1(x1, y1)=t2(x1, y1)t3(x1, y1)=ln4C+D(4+C+D)(y1+1)==ln16(CD)2((4+C)2D)(y1+1)=ln16(CD)216(y1+1)

(здесь аргументы x1, y1 у функций C и D опущены). Данное равенство означает, что поверхность S3 представляет собой график функции

f(x, y)=ln16C(x, y)D(x, y)216(y+1), (4.9)

заданной на множестве GΓ2.

На первом этапе система переходит из начального состояния (x0, y0, v0) за время t1 вдоль положительной траектории в точку (x1, y1, v1), лежащую на поверхности S3. Подставив в равенство v1 = f (x1, y1) вытекающие из (4.2) соотношения

x1=(x0+1)et11, y1=(y01)et1+1, v1=v0+t1,

приходим к уравнению относительно t1:

v0+t1=f(x0+1)et11,(y01)et1+1 (4.10)

Корень данного уравнения задает время движения t1 на первом этапе как функцию начального состояния (x0, y0, v0).

Второй сценарий оптимального движения предполагает, что на третьем этапе система (4.1) приходит в начало координат под действием управления u = –1 вдоль кривой Γ-3, которая симметрична кривой Γ+3 относительно нуля и задается уравнением

x=y1+y, v=ln(1+y); y0.

Рассуждая, как и выше, и учитывая симметрию, приходим к выводу, что множество точек (x1, y1, v1), из которых можно попасть на кривую Γ-3 вдоль положительных траекторий, описывается как график функции

f+(x1, y1)=f(x1, y1); (x1, y1)G+Γ+2

Обозначим это множество через S+3. Оно представляет собой поверхность, образованную семейством полутраекторий системы (4.1) с управлением u = 1, оканчивающихся на кривой Γ-3.

Поверхности S-3 и S+3 «склеиваются» на кривой Γ3=Γ3Γ+3 и образуют поверхность S3=S3S+3, которая задается уравнением

v=f(x, y), (4.11)

т.е. как график непрерывной функции f, определенной на полосе G соотношениями:

f(x,y)=f(x,y), если (x,y)GΓ2f+(x,y), если (x,y)G+Γ+2

Этот график разбивает множество допустимых начальных состояний

Q=G×R1={(x, y, v):<x, v<, |y|<1}

на две области, одна из которых лежит выше S3, обозначим ее через Q+, а другая – ниже, обозначим ее через Q. В [10] установлено, что положительные траектории пересекают поверхность S3 сверху вниз, т.е. из области Q+ в область Q, а отрицательные – снизу вверх.

Поскольку система (4.1) при фиксированном значении управления удовлетворяет условию единственности решений, то ее траектории «одного знака» не пересекаются друг с другом. Поэтому положительные траектории могут пересечь поверхность S3 только на участке S-3, образованном семейством отрицательных траекторий, а отрицательные – на участке S+3, образованном семейством положительных траекторий.

Закон управления, доставляющий решение задачи 3, состоит в следующем: если точка (x, y, v) лежит выше поверхности S3, т.е. v > f (x, y), то u (x, y, v) = 1; если точка (x, y, v) лежит ниже поверхности S3, т.е. v < f (x, y), то u (x, y, v) = –1. Если v = f (x, y), то u (x, y, v) = –1, если точка (x, y, v) лежит на участке поверхности S-3, включая кривую Γ-3, и u (x, y, v) = 1, если точка (x, y, v) лежит на участке поверхности S+3, включая кривую Γ+3.

Таким образом, сначала оптимальное движение происходит до пересечения траектории с поверхностью S3. В момент пересечения управление меняет знак, а движение продолжается по поверхности S3 до достижения траекторией кривой Γ3. Здесь управление вновь меняет знак, и система вдоль кривой Γ3 приходит в начало координат. Если же начальное состояние лежит на поверхности S3, то первый этап отсутствует.

  1. Система четвертого порядка. Вернемся к задаче 1 для исходной системы. Оптимальное движение системы (2.3) возможно по двум сценариям, каждый состоит из четырех этапов. Изучим подробнее сценарий, при котором на первом и третьем этапах u = –1, а на втором и четвертом u = 1. В этой задаче, как и в рассмотренных выше, преобразование центральной симметрии относительно начала координат переводит один сценарий управления в другой.

Решение системы (2.3) с начальным состоянием (x¯, y¯, v¯, z¯) имеет вид

x(t)=(x¯1)et+1, y(t)=(y¯+1)et1v(t)=v¯t, z(t)=z¯+v¯tt2/2, если u=1x(t)=(x¯+1)et1, y(t)=(y¯1)et+1v(t)=v¯+t, z(t)=z¯+v¯t+t2/2, если u=1 (5.1)

Первые три уравнения систем (2.3) и (4.1) совпадают, поэтому совпадают и координаты x (t), y (t), v (t) решений (4.2) и (5.1) этих систем.

Замечание 3. Поскольку оптимальное управление для системы (2.3) на i-м этапе совпадает с управлением для системы (4.1) на (i – 1)-м этапе, i = 2, 3, 4, то оптимальная траектория системы (4.1) представляет собой проекцию траектории системы (2.3) на подпространство z = 0.

Пусть ti – время движения на i-м этапе, i = 2, 3, 4. Из замечания 3 вытекает, что время движения ti системы (2.3) на i-м этапе равно времени движения системы (4.1) на (i – 1)-м этапе. В частности, из (4.7), (4.8) получаем

t3(x, y)=ln4C(x, y)+D(x, y)4(y+1), t4(x, y)=ln4+C(x, y)+D(x, y)4, (5.2)

где x, y – первые две координаты начального состояния системы (4.1) для третьего этапа движения.

Изучение оптимального движения начнем с последнего, четвертого, этапа. На этом этапе система приходит в начало координат по положительной траектории вдоль кривой Γ+4, которая описывается уравнениями

x=y1y, v=ln(1y), z=ln2(1y); 0y<1 (5.3)

Первые два уравнения (5.3) совпадают с уравнениями (4.3), поэтому кривая Γ+3 представляет собой проекцию кривой Γ+4 на подпространство z = 0. Кривая Γ+4 может быть параметризована временем движения t4 на последнем этапе так:

x=et41, y=1et4, v=t4, z=t422 (5.4)

Рассмотрим множество состояний системы, из которых можно попасть на кривую Γ+4, двигаясь по отрицательным траекториям. Это множество образовано семейством полутраекторий системы (2.3) с управлением u = –1, оканчивающихся на кривой Γ+4, и представляет собой двумерную поверхность, обозначим ее через S-4. Поскольку на третьем этапе система движется вдоль этой поверхности в течение времени t3, то в силу (5.1) и (5.4) поверхность S-4 может быть задана параметрически следующим образом:

x(t3, t4)=et3+t42et3+1y(t3, t4)=e(t3+t4)+2et31v(t3, t4)=t3t4z(t3, t4)=t422+t4t3t322; t4>0, t30 (5.5)

Здесь первые три соотношения совпадают с соотношениями (4.6), в которых, с учетом замечания 3, следует заменить t2 и t3 на t3 и t4 соответственно. Это означает, что поверхность S-3 представляет собой проекцию поверхности S-4 на подпространство z = 0. Для описания поверхности S-4 в декартовых координатах необходимо к уравнению (4.11) добавить выражение для координаты z, подставив в последнее равенство (5.5) соотношения (5.2).

Обозначим через S+4 и Γ-4 множества, которые симметричны относительно начала координат поверхности S-4 и кривой Γ+4 соответственно.

Рассмотрим множество состояний системы (2.3), из которых можно попасть на поверхность S-4 по положительным траекториям. Это множество образовано семейством полутраекторий системы (2.3) с управлением u = 1, оканчивающихся на поверхности S-4, и представляет собой трехмерное многообразие M+R4. Поскольку на втором этапе система (2.3) с управлением u = 1 движется вдоль этого многообразия в течение времени t2, то, используя соотношения (5.1) и (5.5), многообразие M+ может быть описано параметрически следующим образом:

x(t2, t3, t4)=et2+t3+t42et2+t3+2et21y(t2, t3, t4)=e(t2+t3+t4)+2e(t2+t3)2et2+1v(t2, t3, t4)=t2+t3t4z(t2, t3, t4)=(t4+t2)22t322+(t4t2)t3; t4>0, t2, t30 (5.6)

Пусть (x, y, v, z) ∈ M+ – точка, в которой оптимальная траектория попадает на многообразие M+ и заканчивается первый этап. На втором, третье и четвертом этапах проекция оптимальной траектории системы (2.3) совпадает с оптимальной траекторией системы (4.1) с начальным состоянием (x, y, v). Отсюда и из (4.10) вытекает, что время движения t2 на втором этапе как функция переменных x, y, v задается уравнением

v+t2=f(x+1)et21, (y1)et2+1 (5.7)

Времена движения на третьем и четвертом этапах t3 и t4 вычисляются с использованием соотношений (4.7) и (4.8) следующим образом:

t3=ln4P(x, y)+Q(x, y)4((y1)et2+2), t4=ln4+P(x, y)+Q(x, y)4 (5.8)

Здесь

P(x, y)=C(x+1)et21, (y1)et2+1, Q(x, y)=P(x, y)P(x, y)+8

Многообразие M+ в декартовых координатах описывается уравнением z = F+ (x, y, v) и представляет собой график функции F+ (x, y, v), заданной на множестве Q+S+4 формулой

F+(x, y, v)=(t4+t2)22t322+(t4t2)t3,

в которую нужно подставить значения t2, t3 и t4, вычисленные с помощью соотношений (5.7) и (5.8).

При втором сценарии первое переключение управления происходит на многообразии M, которое симметрично относительно начала координат многообразию M+ и представляет собой график функции

F(x, y, v)=F+(x, y, v); (x, y, v)QS4

Затем управление переключается последовательно на множествах S+4 и Γ-4. Многообразия M и M+ «склеиваются» на поверхности S4=S4S+4 и образуют многообразие M=MM+, которое представляет собой график непрерывной функции F, заданной на множестве Q формулой:

F(x, y, v)=F(x, y, v), если (x,y,v)QS4F+(x, y, v), если (x,y,v)Q+S+4

Многообразие M разбивает область допустимых начальных состояний

H={(x, y, v, z):<x, v, z<, |y|<1}

на две подобласти, одна из которых, обозначим ее через H+, лежит выше M и там выполнено неравенство z > F (x, y, v), а другая, которую обозначим через H, лежит ниже M, там z < F (x, y, v).

Утверждение. Отрицательные траектории системы (2.3) пересекают многообразие M сверху вниз, т.е. из области H+ в область H, а положительные – снизу вверх, т.е. из области H в область H+.

Доказательство. Поскольку участок M многообразия M образован семейством отрицательных траекторий, а траектории «одного знака» не пересекаются, то отрицательные траектории пересекают многообразие M только на участке M+. Соответственно, положительные траектории пересекают многообразие M на участке M.

Выясним, в каком направлении отрицательные траектории пересекают многообразие M+. С этой целью вычислим знак скалярного произведения (N, V) векторного поля системы V и вектора нормали N к M+, т.е. к графику функции F+ (x, y, v). Используя параметрическое представление (5.6) многообразия M+, координаты ненормированного вектора нормали N к этому многообразию в точке (x, y, v, z) ∈ M+, отвечающей параметрам t2, t3, t4, запишем в виде

Nx(t2, t3, t4)=(t3+t4)et2t3t4et2t3et2t3t4Ny(t2, t3, t4)=t3et2+t3+t4(t3+t4)et2+t3+t4et2Nv(t2, t3, t4)=t2sht4(t2+t3+t4)sht3+(t2+t3)sh(t3+t4)Nz(t2, t3, t4)=sh(t3+t4)sht3sht4; t3, t4>0 (5.9)

Векторное поле V в этой же точке при u = –1 в соответствии с (5.6) задается выражениями

Vx(t2, t3, t4)=et2+t3+t4+2et2+t32et2+2Vy(t2, t3, t4)=e(t2+t3+t4)+2e(t2+t3)2et2+2Vv(t2, t3, t4)=1Vz(t2, t3, t4)=t2+t3t4 (5.10)

Введем обозначение Φ = (N, V) / 4. Покажем, что Φ (t2, t3, t4) < 0 при t2 ≥ 0, t3, t4 > 0. Из (5.9) и (5.10) вытекает

Φ(t2, t3, t4)=(t3+t4)sh(t2+t3)+(t2+t3)sh(t3+t4)t4sht2t2sht4(t2+t3+t4)sht3t3sh(t2+t3+t4) (5.11)

Приведенные ниже рассуждения основаны на том, что если для гладкой функции Θ (t2, t3, t4) при t2, t3, t4 ≥ 0 и фиксированном i, i = 2, 3, 4, имеют место неравенство Θ/ti<0 и при ti = 0 неравенство Θ ≤ 0, то Θ (t2, t3, t4) ≤ 0. Кроме того, ниже используются следующие свойства гиперболических функций:

sh(t+s)>sht+shs>0, ch(t+s)>cht>0, tcht>sht>0; t,s>0

Производные функции Φ удовлетворяют соотношениям

4Φt2t32t4(t2, t3, t4)=ch(t2+t3)+ch(t3+t4)2ch(t2+t3+t4)t3sh(t2+t3+t4)<03Φt2t3t4(t2, 0, t4)=sht2+sht4sh(t2+t4)<0,

из которых вытекает неравенство

3Φt2t3t4(t2, t3, t4)<0 (5.12)

Поскольку

2Φt2t3(t2, t3, t4)=cht3+ch(t2+t3)+(t3+t4)sh(t2+t3)+ch(t3+t4)ch(t2+t3+t4)t3sh(t2+t3+t4); 2Φt2t3(t2, t3, 0)=0,

то с учетом (5.12) получаем

2Φt2t3(t2, t3, t4)<0 (5.13)

Так как

Φt2(t2, t3, t4)=t4cht2sht4sht3+(t3+t4)ch(t2+t3)++sh(t3+t4)t3ch(t2+t3+t4); Φt2(t2, 0, t4)=0,

то с учетом (5.13) получаем

Φt2(t2, t3, t4)<0.

Отсюда и из равенства Φ (0, t3, t4) вытекает, что Φ (t2, t3, t4) < 0, t2 ≥ 0, t3, t4 > 0 т.е. скалярное произведение векторного поля системы (2.3) при u = –1 и вектора нормали к многообразию M+ меньше нуля. Следовательно, отрицательные траектории системы пересекают многообразие M сверху вниз. В силу замечания 1 положительные траектории пересекают многообразие M снизу вверх. Утверждение доказано.

Таким образом, синтез оптимального по быстродействию управления системой (2.3) имеет следующий вид. Если точка (x, y, v, z) не лежит на многообразии M, то

u(x, y, v, z)=1, если z>F(x, y, v)1, если z<F(x, y, v)

На первом этапе оптимальная траектория приходит на многообразие M, где происходит первое переключение управления. На втором этапе движение продолжается вдоль многообразия M до поверхности S4, где происходит второе переключение управления. На третьем этапе траектория проходит по поверхности S4 до пересечения с кривой Γ4. Здесь управление вновь меняет знак, и система вдоль кривой Γ4 достигает начала координат.

Если же (x, y, v, z) ∈ M, то знак управления u (x, y, v, z) определяется знаком участка многообразия, на котором лежит точка (x, y, v, z):

u(x,y,v,z)=1, если (x, y, v, z)M1, если (x, y, v, z)M+

Принадлежность точки (x, y, v, z) многообразию M определяется равенством z = F (x, y, v). Если при этом v > f (x, y), то (x,y,v,z)S4M, если v < f (x, y), то (x,y,v,z)S+4M+. В случае v = f (x, y) имеем

(x, y, v, z)Γ4S4M, если x>y1y(x, y, v, z)Γ+4S+4M+, если x<y1y

Заключение. Использованный подход к решению задачи 1 может быть применен при решении аналогичных задач оптимального быстродействия для линейных систем с нижнетреугольной матрицей. В этом случае фазовые переменные с номером, большим k, не входят в первые k уравнений, k = 1, 2, ..., n − 1, здесь n – порядок системы. Это позволяет свести решение задачи к последовательному решению задач меньшей размерности, постепенно увеличивая порядок системы.

Работа выполнена в соответствии с государственным заданием 124012500443-0.

×

作者简介

I. Ananievsky

Ishlinsky Institute for Problems in Mechanics of the RAS

编辑信件的主要联系方式.
Email: anan@ipmnet.ru
俄罗斯联邦, Moscow

参考

  1. Pontryagin L.S., Boltyanskii V.G., Gamkrelidze R.V., Mishchenko E.F. The Mathematical Theory of Optimal Processes. N.Y.: Wiley, 1962. 360 p.
  2. Milyutin A.A., Dmitruk A.V., Osmolovskiy N.P. The Maximum Principle in Optimal Control. Moscow. MSU. Pub., 2004. 168 p. (in Russian)
  3. Feldbaum A.A. On synthesis of optimal systems with the help of phase space // Avtomat. i Telemeh., 1955, vol. 16, no. 2, pp. 129–149. (in Russian)
  4. Formalskii A.M. Stabilisation and Motion Control of Unstable Objects. Vol. 33. De Gruyter Studies in Mathematical Physics. Berlin;München;Boston: De Gruyter, 2016. https://doi.org/10.1515/9783110375893
  5. Lavrovsky E.K. On quick action in the problem of controlling the vertical position of a pendulum by the movement of its base // J. Comput. Syst. Sci. Int., 2021, vol. 60, no. 1, pp. 39–47.
  6. Reshmin S.A., Chernous’ko F.L. Time-optimal control of an inverted pendulum in the feedback form // J. Comput. Syst. Sci. Int., 2006, vol. 45, no. 3, pp. 383–394.
  7. Chernousko F.L., Akulenko L.D., Sokolov B.N. Control of Oscillations. Moscow: Nauka, 1980. 384 p. (in Russian)
  8. Chernousko F.L., Ananievski I.M., Reshmin S.A. Control of Nonlinear Dynamical Systems. Methods and Applications. Berlin;Heidelberg: Springer, 2008. 396 p.
  9. Anan’yevskii I.M. Control of a fourth-order linear system with mixed constraints // PMM, 2000, vol. 64, iss. 6, pp. 863–870.
  10. Ananievskii I.M., Dunaev I.A. The fastest damping of a linear inverted pendulum using a dynamic absorber // J. Comput. Syst. Sci. Int., 2024, vol. 63, no. 3, pp. 390–402.
  11. Kalman R.E., Falb P.L., Arbib M.A. Topics in Mathematical System Theory. N.Y.: McGraw-Hill, 1969. 358 p.

补充文件

附件文件
动作
1. JATS XML
2. Fig. 1

下载 (10KB)

版权所有 © Russian Academy of Sciences, 2024

Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».