Регуляризация классических условий оптимальности

Обложка

Цитировать

Полный текст

Аннотация

Рассматривается регуляризация классических условий оптимальности(КУО) — принципа Лагранжа (ПЛ) и принципа максимума Понтрягина (ПМП) — в выпуклой задаче оптимального управлении с сильно выпуклым целевым функционалом и с поточечными фазовыми ограничениями типа равенства и неравенства. Управляемая система задается линейным функционально-операторным уравнением II рода общего вида в пространстве L2s, основной оператор правой части уравнения предполагается квазинильпотентным. Получение регуляризованных КУО основано на методе двойственной регуляризации. Основное предназначение регуляризованных ПЛ и ПМП — устойчивое генерирование минимизирующих приближенных решений (МПР) в смысле Дж. Варги. Регуляризованные КУО: 1) формулируются как теоремы существования в исходной задаче МПР с одновременным конструктивным представлением этих решений; 2) выражаются в терминах регулярных классических функций Лагранжа и Гамильтона–Понтрягина; 3) «преодолевают» свойства некорректности КУО и дают регуляризирующие алгоритмы для решения оптимизационных задач. Статья продолжает серию работ авторов по регуляризации КУО для ряда канонических задач оптимального управления линейными распределенными системами вольтеррова типа. В качестве приложения полученных в работе «абстрактных результатов» в ее заключительной части рассматривается регуляризация КУО в конкретной оптимизационной задаче с поточечными фазовыми ограничениями типа равенства и неравенства для управляемой системы с запаздыванием.

Полный текст

Введение

Данная статья продолжает серию работ авторов [1–6] по регуляризации классических условий оптимальности (КУО) — принципа Лагранжа (ПЛ) и принципа максимума Понтрягина (ПМП) — для ряда канонических задач оптимального управления линейными распределенными системами вольтеррова типа. Системами вольтеррова типа мы называем управляемые системы, которые могут быть описаны линейными функциональными (иначе, функционально-операторными) уравнениями II рода общего вида с квазинильпотентным основным линейным оператором правой части. Подобным свойством обладают, прежде всего, различного рода вольтерровы операторы. Заметим, что название «вольтерровы операторы» (операторы типа Вольтерра) присваивалось разными авторами различным классам операторов со сходными свойствами (используются также названия: причинные операторы, наследственные операторы и др.), начиная с известных работ L. Tonelli (1929) и А. Н. Тихонова (1938); см., например, краткий обзор определений вольтерровых операторов [7, Дополнение], а также [6, 8]. В случае линейных операторов эти определения так или иначе связаны со свойством квазинильпотентности: либо это свойство включено в само определение вольтеррова оператора (см., например, [9, с. 10]), либо при естественных условиях следует из этого определения (см., например, цепочечный признак квазинильпотентности [8, теорема 2], опирающийся на определение [10] функционального оператора, «вольтеррова на системе множеств», являющееся многомерным обобщением определения А. Н. Тихонова). Поэтому такие уравнения можно назвать функциональными уравнениями вольтеррова типа.

К уравнениям вольтеррова типа естественным образом (обращением главной части) сводятся самые разнообразные начально-краевые задачи для различных уравнений с частными производными (гиперболических, параболических, интегро-дифференциальных, систем таких уравнений, уравнений с запаздываниями разного рода и др., см. разнообразные конкретные примеры в [7, глава 2], обзоры в [7, 11]). Это позволило в настоящей статье получить регуляризованные ПЛ и ПМП единообразно для широкого класса распределенных оптимизационных задач. При этом существенным образом используется предложенное нами ранее понятие равностепенной квазинильпотентности семейства операторов [12] (историю вопроса см. в [11]).

В статьях [1, 2] рассматривались различные варианты регуляризации КУО для задач с сильно выпуклыми целевыми функционалами и с функциональными ограничениями типа равенства и неравенства. В свою очередь, в [3, 4] аналогичные вопросы изучались применительно к задачам также с сильно выпуклыми целевыми функционалами, но с операторным (т. е. задаваемым оператором с бесконечномерным образом) ограничением-равенством и функциональными ограничениями-неравенствами. Наконец, в [5, 6] регуляризация КУО проводилась для задач такого же вида, как и в [1–4], но в ситуации, когда целевой функционал выпуклой задачи может быть и не сильно выпуклым. «Абстрактные результаты» по регуляризации КУО в [1–6] подробно «расшифровывались» для ряда конкретных задач оптимального управления распределенными системами вольтеррова типа (рассматривались, в частности, оптимизационные задачи, связанные с системой уравнений с запаздыванием, с интегродифференциальным уравнением типа уравнения переноса и с гиперболической системой дифференциальных уравнений первого порядка).

В настоящей работе рассматривается регуляризация КУО в выпуклых задачах оптимизации линейных распределенных систем вольтеррова типа, но, в отличие от [1–6], в качестве операторных ограничений выступают поточечные фазовые ограничения типа равенства и неравенства. В качестве приложения полученных в работе «абстрактных результатов» в ней рассматривается регуляризация КУО в конкретной оптимизационной задаче с поточечными фазовыми ограничениями типа равенства и неравенства для управляемой системы с запаздыванием. Как известно [13–16], задачи с поточечными фазовыми ограничениями вот уже на протяжении более шести десятилетий привлекают постоянное внимание специалистов в области оптимизации сосредоточенных и распределенных систем. Сами же поточечные фазовые ограничения, с точки зрения оптимизационной теории, традиционно относятся к числу наиболее сложных операторных ограничений.

Регуляризация КУО, т. е. регуляризация ПМП и ПЛ, в выпуклых задачах оптимального управления и математического программирования на базе основанного на двойственности подхода к регуляризации [17] была впервые предложена в работах [18, 19]. Указанная регуляризация в теории условной оптимизации, в том числе и в задачах оптимального управления, является «естественной процедурой» ввиду свойств некорректности КУО [19–22]. Говоря о некорректности КУО, мы, прежде всего, имеем в виду такие их свойства, как невыполнимость и неустойчивость [19–22]. Напомним, что о невыполнимости КУО мы говорим тогда, когда известно, что в той или иной задаче на условный экстремум они не могут быть записаны. В свою очередь, неустойчивость КУО мы понимаем в том смысле, что неустойчиво по отношению к возмущению исходных данных экстремальной задачи ведут себя допустимые элементы, удовлетворяющие всем составляющим КУО соотношениям. Анализ различных примеров некорректности [19–22] дают основание рассматривать КУО как математические объекты с присущими им от природы свойствами некорректности. В этом случае центральная роль, как показано в [19, 20, 22], в задачах условной оптимизации естественным образом неизбежно переходит от классического понятия оптимального элемента к понятию минимизирующего приближенного решения (МПР) в смысле Дж. Варги [23], см. ниже определение этого понятия в разделе 2.3 (в математическом программировании такие последовательности часто называют оптимальными обобщенными планами [24]). Такой подход был реализован в [19, 21, 22] (в [22] для обозначения МПР использовалось словосочетание «обобщенная минимизирующая последовательность») применительно к выпуклым задачам на условный экстремум с операторным ограничением-равенством и конечным числом функциональных ограничений-неравенств. Тот же подход был реализован и в наших уже цитированных выше работах [1–6] применительно к регуляризации КУО для канонических задач оптимизации линейных распределенных систем вольтеррова типа. Полученные в указанных работах результаты позволяют выделить следующие важные, на наш взгляд, особенности получаемых регуляризованных КУО в выпуклых задачах условной оптимизации. Можно утверждать, что регуляризованные КУО: 1) при условии конечности значения исходной задачи формулируются как теоремы существования в ней МПР, состоящих из минималей регулярных функционалов Лагранжа, двойственные переменные для которых генерируются в соответствии с выбранной процедурой регуляризации двойственной задачи; 2) обобщают КУО, приводят к ним <<в пределе>> и сохраняют общую структуру классических аналогов; 3) являются условиями оптимальности, выраженными в секвенциальной форме в терминах регулярных функционалов Лагранжа; 4) «преодолевают» свойства некорректности классических аналогов и представляют собою универсальные МПР-образующие (регуляризирующие) алгоритмы в смысле [25] для решения задач на условный экстремум.

Ранее регуляризация КУО для выпуклых задач оптимального управления с поточечными фазовыми ограничениями типа равенства и неравенства рассматривалась в наших работах в случае управляемых систем, связанных с обыкновенными [18] и параболическими дифференциальными уравнениями [26]. Рассматриваемая ниже управляемая система вольтеррова типа своей общностью существенно отличается от рассмотренных ранее в наших работах [18, 26] управляемых систем.

Статья состоит из введения и трех основных разделов, первый из которых посвящен постановке выпуклой задачи оптимального управления для линейной распределенной системы вольтеррова типа с поточечными фазовыми ограничениями типа равенства и неравенства, формулировке и доказательству важных вспомогательных результатов, определению МПР-образующего алгоритма. Второй раздел посвящен доказательству сходимости алгоритма двойственной регуляризации для рассматриваемой задачи, а также доказательству на этой основе регуляризованных КУО для нее. Наконец, в заключительном третьем разделе подробно обсуждается, как «абстрактные» результаты первых двух разделов могут быть «расшифрованы» применительно к конкретной задаче оптимального управления с поточечными фазовыми ограничениями типа равенства и неравенства для управляемой системы с запаздыванием.

Примем следующие обозначения и соглашения: Rn — пространство -векторов-столбцов; ,n и n — евклидовы скалярное произведение и норма в Rn; векторы, если не оговорено противное, считаются столбцами; 0n — ноль в Rn; R+ — множество всех положительных чисел; R — множество всех неположительных чисел; * — знак сопряжения и транспонирования; ΠRn — выпуклый компакт с непустой внутренностью, играющий роль основного множества изменения независимых переменных, элементы которого обозначаем через t{t1,,tn}; LpLp(Π) — лебегово пространство со стандартной нормой (1p); LpmLpm(Π)(Lp(Π))m (1p); p,m — стандартная норма прямого произведения в Lpm; ,2,m — стандартное скалярное произведение в Lpm ; L2,yL2:y(t)0,tΠ; L2,+yL2:y(t)0,tΠ; CC(Π) — пространство непрерывных на Π функций со стандартной нормой C; Cr(C)r; C,r — стандартная норма прямого произведения в Cr; если H гильбертово пространство, то скалярное произведение в нем обозначаем через ,H, а соответствующую норму как H; субдифференцируемость понимается в смысле выпуклого анализа.

1. Постановка задачи оптимального управления

1.1. Базовая оптимизационная задача

Пусть заданы: натуральные числа m,n,q,r,s функция c(t), tΠ, класса L2mL2m(Π); линейный ограниченный оператор (ЛОО) A:L2mL2m с нулевым спектральным радиусом; ЛОО B:L2sL2m. Рассмотрим линейное функциональное уравнение

z(t)=A[z](t)+B[u](t)+c(t),tΠ,zL2m,uL2s, (1.1)

считая u() управляющей функцией (управлением). Ввиду квазинильпотентности A уравнение (1.1) имеет для каждого u()L2s единственное в L2mрешение z(t), tΠ, причем

z(t)=S[B[u]+c](t),tΠ,uL2s, (1.2)

где S:L2mL2m — ЛОО — сумма ряда Неймана: S[y]i=0Ai[y],yL2m. Отвечающее управлению u() решение z() уравнения (1.1), задаваемое формулой (2), обозначим zu().

Чтобы поставить для управляемой системы (1.1) задачу оптимального управления, будем считать, что заданы: функционал J[z,u]K[z]+M[u], zL2m, uL2s, где K:L2mR — непрерывный выпуклый функционал, а M:L2sR — непрерывный сильно выпуклый функционал с постоянной сильной выпуклости κ; ЛОО Σ:L2mCr и ϒ:L2mCq; функции ω()C и Ξ()Cq; функция F(t,y):Π×RrR, непрерывная по совокупности переменных, выпуклая по y на Rr при каждом tΠ.

Используя равенство (1.2) как формулу подстановки, зададим на L2s функционал J[u]J[zu,u]K[zu]+M[u], uL2s, операторы G[u](t)Ξ(t),ϒzu(t)q, tΠ, uL2s, и Ε[u](t)F(t,Σ[zu](t)), tΠ, uL2s. Очевидно, что функционал J непрерывен и сильно выпукл на L2s с постоянной сильной выпуклости κ, а операторы G и E действуют из L2s в C.

Пусть D — выпуклое ограниченное и замкнутое множество пространства L2s. Рассмотрим задачу оптимального управления системой (1.1) c минимизируемым целевым функционалом  при поточечных ограничениях типа равенства и неравенства

G[u](t)=ω(t),  tΠ,  uL2s;Ε[u](t)R,  tΠ,  uL2s, (1.3)

и множестве допустимых управлений D. Эту задачу символически запишем в виде

J[u]min,(3),uD. (1.4)

1.2. Точная и приближенные оптимизационные задачи

Задача (1.4) определяется набором исходных данных fA,B,c,K,M,Ξ,ϒ,ω,F,Σ. Предположим, что точные исходные данные f0A0,B0,c0,K0,M0,Ξ0,ϒ0,ω0,F0,Σ0 нам не известны, но мы можем оперировать с приближенными исходными данными

fδAδ,Bδ,cδ,Kδ,Mδ,Ξδ,ϒδ,ωδ,Fδ,Σδ,

где δ — меняющийся в некотором фиксированном полуинтервале (0,δ0] числовой параметр, характеризующий близость приближенных данных fδк точным данным  в указанном ниже условиями А, Б и В смысле (положительным значениям параметра δ соответствует приближенная оптимизационная задача вида (1.4) c данными fδ, а значению δ=0 — точная оптимизационная задача вида (4) c данными f0). Таким образом, мы считаем, что при каждом δ[0,δ0] существуют следующие объекты: квазинильпотентный ЛОО Aδ:L2mL2m; ЛОО Bδ:L2sL2m; функция cδ()L2m;непрерывный выпуклый функционал Kδ:L2mR; непрерывный сильно выпуклый функционал Mδ:L2sR с постоянной сильной выпуклости κ; ЛОО Σδ:L2mCr и ϒδ:L2mCq; функции ωδ()C и Ξδ()Cq; непрерывная функция Fδ(t,y):Π×RrR, выпуклая по y на Rr при каждом tΠ.

Считаем, что приближенные исходные данные fδ, δ(0,δ0], связаны с точными исходными данными f0 приведенными ниже условиями А, Б, В, Г, Д.

Условие А. Функционалы Kδ:L2mR и Mδ:L2sR при любом δ[0,δ0] липшицевы на каждом ограниченном множестве пространств L2m и L2s соответственно, причем липшицевость равномерна по параметру δ[0,δ0], то есть существуют неубывающие функции N1(),N2():R+R+ такие, что для каждого l>0 и любого δ[0,δ0] 

Kδ[z1]Kδ[z2]N1(l)z1z22,m  при  z12,m,z22,ml,

Mδ[u1]Mδ[u2]N2(l)u1u22,s  при  u12,s,u22,sl   (u1,u2D).

Функция Fδ(t,y):Π×RrR при любом δ[0,δ0] равномерно по tΠ на каждом ограниченном в Rr множестве липшицева по y. Причем липшицевость равномерна по параметру δ[0,δ0], то есть существует неубывающая функция N3():R+R+ такая, что для каждого l>0 и любого δ[0,δ0] 

Fδ(t,y1)Fδ(t,y2)N3(l)y1y2r  при  tΠ,    y1r,y2rl. (1.5)

Условие Б. Существует постоянная C1>0 такая, что при любом δ(0,δ0] 

AδA0C1δ,BδB0C1δ,cδc02,mC1δ, (1.6)

ΣδΣ0C1δ,ϒδϒ0C1δ,ωδω0CC1δ,ΞδΞ0C,qC1δ.

Условие В. Существуют неубывающие функции N4(),N5():R+R+ и постоянная C2>0 такие, что для каждого l>0 и любого δ(0,δ0] 

Kδ[z]K0[z]N4(l)δ,Mδ[u]M0[u]C2δ  при  z2,ml,   uD, (1.7)

Fδ(t,y)F0(t,y)N5(l)δ  при  tΠ,   yrl. (1.8)

Чтобы сформулировать условие Г, воспользуемся следующим введенным нами ранее (историю вопроса см., например, в [11]) понятием равностепенной квазинильпотентности. Пусть B — банахово пространство, X — некоторое множество, {G(ξ)[]:BB}ξX — семейство зависящих от параметра ξX квазинильпотентных ЛОО (напомним: квазинильпотентность ЛОО G(ξ)[]:BB означает, что {G(ξ)}kk0 при k). Назовем семейство операторов {G(ξ)}ξX равностепенно квазинильпотентным, если supξXG(ξ)kk0 при k.

Условие Г. Семейство Aδ:L2mL2mδ0,δ0 равностепенно квазинильпотентно.

При любом δ[0,δ0] управляемое функциональное уравнение

z(t)=Aδ[z](t)+Bδ[u](t)+cδ(t),tΠ,zL2m,uL2s, (1.9)

имеет для каждого uL2s единственное в классе L2m решение z(t), tΠ, причем

z(t)=Sδ[Bδ[u]+cδ](t),tΠ,uL2s, (1.10)

где Sδ:L2mL2m — ЛОО — сумма ряда Неймана: Sδ[y]i=0(Aδ)i[y], yL2m. Отвечающее управлению uL2s и задаваемое формулой (10) решение z() уравнения (9) будем обозначать zuδ(), δ[0,δ0]. При любом δ[0,δ0] мы имеем набор ограничений

Gδ[u](t)=ωδ(t),   tΠ,   uL2s;Εδ[u](t)R1,   tΠ,   uL2s, (1.11)

где Gδ[u](t)Ξδ(t),ϒδzuδ(t)q, tΠ, uL2s, а Εδ[u](t)Fδ(t,Σδ[zuδ](t)), tΠ, uL2s, и задачу оптимального управления

Jδ[u]min,(11),uD,(OCδ)

в которой Jδ[u]Jδ[zuδ,u]Kδ[zuδ]+Mδ[u], uL2s. Задачу (OC0) назовем  точной задачей, а задачи (OCδ), δ(0,δ0], —  приближенными задачами оптимального управления.

Условия Б и Г дают такое свойство семейства операторов Aδ0δδ0 [4, лемма 1].

Лемма 1.1. Существует K>0 такое, что SδS0KAδA0,   δ0,δ0. 

Лемма 1.1 позволяет легко вывести из условий А, Б, В, Г и ограниченности D существование постоянных C1, C2 и функции N1():R+R+ таких, что для δδ0 

zuδ2,mC1,zuδzu02,mC2δ,uD, (1.12)

|Jδ[u]J0[u]|,Gδ[u]G0[u]C,Εδ[u]Ε0[u]CC2δ,uD, (1.13)

|Jδ[u1]Jδ[u2]|,Gδ[u1]Gδ[u2]C,Εδ[u1]Εδ[u2]CN1(l)u1u22,s,

u12,s,u22,sl   (u1,u2D).  

Предполагаем, что выполняется следующее условие, дополнительно связывающее ограничения (1.11) с управляемой системой (1.9).

Условие Д. При любом δ[0,δ0] слабая сходимость в пространстве L2s последовательности ujj=1D к некоторому элементу u влечет за собой поточечную на Π сходимость последовательностей Σδzujδ()j=1 и ϒδzujδ()j=1 соответственно к Σδzuδ() и ϒδzuδ().

Лемма 1.2. При любом δ[0,δ0] операторы Gδ и Eδ слабо непрерывны как операторы из L2s в L2, то есть преобразуют слабо сходящуюся к некоторому элементу в L2s последовательность в последовательность, сходящуюся в норме L2 к образу этого элемента.

Доказательство. Из условия Д следует, что при любом δ[0,δ0] слабая в L2s сходимость последовательности ujj=1 D к некоторому элементу uвлечет за собой поточечную на Π сходимость Gδuj()j=1 и Εδuj()j=1 к Gδu() и Εδu() соответственно. Так как из-за ограниченности D в L2s указанные поточечно сходящиеся последовательности равномерно ограничены, то они сходятся соответственно к Gδu() и Εδu() и в норме L2.

1.3. Обобщенная нижняя грань и минимизирующие приближенные решения

Так как L2, выпукло и замкнуто в гильбертовом пространстве L2, то любая точка v пространства имеет единственную проекцию на L2,; расстояние в L2 от точки v до ее проекции на L2, обозначим через ρ(v) (ρ(v)=minwL2,vw2,1). Проекция точки v()L2 на L2, есть v()¯, где v()¯ — «срезка нулем сверху» функции v() (v()¯ совпадает с v() там, где v() отрицательна, и равна нулю там, где v() неотрицательна); соответственно, ρ(v)=v¯2,1, где v()¯ — «срезка нулем снизу» функции v().

Пусть

Dδ,uD:Gδ[u]ωδ2,1,ρ(Εδ[u]),δ[0,δ0],0,

и D0D0,0. Элементарными выкладками проверяется, что при любых δ[0,δ0], ϵ0 множество Dδ, выпукло и замкнуто в L2s; из ограниченности D следует ограниченность Dδ,; вообще говоря, Dδ,ϵ может быть и пустым. Положим

β0=infuD0J0[u],    если    D0=;β0=+,    если    D0=.

Величину β0 можно назвать классической нижней гранью задачи (OC0). Положим

βinfuD0,J0[u],    если    D0,;β+,    если    D0,=.

Обобщенной нижней гранью задачи (OC0) назовем предельную величину

ββ+0lim+0β.

Ввиду непрерывности и выпуклости функционала J0, ограниченности, замкнутости и выпуклости множества D0 задача (OC0) заведомо разрешима, если D0 [27, теорема 8.2.8]. А так как функционал J0 сильно выпуклый, то задача (OC0) может иметь не более одного решения [27, теорема 8.2.10]. Таким образом, если D0, задача (OC0) имеет ровно одно решение, будем обозначать его через u0 (в этом случае J0(u0)=minuD0J0(u)=β0).

Непосредственно из определения обобщенной нижней грани β следует, что ββ0. Покажем, что наша задача (OC0) такова, что имеет место равенство β=β0.

Теорема 1.1. Величины β и β0 совпадают. Если они конечны, то задача (OC0) разрешима, и ее решение единственно.

Доказательство. При β=+ равенство β=β0 следует из неравенства ββ0. Рассмотрим случай β<+. При ϵ>0 множество D0,ϵ непусто, так как ββ<+. Зафиксируем некоторое ϵ0>0. Так как функционал J0 непрерывен и сильно выпукл на L2s, а множество D0,ϵ при ϵ>0 выпукло и замкнуто в L2s, то при любом 0,0 существует единственный элемент uϵD0,ϵ такой, что J0u=minuD0,J0u=β [27, теорема 8.2.10].

Множество D выпукло, ограничено и замкнуто, а потому и слабо компактно в L2s [27, теорема 8.2.3]. То есть существуют uD и стремящаяся к нулю последовательность ii=10,0 такие, что uii=1 слабо в L2s сходится к u. Функционал J0 непрерывен и выпукл, а потому и слабо полунепрерывен снизу на D [27, теорема 8.2.7]. Значит существует подпоследовательность ϵijj=1 (обозначим ее σjj=1), для которой

J0uliminfiJ0ui=limjJ0uσj=β. (1.14)

В силу условия Д слабая в L2s сходимость uσjj=1 к u влечет за собой поточечную на Π сходимость последовательностей Σ0zuσj()j=1 и ϒ0zuσj()j=1 соответственно к Σ0zu() и ϒ0zu(). Отсюда следует поточечная на Π сходимость G0uσj()j=1 и Ε0uσj()¯j=1 к G0u() и Ε0u()¯. Так как указанные поточечно сходящиеся последовательности равномерно ограничены, то можем записать предельные соотношения G0uσjω02,1G0uω02,1, Ε0uσj¯2,1Ε0u¯2,1 при j. Ввиду uϵD0,ϵ получаем

G0uω02,1=0,Ε0u¯2,1=0.

То есть uD0. Это означает, что D0 непусто и β0 конечно.

Так как D0D0,ϵ, то uD0,ϵ, 0<ϵϵ0. То есть J0(u)J0(u)=minuD0,J0(u)=β. Но βϵβ при ϵ0 и поэтому J0(u)β, что вместе с (1.14) дает J0(u)=β. Имеем: β0=infuD0J0(u)J0(u)=β. А так как ββ0, то получаем β0=minuD0J0(u)=J0(u)=β, то есть β=β0, u — решение задачи (OC0).

Итак, если одна из величин β, β0 конечна, то они совпадают, множество D0 непусто, а задача (OC0) разрешима. Разрешимость, как уже было отмечено, может быть лишь однозначной.

Следуя [23], введем следующее определение.

Определение 1.1. Назовем последовательность uiD, i=1,2,, минимизирующим приближенным решением (МПР) задачи (OC0), если J0[ui]β при i и uiD0,ϵi (i=1,2,) для некоторой сходящейся к нулю последовательности чисел ϵi>0, i=1,2,. 

Укажем условия (теорема 1.2), при которых МПР обязательно так или иначе сходятся к решению задачи (OC0). Нам поможет, в частности, следующее утверждение.  Пусть X — выпуклое замкнутое множество гильбертова пространства H, а функция f():XR выпукла, полунепрерывна снизу и субдифференцируема на X. Тогда, если она является сильно выпуклой на X с постоянной сильной выпуклости k, то

f(z)f(y)+f(y),zyH+κzyH2,z,yX. (1.15)

Доказательство. Воспользуемся тем, что общее определение сильной выпуклости [27, гл. 8, с. 650] аналогично определению сильной выпуклости функции конечного числа переменных. Аналог для случая гильбертова пространства утверждения [27, лемма 4.3.1] позволяет сказать, что f сильно выпукла на X с постоянной κ>0 тогда и только тогда, когда найдется выпуклая функция g():XR такая, что f(z)=g(z)+κzH2, zX. При этом (см. [28, следствие 4.3]) функции f и g субдифференцируемы в точках X одновременно и

f(y)=g(y)+2κy,   yX. (1.16)

Таким образом, выпуклая функция g(z)f(z)κzH2, zX, субдифференцируема на X т. е.

g(z)g(y)+g(y),zyH,   z,yX. (1.17)

Осталось заметить, что из соотношений (1.16), (1.17) и очевидного тождества zH2=yH2+2y,zyH+zyH2, z,yX, следует (1.15).

Теорема 1.2. Если β<+, то любое МПР слабо в L2s сходится к решению u0 задачи (OC0). А если еще и функционал J0 субдифференцируем в точках D, то всякое МПР сходится к u0 сильно в L2s.  

Доказательство. Пусть β<+. По теореме 1.1 задача (OC0) имеет единственное решение u0. Пусть uii=1 — некоторое МПР задачи (OC0).Последовательность uii=1 ограничена в L2s вместе с D. То есть она слабо компактна в L2s [27, теорема 8.2.3] и у нее существует подпоследовательность, слабо сходящаяся в L2s к некоторому элементу uD. Пусть uσjj=1 — указанная подпоследовательность. Воспользовавшись выкладками из доказательства теоремы 1.1, получаем, что элемент u совпадает с решением u0 задачи (OC0). Тем самым мы доказали существование у каждого МПР задачи (OC0) подпоследовательности (а она тоже есть МПР), слабо в L2s сходящейся к решению задачи.

Покажем теперь, что любое МПР задачи (OC0) слабо в L2s сходится к решению u0. Воспользуемся тем, что слабая сходимость в L2s эквивалентна сходимости в слабой норме (см. [23, теорема I.3.11]), обозначим ее w. Действуя от противного, предположим, что некоторое МПР uii=1 задачи (OC0) не сходится слабо в L2s к u0. Это означает, что существует ν>0 и подпоследовательность uijj=1 такие, что uiju0wν (j=1,2,). Так как последовательность uijj=1 сама есть МПР вместе с uii=1, то по доказанному выше из нее можно выделить подпоследовательность, сходящуюся слабо в L2s (а значит и в слабой норме w) к решению u0 задачи (OC0). Получили противоречие.

Предположим теперь, что функционал J0 субдифференцируем в точках D. Пусть uii=1 — некоторое МПР задачи (OC0). По лемме 1.3, ввиду сильной выпуклости J0, для любого i=1,2, справедливо неравенство

J0uiJ0u0J0(u0),uiu0κuiu02,s2.

Так как по доказанному последовательность uii=1 слабо в L2s сходится к решению u0 задачи (OC0), а по теореме 1.1 J0uiβ=β0=J0u0 при i, то из выписанного неравенства следует, что uiu02,s0 при i. 

1.4. Регуляризирующий и МПР-образующий операторы

Следуя нашей работе [25], введем определение регуляризирующего оператора в задаче с поточечными фазовыми ограничениями (OC0). Зависящий от δ оператор R(,δ), ставящий в соответствие каждому набору исходных данных fδ элемент R(fδ,δ)uδD, удовлетворяющий условиям (1.6), (1.7), (1.8), называется регуляризирующим в задаче (OC0), если

J0uδβ,G0[uδ]ω02,10,ρ(Ε0[uδ])0  при  δ0.

Далее, по аналогии с [25], введем «порождаемое» этим определением понятие МПР-образующего оператора (алгоритма) в задаче (OC0). Пусть δi(0,δ0), i=1,2,, — сходящаяся к нулю последовательность положительных чисел. Зависящий от δi, i=1,2,, оператор R(,δi), ставящий в соответствие каждому набору исходных данных fδi элемент R(fδi,δi)uδiD, называется МПР-образующим в задаче (OC0), если последовательность uδi, i=1,2,, есть МПР в этой задаче.

2. Двойственная регуляризация и условия существования МПР в выпуклой задаче оптимального управления с поточечными фазовыми ограничениями и сильно выпуклым функционалом качества

В этом разделе сформулируем и докажем условия существования МПР (отдельно необходимые и достаточные) в задаче (OC0) с одновременным конструктивным устойчивым представлением конкретного экземпляра МПР (напомним, что вместо точной задачи (OC0) в нашем распоряжении имеется семейство задач (OCδ) с возмущенными исходными данными, зависящими от параметра δ>0, характеризующего ошибку задания этих данных по сравнению с точными данными). Указанные условия существования можно трактовать и как условия устойчивого конструирования МПР в задаче (OC0). Будем придерживаться общей схемы рассуждений, использованной при получении аналогичных результатов в работах [17, 19].

2.1. Двойственная регуляризация в выпуклой задаче оптимизации с поточечными фазовыми ограничениями и необходимые условия существования МПР

В данном разделе опишем процедуру двойственной регуляризации [17, 19] для задачи оптимального управления с поточечными фазовыми ограничениями  и получаемые с ее помощью необходимые условия существования МПР в этой задаче.

2.1.1. Двойственная задача. Введем для задачи (OCδ), δ[0,δ0], регулярный функционал Лагранжа

Lδ(u,λ,μ)Jδu+λ,Gδ[u]ωδ2,1+μ,Εδ[u]2,1,    uD,    λL2,    μL2,

и соответствующую двойственную задачу

Vδ(λ,μ)infuDLδ(u,λ,μ)sup,    {λ,μ}L2×L2,+. (2.1)

Функционал Vδ определен (конечен) в каждой точке {λ,μ}L2×L2 и вогнут. Поэтому он является локально липшицевым на L2×L2, так как благодаря ограниченности D ограничен на любом ограниченном множестве [28, теорема 2.1]. Ввиду выпуклости и замкнутости в L2s множества D, непрерывности и сильной выпуклости на D функционала Jδ(u), здесь infuDLδ(u,λ,μ)=minuDLδ(u,λ,μ) для каждой пары {λ,μ}L2×L2,+, причем минимум достигается в единственной точке

uδ[λ,μ]arg min{Lδ(u,λ,μ),uD}.

Из неравенства Vδ(λ,μ)V0(λ,μsupuDLδ(u,λ,μ)L0(u,λ,μ) и условий А, Б, В и Г простыми выкладками, используя лемму 1.1 и ограниченность D, получаем, что при некотором C~>0. 

|Vδ(λ,μ)V0(λ,μ)|C~δ(1+λ2,1+μ2,1),{λ,μ}L2×L2,+,    δ(0,δ0]. (2.2)

При любых δ[0,δ0], α>0 сильно вогнутый функционал

Rδ,α(λ,μ)Vδ(λ,μ)αλ2,12αμ2,12,    {λ,μ}L2×L2,+,

достигает на L2×L2,+ максимума в одной точке

λδ,α,μδ,αarg minRδ,α(λ,μ),λ,μL2×L2,+.

Пусть α():R+R+ — некоторая функция, удовлетворяющая условию

δα(δ)0,    α(δ)0     при     δ0. (2.3)

Общие свойства метода стабилизации [27, гл. 8, § 4] позволяют сказать, что в случае разрешимости двойственной задачи (2.1) при δ=0 оценка (2.2) и условие согласования (20) влекут за собой сходимость

λδ,α(δ)λ02,1+μδ,α(δ)μ02,10,    δ0, (2.4)

где λ0,μ0 — минимальное по норме решение указанной двойственной задачи.

2.1.2. Супердифференциал вогнутого целевого функционала двойственной задачи. Далее нам потребуется формула для супердифференциала вогнутого функционала значений Vδ(,), который по определению равен взятому с обратным знаком субдифференциалу выпуклого функционала Vδ(,). Чтобы выписать эту формулу, обратимся сначала к общей ситуации, рассмотренной в [17].

Пусть Y, H — некоторые гильбертовы пространства, P — ограниченное замкнутое множество в YI0():PR — липшицев функционал, I1():PH — липшицев оператор. Считаем I0 и I1 равномерно ограниченными на P. Определим составной функционал (его естественно назвать функционалом Лагранжа)

L(y,ν)I0(y)+ν,I1(y)H,    yP,    νH,

и соответствующий (двойственный) функционал значений

V(ν)infyPL(y,ν),    νH.

Супердифференциал вогнутого функционала значений V задается следующей формулой, при записи которой используется обобщенный градиент Кларка [29, § 2.1].

Лемма 2.4. Супердифференциал вогнутого функционала V в точке νH равен

где CV(ν) — обобщенный градиент Кларка функционала  в точке   — замыкание выпуклой оболочки множества X, предел wlim понимается в смысле слабой сходимости в пространстве H. Другими словами, супердифференциал V(ν) есть замыкание выпуклой оболочки совокупности всех слабых пределов всевозможных последовательностей I1(yi), i=1,2,, когда последовательность yiP,  i=1,2,, является минимизирующей для функционала L(y,ν), yP.

Доказательство этой леммы см. в [17, лемма 2].

Применим лемму 2.4 к функционалу Vδ(λ,μ), λ,μL2×L2. В этом случае Y=L2s, H=L2×L2, P=D, V(ν)=Vδ(λ,μ), I0()=Jδ[], I1()=Gδ[]ωδ,Εδ[].

Лемма 2.5. Супердифференциал вогнутого функционала Vδ в точке λ,μL2×L2 равен

Vδ(λ,μ)=CVδ(λ,μ)=co¯{wlimiGδ[ui]ωδ,Εδ[ui]:uiD,

где CVδ(λ,μ) — обобщенный градиент Кларка функционала Vδ в точке λ,μ, а предел wlim понимается в смысле слабой сходимости в пространстве L2×L2. 

В свою очередь, лемма 2.5, в силу слабой непрерывности операторов Gδ[],  Εδ[] (см. лемму 1.2) и единственности для любой пары λ,μL2×L2,+ минимали uδ[λ,μ], преобразуется к следующему виду.

Лемма 2.6. Супердифференциал вогнутого функционала Vδ в точке {λ,μ}L2×L2,+ является одноточечным множеством и равен

Vδ(λ,μ)=CVδ(λ,μ)=Gδuδ[λ,μ]ωδ,Εδuδ[λ,μ],

где CVδ(λ,μ) — обобщенный градиент Кларка функционала Vδ в точке λ,μ. 

Доказательство. Утверждение леммы вытекает непосредственно из леммы 2.5 и выпуклости задачи (OCδ) с сильно выпуклым функционалом цели. Действительно, в силу единственности точки uδ[λ,μ], минимизирующей сильно выпуклый функционал Lδ(u,λ,μ) на D, и сильной сходимости к этой точке любой минимизирующей последовательности в этой задаче минимизации (при λ,μL2×L2,+), обобщенный градиент Кларка CVδ(λ,μ) состоит из единственного элемента. Другими словами, в силу равенства C(Vδ(λ,μ))=CVδ(λ,μ) и совпадения субдифференциала (Vδ(λ,μ)) с обобщенным градиентом C(Vδ(λ,μ)) [29, предложения 2.2.7, 2.3.1], взятый с обратным знаком субдифференциал выпуклого функционала Vδ(λ,μ), то есть супердифференциал вогнутого функционала Vδ(λ,μ), в каждой точке λ,μL2×L2,+ состоит лишь из одного элемента Gδuδ[λ,μ]ωδ,Εδuδ[λ,μ]. 

2.1.3. Метод двойственной регуляризации. В данном разделе опишем метод двойственной регуляризации [17, 19] применительно к задаче оптимального управления с поточечными фазовыми ограничениями (OC0) и докажем соответствующую теорему сходимости этого метода. Считаем при этом, что задача (OC0) разрешима. Это при сделанных предположениях об исходных данных равносильно существованию в ней МПР (см. теоремы 1.1, 1.2).

Для описания и обоснования процедуры двойственной регуляризации воспользуемся следующей леммой, частным случаем более общего утверждения [30, следствие 4.3.6(c)].

Лемма 2.7. Пусть H — гильбертово пространство, f:HR{+} — собственная выпуклая полунепрерывная снизу функция с dom f{zH:f(z)<+}=H, ΩH — замкнутое выпуклое множество. Тогда xΩ — точка минимума f на Ω в том и только в том случае, когда 0f(x)+NΩ(x), где NΩ(x) — конус нормалей в смысле выпуклого анализа ко множеству Ω в точке x. 

Заметим, что в условиях леммы 2.7 (см. [30, предложение 4.1.4])

NΩ(x)={pH:p,yxH0,  yΩ}.

Применим лемму 2.7, взяв H=L2×L2, Ω=L2×L2,+, а в качестве f выпуклую функцию f(λ,μ)=Vδ(λ,μ)+αλ2,12+αμ2,12,   {λ,μ}L2×L2. С учетом леммы 2.6, позволяющей выписать субдифференциал выбранной функции f, критерий минимума леммы 2.7 дает следующее вариационное неравенство

{Gδ[uδ[λδ,α(δ),μδ,α(δ)]]ωδ,Εδ[uδ[λδ,α(δ),μδ,α(δ)]]}2α(δ){λδ,α(δ),μδ,α(δ)},

{λ',μ'}{λδ,α(δ),μδ,α(δ)}L2×L20,  {λ',μ'}L2×L2,+. (2.5)

Gδuδλδ,α(δ),μδ,α(δ)ωδ=2α(δ)λδ,α(δ);  (2.6)

Εδuδλδ,α(δ),μδ,α(δ)(t)=2α(δ)μδ,α(δ)(t)    прип.в.   tΠ   таких,что   μδ,α(δ)(t)>0; (2.7)

Εδuδλδ,α(δ),μδ,α(δ)(t)0    прип.в.   tΠ   таких,что   μδ,α(δ)(t)=0. (2.8)

Из соотношений (2.6)–(2.8), в свою очередь, получаем:

Gδuδλδ,α(δ),μδ,α(δ)ωδ,λδ,α(δ)2,1=2α(δ)λδ,α(δ)20. (2.9)

Εδuδλδ,α(δ),μδ,α(δ),μδ,α(δ)2,1=2α(δ)μδ,α(δ)20.  

Из (2.7) следует также, что если μδ,α(δ)(t)>0 для некоторого t, принадлежащего множеству полной меры в {tΠ:μδ,α(δ)(t)>0}, то

Εδuδλδ,α(δ),μδ,α(δ)(t)2α(δ)μδ,α(δ)(t)=0,    Εδ[uδ[λδ,α(δ),μδ,α(δ)]](t)μδ,α(δ)(t)>0   (2.10)

и, значит, при п. в. tΠ таких, что Εδuδλδ,α(δ),μδ,α(δ)(t)<0, выполняется равенство μδ,α(δ)(t)=0. Из (2.7) и (2.10) получаем одновременно, что

μδ,α(δ)(t)Εδuδλδ,α(δ),μδ,α(δ)(t)0    припв.  tΠ.

Кроме того, из (2.9) получаем равенство и неравенство

Gδuδλδ,α(δ),μδ,α(δ)ωδ,Εδuδλδ,α(δ),μδ,α(δ),λδ,α(δ),μδ,α(δ)L2×L2

=2α(δ)λδ,α(δ)2,12+μδ,α(δ)2,120.   (2.11)

Далее, так как

Lδuδλδ,α(δ),μδ,α(δ),λδ,α(δ),μδ,α(δ)Jδuδλδ,α(δ),μδ,α(δ)

+λδ,α(δ),Gδuδλδ,α(δ),μδ,α(δ)ωδ2,1+μδ,α(δ),Εδuδλδ,α(δ),μδ,α(δ)2,1

Lδu0,λδ,α(δ),μδ,α(δ)Jδ[u0]+λδ,α(δ),Gδ[u0]ωδ2,1+μδ,α(δ),Εδ[u0]2,1

Lδu0,λδ,α(δ),μδ,α(δ)Jδ[u0]+λδ,α(δ),Gδ[u0]ωδ2,1+μδ,α(δ),Εδ[u0]Ε0[u0]2,1

J0[u0]+Jδ[u0]J0[u0]+λδ,α(δ)2,1Gδ[u0]ωδ2,1+μδ,α(δ)2,1Εδ[u0)Ε0[u0]2,1,

то в силу оценок (1.6), (1.13) и равенства (2.11) получаем после ряда элементарных преобразований оценку

2α(δ)λδ,α(δ)2,12+μδ,α(δ)2,12C3δλδ,α(δ)2,1+μδ,α(δ)2,1+J0(u0)+C3δminuDJδ(u)

C4δλδ,α(δ)2,12+μδ,α(δ)2,12+J0(u0)+C3δminuDJδ(u)     при     δ(0,δ0),

или

2α(δ)λδ,α(δ)2,12+μδ,α(δ)2,12C4δλδ,α(δ)2,12+μδ,α(δ)2,12J0(u0)C3δ+minuDfδ(u)0,

где C3,C4 — не зависящие от δ положительные постоянные. Отсюда находим, что

λδ,α(δ)2,12+μδ,α(δ)2,12C4δ+(C4δ)28α(δ)K(δ)4α(δ)     при     δ(0,δ0], (2.12)

где K(δ)minuDJδ(u)J0(u0)C3δ, следствием чего является предельное соотношение

α(δ)λδ,α(δ),μδ,α(δ)L2×L20  при  δ0. (2.13)

Кроме того, из соотношений (2.6)–(2.8), оценок (1.5), (1.6), (1.7), (1.8), (1.12) и оценки (2.12), в свою очередь, следуют оценки (в которых положительные постоянные C5,C6,C7 не зависят от δδ0):

G0uδλδ,α(δ),μδ,α(δ)ω02,1Gδuδλδ,α(δ),μδ,α(δ)ωδ2,1+C5δ

2α(δ)λδ,α(δ)2,1+C5δC4δ+(C4δ)28α(δ)K(δ)+C5δ, (2.14)

​​​​​Ε0uδλδ,α(δ),μδ,α(δ)(t)F0(t,Σ0[zuδ[λδ,α(δ),μδ,α(δ)]0](t))=F0(t,Σ0[zuδ[λδ,α(δ),μδ,α(δ)]0](t))

Fδ(t,Σ0[zuδ[λδ,α(δ),μδ,α(δ)]0](t))+Fδ(t,Σ0[zuδ[λδ,α(δ),μδ,α(δ)]0](t))

Fδ(t,Σδ[zuδ[λδ,α(δ),μδ,α(δ)]δ](t))+Fδ(t,Σδ[zuδ[λδ,α(δ),μδ,α(δ)]δ](t))

C6δ+C7δ+Fδ(t,Σδ[zuδ[λδ,α(δ),μδ,α(δ)]δ](t))

C6δ+C7δ+2α(δ)μδ,α(δ)(t)  припв.  tΠ, (2.15)

2α(δ)μδ,α(δ)2,1C4δ+(C4δ)28α(δ)K(δ)  при  δ(0,δ0]. (2.16)

Из неравенств (2.14), (2.15), (2.16) выводим, что

G0uδλδ,α(δ),μδ,α(δ)ω00  при  δ0, (2.17)

и для любого δ(0,δ0] существует функция ϕδ()L2,+ такая, что

Ε0uδλδ,α(δ),μδ,α(δ)(t)ϕδ(t),  tΠ,   причем   ϕδ()2,10   при   δ0. (2.18)

Неравенство в (2.18) означает, что

Ε0[uδ[λδ,α(δ),μδ,α(δ)]]()ϕδ()L2,.

Одновременно для всех uD выполняется неравенство

Jδuδ[λδ,α(δ),μδ,α(δ)]+λδ,α(δ),Gδ[uδ[λδ,α(δ),μδ,α(δ)]]ωδ2,1+μδ,α(δ),Εδ[uδ[λδ,α(δ),μδ,α(δ)]]2,1

Jδ[u]+λδ,α(δ),Gδ[u]ωδ2,1+μδ,α(δ),Εδ[u]2,1,

из которого, с учетом оценок (1.13), следует, что

​​​​Jδuδ[λδ,α(δ),μδ,α(δ)]+λδ,α(δ),Gδ[uδ[λδ,α(δ),μδ,α(δ)]]ωδ2,1+μδ,α(δ),Εδ[uδ[λδ,α(δ),μδ,α(δ)]]2,1

Jδ[u0]+λδ,α(δ),Gδ[u0]ωδ2,1+μδ,α(δ),Εδ[u0]2,1

J0[u0]+C8δλδ,α(δ)2,1+δμδ,α(δ)2,1+δ, (2.19)

где C8>0 — постоянная, не зависящая от δ(0,δ0]. Учитывая ограниченность D, получаем, что при всех δ(0,δ0] 

J0uδ[λδ,α(δ),μδ,α(δ)]J0[u0]+J0uδ[λδ,α(δ),μδ,α(δ)]Jδuδ[λδ,α(δ),μδ,α(δ)]

+C8δ|λδ,α(δ)2,1+μδ,α(δ)2,1+1J0[u0]+C9δλδ,α(δ)2,1+δμδ,α(δ)2,1+δ,

где C9>0 не зависит от δ(0,δ0]. Отсюда, в силу условия согласования (2.3) и соотношения (2.13), следует: для любого δ(0,δ0] существует число ϕ~δ0 такое, что

J0uδ[λδ,α(δ),μδ,α(δ)]J0[u0]+ϕ~δ,  причем  ϕ~δ0  при  δ0. (2.20)

Итак, с учетом ограниченности D построено семейство зависящих от δ(0,δ0] элементов uδ[λδ,α(δ),μδ,α(δ)], удовлетворяющих оценкам (2.14), (2.15), (2.20) и, стало быть, такое, что выполняются соотношения (2.17), (2.18) и одновременно

J0uδ[λδ,α(δ),μδ,α(δ)]minuD0J0[u]=β=β0=J0[u0],   δ0. (2.21)

Соотношения (2.17), (2.18), (2.21) в соответствии с определением 1.2 позволяют сказать, что оператор R(,δ), ставящий в соответствие каждому набору исходных данных fδ, удовлетворяющих оценкам (1.13), элемент uδ[λδ,α(δ),μδ,α(δ)]D, является регуляризирующим в задаче (OC0). При этом в соответствии с теоремой 1.2 любая последовательность uδk[λδk,α(δk),μδk,α(δk)], k=1,2,, δk0, k, сходится слабо к решению задачи (OC0), а в случае субдифференцируемости J0 на D сходится сильно, то есть R(fδ,δ)uδ[λδ,α(δ),μδ,α(δ)]u0, δ0.

Наконец, следствием оценки (2.19), условия (2.3), предельного соотношения (2.13), ограниченности  и соотношения (2.21) является предельное соотношение

λδ,α(δ),μδ,α(δ),Gδuδλδ,α(δ),μδ,α(δ)ωδ,Εδuδλδ,α(δ),μδ,α(δ)L2×L20,  δ0. (2.22)

Равенство (2.11) и соотношение (2.22) позволяют сказать, что

α(δ)λδ,α(δ),μδ,α(δ)L2×L220  при  δ0. (2.23)

Покажем, что выполняется и предельное соотношение

limδ0V0(λδ,α(δ),μδ,α(δ))=supλ,μL2×L2,+V0(λ,μ)=minuD0J0[u]=J0[u0].(2.24)

Заметим сначала, что благодаря соотношениям (2.21), (2.22) можем записать

limδ0Vδ(λδ,α(δ),μδ,α(δ))=J0[u0],

откуда в силу оценки (2.2), предельных соотношений (2.13) и условия (2.3) получаем

V0(λδ,α(δ),μδ,α(δ))J0[u0]  при  δ0,

что и означает, в силу неравенства supλ,μL2×L2,+V0(λ,μ)minuD0J0[u]=J0[u0], справедливость предельного соотношения (2.24).

Таким образом, как результат проведенных выше рассуждений, мы можем сформулировать следующую теорему сходимости метода двойственной регуляризации в задаче (OC0). Эта теорема сходимости является следствием сделанного в начале раздела 2.1.3 предположения о существовании решения задачи (OC0). По этой причине сформулированный в ней результат можно трактовать и как необходимое условие оптимальности управления u0, выраженное в секвенциальной форме.

Теорема 2.3. Пусть задача (OC0) имеет решение u0. Вне зависимости от того, существует или нет вектор Куна–Таккера в задаче (OC0), или, другими словами, разрешима или нет двойственная к ней задача, имеют место соотношения

α(δ)λδ,α(δ),μδ,α(δ)L2×L20     при     δ0, (2.25)

J0uδλδ,α(δ),μδ,α(δ)minuD0J0[u]=J0[u0]     при     δ0,

G0uδλδ,α(δ),μδ,α(δ)ω00     при     δ0,

Ε0uδλδ,α(δ),μδ,α(δ)(t)ϕδ(t),    tΠ;ϕδ2,10     при     δ0,

{λδ,α(δ),μδ,α(δ)},{Gδuδλδ,α(δ),μδ,α(δ)ωδ,Εδuδλδ,α(δ),μδ,α(δ)}L2×L20     при     δ0,

где ϕδ()L2,+ и неравенство означает включение Ε0[uδ[λδ,α(δ),μδ,α(δ)]]()ϕδ()L2,.

Элементы uδ[λδ,α(δ),μδ,α(δ)] при δ0 слабо сходятся к u0, а в случае субдифференцируемости J0 на D сходимость является сильной. Таким образом, зависящий от δ оператор R(,δ), ставящий в соответствие каждому набору исходных данных fδ, удовлетворяющих оценкам (1.6), (1.7), (1.8), элемент R(fδ,δ)uδ[λδ,α(δ),μδ,α(δ)]D, является регуляризирующим (в смысле определения 1.2) в задаче (OC0). Кроме того выполняется предельное соотношение (2.24), а в случае разрешимости двойственной к (OC0) задачи и предельное соотношение (2.4).

Замечание 2.1. Теорема 2.3 сформулирована с учетом «опоры» на предельное соотношение (2.13). Если же это предельное соотношение заменить более «сильным» предельным соотношением (2.23), то мы получаем другой вариант теоремы сходимости метода двойственной регуляризации в задаче (OC0), который отличается от сформулированного выше лишь тем, что используемое в теореме 2.3 предельное соотношение (2.25) заменяется на «аналогичное» предельное соотношение α(δ)λδ,α(δ),μδ,α(δ)L2×L220, δ0. Такой вариант теоремы сходимости используется при рассмотрении задач условной минимизации с неограниченными множествами допустимых элементов D [20–22].

2.1.4. Необходимые условия существования МПР. Как следствие теоремы 2.3 сформулируем, наконец, необходимые условия существования МПР в задаче (OC0).

Теорема 2.4. Пусть δkk=1(0,δ0] — фиксированная стремящаяся к нулю последовательность чисел. Вне зависимости от разрешимости или неразрешимости двойственной к (OC0) задачи справедливо следующее. Для того, чтобы в задаче (OC0) существовало МПР (в случае существования оно сходится слабо к решению задачи) необходимо существование стремящейся к нулю последовательности чисел kk=1[0,), а также последовательности двойственных переменных λk,μkL2×L2,+, k=1,2,, таких, что δkλk,μkL2×L20 при k и выполняются предельные соотношения

uδk[λk,μk]Dδk,k,k0,k, (2.26)

λk,μk,{Gδk[uδk[λk,μk]]ωδk,Εδk[uδk[λk,μk]]}L2×L20,k. (2.27)

Одновременно с предельным соотношением δkλk,μkL2×L20, k, и предельными соотношениями (2.26), (2.27) выполняется и предельное соотношение

limkV0(λk,μk)=supλ,μL2×L2,+V0(λ,μ)=minuD0J0[u]=J0[u0]. (2.28)

Если некоторое МПР существует, то необходимо найдется и последовательность двойственных переменных λk,μk, k=1,2,, с указанными выше свойствами, генерируемая методом двойственной регуляризации теоремы 2.3 то есть λk,μk={λδk,α(δk),μδk,α(δk)}, k=1,2,; при разрешимости двойственной задачи указанная последовательность сходится к минимальному по норме решению этой задачи. Соответствующая последовательность uδk[λk,μk], k=1,2,, будет МПР; в случае субдифференцируемости J0 на D это МПР сходится сильно при k к решению u0 задачи (OC0). То есть оператор R(,δk), ставящий в соответствие при таком выборе λk,μk, k=1,2,, каждому набору исходных данных fδk, удовлетворяющих оценкам (1.6), (1.7), (1.8) при δ=δk, элемент uδk[λk,μk]D, k=1,2,, является МПР-образующим в задаче (OC0). 

Замечание 2.2. Заметим, что ввиду ограниченности  соотношения (2.26) выполняются тогда и только тогда, когда uδk[λk,μk]D0,~k для некоторой последовательности сходящихся к нулю неотрицательных чисел ϵ~k, k=1,2,.   

Замечание 2.3. С учетом замечания 2.1 другой вариант необходимых условий существования МПР в задаче (OC0) мы получаем, если используемое в теореме 2.4 предельное соотношение δkλk,μkL2×L20, k, заменить на «аналогичное» предельное соотношение δkλk,μkL2×L220,k. При этом, как легко заметить, первое из указанных двух предельных соотношений является следствием второго.

2.2. Достаточные условия существования МПР в выпуклой задаче оптимального управления с поточечными фазовыми ограничениями

Каждому из двух вариантов необходимых условий существования МПР, о которых идет речь в замечании 2.3, подходит свой вариант указанных достаточных условий существования МПР. Так как предельное соотношение

δkλk,μkL2×L20,  k,

можно трактовать как менее жесткое по сравнению с предельным соотношением

δkλk,μkL2×L220,  k,

то ниже приводится формулировка и доказательство варианта достаточных условий, соответствующего первому из двух указанных предельных соотношений. Соответствующий второму предельному соотношению вариант достаточных условий применяется при регуляризации КУО в задачах с неограниченными множествами допустимых элементов D (см. [20–22]).

Справедлива следующая теорема, устанавливающая достаточные условия существования МПР в задаче (OC0).

Теорема 2.5. Пусть δkk=1(0,δ0] — фиксированная стремящаяся к нулю последовательность чисел. Вне зависимости от разрешимости или неразрешимости двойственной к (OC0) задачи справедливо следующее. Для того, чтобы в задаче (OC0) существовало МПР (в случае существования оно будет сходиться слабо к решению задачи) достаточно существования стремящейся к нулю последовательности чисел kk=1[0,), а также последовательности двойственных переменных λk,μkL2×L2,+, k=1,2,, таких, что δkλk,μkL2×L20, k, и выполняются соотношения (2.26), (2.27). При этом последовательность uδk[λk,μk], k=1,2,, является искомым МПР. Это МПР сильно сходится к решению u0 задачи (OC0) в случае субдифференцируемости J0 на D. Другими словами, оператор R(,δk), ставящий в соответствие каждому набору исходных данных fδk, удовлетворяющих оценкам (1.6), (1.7), (1.8) при δ=δk, элемент R(fδk,δk)uδk[λk,μk]D, является МПР-образующим в задаче (OC0). Одновременно с предельным соотношением δkλk,μkL2×L20, k, и соотношениями (2.26), (2.27) выполняется и предельное соотношение (2.28).

Доказательство. Прежде всего, напомним (см. раздел 1.2), что функционал J0 слабо полунепрерывен снизу на D; операторы G0,E0 слабо непрерывны на D, то есть переводят слабо сходящиеся в L2s последовательности управлений из D в сильно сходящиеся в L2 последовательности их образов. Указанные свойства, ввиду включения uδk[λk,μk]Dδk,k и ограниченности последовательности uδk[λk,μk], k=1,2,, обеспечивают непустоту множества D0, а следовательно, и разрешимость (однозначную) исходной задачи (OC0). Далее, так как точка uδk[λk,μk] минимизирует функционал Lδk(,λk,μk), при uD можем записать

Jδk[uδk[λk,μk]]+λk,μk,{Gδk[uδk[λk,μk]]ωδk,Εδk[uδk[λk,μk]]}L2×L2

Jδk[u]+λk,μk,{Gδk[u]ωδk,Εδk[u]}L2×L2.5pt

В силу условий теоремы (см. предельное соотношение (2.27)) отсюда следует, что при любом uD существует стремящаяся к нулю последовательность ψkk=1 неотрицательных чисел такая, что

Jδk[uδk[λk,μk]]Jδk[u]+λk,μk,{Gδk[u]ωδk,Εδk[u]}L2×L2+ψk,k=1,2,....1ex

Положим здесь u=u0 и используем ограниченность D, а также условие согласования δkλk,μkL2×L20, k. Можем записать, используя оценки (1.6), (1.13),

J0uδk[λk,μk]J0[u0]+Jδk[u0]J0[u0]+J0[uδk[λk,μk]]Jδk[uδk[λk,μk]]

+|λk,Gδk[u0]G0[u0]2,1|+|λk,ω0ωδk2,1|+|μk,Εδk[u0]Ε0[u0]2,1|+ψk

J0[u0]+C10δk+C11δkλk2,1+C12δkμk2,1+ψk,   k=1,2,,

где постоянные C10,C11,C12>0 не зависят от k. Получаем: существует стремящаяся к нулю последовательность ψ~kk=1 неотрицательных чисел такая, что

J0[uδk[λk,μk]]J0[u0]+ψ~k,k=1,2,.

Так как одновременно имеем включения uδk[λk,μk]Dδk,k, k=1,2,, а значит, в силу ограниченности D, при некоторой стремящейся к нулю последовательности ~kk=1 неотрицательных чисел и включения uδk[λk,μk]D0,~k, k=1,2,, то последовательность uδk[λk,μk], k=1,2,, является МПР в задаче (OC0). Далее, принимая во внимание снова предельное соотношение (2.27) и полученное предельное соотношение J0[uδk[λk,μk]]J0[u0], k, можем записать соотношение:

​​​​Vδk(λk,μk)=Jδk[uδk[λk,μk]]

+λk,μk,{Gδk[uδk[λk,μk]]ωδk,Εδk[uδk[λk,μk]]}L2×L2J0[u0],    k,

а следовательно, и предельное соотношение (2.28) в силу оценки (2.2) и предельного соотношения δkλk,μkL2×L20, k. 

2.3. Регуляризованные принцип Лагранжа и принцип максимума Понтрягина в выпуклой задаче оптимального управления с поточечными фазовыми ограничениями

2.3.1. Регуляризованный принцип Лагранжа. «Объединив» теоремы 2.4, 2.5, сформулируем, наконец, регуляризованные принцип Лагранжа и принцип максимума Понтрягина в форме критериев существования МПР в выпуклой задаче оптимального управления с поточечными фазовыми ограничениями. Регуляризованный принцип Лагранжа (ввиду регулярности функций Лагранжа его можно называть также регуляризованной теоремой Куна–Таккера) можно записать в следующем виде.  

Теорема 2.6. Пусть δkk=1(0,δ0] — фиксированная стремящаяся к нулю последовательность чисел. Вне зависимости от разрешимости или неразрешимости двойственной к (OC0) задачи справедливо следующее. Для того, чтобы в задаче (OC0) существовало МПР (в случае существования оно будет слабо сходиться к точному решению задачи), необходимо и достаточно, чтобы существовала последовательность двойственных переменных {λk,μk}L2×L2,+, k=1,2,, такая, что δkλk,μkL2×L20, k, и выполнялись предельные соотношения (2.26), (2.27). При этом последовательность uδk[λk,μk], k=1,2,, является искомым МПР, сходящимся сильно к решению u0 задачи (OC0) в случае субдифференцируемости J0 на D. Другими словами, оператор R(,δk), ставящий в соответствие каждому набору исходных данных fδk,  удовлетворяющих оценкам (1.6), (1.7), (1.8) при δ=δk, элемент R(fδk,δk)uδk[λδk,α(δk),μδk,α(δk)]D, является МПР-образующим в задаче (OC0).

Одновременно с предельным соотношением δkλk,μkL2×L20, k, и соотношениями (2.26), (2.27) выполняется и предельное соотношение (2.28). В качестве последовательности {λk,μk},k=1,2,, может быть взята генерируемая методом двойственной регуляризации теоремы 2.3  последовательность {λδk,α(δk),μδk,α(δk)}, k=1,2,, сходящаяся к минимальному по норме решению двойственной задачи в случае разрешимости последней.

2.3.2. О минимизации функции Лагранжа. Ключевой задачей процедуры двойственной регуляризации процесса приближенного решения задачи (OC0) является задача минимизации функционала Лагранжа Lδ(u,λ,μ),   λ,μL2×L2,+, задачи (OCδ)

Lδ(u,λ,μ)min,uD, (2.29)

решение которой мы обозначили через uδ[λ,μ]. Для упрощения изложения предположим, что при каждом δ0,δ0 функционалы Kδ[z]:L2mR,Mδ[u]:L2sR дифференцируемы по Фреше, а функция Fδ(t,y):Π×RrR дифференцируема по y на Rr при каждом tΠ. Тогда при каждом δ0,δ0 дифференцируемы по Фреше на L2s оператор Εδ[] (рассматриваем его как оператор из L2s в L2) и функционал Лагранжа Lδ(,λ,μ). В этом случае решение uδ[λ,μ] задачи (2.29) удовлетворяет критерию минимума

Lδu/uδ[λ,μ],λ,μuuδ[λ,μ]0,uD, (2.30)

где Lδu/u¯,λ,μ. — производная Фреше функционала Lδ(u,λ,μ) по переменной u в точке u¯L2s при фиксированных λ,μ. Пусть Ψδ[u¯,λ,μ]()L2s — функция Рисса функционала Lδu/u¯,λ,μ.L2s*. Критерий (47) можно записать в виде

Ψδ[uδ[λ,μ],λ,μ],uuδ[λ,μ]2,s0,uD. (2.31)

Найдем представление функции Ψδ[u¯,λ,μ](t),tΠ, в терминах задачи (OCδ), δ>0.

Непосредственно вычисляя, получаем

Lδu/u¯,λ,μv=ϕδu¯,v2,s+ψδu¯,λ,μ,Bδ[v]2,m,vL2s,   u¯L2s, (2.32)

здесь ϕδu¯()L2s — функция Рисса функционала Muδ/​​u¯L2s*, а ψδu¯,λ,μ()L2m — функция, которая задается формулой

ψδu¯,λ,μ()=Sδ*ϕ1δu¯+ϕ2δu¯,λ+ϕ3δu¯,μ(), (2.33)

где ϕ1δu¯(), ϕ2δu¯,λ() и ϕ3δu¯,μ() — функции Рисса принадлежащих классу L2m* функционалов Kδz/zu¯δ, ϒδ*​​λΞδ и Σδ*​​[μ()(Fδy/,Σδzu¯δ())*] соответственно.

Так как Sδ*(EAδ1)*=EAδ*1=EAδ*1, где E — единичный оператор в L2m, то определяемая формулой (2.33) и входящая в (2.32) функция ψδ[u¯,λ,μ] есть (единственное в L2m) решение уравнения

ψ(t)Aδ*[ψ](t)=ϕ1δu¯(t)+ϕ2δu¯,λ(t)+ϕ3δu¯,μ(t),tΠ,ψL2m. (2.34)

Переписав (2.32) в виде Lδu/u¯,λ,μv=Bδ*ψδ[u¯,λ,μ]+ϕδ[u¯],  v2,s, vL2s, находим искомое представление функции Ψδ[u¯,λ,μ] в терминах задачи (OCδ):

Ψδ[u¯,λ,μ](t)=Bδ*ψδ[u¯,λ,μ](t)+ϕδ[u¯](t),tΠ, (2.35)

в котором ψδ[u¯,λ,μ] — единственное в  решение уравнения (2.34).

2.3.3. Случай ограниченных управлений. Рассмотрим задачу (OC0) в ситуации, когда допустимые управления принимают значения из некоторого ограниченного замкнутого и выпуклого множества URs, то есть Du()Ls:u(t)U,  tΠ. В этом случае получаем из (2.31) критерий минимума функционала Лагранжа в виде следующего линеаризованного поточечного принципа максимума.

Лемма 2.8. Функция u¯()D есть решение задачи (2.29) тогда и только тогда, когда

Ψδ[u¯,λ,μ](t),u¯(t)s=maxwUΨδ[u¯,λ,μ](t),ws     прип.в.     tΠ,(2.36)

где Ψδ[u¯,λ,μ] задается формулой (2.35), в которой ψδ[u¯,λ,μ] — решение (2.34).

Доказательство. Необходимость для решения u¯ задачи (2.29) условия (2.36) доказывается простейшим игольчатым варьированием, а достаточность получается стандартным применением теоремы А. А. Ляпунова (см., например, [14, § 2.4, § 8.2]).

Обозначим через Umδ[λ,μ] множество всех управлений из D, удовлетворяющих (при сформулированных выше дополнительных условиях дифференцируемости) принципу максимума леммы 2.8. В нашем случае, благодаря сильной выпуклости целевого функционала, множество Umδ[λ,μ] состоит из одного элемента, обозначим его через umδ[λ,μ]. Очевидно, что umδ[λ,μ]=uδ[λ,μ]. То есть непосредственно из теоремы 2.6 и леммы 2.8 получаем следующий регуляризованный поточечный принцип максимума для задачи (OC0).  

Теорема 2.7. При сформулированных выше дополнительных условиях дифференцируемости все утверждения теоремы 2.6 останутся справедливыми, если в них uδkλk,μk заменить везде на umδkλk,μk.

3. Пример. Оптимизационная задача с поточечными фазовыми ограничениями для управляемой системы с запаздыванием

Естественный переход от начально-краевой задачи к эквивалентному ей функциональному уравнению II рода вольтеррова типа осуществляется с помощью обращения главной части задачи. Разнообразные конкретные примеры начально-краевых задач (для параболических, гиперболических, интегродифференциальных уравнений с частными производными и систем таких уравнений, различных уравнений с запаздывающим аргументом и др.), которые допускают эквивалентное описание с помощью функциональных уравнений вольтеррова типа, можно найти, например, в [7] (см. также обзор в [11]). Из множества самых различных подобных начально-краевых задач мы для иллюстрации изложенной выше теории выбрали начальную задачу для системы с запаздыванием. В примере выписываются те основные конструкции, которые и участвуют в формулировке регуляризованных КУО (формирующая критерий минимума функционала Лагранжа функция, сопряженное уравнение, ). Сформулировать с их помощью соответствующие регуляризованные КУО — конкретные реализации сформулированных выше теорем уже не сложно.

Пусть n=1; Π=[0,1]; ρ(0,1) — фиксированное число; ηRm — фиксированный вектор; a(),b()L2m×m, d()Lm×s, ξ()Cm[ρ,0] — фиксированные функции. Рассмотрим начальную задачу для линейной управляемой системы дифференциальных уравнений с запаздывающим аргументом (x()m-вектор-функция)

x˙=a(t)x(t)+b(t)x(tρ)+d(t)u(t),t[0,1]; (3.1)

 x(t)=ξ(t),    t[ρ,0);x(0)=η, (3.2)

где u()L2s — управление. Решение начальной задачи (3.1), (3.2) понимаем как решение в смысле «почти всюду» из пространства W21[0,1]mабсолютно непрерывных на отрезке [0,1] функций с квадратично суммируемыми первыми производными, рассматривая первое из условий (3.2) как требуемое в (3.1) условие доопределения x(t) слева от t=0: x(tρ)=ξ(tρ) при tρ<0. Приведем задачу (3.1), (3.2) к эквивалентному уравнению вида (1.1), показав тем самым, что каждому u()L2s отвечает единственное в классе W функций x()W21[0,1]m, удовлетворяющих второму условию (3.2), решение этой задачи. Для этого сделаем в (3.1), (3.2) замену по формуле

x(t)=η+0tz(ζ)dζ,t[0,1], (3.3)

устанавливающей взаимно однозначное соответствие между классом W функций x() и пространством L2m функций z() (такое преобразование задачи (3.1), (3.2) естественно назвать обращением главной части этой задачи). «Подставляя» (3.3) в (3.1) (с учетом при t[0,ρ) первого условия (3.2)), получаем

z(t)=a(t)η+a(t)0tz(ζ)dζ+b(t)η+b(t)0tρz(ζ)dζ+d(t)u(t),t[ρ,1], (3.4)

z(t)=a(t)η+a(t)0tz(ζ)dζ+b(t)ξ(tρ)+d(t)u(t),t[0,ρ). (3.5)

Положим χ(t){ξ(tρ),  t[0,ρ);  η,  t[ρ,1]},  t[0,1]; Λ1[z](t)0tz(ζ)dζ, Λ2[z](t){0m,  t[0,ρ];  0tρz(ζ)dζ,  t(ρ,1]}, z()L2m. Запишем (3.4), (3.5) в виде

z(t)=a(t)η+Λ1[z](t)+b(t)χ(t)+Λ2[z](t)+d(t)u(t)

a(t)Λ1[z](t)+b(t)Λ2[z](t)+d(t)u(t)+a(t)η+b(t)χ(t),tΠ.   (3.6)

Уравнение (3.6) и есть уравнение вида (1.1), эквивалентное начальной задаче (3.1), (3.2). Здесь Π[0,1]; A[z](t)a(t)Λ1[z](t)+b(t)Λ2[z](t),z()L2m,tΠ (квазинильпотентность оператора A[]:L2mL2m легко проверяется, например, с помощью цепочечного признака [8, теорема 2], см. также [11, c. 269]); B[u](t)d(t)u(t), u()L2s, tΠc(t)a(t)η+b(t)χ(t), tΠ. Если x()W — решение задачи (3.1), (3.2) при некотором u()L2s, то связанная с x() формулой (3.3) функция z()L2m есть решение уравнения (3.6) при том же u(). И наоборот, если z()L2m — решение уравнения (3.6) при данном u()L2s, то функция x(), связанная с z() формулой (3.3), есть решение класса W задачи (3.1), (3.2) при этом u(). Отвечающие управлению u()L2s решения задачи (3.1)–(3.2) и уравнения (3.6) обозначим через xu и zu соответственно.

Пусть задано следующее: функции Q()Cm, γ()C; непрерывная выпуклая функция F():RmR; выпуклое ограниченное и замкнутое множество D пространства L2s. Рассмотрим задачу оптимального управления системой (3.1), (3.2) c минимизируемым целевым функционалом J[u]u2,s2,uL2s, при ограничениях

Q(t),x(t)m=γ(t)    (tΠ),F(x(t))0    (tΠ),x()W21[0,1]m, (3.7)

и множестве допустимых управлений D. Эту задачу символически запишем в виде

J[u]min,    (54),    (54)(55),    (54)(55)(60),    uD. (3.8)

Сделав в задаче (3.8) замену (3.3), получим следующую эквивалентную задачу оптимизации управляемой системы (3.6):

J[u]min,Pzu(t)=γ(t)Q(t),ηm    (tΠ),   F(η+Λ1[zu](t))0    (tΠ),  uD,

где Pz(t)Q(t),Λ1[z](t)m, zL2m (tΠ). Это задача (4) с n=1; Π=[0,1]; J[u]=J[u] (K[z]0, M[u]=J[u]); G[u]=P[zu] (Ξ(t)=Q(t), ϒ[z](t)=Λ1[z](t), q=m); ω(t)=γ(t)Q(t),ηm; E[u](t)=F(η+Λ1[zu](t)) (F(t,y)=F(η+y), Σ[z](t)=Λ1[z](t), r=m).

Пусть fη,a,b,d,ξ;Q,γ;F — набор данных задачи (3.8), которые подвергаются возмущению, и точный набор f0η0,a0,b0,d0,ξ0;Q0,γ0;F0 нам не известен, но можно оперировать с приближенными наборами fδηδ,aδ,bδ,dδ,ξδ;Qδ,γδ;Fδ, δ(0,δ0] (δ0>0 фиксировано), которые связаны с набором f0 следующими условиями 3.1–3.3.

Условие 3.1. Функция Fδ():RmR липшицева на каждом ограниченном множестве, причем липшицевость равномерна по параметру δ[0,δ0], то есть существует неубывающая функция L1():R+R+ такая, что для любых l>0 и δ[0,δ0] выполнено Fδ(y1)Fδ(y2)L1(l)y1y2m при y1m,y2ml. 

Условие 3.2. Существует постоянная C>0 такая, что при любом δ(0,δ0] величины ηδη0m, aδa02,m×m, bδb02,m×m, ξδξ0Cm[ρ,0],dδd0,m×s, γδγ0C, QδQ0C,m  не превосходят величины Cδ. 

Условие 3.3. Существует неубывающая функция L2():R+R+ такая, что для каждого l>0 и любого δ[0,δ0] имеем Fδ(y)F0(y)L2(l)δ при yml. 

При любом δ[0,δ0] мы имеем управляемую начальную задачу

x˙=aδ(t)x(t)+bδ(t)xtρ+dδ(t)u(t),t[0,1]; (3.9)

x(t)=ξδ(t),t[ρ,0);x(0)=ηδ, (3.10)

набор ограничений

Qδ(t),x(t)m=γδ(t)    (tΠ),Fδ(x(t))0    (tΠ),x()W21[0,1]m, (3.11)

и задачу оптимизации системы (3.9)–(3.10) c минимизируемым функционалом цели J[u] при ограничениях (3.11) и множестве допустимых управлений D. Эту задачу оптимального управления символически запишем в виде

J[u]min,      uD. (3.9), (3.10), (3.11) (3.12)

Пусть xuδ() — отвечающее управлению u() решение начальной задачи (3.9), (3.10).

Сделав в задаче (3.12) замену x(t)=ηδ+0tz(ζ)dζ, t[0,1], соответствующую обращению главной части начальной задачи (3.9), (3.10), получим эквивалентную задачу оптимизации управляемой системы

z(t)=aδ(t)Λ1[z](t)+bδ(t)Λ2[z](t)+dδ(t)u(t)+aδ(t)ηδ+bδ(t)χδ(t),tΠ, (3.13)

где χδ(t){ξδ(tρ),  t[0,ρ);  ηδ,  t[ρ,1]}, tΠ. Эту задачу запишем в виде

​​​​​​​​​J[u]min,

​​​​​Pδzuδ(t)=γδ(t)Qδ(t),ηδm   (tΠ),   Fδηδ+Λ1zuδ(t)0   (tΠ),   uD, (3.14)

где Pδz(t)Qδ(t),Λ1[z](t)m, zL2m (tΠ), zuδ — отвечающее u решение (3.13).

Положив Aδ[z](t)aδ(t)Λ1[z](t)+bδ(t)Λ2[z](t), tΠ, zL2m Bδ[u](t)dδ(t)u(t), tΠ, uL2scδ(t)aδ(t)ηδ+bδ(t)χδ(t), tΠ, переписываем (3.13) в форме (1.9). Задача (3.14) имеет вид (OCδ), здесь: Jδ[u]=J[u] (Kδ[z]0, Mδ[u]=J[u]); Gδ[u]=Pδ[zuδ]Qδ(t),Λ1[zuδ](t)m (Ξδ(t)=Qδ(t), ϒδ[z](t)=Λ1[z](t), q=m); ωδ(t)=γδ(t)Qδ(t),ηδm; Eδ[u](t)=Fδ(ηδ+Λ1[zuδ](t)) (Fδ(t,y)=Fδ(ηδ+y), Σδ[z](t)=Λ1[z](t), r=m).

При сделанных относительно семейства задач (3.12), δ[0,δ0], предположениях семейство задач (3.14), δ[0,δ0], удовлетворяет условиям А–Д. Действительно, выполнение условий А, Б и В проверяется элементарными выкладками, исходя из предположений в условиях 3.1, 3.2, условии 3.2 и условиях 3.2, 3.3 соответственно. Выполнение условия Г следует из цепочечного признака равностепенной квазинильпотентности [11, теорема 2].

Для проверки выполнения условия Д заметим, что для каждого uL2s при tΠ, используя обозначение ι(t,ζ)1,  0ζt;  0,  t<ζ1, 0t1,0ζ1, получаем

ϒδzuδ(t)=Σδzuδ(t)=Λ1zuδ(t)=01ι(t,ζ)zuδ(ζ)dζ=01ι(t,ζ)SδBδ[u]+cδ(ζ)dζ.

Рассмотрим сначала случай m=s=1. Переходя к сопряженным операторам, получаем

ϒδzuδ(t)=Σδzuδ(t)=01​​Bδ*Sδ*ι(t,)(ζ)u(ζ)dζ+01​​Sδ*ι(t,)(ζ)cδ(ζ)dζ,  tΠ,  uL2,

что, очевидно, означает выполнение условия Д. Проверка выполнения Д в общем случае аналогична — можно воспользоваться матричным представлением S и B.

Предположив, что функции Fδ(), δ(0,δ0], дифференцируемы, можем выписать для нашего примера критерии (2.31) и (2.36) решения задачи (2.29). Прямые вычисления дают: ϕ1δ[u¯](t)0, ϕ2δ[u¯,λ](t)t1λ(ξ)Qδ(ξ)dξ, ϕ3δ[u¯,μ](t)t1μ(ξ)Fδy/xu¯δ(ξ)*dξ, tΠ. По определению сопряженного оператора

(Aδ)*[ψ](t)Λ1*[aδ*ψ](t)+Λ2*(bδ*ψ](t),   tΠ,   ψL2m;

Λ1*y(t)t1y(ζ)dζ,

Λ2*y(t){t+ρ1y(ζ)dζ,  0t1ρ;   0m,1ρ<t1},   tΠ,   yL2m.1ex

То есть уравнение (2.34) можно записать в виде

ψ(t)t1aδ(ζ)*ψ(ζ)dζ=hδ[u¯,λ,μ](t),   1ρt1;ψ(t)t1aδ(ζ)*ψ(ζ)dζt+ρ1bδ(ζ)*ψ(ζ)dζ=hδ[u¯,λ,μ](t),   0t1ρ, (3.15)

где hδ[u¯,λ,μ](t)t1{λ(ξ)Qδ(ξ)+μ(ξ)Fδy/(xu¯δ(ξ))*}dξ, tΠ. Формирующая критерии (2.31) и (2.36), которым удовлетворяет решение uδ[λ,μ] задачи (2.29), функция Ψδ[u¯,λ,μ] задается формулой

Ψδ[u¯,λ,μ](t)dδ(t)*ψδ[u¯,λ,μ](t)+2u¯(t),   tΠ,

где ψδ[u¯,λ,μ] — решение сопряженного уравнения (3.15). Это уравнение вольтеррова типа. Единственное в L2m решение ψδ[u¯,λ,μ] уравнения (3.15) абсолютно непрерывно на Π и принадлежит классу (W21(Π))m. Уравнение (3.15) эквивалентно системе уравнений

ψ˙+aδ(t)*ψ(t)=λ(t)Qδ(t)μ(t)(Fδy/xu¯δ(t))*,   1ρt1;ψ(1)=0; (3.16)

ψ˙+aδ(t)*ψ(t)+bδ(t+ρ)*ψ(t+ρ)

=λ(t)Qδ(t)μ(t)(Fδy/xu¯δ(t))*,   0t1ρ;(3.17)

ψ(1ρ)=1ρ1aδ(ζ)*ψ(ζ)+λ(ζ)Qδ(ζ)+μ(ζ)(Fδy/xu¯δ(ζ))*dζ,(3.18)

состоящей из задачи Коши (3.16) для обыкновенного дифференциального уравнения, рассматриваемого на отрезке 1ρt1, с условием Коши в точке t=1, и начальной задачи (3.17), (3.18) для рассматриваемого на отрезке 0t1ρ дифференциального уравнения с опережением (3.17), в которой условие (3.18) играет роль условия Коши в точке t=1ρ; требуемое в (3.17) и (3.18) доопределение функции ψ справа от точки t=1ρ обеспечивается задачей Коши (3.16).

×

Об авторах

Владимир Иосифович Сумин

ФГБОУ ВО «Тамбовский государственный университет им. Г. Р. Державина»; ФГАОУ ВО «Нижегородский государственный университет им. Н. И. Лобачевского»

Автор, ответственный за переписку.
Email: v_sumin@mail.ru
ORCID iD: 0000-0002-7479-2181

доктор физико-математических наук, ведущий научный сотрудник, Тамбовский государственный университет им. Г. Р. Державина; профессор, Нижегородский государственный университет им. Н. И. Лобачевского

Россия, 392000, Тамбов, ул. Интернациональная, 33; 603950, Нижний Новгород, пр-т Гагарина, 23

Михаил Иосифович Сумин

ФГБОУ ВО «Тамбовский государственный университет им. Г. Р. Державина»; ФГАОУ ВО «Нижегородский государственный университет им. Н. И. Лобачевского»

Email: m.sumin@mail.ru
ORCID iD: 0000-0002-3700-6428

доктор физико-математических наук, ведущий научный сотрудник, Тамбовский государственный университет им. Г. Р. Державина; профессор, Нижегородский государственный университет им. Н. И. Лобачевского

Россия, 392000, Тамбов, ул. Интернациональная, 33; 603950, Нижний Новгород, пр-т Гагарина, 23

Список литературы

  1. В. И. Сумин, М. И. Сумин, “Регуляризованные классические условия оптимальности в итерационной форме для выпуклых задач оптимизации распределенных систем вольтеррова типа” , Вестник Удмуртского университета. Математика. Механика. Компьютерные на¬уки, 31:2 (2021), 265–284. [V. I. Sumin, M. I. Sumin, “Regularized classical optimality conditions in iterative form for convex optimization problems for distributed Volterra-type systems”, Vestnik Udmurtskogo universiteta. Matematika. Mekhanika. Komp‘yuternye nauki, 31:2 (2021), 265–284 (In Russian)].
  2. В. И. Сумин, М. И. Сумин, “Регуляризация классических условий оптимальности в задачах оптимального управления линейными распределенными системами вольтеррова типа”, Журн. вычисл. матем. и матем. физ., 62:1 (2022), 45–70; англ. пер.:V. I. Sumin, M. I. Sumin, “Regularization of the classical optimality conditions in optimal control problems for linear distributed systems of Volterra type”, Comput. Math. Math. Phys., 62:1 (2022), 42–65.
  3. В. И. Сумин, М. И. Сумин, “О регуляризации принципа Лагранжа в задачах оптимизации линейных распределенных систем вольтеррова типа с операторными ограничениями”, Известия Института математики и информатики Удмуртского государствен¬ного университета, 59 (2022), 85–113. [V. I. Sumin, M. I. Sumin, “On regularization of the Lagrange principle in the optimization problems for linear distributed Volterra type systems with operator constraints”, Izvestiya Instituta Matematiki i Informatiki Udmurtskogo Gosudarstvennogo Universiteta, 59 (2022), 85–113 (In Russian)].
  4. В. И. Сумин, М. И. Сумин Об итеративной регуляризации принципа Лагранжа в выпуклых задачах оптимального управления распределенными системами вольтеррова типа с операторными ограничениями, Дифференциальные уравнения, 58:6 (2022), 795–812; англ. пер.:V. I. Sumin, M. I. Sumin, “On the iterative regularization of the Lagrange principle in convex optimal control problems for distributed systems of the Volterra type with operator constraints”, Differ. Equ., 58:6 (2022), 791–809.
  5. В. И. Сумин, М. И. Сумин, “Регуляризация классических условий оптимальности в задачах оптимизации линейных систем вольтеррова типа с функциональными ограничениями”, Вестник российских университетов. Математика, 28:143 (2023), 298–325. [V. I. Sumin, M. I. Sumin, “Regularization of classical optimality conditions in optimization problems for linear Volterra-type systems with functional constraints”, Vestnik rossiyskikh universitetov. Matematika = Russian Universities Reports. Mathematics, 28:143 (2023), 298–325 (In Russian)].
  6. В. И. Сумин, М. И. Сумин О регуляризации классических условий оптимальности в выпуклых задачах оптимизации систем вольтеррова типа с операторными ограничениями, Дифференциальные уравнения, 60:2 (2024), 237–259; англ. пер.:V. I. Sumin, M. I. Sumin, “On regularization of classical optimality conditions in convex optimization problems for Volterra type systems with operator constraints”, Differ. Equ., 60:2 (2024), 227–246.
  7. В. И. Сумин, Функциональные вольтерровы уравнения в теории оптимального управления распределенными системами, Изд-во Нижегородского госуниверситета, Нижний Новгород, 1992. [V. I. Sumin, Functional Volterra Equations in the Theory of Optimal Control of Distributed Systems, Publishing House of Nizhnii Novgorod State University, Nizhnii Novgorod, 1992 (In Russian)].
  8. В. И. Сумин, A. В. Чернов, “Операторы в пространствах измеримых функций: вольтерровость и квазинильпотентность”, Дифференциальные уравнения, 34:10 (1998), 1402–1411; англ. пер.:V. I. Sumin, A. V. Chernov, “Operators in the spaces of measurable functions: the Volterra property and quasinilpotency”, Differ. Equ., 34:10 (1998), 1403–1411.
  9. И. Ц. Гохберг, М. Г. Крейн, Теория вольтерровых операторов в гильбертовом пространстве и ее приложения, Наука, М., 1967; англ. пер.:I. Ts. Gokhberg, M. G. Krein, Theory and Applications of Volterra Operators in Hilbert Space, American Mathematical Society, Providence, 1970.
  10. В. И. Сумин, “Функционально-операторные вольтерровы уравнения в теории оптимального управления распределенными системами”, Докл. АН СССР, 305:5 (1989), 1056–1059; англ. пер.:V. I. Sumin, “Volterra functional-operator equations in the theory of the optimal control of distributed systems”, Sov. Math., Dokl., 39:2 (1989), 374–378.
  11. В. И. Сумин, “Управляемые вольтерровы функциональные уравнения и принцип сжимающих отображений”, Тр. Ин-та математики и механики УрО РАН, 25:1 (2019), 262–278. [V. I. Sumin, “Controlled Volterra functional equations and the contraction mapping principle”, Trudy Inst. Mat. Mekh. UrO RAN, 25:1 (2019), 262–278 (In Russian)].
  12. В. И. Сумин, “Управляемые вольтерровы функциональные уравнения в лебеговых пространствах” , Вестн. Нижегород. ун-та. Математическое моделирование и оптимальное управление, 1998, № 2(19), 138–151. [V. I. Sumin, “Controlled Volterra functional equations in Lebesgue spaces”, Vestn. Nizhegorod. un-ta. Matematicheskoe modelirovanie i optimal‘noe upravlenie, 1998, № 2(19), 138–151 (In Russian)].
  13. Р. В. Гамкрелидзе, “Оптимальные процессы управления при ограниченных фазовых координатах”, Изв. АН СССР. Сер. матем., 24:3 (1960), 315–356. [R. V. Gamkrelidze, “Optimal control processes for bounded phase coordinates”, Izv. Akad. Nauk SSSR Ser. Mat., 24:3 (1960), 316–356 (In Russian)].
  14. А. Д. Иоффе, В. М. Тихомиров, Теория экстремальных задач, Наука, М., 1974; англ. пер.:A. D. Ioffe, V. M. Tikhomirov, Theory of Extremal Problems, North-Holland Publishing Company, Amsterdam–New York–Oxford, 1979.
  15. А. В. Арутюнов, Условия экстремума. Анормальные и вырожденные задачи, Факториал, М., 1997; англ. пер.:A. V. Arutyunov, Optimality conditions: Abnormal and Degenerate Problems, Kluwer Academic Publishers, Dordrecht–Boston–London, 2000.
  16. А. А. Милютин, А. В. Дмитрук, Н. П. Осмоловский, Принцип максимума в оптимальном управлении, Центр прикладных исследований мехмата МГУ, М., 2004. [A. A. Milyutin, A. V. Dmitruk, N. P. Osmolovsky, The Maximum Principle in Optimal Control, Center for Applied Research of the Faculty of Mechanics and Mathematics of Moscow State University, Moscow, 2004 (In Russian)].
  17. М. И. Сумин, “Регуляризация в линейно выпуклой задаче математического программирования на основе теории двойственности”, Журн. вычисл. матем. и матем. физ., 47:4 (2007), 602–625; англ. пер.:M. I. Sumin, “Duality-based regularization in a linear convex mathematical programming problem”, Comput. Math. Math. Phys., 47:4 (2007), 579–600.
  18. М. И. Сумин, “Параметрическая двойственная регуляризация для задачи оптимального управления с поточечными фазовыми ограничениями” , Журн. вычисл. матем. и матем. физ., 49:12 (2009), 2083–2102; англ. пер.:M. I. Sumin, “Parametric dual regularization for an optimal control problem with pointwise state constraints”, Comput. Math. Math. Phys., 49:12 (2009), 1987–2005.
  19. М. И. Сумин, “Регуляризованная параметрическая теорема Куна–Таккера в гильбертовом пространстве”, Журн. вычисл. матем. и матем. физ., 51:9 (2011), 1594–1615; англ. пер.:M. I. Sumin, “Regularized parametric Kuhn–Tucker theorem in a Hilbert space”, Comput. Math. Math. Phys., 51:9 (2011), 1489–1509.
  20. М. И. Сумин, “ Регуляризованные принцип Лагранжа и принцип максимума Понтрягина в оптимальном управлении и обратных задачах”, Тр. Ин-та математики и механики УрО РАН, 25:1 (2019), 279–296. [M. I. Sumin, “Regularized Lagrange principle and Pontryagin maximum principle in optimal control and in inverse problems”, Trudy Inst. Mat. Mekh. UrO RAN, 25:1 (2019), 279–296 (In Russian)].
  21. М. И. Сумин, “Принцип Лагранжа и его регуляризация как теоретическая основа устойчивого решения задач оптимального управления и обратных задач” , Вестник российских университетов. Математика, 26:134 (2021), 151–171. [M. I. Sumin, “Lagrange principle and its regularization as a theoretical basis of stable solving optimal control and inverse problems”, Vestnik rossiyskikh universitetov. Matematika = Russian Universities Reports. Mathematics, 26:134 (2021), 151–171 (In Russian)].
  22. М. И. Сумин, “О некорректных задачах, экстремалях функционала Тихонова и регуляризованных принципах Лагранжа”, Вестник российских университетов. Математика, 27:137 (2022), 58–79. [M. I. Sumin, “On ill-posed problems, extremals of the Tikhonov functional and the regularized Lagrange principles”, Vestnik rossiyskikh universitetov. Matematika = Russian Universities Reports. Mathematics, 27:137 (2022), 58–79 (In Russian)].
  23. Дж. Варга, Оптимальное управление дифференциальными и функциональными уравнениями, Наука, М., 1977; англ. ориг.:J. Warga, Optimal Control of Differential and Functional Equations, Academic Press, New York, 1972.
  24. Е. Г. Гольштейн, Теория двойственности в математическом программировании и ее приложения, Наука, М., 1971. [E. G. Golshtein, Duality Theory in Mathematical Programming and Its Applications, Nauka Publ., Moscow, 1971 (In Russian)].
  25. М. И. Сумин, “О регуляризации классических условий оптимальности в выпуклых задачах оптимального управления”, Тр. Ин-та математики и механики УрО РАН, 26:2 (2020), 252–269. [M. I. Sumin, “On regularization of the classical optimality conditions in convex optimal control problems”, Trudy Inst. Mat. Mekh. UrO RAN, 26:2 (2020), 252–269 (In Russian)].
  26. M. I. Sumin, “Regularization of Pontryagin maximum principle in optimal control of distributed systems”, Ural Math. J., 2:2 (2016), 72–86.
  27. Ф. П. Васильев, Методы оптимизации: В 2-х кн., МЦНМО, М., 2011. [F. P. Vasil’ev, Optimization Methods: in 2 books, MCCME, Moscow, 2011 (In Russian)].
  28. Ж.-П. Обен, Нелинейный анализ и его экономические приложения, Мир, М., 1988; франц. ориг.:J. -P. Aubin, L’analyse non Lineaire et ses Motivations Economiques, Masson, Paris–New York, 1984.
  29. Ф. Кларк, Оптимизация и негладкий анализ, Наука, М., 1988; англ. ориг.:F. H. Clarke, Optimization and Nonsmooth Analysis, A Wiley–Interscience Publication John Wiley and Sons, New York–Chichester–Brisbane–Toronto–Singapore, 1983.
  30. Ж.-П. Обен, И. Экланд, Прикладной нелинейный анализ, Мир, М., 1988; англ. ориг.:J. - P. Aubin, I. Ekeland, Applied Nonlinear Analysis, Wiley, New York, 1984.

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML


Creative Commons License
Эта статья доступна по лицензии Creative Commons Attribution 4.0 International License.

Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».