Регуляризация классических условий оптимальности
- Авторы: Сумин В.И.1,2, Сумин М.И.1,2
-
Учреждения:
- ФГБОУ ВО «Тамбовский государственный университет им. Г. Р. Державина»
- ФГАОУ ВО «Нижегородский государственный университет им. Н. И. Лобачевского»
- Выпуск: Том 29, № 148 (2024)
- Страницы: 455-484
- Раздел: Статьи
- URL: https://journals.rcsi.science/2686-9667/article/view/277705
- DOI: https://doi.org/10.20310/2686-9667-2024-29-148-455-484
- ID: 277705
Цитировать
Полный текст
Аннотация
Рассматривается регуляризация классических условий оптимальности(КУО) — принципа Лагранжа (ПЛ) и принципа максимума Понтрягина (ПМП) — в выпуклой задаче оптимального управлении с сильно выпуклым целевым функционалом и с поточечными фазовыми ограничениями типа равенства и неравенства. Управляемая система задается линейным функционально-операторным уравнением II рода общего вида в пространстве основной оператор правой части уравнения предполагается квазинильпотентным. Получение регуляризованных КУО основано на методе двойственной регуляризации. Основное предназначение регуляризованных ПЛ и ПМП — устойчивое генерирование минимизирующих приближенных решений (МПР) в смысле Дж. Варги. Регуляризованные КУО: 1) формулируются как теоремы существования в исходной задаче МПР с одновременным конструктивным представлением этих решений; 2) выражаются в терминах регулярных классических функций Лагранжа и Гамильтона–Понтрягина; 3) «преодолевают» свойства некорректности КУО и дают регуляризирующие алгоритмы для решения оптимизационных задач. Статья продолжает серию работ авторов по регуляризации КУО для ряда канонических задач оптимального управления линейными распределенными системами вольтеррова типа. В качестве приложения полученных в работе «абстрактных результатов» в ее заключительной части рассматривается регуляризация КУО в конкретной оптимизационной задаче с поточечными фазовыми ограничениями типа равенства и неравенства для управляемой системы с запаздыванием.
Полный текст
Введение
Данная статья продолжает серию работ авторов [1–6] по регуляризации классических условий оптимальности (КУО) — принципа Лагранжа (ПЛ) и принципа максимума Понтрягина (ПМП) — для ряда канонических задач оптимального управления линейными распределенными системами вольтеррова типа. Системами вольтеррова типа мы называем управляемые системы, которые могут быть описаны линейными функциональными (иначе, функционально-операторными) уравнениями II рода общего вида с квазинильпотентным основным линейным оператором правой части. Подобным свойством обладают, прежде всего, различного рода вольтерровы операторы. Заметим, что название «вольтерровы операторы» (операторы типа Вольтерра) присваивалось разными авторами различным классам операторов со сходными свойствами (используются также названия: причинные операторы, наследственные операторы и др.), начиная с известных работ L. Tonelli (1929) и А. Н. Тихонова (1938); см., например, краткий обзор определений вольтерровых операторов [7, Дополнение], а также [6, 8]. В случае линейных операторов эти определения так или иначе связаны со свойством квазинильпотентности: либо это свойство включено в само определение вольтеррова оператора (см., например, [9, с. 10]), либо при естественных условиях следует из этого определения (см., например, цепочечный признак квазинильпотентности [8, теорема 2], опирающийся на определение [10] функционального оператора, «вольтеррова на системе множеств», являющееся многомерным обобщением определения А. Н. Тихонова). Поэтому такие уравнения можно назвать функциональными уравнениями вольтеррова типа.
К уравнениям вольтеррова типа естественным образом (обращением главной части) сводятся самые разнообразные начально-краевые задачи для различных уравнений с частными производными (гиперболических, параболических, интегро-дифференциальных, систем таких уравнений, уравнений с запаздываниями разного рода и др., см. разнообразные конкретные примеры в [7, глава 2], обзоры в [7, 11]). Это позволило в настоящей статье получить регуляризованные ПЛ и ПМП единообразно для широкого класса распределенных оптимизационных задач. При этом существенным образом используется предложенное нами ранее понятие равностепенной квазинильпотентности семейства операторов [12] (историю вопроса см. в [11]).
В статьях [1, 2] рассматривались различные варианты регуляризации КУО для задач с сильно выпуклыми целевыми функционалами и с функциональными ограничениями типа равенства и неравенства. В свою очередь, в [3, 4] аналогичные вопросы изучались применительно к задачам также с сильно выпуклыми целевыми функционалами, но с операторным (т. е. задаваемым оператором с бесконечномерным образом) ограничением-равенством и функциональными ограничениями-неравенствами. Наконец, в [5, 6] регуляризация КУО проводилась для задач такого же вида, как и в [1–4], но в ситуации, когда целевой функционал выпуклой задачи может быть и не сильно выпуклым. «Абстрактные результаты» по регуляризации КУО в [1–6] подробно «расшифровывались» для ряда конкретных задач оптимального управления распределенными системами вольтеррова типа (рассматривались, в частности, оптимизационные задачи, связанные с системой уравнений с запаздыванием, с интегродифференциальным уравнением типа уравнения переноса и с гиперболической системой дифференциальных уравнений первого порядка).
В настоящей работе рассматривается регуляризация КУО в выпуклых задачах оптимизации линейных распределенных систем вольтеррова типа, но, в отличие от [1–6], в качестве операторных ограничений выступают поточечные фазовые ограничения типа равенства и неравенства. В качестве приложения полученных в работе «абстрактных результатов» в ней рассматривается регуляризация КУО в конкретной оптимизационной задаче с поточечными фазовыми ограничениями типа равенства и неравенства для управляемой системы с запаздыванием. Как известно [13–16], задачи с поточечными фазовыми ограничениями вот уже на протяжении более шести десятилетий привлекают постоянное внимание специалистов в области оптимизации сосредоточенных и распределенных систем. Сами же поточечные фазовые ограничения, с точки зрения оптимизационной теории, традиционно относятся к числу наиболее сложных операторных ограничений.
Регуляризация КУО, т. е. регуляризация ПМП и ПЛ, в выпуклых задачах оптимального управления и математического программирования на базе основанного на двойственности подхода к регуляризации [17] была впервые предложена в работах [18, 19]. Указанная регуляризация в теории условной оптимизации, в том числе и в задачах оптимального управления, является «естественной процедурой» ввиду свойств некорректности КУО [19–22]. Говоря о некорректности КУО, мы, прежде всего, имеем в виду такие их свойства, как невыполнимость и неустойчивость [19–22]. Напомним, что о невыполнимости КУО мы говорим тогда, когда известно, что в той или иной задаче на условный экстремум они не могут быть записаны. В свою очередь, неустойчивость КУО мы понимаем в том смысле, что неустойчиво по отношению к возмущению исходных данных экстремальной задачи ведут себя допустимые элементы, удовлетворяющие всем составляющим КУО соотношениям. Анализ различных примеров некорректности [19–22] дают основание рассматривать КУО как математические объекты с присущими им от природы свойствами некорректности. В этом случае центральная роль, как показано в [19, 20, 22], в задачах условной оптимизации естественным образом неизбежно переходит от классического понятия оптимального элемента к понятию минимизирующего приближенного решения (МПР) в смысле Дж. Варги [23], см. ниже определение этого понятия в разделе 2.3 (в математическом программировании такие последовательности часто называют оптимальными обобщенными планами [24]). Такой подход был реализован в [19, 21, 22] (в [22] для обозначения МПР использовалось словосочетание «обобщенная минимизирующая последовательность») применительно к выпуклым задачам на условный экстремум с операторным ограничением-равенством и конечным числом функциональных ограничений-неравенств. Тот же подход был реализован и в наших уже цитированных выше работах [1–6] применительно к регуляризации КУО для канонических задач оптимизации линейных распределенных систем вольтеррова типа. Полученные в указанных работах результаты позволяют выделить следующие важные, на наш взгляд, особенности получаемых регуляризованных КУО в выпуклых задачах условной оптимизации. Можно утверждать, что регуляризованные КУО: 1) при условии конечности значения исходной задачи формулируются как теоремы существования в ней МПР, состоящих из минималей регулярных функционалов Лагранжа, двойственные переменные для которых генерируются в соответствии с выбранной процедурой регуляризации двойственной задачи; 2) обобщают КУО, приводят к ним <<в пределе>> и сохраняют общую структуру классических аналогов; 3) являются условиями оптимальности, выраженными в секвенциальной форме в терминах регулярных функционалов Лагранжа; 4) «преодолевают» свойства некорректности классических аналогов и представляют собою универсальные МПР-образующие (регуляризирующие) алгоритмы в смысле [25] для решения задач на условный экстремум.
Ранее регуляризация КУО для выпуклых задач оптимального управления с поточечными фазовыми ограничениями типа равенства и неравенства рассматривалась в наших работах в случае управляемых систем, связанных с обыкновенными [18] и параболическими дифференциальными уравнениями [26]. Рассматриваемая ниже управляемая система вольтеррова типа своей общностью существенно отличается от рассмотренных ранее в наших работах [18, 26] управляемых систем.
Статья состоит из введения и трех основных разделов, первый из которых посвящен постановке выпуклой задачи оптимального управления для линейной распределенной системы вольтеррова типа с поточечными фазовыми ограничениями типа равенства и неравенства, формулировке и доказательству важных вспомогательных результатов, определению МПР-образующего алгоритма. Второй раздел посвящен доказательству сходимости алгоритма двойственной регуляризации для рассматриваемой задачи, а также доказательству на этой основе регуляризованных КУО для нее. Наконец, в заключительном третьем разделе подробно обсуждается, как «абстрактные» результаты первых двух разделов могут быть «расшифрованы» применительно к конкретной задаче оптимального управления с поточечными фазовыми ограничениями типа равенства и неравенства для управляемой системы с запаздыванием.
Примем следующие обозначения и соглашения: — пространство -векторов-столбцов; и — евклидовы скалярное произведение и норма в векторы, если не оговорено противное, считаются столбцами; — ноль в — множество всех положительных чисел; — множество всех неположительных чисел; — знак сопряжения и транспонирования; — выпуклый компакт с непустой внутренностью, играющий роль основного множества изменения независимых переменных, элементы которого обозначаем через — лебегово пространство со стандартной нормой (); (); — стандартная норма прямого произведения в — стандартное скалярное произведение в ; — пространство непрерывных на функций со стандартной нормой — стандартная норма прямого произведения в ; если H гильбертово пространство, то скалярное произведение в нем обозначаем через а соответствующую норму как ; субдифференцируемость понимается в смысле выпуклого анализа.
1. Постановка задачи оптимального управления
1.1. Базовая оптимизационная задача
Пусть заданы: натуральные числа функция класса линейный ограниченный оператор (ЛОО) с нулевым спектральным радиусом; ЛОО Рассмотрим линейное функциональное уравнение
(1.1)
считая управляющей функцией (управлением). Ввиду квазинильпотентности A уравнение (1.1) имеет для каждого единственное в решение причем
(1.2)
где — ЛОО — сумма ряда Неймана: Отвечающее управлению решение уравнения (1.1), задаваемое формулой (2), обозначим
Чтобы поставить для управляемой системы (1.1) задачу оптимального управления, будем считать, что заданы: функционал где — непрерывный выпуклый функционал, а — непрерывный сильно выпуклый функционал с постоянной сильной выпуклости ; ЛОО и функции и функция непрерывная по совокупности переменных, выпуклая по y на при каждом
Используя равенство (1.2) как формулу подстановки, зададим на функционал операторы и Очевидно, что функционал J непрерывен и сильно выпукл на с постоянной сильной выпуклости а операторы и действуют из в
Пусть D — выпуклое ограниченное и замкнутое множество пространства Рассмотрим задачу оптимального управления системой (1.1) c минимизируемым целевым функционалом при поточечных ограничениях типа равенства и неравенства
(1.3)
и множестве допустимых управлений D. Эту задачу символически запишем в виде
(1.4)
1.2. Точная и приближенные оптимизационные задачи
Задача (1.4) определяется набором исходных данных Предположим, что точные исходные данные нам не известны, но мы можем оперировать с приближенными исходными данными
где — меняющийся в некотором фиксированном полуинтервале числовой параметр, характеризующий близость приближенных данных к точным данным в указанном ниже условиями А, Б и В смысле (положительным значениям параметра соответствует приближенная оптимизационная задача вида (1.4) c данными а значению — точная оптимизационная задача вида (4) c данными ). Таким образом, мы считаем, что при каждом существуют следующие объекты: квазинильпотентный ЛОО ЛОО функция непрерывный выпуклый функционал непрерывный сильно выпуклый функционал с постоянной сильной выпуклости ЛОО и функции и непрерывная функция выпуклая по y на при каждом
Считаем, что приближенные исходные данные связаны с точными исходными данными приведенными ниже условиями А, Б, В, Г, Д.
Условие А. Функционалы и при любом липшицевы на каждом ограниченном множестве пространств и соответственно, причем липшицевость равномерна по параметру то есть существуют неубывающие функции такие, что для каждого и любого
Функция при любом равномерно по на каждом ограниченном в множестве липшицева по y. Причем липшицевость равномерна по параметру то есть существует неубывающая функция такая, что для каждого и любого
(1.5)
Условие Б. Существует постоянная такая, что при любом
(1.6)
Условие В. Существуют неубывающие функции и постоянная такие, что для каждого и любого
(1.7)
(1.8)
Чтобы сформулировать условие Г, воспользуемся следующим введенным нами ранее (историю вопроса см., например, в [11]) понятием равностепенной квазинильпотентности. Пусть B — банахово пространство, X — некоторое множество, — семейство зависящих от параметра квазинильпотентных ЛОО (напомним: квазинильпотентность ЛОО означает, что при ). Назовем семейство операторов равностепенно квазинильпотентным, если при
Условие Г. Семейство равностепенно квазинильпотентно.
При любом управляемое функциональное уравнение
(1.9)
имеет для каждого единственное в классе решение причем
(1.10)
где — ЛОО — сумма ряда Неймана: Отвечающее управлению и задаваемое формулой (10) решение уравнения (9) будем обозначать При любом мы имеем набор ограничений
(1.11)
где а и задачу оптимального управления
в которой Задачу назовем точной задачей, а задачи — приближенными задачами оптимального управления.
Условия Б и Г дают такое свойство семейства операторов [4, лемма 1].
Лемма 1.1. Существует такое, что
Лемма 1.1 позволяет легко вывести из условий А, Б, В, Г и ограниченности D существование постоянных и функции таких, что для
(1.12)
(1.13)
Предполагаем, что выполняется следующее условие, дополнительно связывающее ограничения (1.11) с управляемой системой (1.9).
Условие Д. При любом слабая сходимость в пространстве последовательности к некоторому элементу влечет за собой поточечную на сходимость последовательностей и соответственно к и
Лемма 1.2. При любом операторы и слабо непрерывны как операторы из в то есть преобразуют слабо сходящуюся к некоторому элементу в последовательность в последовательность, сходящуюся в норме к образу этого элемента.
Доказательство. Из условия Д следует, что при любом слабая в сходимость последовательности к некоторому элементу влечет за собой поточечную на сходимость и к и соответственно. Так как из-за ограниченности D в указанные поточечно сходящиеся последовательности равномерно ограничены, то они сходятся соответственно к и и в норме
1.3. Обобщенная нижняя грань и минимизирующие приближенные решения
Так как выпукло и замкнуто в гильбертовом пространстве то любая точка пространства имеет единственную проекцию на расстояние в от точки v до ее проекции на обозначим через (). Проекция точки на есть где — «срезка нулем сверху» функции ( совпадает с там, где отрицательна, и равна нулю там, где неотрицательна); соответственно, где — «срезка нулем снизу» функции
Пусть
и Элементарными выкладками проверяется, что при любых множество выпукло и замкнуто в из ограниченности D следует ограниченность вообще говоря, может быть и пустым. Положим
Величину можно назвать классической нижней гранью задачи Положим
Обобщенной нижней гранью задачи назовем предельную величину
Ввиду непрерывности и выпуклости функционала ограниченности, замкнутости и выпуклости множества задача заведомо разрешима, если [27, теорема 8.2.8]. А так как функционал сильно выпуклый, то задача может иметь не более одного решения [27, теорема 8.2.10]. Таким образом, если задача имеет ровно одно решение, будем обозначать его через (в этом случае ).
Непосредственно из определения обобщенной нижней грани следует, что Покажем, что наша задача такова, что имеет место равенство
Теорема 1.1. Величины и совпадают. Если они конечны, то задача разрешима, и ее решение единственно.
Доказательство. При равенство следует из неравенства Рассмотрим случай При множество непусто, так как Зафиксируем некоторое Так как функционал непрерывен и сильно выпукл на а множество при выпукло и замкнуто в то при любом существует единственный элемент такой, что [27, теорема 8.2.10].
Множество D выпукло, ограничено и замкнуто, а потому и слабо компактно в [27, теорема 8.2.3]. То есть существуют и стремящаяся к нулю последовательность такие, что слабо в сходится к Функционал непрерывен и выпукл, а потому и слабо полунепрерывен снизу на D [27, теорема 8.2.7]. Значит существует подпоследовательность (обозначим ее ), для которой
(1.14)
В силу условия Д слабая в сходимость к влечет за собой поточечную на сходимость последовательностей и соответственно к и Отсюда следует поточечная на сходимость и к и Так как указанные поточечно сходящиеся последовательности равномерно ограничены, то можем записать предельные соотношения при Ввиду получаем
То есть Это означает, что непусто и конечно.
Так как то То есть Но при и поэтому что вместе с (1.14) дает Имеем: А так как то получаем то есть — решение задачи
Итак, если одна из величин конечна, то они совпадают, множество непусто, а задача разрешима. Разрешимость, как уже было отмечено, может быть лишь однозначной.
Следуя [23], введем следующее определение.
Определение 1.1. Назовем последовательность минимизирующим приближенным решением (МПР) задачи если при и () для некоторой сходящейся к нулю последовательности чисел
Укажем условия (теорема 1.2), при которых МПР обязательно так или иначе сходятся к решению задачи Нам поможет, в частности, следующее утверждение. Пусть X — выпуклое замкнутое множество гильбертова пространства H, а функция выпукла, полунепрерывна снизу и субдифференцируема на X. Тогда, если она является сильно выпуклой на X с постоянной сильной выпуклости k, то
(1.15)
Доказательство. Воспользуемся тем, что общее определение сильной выпуклости [27, гл. 8, с. 650] аналогично определению сильной выпуклости функции конечного числа переменных. Аналог для случая гильбертова пространства утверждения [27, лемма 4.3.1] позволяет сказать, что f сильно выпукла на X с постоянной тогда и только тогда, когда найдется выпуклая функция такая, что При этом (см. [28, следствие 4.3]) функции f и g субдифференцируемы в точках X одновременно и
(1.16)
Таким образом, выпуклая функция субдифференцируема на X т. е.
(1.17)
Осталось заметить, что из соотношений (1.16), (1.17) и очевидного тождества следует (1.15).
Теорема 1.2. Если то любое МПР слабо в сходится к решению задачи А если еще и функционал субдифференцируем в точках D, то всякое МПР сходится к сильно в
Доказательство. Пусть По теореме 1.1 задача имеет единственное решение Пусть — некоторое МПР задачи Последовательность ограничена в вместе с D. То есть она слабо компактна в [27, теорема 8.2.3] и у нее существует подпоследовательность, слабо сходящаяся в к некоторому элементу Пусть — указанная подпоследовательность. Воспользовавшись выкладками из доказательства теоремы 1.1, получаем, что элемент совпадает с решением задачи Тем самым мы доказали существование у каждого МПР задачи подпоследовательности (а она тоже есть МПР), слабо в сходящейся к решению задачи.
Покажем теперь, что любое МПР задачи слабо в сходится к решению Воспользуемся тем, что слабая сходимость в эквивалентна сходимости в слабой норме (см. [23, теорема I.3.11]), обозначим ее Действуя от противного, предположим, что некоторое МПР задачи не сходится слабо в к Это означает, что существует и подпоследовательность такие, что Так как последовательность сама есть МПР вместе с то по доказанному выше из нее можно выделить подпоследовательность, сходящуюся слабо в (а значит и в слабой норме ) к решению задачи Получили противоречие.
Предположим теперь, что функционал субдифференцируем в точках D. Пусть — некоторое МПР задачи По лемме 1.3, ввиду сильной выпуклости для любого справедливо неравенство
Так как по доказанному последовательность слабо в сходится к решению задачи а по теореме 1.1 при то из выписанного неравенства следует, что при
1.4. Регуляризирующий и МПР-образующий операторы
Следуя нашей работе [25], введем определение регуляризирующего оператора в задаче с поточечными фазовыми ограничениями Зависящий от оператор ставящий в соответствие каждому набору исходных данных элемент удовлетворяющий условиям (1.6), (1.7), (1.8), называется регуляризирующим в задаче если
Далее, по аналогии с [25], введем «порождаемое» этим определением понятие МПР-образующего оператора (алгоритма) в задаче Пусть — сходящаяся к нулю последовательность положительных чисел. Зависящий от оператор ставящий в соответствие каждому набору исходных данных элемент называется МПР-образующим в задаче если последовательность есть МПР в этой задаче.
2. Двойственная регуляризация и условия существования МПР в выпуклой задаче оптимального управления с поточечными фазовыми ограничениями и сильно выпуклым функционалом качества
В этом разделе сформулируем и докажем условия существования МПР (отдельно необходимые и достаточные) в задаче с одновременным конструктивным устойчивым представлением конкретного экземпляра МПР (напомним, что вместо точной задачи в нашем распоряжении имеется семейство задач с возмущенными исходными данными, зависящими от параметра характеризующего ошибку задания этих данных по сравнению с точными данными). Указанные условия существования можно трактовать и как условия устойчивого конструирования МПР в задаче Будем придерживаться общей схемы рассуждений, использованной при получении аналогичных результатов в работах [17, 19].
2.1. Двойственная регуляризация в выпуклой задаче оптимизации с поточечными фазовыми ограничениями и необходимые условия существования МПР
В данном разделе опишем процедуру двойственной регуляризации [17, 19] для задачи оптимального управления с поточечными фазовыми ограничениями и получаемые с ее помощью необходимые условия существования МПР в этой задаче.
2.1.1. Двойственная задача. Введем для задачи регулярный функционал Лагранжа
и соответствующую двойственную задачу
(2.1)
Функционал определен (конечен) в каждой точке и вогнут. Поэтому он является локально липшицевым на так как благодаря ограниченности D ограничен на любом ограниченном множестве [28, теорема 2.1]. Ввиду выпуклости и замкнутости в множества D, непрерывности и сильной выпуклости на D функционала здесь для каждой пары причем минимум достигается в единственной точке
Из неравенства и условий А, Б, В и Г простыми выкладками, используя лемму 1.1 и ограниченность D, получаем, что при некотором
(2.2)
При любых сильно вогнутый функционал
достигает на максимума в одной точке
Пусть — некоторая функция, удовлетворяющая условию
(2.3)
Общие свойства метода стабилизации [27, гл. 8, § 4] позволяют сказать, что в случае разрешимости двойственной задачи (2.1) при оценка (2.2) и условие согласования (20) влекут за собой сходимость
(2.4)
где — минимальное по норме решение указанной двойственной задачи.
2.1.2. Супердифференциал вогнутого целевого функционала двойственной задачи. Далее нам потребуется формула для супердифференциала вогнутого функционала значений который по определению равен взятому с обратным знаком субдифференциалу выпуклого функционала Чтобы выписать эту формулу, обратимся сначала к общей ситуации, рассмотренной в [17].
Пусть Y, H — некоторые гильбертовы пространства, P — ограниченное замкнутое множество в Y, — липшицев функционал, — липшицев оператор. Считаем и равномерно ограниченными на P. Определим составной функционал (его естественно назвать функционалом Лагранжа)
и соответствующий (двойственный) функционал значений
Супердифференциал вогнутого функционала значений V задается следующей формулой, при записи которой используется обобщенный градиент Кларка [29, § 2.1].
Лемма 2.4. Супердифференциал вогнутого функционала V в точке равен
где — обобщенный градиент Кларка функционала в точке — замыкание выпуклой оболочки множества X, предел понимается в смысле слабой сходимости в пространстве H. Другими словами, супердифференциал есть замыкание выпуклой оболочки совокупности всех слабых пределов всевозможных последовательностей когда последовательность является минимизирующей для функционала
Доказательство этой леммы см. в [17, лемма 2].
Применим лемму 2.4 к функционалу В этом случае
Лемма 2.5. Супердифференциал вогнутого функционала в точке равен
где — обобщенный градиент Кларка функционала в точке а предел понимается в смысле слабой сходимости в пространстве
В свою очередь, лемма 2.5, в силу слабой непрерывности операторов (см. лемму 1.2) и единственности для любой пары минимали преобразуется к следующему виду.
Лемма 2.6. Супердифференциал вогнутого функционала в точке является одноточечным множеством и равен
где — обобщенный градиент Кларка функционала в точке
Доказательство. Утверждение леммы вытекает непосредственно из леммы 2.5 и выпуклости задачи с сильно выпуклым функционалом цели. Действительно, в силу единственности точки минимизирующей сильно выпуклый функционал на D, и сильной сходимости к этой точке любой минимизирующей последовательности в этой задаче минимизации (при ), обобщенный градиент Кларка состоит из единственного элемента. Другими словами, в силу равенства и совпадения субдифференциала с обобщенным градиентом [29, предложения 2.2.7, 2.3.1], взятый с обратным знаком субдифференциал выпуклого функционала то есть супердифференциал вогнутого функционала в каждой точке состоит лишь из одного элемента
2.1.3. Метод двойственной регуляризации. В данном разделе опишем метод двойственной регуляризации [17, 19] применительно к задаче оптимального управления с поточечными фазовыми ограничениями и докажем соответствующую теорему сходимости этого метода. Считаем при этом, что задача разрешима. Это при сделанных предположениях об исходных данных равносильно существованию в ней МПР (см. теоремы 1.1, 1.2).
Для описания и обоснования процедуры двойственной регуляризации воспользуемся следующей леммой, частным случаем более общего утверждения [30, следствие 4.3.6(c)].
Лемма 2.7. Пусть H — гильбертово пространство, — собственная выпуклая полунепрерывная снизу функция с — замкнутое выпуклое множество. Тогда — точка минимума f на в том и только в том случае, когда где — конус нормалей в смысле выпуклого анализа ко множеству в точке x.
Заметим, что в условиях леммы 2.7 (см. [30, предложение 4.1.4])
Применим лемму 2.7, взяв а в качестве f выпуклую функцию С учетом леммы 2.6, позволяющей выписать субдифференциал выбранной функции f, критерий минимума леммы 2.7 дает следующее вариационное неравенство
(2.5)
(2.6)
(2.7)
(2.8)
Из соотношений (2.6)–(2.8), в свою очередь, получаем:
(2.9)
Из (2.7) следует также, что если для некоторого t, принадлежащего множеству полной меры в то
(2.10)
и, значит, при п. в. таких, что выполняется равенство Из (2.7) и (2.10) получаем одновременно, что
Кроме того, из (2.9) получаем равенство и неравенство
(2.11)
Далее, так как
то в силу оценок (1.6), (1.13) и равенства (2.11) получаем после ряда элементарных преобразований оценку
или
где — не зависящие от положительные постоянные. Отсюда находим, что
(2.12)
где следствием чего является предельное соотношение
(2.13)
Кроме того, из соотношений (2.6)–(2.8), оценок (1.5), (1.6), (1.7), (1.8), (1.12) и оценки (2.12), в свою очередь, следуют оценки (в которых положительные постоянные не зависят от ):
(2.14)
(2.15)
(2.16)
Из неравенств (2.14), (2.15), (2.16) выводим, что
(2.17)
и для любого существует функция такая, что
(2.18)
Неравенство в (2.18) означает, что
Одновременно для всех выполняется неравенство
из которого, с учетом оценок (1.13), следует, что
(2.19)
где — постоянная, не зависящая от Учитывая ограниченность D, получаем, что при всех
где не зависит от Отсюда, в силу условия согласования (2.3) и соотношения (2.13), следует: для любого существует число такое, что
(2.20)
Итак, с учетом ограниченности D построено семейство зависящих от элементов удовлетворяющих оценкам (2.14), (2.15), (2.20) и, стало быть, такое, что выполняются соотношения (2.17), (2.18) и одновременно
(2.21)
Соотношения (2.17), (2.18), (2.21) в соответствии с определением 1.2 позволяют сказать, что оператор ставящий в соответствие каждому набору исходных данных удовлетворяющих оценкам (1.13), элемент является регуляризирующим в задаче При этом в соответствии с теоремой 1.2 любая последовательность сходится слабо к решению задачи а в случае субдифференцируемости на D сходится сильно, то есть
Наконец, следствием оценки (2.19), условия (2.3), предельного соотношения (2.13), ограниченности и соотношения (2.21) является предельное соотношение
(2.22)
Равенство (2.11) и соотношение (2.22) позволяют сказать, что
(2.23)
Покажем, что выполняется и предельное соотношение
(2.24)
Заметим сначала, что благодаря соотношениям (2.21), (2.22) можем записать
откуда в силу оценки (2.2), предельных соотношений (2.13) и условия (2.3) получаем
что и означает, в силу неравенства справедливость предельного соотношения (2.24).
Таким образом, как результат проведенных выше рассуждений, мы можем сформулировать следующую теорему сходимости метода двойственной регуляризации в задаче Эта теорема сходимости является следствием сделанного в начале раздела 2.1.3 предположения о существовании решения задачи По этой причине сформулированный в ней результат можно трактовать и как необходимое условие оптимальности управления выраженное в секвенциальной форме.
Теорема 2.3. Пусть задача имеет решение Вне зависимости от того, существует или нет вектор Куна–Таккера в задаче или, другими словами, разрешима или нет двойственная к ней задача, имеют место соотношения
(2.25)
где и неравенство означает включение
Элементы при слабо сходятся к а в случае субдифференцируемости на D сходимость является сильной. Таким образом, зависящий от оператор ставящий в соответствие каждому набору исходных данных удовлетворяющих оценкам (1.6), (1.7), (1.8), элемент является регуляризирующим (в смысле определения 1.2) в задаче Кроме того выполняется предельное соотношение (2.24), а в случае разрешимости двойственной к задачи и предельное соотношение (2.4).
Замечание 2.1. Теорема 2.3 сформулирована с учетом «опоры» на предельное соотношение (2.13). Если же это предельное соотношение заменить более «сильным» предельным соотношением (2.23), то мы получаем другой вариант теоремы сходимости метода двойственной регуляризации в задаче который отличается от сформулированного выше лишь тем, что используемое в теореме 2.3 предельное соотношение (2.25) заменяется на «аналогичное» предельное соотношение Такой вариант теоремы сходимости используется при рассмотрении задач условной минимизации с неограниченными множествами допустимых элементов D [20–22].
2.1.4. Необходимые условия существования МПР. Как следствие теоремы 2.3 сформулируем, наконец, необходимые условия существования МПР в задаче
Теорема 2.4. Пусть — фиксированная стремящаяся к нулю последовательность чисел. Вне зависимости от разрешимости или неразрешимости двойственной к задачи справедливо следующее. Для того, чтобы в задаче существовало МПР (в случае существования оно сходится слабо к решению задачи) необходимо существование стремящейся к нулю последовательности чисел а также последовательности двойственных переменных таких, что при и выполняются предельные соотношения
(2.26)
(2.27)
Одновременно с предельным соотношением и предельными соотношениями (2.26), (2.27) выполняется и предельное соотношение
(2.28)
Если некоторое МПР существует, то необходимо найдется и последовательность двойственных переменных с указанными выше свойствами, генерируемая методом двойственной регуляризации теоремы 2.3 то есть при разрешимости двойственной задачи указанная последовательность сходится к минимальному по норме решению этой задачи. Соответствующая последовательность будет МПР; в случае субдифференцируемости на D это МПР сходится сильно при к решению задачи То есть оператор ставящий в соответствие при таком выборе каждому набору исходных данных удовлетворяющих оценкам (1.6), (1.7), (1.8) при элемент является МПР-образующим в задаче
Замечание 2.2. Заметим, что ввиду ограниченности соотношения (2.26) выполняются тогда и только тогда, когда для некоторой последовательности сходящихся к нулю неотрицательных чисел
Замечание 2.3. С учетом замечания 2.1 другой вариант необходимых условий существования МПР в задаче мы получаем, если используемое в теореме 2.4 предельное соотношение заменить на «аналогичное» предельное соотношение При этом, как легко заметить, первое из указанных двух предельных соотношений является следствием второго.
2.2. Достаточные условия существования МПР в выпуклой задаче оптимального управления с поточечными фазовыми ограничениями
Каждому из двух вариантов необходимых условий существования МПР, о которых идет речь в замечании 2.3, подходит свой вариант указанных достаточных условий существования МПР. Так как предельное соотношение
можно трактовать как менее жесткое по сравнению с предельным соотношением
то ниже приводится формулировка и доказательство варианта достаточных условий, соответствующего первому из двух указанных предельных соотношений. Соответствующий второму предельному соотношению вариант достаточных условий применяется при регуляризации КУО в задачах с неограниченными множествами допустимых элементов D (см. [20–22]).
Справедлива следующая теорема, устанавливающая достаточные условия существования МПР в задаче
Теорема 2.5. Пусть — фиксированная стремящаяся к нулю последовательность чисел. Вне зависимости от разрешимости или неразрешимости двойственной к задачи справедливо следующее. Для того, чтобы в задаче существовало МПР (в случае существования оно будет сходиться слабо к решению задачи) достаточно существования стремящейся к нулю последовательности чисел а также последовательности двойственных переменных таких, что и выполняются соотношения (2.26), (2.27). При этом последовательность является искомым МПР. Это МПР сильно сходится к решению задачи в случае субдифференцируемости на D. Другими словами, оператор ставящий в соответствие каждому набору исходных данных удовлетворяющих оценкам (1.6), (1.7), (1.8) при элемент является МПР-образующим в задаче Одновременно с предельным соотношением и соотношениями (2.26), (2.27) выполняется и предельное соотношение (2.28).
Доказательство. Прежде всего, напомним (см. раздел 1.2), что функционал слабо полунепрерывен снизу на D; операторы слабо непрерывны на D, то есть переводят слабо сходящиеся в последовательности управлений из D в сильно сходящиеся в последовательности их образов. Указанные свойства, ввиду включения и ограниченности последовательности обеспечивают непустоту множества а следовательно, и разрешимость (однозначную) исходной задачи . Далее, так как точка минимизирует функционал при можем записать
В силу условий теоремы (см. предельное соотношение (2.27)) отсюда следует, что при любом существует стремящаяся к нулю последовательность неотрицательных чисел такая, что
Положим здесь и используем ограниченность D, а также условие согласования Можем записать, используя оценки (1.6), (1.13),
где постоянные не зависят от Получаем: существует стремящаяся к нулю последовательность неотрицательных чисел такая, что
Так как одновременно имеем включения а значит, в силу ограниченности D, при некоторой стремящейся к нулю последовательности неотрицательных чисел и включения то последовательность является МПР в задаче Далее, принимая во внимание снова предельное соотношение (2.27) и полученное предельное соотношение можем записать соотношение:
а следовательно, и предельное соотношение (2.28) в силу оценки (2.2) и предельного соотношения
2.3. Регуляризованные принцип Лагранжа и принцип максимума Понтрягина в выпуклой задаче оптимального управления с поточечными фазовыми ограничениями
2.3.1. Регуляризованный принцип Лагранжа. «Объединив» теоремы 2.4, 2.5, сформулируем, наконец, регуляризованные принцип Лагранжа и принцип максимума Понтрягина в форме критериев существования МПР в выпуклой задаче оптимального управления с поточечными фазовыми ограничениями. Регуляризованный принцип Лагранжа (ввиду регулярности функций Лагранжа его можно называть также регуляризованной теоремой Куна–Таккера) можно записать в следующем виде.
Теорема 2.6. Пусть — фиксированная стремящаяся к нулю последовательность чисел. Вне зависимости от разрешимости или неразрешимости двойственной к задачи справедливо следующее. Для того, чтобы в задаче существовало МПР (в случае существования оно будет слабо сходиться к точному решению задачи), необходимо и достаточно, чтобы существовала последовательность двойственных переменных такая, что и выполнялись предельные соотношения (2.26), (2.27). При этом последовательность является искомым МПР, сходящимся сильно к решению задачи в случае субдифференцируемости на D. Другими словами, оператор ставящий в соответствие каждому набору исходных данных удовлетворяющих оценкам (1.6), (1.7), (1.8) при элемент является МПР-образующим в задаче
Одновременно с предельным соотношением и соотношениями (2.26), (2.27) выполняется и предельное соотношение (2.28). В качестве последовательности может быть взята генерируемая методом двойственной регуляризации теоремы 2.3 последовательность сходящаяся к минимальному по норме решению двойственной задачи в случае разрешимости последней.
2.3.2. О минимизации функции Лагранжа. Ключевой задачей процедуры двойственной регуляризации процесса приближенного решения задачи является задача минимизации функционала Лагранжа задачи ()
(2.29)
решение которой мы обозначили через Для упрощения изложения предположим, что при каждом функционалы дифференцируемы по Фреше, а функция дифференцируема по y на при каждом Тогда при каждом дифференцируемы по Фреше на оператор (рассматриваем его как оператор из в ) и функционал Лагранжа В этом случае решение задачи (2.29) удовлетворяет критерию минимума
(2.30)
где — производная Фреше функционала по переменной u в точке при фиксированных Пусть — функция Рисса функционала Критерий (47) можно записать в виде
(2.31)
Найдем представление функции в терминах задачи
Непосредственно вычисляя, получаем
(2.32)
здесь — функция Рисса функционала а — функция, которая задается формулой
(2.33)
где и — функции Рисса принадлежащих классу функционалов и соответственно.
Так как где E — единичный оператор в то определяемая формулой (2.33) и входящая в (2.32) функция есть (единственное в ) решение уравнения
(2.34)
Переписав (2.32) в виде находим искомое представление функции в терминах задачи :
(2.35)
в котором — единственное в решение уравнения (2.34).
2.3.3. Случай ограниченных управлений. Рассмотрим задачу в ситуации, когда допустимые управления принимают значения из некоторого ограниченного замкнутого и выпуклого множества то есть В этом случае получаем из (2.31) критерий минимума функционала Лагранжа в виде следующего линеаризованного поточечного принципа максимума.
Лемма 2.8. Функция есть решение задачи (2.29) тогда и только тогда, когда
(2.36)
где задается формулой (2.35), в которой — решение (2.34).
Доказательство. Необходимость для решения задачи (2.29) условия (2.36) доказывается простейшим игольчатым варьированием, а достаточность получается стандартным применением теоремы А. А. Ляпунова (см., например, [14, § 2.4, § 8.2]).
Обозначим через множество всех управлений из D, удовлетворяющих (при сформулированных выше дополнительных условиях дифференцируемости) принципу максимума леммы 2.8. В нашем случае, благодаря сильной выпуклости целевого функционала, множество состоит из одного элемента, обозначим его через Очевидно, что То есть непосредственно из теоремы 2.6 и леммы 2.8 получаем следующий регуляризованный поточечный принцип максимума для задачи
Теорема 2.7. При сформулированных выше дополнительных условиях дифференцируемости все утверждения теоремы 2.6 останутся справедливыми, если в них заменить везде на
3. Пример. Оптимизационная задача с поточечными фазовыми ограничениями для управляемой системы с запаздыванием
Естественный переход от начально-краевой задачи к эквивалентному ей функциональному уравнению II рода вольтеррова типа осуществляется с помощью обращения главной части задачи. Разнообразные конкретные примеры начально-краевых задач (для параболических, гиперболических, интегродифференциальных уравнений с частными производными и систем таких уравнений, различных уравнений с запаздывающим аргументом и др.), которые допускают эквивалентное описание с помощью функциональных уравнений вольтеррова типа, можно найти, например, в [7] (см. также обзор в [11]). Из множества самых различных подобных начально-краевых задач мы для иллюстрации изложенной выше теории выбрали начальную задачу для системы с запаздыванием. В примере выписываются те основные конструкции, которые и участвуют в формулировке регуляризованных КУО (формирующая критерий минимума функционала Лагранжа функция, сопряженное уравнение, ). Сформулировать с их помощью соответствующие регуляризованные КУО — конкретные реализации сформулированных выше теорем уже не сложно.
Пусть — фиксированное число; — фиксированный вектор; — фиксированные функции. Рассмотрим начальную задачу для линейной управляемой системы дифференциальных уравнений с запаздывающим аргументом ( — m-вектор-функция)
(3.1)
(3.2)
где — управление. Решение начальной задачи (3.1), (3.2) понимаем как решение в смысле «почти всюду» из пространства абсолютно непрерывных на отрезке функций с квадратично суммируемыми первыми производными, рассматривая первое из условий (3.2) как требуемое в (3.1) условие доопределения слева от : при Приведем задачу (3.1), (3.2) к эквивалентному уравнению вида (1.1), показав тем самым, что каждому отвечает единственное в классе W функций удовлетворяющих второму условию (3.2), решение этой задачи. Для этого сделаем в (3.1), (3.2) замену по формуле
(3.3)
устанавливающей взаимно однозначное соответствие между классом W функций и пространством функций (такое преобразование задачи (3.1), (3.2) естественно назвать обращением главной части этой задачи). «Подставляя» (3.3) в (3.1) (с учетом при первого условия (3.2)), получаем
(3.4)
(3.5)
Положим Запишем (3.4), (3.5) в виде
(3.6)
Уравнение (3.6) и есть уравнение вида (1.1), эквивалентное начальной задаче (3.1), (3.2). Здесь (квазинильпотентность оператора легко проверяется, например, с помощью цепочечного признака [8, теорема 2], см. также [11, c. 269]); ; Если — решение задачи (3.1), (3.2) при некотором то связанная с формулой (3.3) функция есть решение уравнения (3.6) при том же И наоборот, если — решение уравнения (3.6) при данном то функция связанная с формулой (3.3), есть решение класса W задачи (3.1), (3.2) при этом Отвечающие управлению решения задачи (3.1)–(3.2) и уравнения (3.6) обозначим через и соответственно.
Пусть задано следующее: функции непрерывная выпуклая функция выпуклое ограниченное и замкнутое множество D пространства Рассмотрим задачу оптимального управления системой (3.1), (3.2) c минимизируемым целевым функционалом при ограничениях
(3.7)
и множестве допустимых управлений D. Эту задачу символически запишем в виде
(3.8)
Сделав в задаче (3.8) замену (3.3), получим следующую эквивалентную задачу оптимизации управляемой системы (3.6):
где Это задача (4) с ( ); ( ); ( ).
Пусть — набор данных задачи (3.8), которые подвергаются возмущению, и точный набор нам не известен, но можно оперировать с приближенными наборами ( фиксировано), которые связаны с набором следующими условиями 3.1–3.3.
Условие 3.1. Функция липшицева на каждом ограниченном множестве, причем липшицевость равномерна по параметру то есть существует неубывающая функция такая, что для любых и выполнено при
Условие 3.2. Существует постоянная такая, что при любом величины не превосходят величины
Условие 3.3. Существует неубывающая функция такая, что для каждого и любого имеем при
При любом мы имеем управляемую начальную задачу
(3.9)
(3.10)
набор ограничений
(3.11)
и задачу оптимизации системы (3.9)–(3.10) c минимизируемым функционалом цели при ограничениях (3.11) и множестве допустимых управлений Эту задачу оптимального управления символически запишем в виде
(3.9), (3.10), (3.11) (3.12)
Пусть — отвечающее управлению решение начальной задачи (3.9), (3.10).
Сделав в задаче (3.12) замену соответствующую обращению главной части начальной задачи (3.9), (3.10), получим эквивалентную задачу оптимизации управляемой системы
(3.13)
где Эту задачу запишем в виде
(3.14)
где — отвечающее u решение (3.13).
Положив ; переписываем (3.13) в форме (1.9). Задача (3.14) имеет вид здесь: ( ); ( ); ( ).
При сделанных относительно семейства задач (3.12), предположениях семейство задач (3.14), удовлетворяет условиям А–Д. Действительно, выполнение условий А, Б и В проверяется элементарными выкладками, исходя из предположений в условиях 3.1, 3.2, условии 3.2 и условиях 3.2, 3.3 соответственно. Выполнение условия Г следует из цепочечного признака равностепенной квазинильпотентности [11, теорема 2].
Для проверки выполнения условия Д заметим, что для каждого при используя обозначение получаем
Рассмотрим сначала случай Переходя к сопряженным операторам, получаем
что, очевидно, означает выполнение условия Д. Проверка выполнения Д в общем случае аналогична — можно воспользоваться матричным представлением S и B.
Предположив, что функции дифференцируемы, можем выписать для нашего примера критерии (2.31) и (2.36) решения задачи (2.29). Прямые вычисления дают: По определению сопряженного оператора
То есть уравнение (2.34) можно записать в виде
(3.15)
где Формирующая критерии (2.31) и (2.36), которым удовлетворяет решение задачи (2.29), функция задается формулой
где — решение сопряженного уравнения (3.15). Это уравнение вольтеррова типа. Единственное в решение уравнения (3.15) абсолютно непрерывно на и принадлежит классу Уравнение (3.15) эквивалентно системе уравнений
(3.16)
(3.17)
(3.18)
состоящей из задачи Коши (3.16) для обыкновенного дифференциального уравнения, рассматриваемого на отрезке с условием Коши в точке и начальной задачи (3.17), (3.18) для рассматриваемого на отрезке дифференциального уравнения с опережением (3.17), в которой условие (3.18) играет роль условия Коши в точке требуемое в (3.17) и (3.18) доопределение функции справа от точки обеспечивается задачей Коши (3.16).
Об авторах
Владимир Иосифович Сумин
ФГБОУ ВО «Тамбовский государственный университет им. Г. Р. Державина»; ФГАОУ ВО «Нижегородский государственный университет им. Н. И. Лобачевского»
Автор, ответственный за переписку.
Email: v_sumin@mail.ru
ORCID iD: 0000-0002-7479-2181
доктор физико-математических наук, ведущий научный сотрудник, Тамбовский государственный университет им. Г. Р. Державина; профессор, Нижегородский государственный университет им. Н. И. Лобачевского
Россия, 392000, Тамбов, ул. Интернациональная, 33; 603950, Нижний Новгород, пр-т Гагарина, 23Михаил Иосифович Сумин
ФГБОУ ВО «Тамбовский государственный университет им. Г. Р. Державина»; ФГАОУ ВО «Нижегородский государственный университет им. Н. И. Лобачевского»
Email: m.sumin@mail.ru
ORCID iD: 0000-0002-3700-6428
доктор физико-математических наук, ведущий научный сотрудник, Тамбовский государственный университет им. Г. Р. Державина; профессор, Нижегородский государственный университет им. Н. И. Лобачевского
Россия, 392000, Тамбов, ул. Интернациональная, 33; 603950, Нижний Новгород, пр-т Гагарина, 23Список литературы
- В. И. Сумин, М. И. Сумин, “Регуляризованные классические условия оптимальности в итерационной форме для выпуклых задач оптимизации распределенных систем вольтеррова типа” , Вестник Удмуртского университета. Математика. Механика. Компьютерные на¬уки, 31:2 (2021), 265–284. [V. I. Sumin, M. I. Sumin, “Regularized classical optimality conditions in iterative form for convex optimization problems for distributed Volterra-type systems”, Vestnik Udmurtskogo universiteta. Matematika. Mekhanika. Komp‘yuternye nauki, 31:2 (2021), 265–284 (In Russian)].
- В. И. Сумин, М. И. Сумин, “Регуляризация классических условий оптимальности в задачах оптимального управления линейными распределенными системами вольтеррова типа”, Журн. вычисл. матем. и матем. физ., 62:1 (2022), 45–70; англ. пер.:V. I. Sumin, M. I. Sumin, “Regularization of the classical optimality conditions in optimal control problems for linear distributed systems of Volterra type”, Comput. Math. Math. Phys., 62:1 (2022), 42–65.
- В. И. Сумин, М. И. Сумин, “О регуляризации принципа Лагранжа в задачах оптимизации линейных распределенных систем вольтеррова типа с операторными ограничениями”, Известия Института математики и информатики Удмуртского государствен¬ного университета, 59 (2022), 85–113. [V. I. Sumin, M. I. Sumin, “On regularization of the Lagrange principle in the optimization problems for linear distributed Volterra type systems with operator constraints”, Izvestiya Instituta Matematiki i Informatiki Udmurtskogo Gosudarstvennogo Universiteta, 59 (2022), 85–113 (In Russian)].
- В. И. Сумин, М. И. Сумин Об итеративной регуляризации принципа Лагранжа в выпуклых задачах оптимального управления распределенными системами вольтеррова типа с операторными ограничениями, Дифференциальные уравнения, 58:6 (2022), 795–812; англ. пер.:V. I. Sumin, M. I. Sumin, “On the iterative regularization of the Lagrange principle in convex optimal control problems for distributed systems of the Volterra type with operator constraints”, Differ. Equ., 58:6 (2022), 791–809.
- В. И. Сумин, М. И. Сумин, “Регуляризация классических условий оптимальности в задачах оптимизации линейных систем вольтеррова типа с функциональными ограничениями”, Вестник российских университетов. Математика, 28:143 (2023), 298–325. [V. I. Sumin, M. I. Sumin, “Regularization of classical optimality conditions in optimization problems for linear Volterra-type systems with functional constraints”, Vestnik rossiyskikh universitetov. Matematika = Russian Universities Reports. Mathematics, 28:143 (2023), 298–325 (In Russian)].
- В. И. Сумин, М. И. Сумин О регуляризации классических условий оптимальности в выпуклых задачах оптимизации систем вольтеррова типа с операторными ограничениями, Дифференциальные уравнения, 60:2 (2024), 237–259; англ. пер.:V. I. Sumin, M. I. Sumin, “On regularization of classical optimality conditions in convex optimization problems for Volterra type systems with operator constraints”, Differ. Equ., 60:2 (2024), 227–246.
- В. И. Сумин, Функциональные вольтерровы уравнения в теории оптимального управления распределенными системами, Изд-во Нижегородского госуниверситета, Нижний Новгород, 1992. [V. I. Sumin, Functional Volterra Equations in the Theory of Optimal Control of Distributed Systems, Publishing House of Nizhnii Novgorod State University, Nizhnii Novgorod, 1992 (In Russian)].
- В. И. Сумин, A. В. Чернов, “Операторы в пространствах измеримых функций: вольтерровость и квазинильпотентность”, Дифференциальные уравнения, 34:10 (1998), 1402–1411; англ. пер.:V. I. Sumin, A. V. Chernov, “Operators in the spaces of measurable functions: the Volterra property and quasinilpotency”, Differ. Equ., 34:10 (1998), 1403–1411.
- И. Ц. Гохберг, М. Г. Крейн, Теория вольтерровых операторов в гильбертовом пространстве и ее приложения, Наука, М., 1967; англ. пер.:I. Ts. Gokhberg, M. G. Krein, Theory and Applications of Volterra Operators in Hilbert Space, American Mathematical Society, Providence, 1970.
- В. И. Сумин, “Функционально-операторные вольтерровы уравнения в теории оптимального управления распределенными системами”, Докл. АН СССР, 305:5 (1989), 1056–1059; англ. пер.:V. I. Sumin, “Volterra functional-operator equations in the theory of the optimal control of distributed systems”, Sov. Math., Dokl., 39:2 (1989), 374–378.
- В. И. Сумин, “Управляемые вольтерровы функциональные уравнения и принцип сжимающих отображений”, Тр. Ин-та математики и механики УрО РАН, 25:1 (2019), 262–278. [V. I. Sumin, “Controlled Volterra functional equations and the contraction mapping principle”, Trudy Inst. Mat. Mekh. UrO RAN, 25:1 (2019), 262–278 (In Russian)].
- В. И. Сумин, “Управляемые вольтерровы функциональные уравнения в лебеговых пространствах” , Вестн. Нижегород. ун-та. Математическое моделирование и оптимальное управление, 1998, № 2(19), 138–151. [V. I. Sumin, “Controlled Volterra functional equations in Lebesgue spaces”, Vestn. Nizhegorod. un-ta. Matematicheskoe modelirovanie i optimal‘noe upravlenie, 1998, № 2(19), 138–151 (In Russian)].
- Р. В. Гамкрелидзе, “Оптимальные процессы управления при ограниченных фазовых координатах”, Изв. АН СССР. Сер. матем., 24:3 (1960), 315–356. [R. V. Gamkrelidze, “Optimal control processes for bounded phase coordinates”, Izv. Akad. Nauk SSSR Ser. Mat., 24:3 (1960), 316–356 (In Russian)].
- А. Д. Иоффе, В. М. Тихомиров, Теория экстремальных задач, Наука, М., 1974; англ. пер.:A. D. Ioffe, V. M. Tikhomirov, Theory of Extremal Problems, North-Holland Publishing Company, Amsterdam–New York–Oxford, 1979.
- А. В. Арутюнов, Условия экстремума. Анормальные и вырожденные задачи, Факториал, М., 1997; англ. пер.:A. V. Arutyunov, Optimality conditions: Abnormal and Degenerate Problems, Kluwer Academic Publishers, Dordrecht–Boston–London, 2000.
- А. А. Милютин, А. В. Дмитрук, Н. П. Осмоловский, Принцип максимума в оптимальном управлении, Центр прикладных исследований мехмата МГУ, М., 2004. [A. A. Milyutin, A. V. Dmitruk, N. P. Osmolovsky, The Maximum Principle in Optimal Control, Center for Applied Research of the Faculty of Mechanics and Mathematics of Moscow State University, Moscow, 2004 (In Russian)].
- М. И. Сумин, “Регуляризация в линейно выпуклой задаче математического программирования на основе теории двойственности”, Журн. вычисл. матем. и матем. физ., 47:4 (2007), 602–625; англ. пер.:M. I. Sumin, “Duality-based regularization in a linear convex mathematical programming problem”, Comput. Math. Math. Phys., 47:4 (2007), 579–600.
- М. И. Сумин, “Параметрическая двойственная регуляризация для задачи оптимального управления с поточечными фазовыми ограничениями” , Журн. вычисл. матем. и матем. физ., 49:12 (2009), 2083–2102; англ. пер.:M. I. Sumin, “Parametric dual regularization for an optimal control problem with pointwise state constraints”, Comput. Math. Math. Phys., 49:12 (2009), 1987–2005.
- М. И. Сумин, “Регуляризованная параметрическая теорема Куна–Таккера в гильбертовом пространстве”, Журн. вычисл. матем. и матем. физ., 51:9 (2011), 1594–1615; англ. пер.:M. I. Sumin, “Regularized parametric Kuhn–Tucker theorem in a Hilbert space”, Comput. Math. Math. Phys., 51:9 (2011), 1489–1509.
- М. И. Сумин, “ Регуляризованные принцип Лагранжа и принцип максимума Понтрягина в оптимальном управлении и обратных задачах”, Тр. Ин-та математики и механики УрО РАН, 25:1 (2019), 279–296. [M. I. Sumin, “Regularized Lagrange principle and Pontryagin maximum principle in optimal control and in inverse problems”, Trudy Inst. Mat. Mekh. UrO RAN, 25:1 (2019), 279–296 (In Russian)].
- М. И. Сумин, “Принцип Лагранжа и его регуляризация как теоретическая основа устойчивого решения задач оптимального управления и обратных задач” , Вестник российских университетов. Математика, 26:134 (2021), 151–171. [M. I. Sumin, “Lagrange principle and its regularization as a theoretical basis of stable solving optimal control and inverse problems”, Vestnik rossiyskikh universitetov. Matematika = Russian Universities Reports. Mathematics, 26:134 (2021), 151–171 (In Russian)].
- М. И. Сумин, “О некорректных задачах, экстремалях функционала Тихонова и регуляризованных принципах Лагранжа”, Вестник российских университетов. Математика, 27:137 (2022), 58–79. [M. I. Sumin, “On ill-posed problems, extremals of the Tikhonov functional and the regularized Lagrange principles”, Vestnik rossiyskikh universitetov. Matematika = Russian Universities Reports. Mathematics, 27:137 (2022), 58–79 (In Russian)].
- Дж. Варга, Оптимальное управление дифференциальными и функциональными уравнениями, Наука, М., 1977; англ. ориг.:J. Warga, Optimal Control of Differential and Functional Equations, Academic Press, New York, 1972.
- Е. Г. Гольштейн, Теория двойственности в математическом программировании и ее приложения, Наука, М., 1971. [E. G. Golshtein, Duality Theory in Mathematical Programming and Its Applications, Nauka Publ., Moscow, 1971 (In Russian)].
- М. И. Сумин, “О регуляризации классических условий оптимальности в выпуклых задачах оптимального управления”, Тр. Ин-та математики и механики УрО РАН, 26:2 (2020), 252–269. [M. I. Sumin, “On regularization of the classical optimality conditions in convex optimal control problems”, Trudy Inst. Mat. Mekh. UrO RAN, 26:2 (2020), 252–269 (In Russian)].
- M. I. Sumin, “Regularization of Pontryagin maximum principle in optimal control of distributed systems”, Ural Math. J., 2:2 (2016), 72–86.
- Ф. П. Васильев, Методы оптимизации: В 2-х кн., МЦНМО, М., 2011. [F. P. Vasil’ev, Optimization Methods: in 2 books, MCCME, Moscow, 2011 (In Russian)].
- Ж.-П. Обен, Нелинейный анализ и его экономические приложения, Мир, М., 1988; франц. ориг.:J. -P. Aubin, L’analyse non Lineaire et ses Motivations Economiques, Masson, Paris–New York, 1984.
- Ф. Кларк, Оптимизация и негладкий анализ, Наука, М., 1988; англ. ориг.:F. H. Clarke, Optimization and Nonsmooth Analysis, A Wiley–Interscience Publication John Wiley and Sons, New York–Chichester–Brisbane–Toronto–Singapore, 1983.
- Ж.-П. Обен, И. Экланд, Прикладной нелинейный анализ, Мир, М., 1988; англ. ориг.:J. - P. Aubin, I. Ekeland, Applied Nonlinear Analysis, Wiley, New York, 1984.
Дополнительные файлы
