Full Text
1. Введение. Постановка краевой задачи
Поиск эффективных механизмов управления физическими полями в сплошных средах остается важной прикладной задачей на протяжении многих лет. Значимый вклад в эти исследования вносит качественный анализ решений краевых и экстремальных задач для моделей тепломассопереноса. В первую очередь отметим работы [1–7], посвященные исследованию краевых и экстремальных задач для моделей тепломассопереноса в приближении Буссинеска. Статьи [8–14] по исследованию моделей реакции–диффузии–конвекции с зависимыми от решения младшими коэффициентами занимают промежуточное место между работами в рамках приближения Буссинеска и его обобщением. Здесь же отметим статьи [15–19], в которых исследованы близкие модели сложного теплообмена.
В работах [20–27] исследованы краевые и экстремальные задачи для моделей тепломассопереноса, обобщающих приближение Буссинеска. Можно надеяться, что в рамках моделей с наименьшим числом упрощающих предположений могут быть реализованы более реалистичные механизмы управления. Также отметим статьи [28–31] по исследованию усложненных моделей гидродинамики, учитывающих в т.ч. реологию.
В настоящей статье исследуется задача мультипликативного управления для уравнения реакции–диффузии, в котором коэффициент реакции нелинейно зависит от концентрации вещества, а также от пространственных переменных. Роль мультипликативных управлений играют зависящие от пространственных переменных коэффициенты реакции и массобмена в уравнении и граничном условии модели. Основной акцент делается на качественном анализе свойств решений рассматриваемой экстремальной задачи, обладающей повышенной нелинейностью. При этом отсутствие конвекции не упрощает исследование данной задачи, но позволяет установить его новые свойства.
В ограниченной области с границей G, состоящей из двух частей GD и GN, рассматривается следующая краевая задача:
(1)
(2)
Здесь j — концентрация загрязняющего вещества, — коэффициент диффузии, f — объемная плотность внешних источников, — коэффициент реакции, где — коэффициент массобмена. Ниже на задачу (1), (2) при заданных функциях и будем ссылаться как на задачу 1.
Глобальная разрешимость и единственность решения задачи 1 вытекает из результатов [9] для монотонной нелинейности k(j, x)j. Также отметим работу [14], в которой доказана глобальная разрешимость близкой краевой задачи с двумя нелинейностями: k(j, x)j в уравнении и a(j, x)j в граничном условии. Поскольку мы используем операторную конструкцию k, обобщающую зависимость четвертой степени от концентрации j, то это ближе к [9]. В настоящей работе для задачи 1 доказывается разрешимость задачи управления с мультипликативными управлениями l и a и распределенным управление f. При этом требования на гладкость управления l снижены, например, по сравнению с [26] и близкими работами.
При где — размерный параметр, для задачи управления выводятся системы оптимальности. На основе анализа данных систем для двухпараметрической задачи управления, не использующей регуляризацию, установлено, что управления a и f удовлетворяют свойству релейности, иначе, для них справедлив принцип bang–bang. При работе с управлением a используется принцип максимума для концентрации j, установленный в [13]. Для управления f, применяя подход [19], основанный на результатах [32], устанавливается строгое свойство релейности (см. подробнее в [14; 19]). Отметим, что для модели (1), (2) данный подход применим из-за отсутствия конвекции.
В заключительном разделе с использованием системы оптимальности для двухпараметрической задачи мультипликативного управления выводятся оценки локальной устойчивости оптимальных решений относительно малых возмущений как функционалов качества, так и заданной функциий y.
2. Разрешимость краевой задачи
При анализе краевой задачи и задач управления будем использовать функциональные пространства Соболева H S(D), Здесь D обозначает область W, либо некоторую подобласть либо часть GD границы G. Через и будем обозначать норму, полунорму и скалярное произведение в H S(D). Нормы и скалярные произведения в L2(Q), L2(W) либо в L2(GN) будем обозначать соответственно через и и либо и
Введем пространство тестовых функций для концентрации вещества
и функциональные множества
Предположим, что выполняются следующие условия:
(i) W — ограниченная область в с границей состоящей из замыканий двух непересекающихся открытых участков GD и GN при этом поверхностная мера meas GD > 0 и граница GD участка GD состоит из конечного числа липшицевых кривых или является n-угольником;
(ii) , , , , ;
(iii) для любой функции справедливо вложение для некоторого не зависящего от v, и на любом шаре радиуса r выполняется неравенство
где константа L зависит от r, но не зависит от
(iv) нелинейность является монотонной в следующем смысле:
для всех ;
(v) функция ограничена в том смысле, что существуют положительные константы A1, B1, зависящие от k, такие, что
для всех при , .
Отметим, что условия (iii)–(v) описывают оператор, действующий из в позволяющий учитывать достаточно произвольную зависимость коэффициента реакции, как от концентрации j, так и от пространственных переменных. Например,
Напомним также, что в силу теоремы вложения Соболева пространство вкладывается в пространство непрерывно при и компактно при и с некоторой константой , зависящей от и W, справедлива оценка
(3)
Пространство вкладывается в пространство непрерывно при и компактно при В силу непрерывности оператора следа (и его сужения на с константой зависящей от q и GN, справедлива оценка
(4)
Справедлива следующая техническая лемма (см. [33]).
Лемма 2.1. При выполнении условий (i), (ii) , , , и существуют положительные константы , , и , зависящие от или от и , такие, что имеют место следующие соотношения:
(5)
(6)
(7)
Из второй оценки в (5) вытекает следующее неравенство для функции удовлетворяющей условию (iv):
(8)
Умножим уравнение (1) на и проинтегрируем по W, применяя формулу Грина. Учитывая (2), получим
(9)
Определение 2.1. Функцию , удовлетворяющую (9), назовем слабым решением задачи 1.
Для доказательства разрешимости задачи 1 используется следующая лемма (см. [33]).
Лемма 2.2. Пусть выполняются условия (i). Тогда для любой функции существует функция такая, что на и с некоторой константой зависящей от и справедлива оценка .
Из результатов [9], [14] вытекает следующая теорема.
Теорема 2.1. При выполнении условий (i)–(v) существует единственное слабое решение задачи , для которого справедлива оценка
(10)
где — константа из леммы 1.2, и
(11)
Пусть в дополнение к (i)–(v) выполняется следующее условие:
(vi) п.в. на , и п.в. в W, и п.в. на .
Здесь , , , , , — неотрицательные числа, а , и , — положительные числа.
Кроме того, будем считать, что коэффициент реакции k удовлетворяет условию
(vii) , где — непрерывная неотрицательная функция, при этом функциональные уравнения относительно и :
(12)
имеют хотя бы по одному решению.
Положим
(13)
Справедлива следующая теорема (см. [13]).
Теорема 2.2. Пусть выполняются условия (i)–(vii). Тогда для решения задачи 1 выполняется следующий принцип максимума и минимума:
(14)
Здесь константы m и M определены в (13), где M1 — минимальный корень первого уравнения в (12) и ,m1 — максимальный корень второго уравнения в (12).
Замечание 2.1. Для степенных коэффициентов реакции , и из работ [9–11 и 15; 16], образующих монотонные нелинейности , , параметры m1 и M1 легко вычисляются.
3. Задача мультипликативного управления
В этом разделе исследуется задача управления для системы (1), (2) с двумя мультипликативными управлениями l, a и распределенным управлением f.
Предположим, что l, a и f могут изменяться в подмножествах K1, K2 и K3 соответственно, которые удовлетворяют следующему условию:
(j) , , и — непустые выпуклые замкнутые множества.
Пусть в дополнение к (iii)–(v) коэффициент реакции удовлетворяет условию
(viii) для любых справедлива оценка
где L1 — константа, зависящая от r, но не зависящая от .
Несложно проверить, что удовлетворяет условию (viii) так же, как и условиям (iii)–(v).
Введем функциональное пространство , положим , и введем оператор по формулам
и перепишем слабую формулировку (9) задачи 1 в виде операторного уравнения .
Пусть — слабополунепрерывный снизу функционал. Рассмотрим следующую задачу мультипликативного управления:
(15)
Через
обозначим множество допустимых пар для задачи (15).
Пусть в дополнение к (j) выполняются условия:
(jj) множество K1 ограничено в и ;
(jjj) , , , и множество K1 ограничено по норме , а множества K2 и K3 ограничены в своих нормах или , , и функционал I ограничен снизу.
Будем использовать следующие функционалы качества (см. [33]):
(16)
Здесь функция имеет смысл концентрации вещества, измеренной в некоторой подобласти .
Теорема 3.1. Пусть выполняются условия (i)–(v) и (j)–(jjj). Пусть — слабополунепрерывный снизу функционал и . Тогда существует хотя бы одно решение задачи управления (15).
Доказательство. Пусть — минимизирующая последовательность, для которой справедливо равенство
Из условий (jj), (jjj) и теоремы 2.1 следует, что выполняются оценки
(17)
где константы c1, c2, c3 и v4 не зависят от m.
Из оценки (17) и условия (j) вытекает существование слабых пределов , , и некоторых подпоследовательностей последовательностей соответственно , , и . С учетом этого при имеем
(18)
Ясно, что . Покажем, что , т.е. что
(19)
При этом пара удовлетворяет равенству
(20)
Перейдем в (20) к пределу при . Из (18) следует, что все линейные слагаемые в (20) переходят в соответствующие слагаемые в (19). Поэтому перейдем к нелинейным слагаемым, начиная с . Рассуждая как в [9], получаем, что
Рассмотрим далее нелинейные слагаемые, содержащие мультипликативные управления. Для справедливо равенство
(21)
Поскольку , то в силу (18) получаем, что
(22)
Используя последовательность , сходящуюся к h в H–1 (Ω), для первого слагаемого в (21) получаем равенство
(23)
В силу равномерной ограниченности величин и по m существует такой номер , что для второго слагаемого в (23) справедливо неравенство
(24)
Из равномерной ограниченности величин по n и по m и из (18) следует существование такого номера , что для первого слагаемого в (23) справедливо неравенство
(25)
Тогда из (23)–(25) вытекает, что
(26)
В таком случае при для всех Отсюда с учетом (22) заключаем, что
(27)
Для нелинейного слагаемого справедливо равенство
(28)
Поскольку , то для третьего слагаемого в правой части (28) имеем
(29)
Используя , для второго слагаемого получаем
(30)
В силу равномерной ограниченности по m величин и , существует такое число , с которым для второго слагаемого в (30) выполняется неравенство
(31)
В силу равномерной ограниченности по m и n соответственно величин и существует число , с которым первое слагаемое в (30) удовлетворяет неравенству
(32)
Тогда из (31) и (32) вытекает, что
(33)
Аналогично для первого слагаемого в (28) справедливо равенство
(34)
В силу равномерной ограниченности по m и n соответственно величин и , существует число , с которым первое слагаемое в (34) удовлетворяет неравенству
(35)
В силу равномерной ограниченности по и соответственно величин
, и , существует число , с которым первое слагаемое в (34) удовлетворяет неравенству
(36)
Из (35) и (36) вытекает, что
(37)
В таком случае из (29), (33) и (37) заключаем, что
Поскольку функционал J слабополунепрерывен снизу на , тогда из (17) следует, что . Теорема доказана.
Замечание 3.1. Отметим, что требования на гладкость λ уменьшены по сравнению с [26], но остаются высокими, поскольку управления λ и α мультипликативно входят в граничное условие на . Для сравнения при условии Дирихле можно ограничиться тем, что , (см. [34]).
Замечание 3.2. Ясно, что все функционалы качества из (16) удовлетворяют условиям теоремы 3.1.
4. Система оптимальности и принцип bang–bang
В этом разделе и далее будем считать, что , где — размерный параметр. Через обозначим двойственное пространство к пространству Y, введенному в разд. 3.
Легко показать, что производная Фреше оператора по в каждой точке является линейным непрерывным оператором отображающим каждый элемент в элемент
Здесь элементы определяются следующими соотношениями:
(38)
Через обозначим оператор, сопряженный с оператором
В соответствии с общей теорией гладковыпуклых экстремальных задач (см. [35]) введем элемент , на который будем ссылаться как на сопряженное состояние, и определим Лагранжиан по формуле
(39)
Из лемм 2.1, 2.2 и теоремы Лакса–Мильграма вытекает, что для любой пары существует единственное решение линейной задачи
(40)
Тогда оператор — изоморфизм, а из гл. 6 [33] вытекает следующая теорема.
Теорема 4.1. Пусть выполняются условия (i), (ii) и (j)–(jjj), при этом и элемент является локальным минимумом задачи (15). Предположим также, что функционал качества непрерывно дифференцируем по Фреше по состоянию в точке . Тогда
1) существует ненулевой множитель Лагранжа такой, что имеет место уравнение Эйлера–Лагранжа в , эквивалентное соотношению
(41)
2) выполняется принцип минимума , эквивалентный неравенствам
(42)
(43)
(44)
Уравнение Эйлера–Лагранжа (41), неравенства (42)–(44) и слабая формулировка (9) задачи 1 представляют собой систему оптимальности для задачи управления (15).
С использованием системы оптимальности, в большей степени принципа минимума, установим свойство релейности управлений α и f для задачи управления, отвечающей функционалу качества из (16) и в случае, когда , :
(45)
Пусть выполняется условие
(j ) п.в. на для всех и п.в. в Ω для всех .
Здесь — положительные числа.
Для задачи (45) неравенства (43), (44) принимают следующий вид:
(46)
(47)
Из (46), (47) несложно получить (например, методом от противного) неравенства
Если справедлив принцип максимума и минимума для концентрации , то из него вытекает неравенство на . С учетом этого из последних неравенств получаем следующий принцип минимума для экстремальной задачи (45):
(48)
(49)
Из неравенств (48), (49) вытекает, что оптимальные управления и задачи (45) могут принимать, в зависимости от знака множителя Лагранжа , только максимальные и минимальные значения , и , соответственно.
В таком случае говорят, что оптимальные управления α и f удовлетворяют свойству релейности, иначе, для этих управлений справедлив принцип bang–bang. Другими словами, подобное поведение оптимального управления интерпретируют как переключение между двумя состояниями или скачки из одного состояния в другое.
Если не удается исключить ситуацию, когда на некоторых подмножествах и положительной меры, которая приводит к неопределенности, в рамках которой управления и на указанных подмножествах могут как перескочить из одного граничного значения в другое, так и не совершать такой скачок (см. (48), (49)), тогда свойство релейности называют нестрогим.
Покажем, что для управления справедлив строгий принцип bang–bang, при котором указанная выше неопределенность не возникает. Для этого достаточно показать, что п.в. в Ω.
Из уравнения Эйлера–Лагранжа (41) при приходим к равенству
(50)
Из (50) вытекает, что если п.в. в Ω, то п.в. в Ω. В таком случае говорят, что имеет место строгое свойство релейности.
Если в некоторой подобласти положительной меры, то из уравнения (50) вытекает, что
(51)
В то же время, если п.в. в , , то п.в. в Ω, что вытекает из свойства единственности продолжения для эллиптических уравнений (см. [19], [32]). Но равенство п.в. в Ω противоречит теореме 4.1. Таким образом, п.в. в Ω.
Из вышесказанного следует, что для управления f справедлив строгий принцип bang–bang или управление f удовлетворяет строгому свойству релейности. Здесь же отметим работы [14]–[18], посвященные исследованию свойства релейности оптимального управления.
5. Система оптимальности и устойчивость решений задачи управления
Нашей дальнейшей целью является анализ единственности и устойчивости (оптимальных) решений задачи (15) только с двумя мультипликативными управлениями λ и α. При этом требования на функцию λ будут более жесткими.
Будем считать, что вместо (j) и (jjj) выполняются условия
(j0) , , и — непустые выпуклые замкнутые множества;
(jjj0) , , , и множество ограничено или , , и функционал I ограничен снизу.
Вместо (15) будем рассматривать следующую задачу управления:
(52)
Замечание 5.1. Ясно, что для задачи (52) как для частного случая задачи (15), но при более жестких условиях на управление λ, справедливы соответствующие аналоги теорем 3.1 и 4.1.
Далее нам понадобятся дополнительные свойства оптимальных решений задачи (52). Чтобы их получить, вместе с исходной задачей управления (52), рассмотрим возмущенную задачу
(53)
заменив функционал в (52) возмущенным функционалом .
Пусть — решения задачи (52) при и решение задачи (53) при . Из теорем 3.1 и 2.1 вытекает, что для управлений и состояния справедливы следующие оценки:
(54)
Здесь и — положительные константы, а константа определена в (10).
Через , , обозначим нетривиальные множители Лагранжа, отвечающие решениям задачи (52). В силу теоремы 4.1 указанные множители определяются однозначно и удовлетворяют соотношениям
(55)
Положим
(56)
Первым из важных свойств представленных оптимальных решений является алгебраическое неравенство, показывающее связь разностей (56) и производных Фреше функционалов и в точках и . Этот факт отражен в следующей теореме.
Теорема 5.1. Пусть выполняются условия (i), (ii) и (j ), (jjj ), , и пусть функционалы и непрерывно дифференцируемы по . Пусть тройки и являются решениями соответственно задач (52) и (53), и пусть , , — множители Лагранжа, соответствующие решениям , . Тогда для разностей и , определенных в (56), справедливо следующее неравенство:
(57)
Доказательство. Вычтем равенство (9) при , записанное для , из (9) при , записанного для . Учитывая соотношения
приходим к равенству
(58)
Положим далее в (58). Будем иметь
(59)
Вычитая (55) при из (55) при , с учетом соотношений
получим
(60)
Подставляя в (60), получим
(61)
Вычитая (59) из (61), с учетом соотношений
(62)
получаем следующее равенство:
(63)
Положим в неравенстве (42), записанном при , , и . С учетом обозначений (56) получим
Полагая в неравенстве (42), записанном для , , и , получим
Складывая эти неравенства, приходим к следующей оценке:
(64)
Положим в неравенстве (43), записанном при , , и . С учетом обозначений (56) выводим
Полагая в (43), записанном для , , и , получим
Складывая эти неравенства, приходим к оценке
(65)
В свою очередь, складывая (64) и (65) и рассуждая как в [26], получаем
(66)
Наконец, с учетом (66) из (63) мы выводим основное неравенство (57). Теорема доказана.
В заключение раздела выведем оценку нормы разности через соответствующие нормы разностей управлений λ, α и возмущенной функции ψ. Для этого обратимся к равенству (58), в дополнение к (56) полагая
(67)
где , .
Из леммы 2.2 и линейности оператора частичного следа вытекает
(68)
Используя представление (67) и полагая в (58), получим
(69)
Поскольку , на , то, применяя лемму 2.1, с учетом оценок (54) и обозначений (56) из (69) приходим к оценке
С учетом (68) оценка для нормы разности будет иметь вид
(70)
6. Оценки устойчивости оптимальных решений
Используя теорему 5.1, выведем в данном разделе оценки локальной устойчивости оптимальных решений задачи (52) для конкретных функционалов качества.
Рассмотрим следующую задачу управления:
(71)
отвечающую функционалу качества .
Через обозначим решение задачи (71), отвечающее заданным функциям и , а через обозначим решение задачи (71), отвечающее возмущенным функциям и .
В дополнение к (56) положим . В случае задачи (71) справедливо равенство
(72)
С учетом (72) неравенство (57) и соотношения (55), (19) для множителей Лагранжа , отвечающих решениям , , принимают следующий вид:
(73)
(74)
Справедлива оценка
(75)
Полагая в (74), с учетом (75) выводим
(76)
С помощью оценки (70) и неравенств леммы 2.1 оценим слагаемые, входящие в выражение (73) для A, через нормы разностей λ, α и ψ. Начнем со второго слагаемого. С учетом обозначений (62) получим
(77)
Далее выведем аналогичную оценку для первого слагаемого в выражении для A, оценив норму разности через нормы разностей λ, α и ψ.
Положим далее в соотношении (60), записанном для . Получим
(78)
Учитывая, что
из (78) приходим к неравенству
С учетом неравенства (70) из (79) получаем следующую оценку для :
(80)
Здесь
(81)
Наконец, используя (80), с учетом обозначений (62) мы можем оценить первое слагаемое в выражении для в (73):
(82)
С учетом (77) и (82) для из (73) получаем оценку
(83)
Здесь положительные константы и , зависящие от величин и , определяются следующим образом:
(84)
Для того чтобы оценить слагаемое , запишем равенство (61) для функционала в виде
(85)
Рассуждая как и выше, последовательно оценим слагаемые в правой части (85). Справедливы следующие неравенства:
(86)
Из неравенств (86) приходим к оценке
(87)
Здесь положительные константы , , определяются формулами
(88)
Пусть исходные данные задачи (71) удовлетворяют условиям
(89)
С учетом (89) из (73) выводим
(90)
Отбрасывая неположительное слагаемое в правой части (90), получаем
(91)
Решив квадратичное относительно неравенство (91), выводим оценку
Поскольку , и , то последнее неравенство эквивалентно следующему:
(92)
В случае, когда , неравенство (92) имеет смысл -оценки устойчивости компоненты решения задачи (71) относительно малых возмущений функций и .
Если и , то из неравенства (92) вытекает, что в . Тогда из (90) при и вытекает, что в Ω и на , а из (70) при и получаем, что или в Ω. В таком случае при выполнении условия (89) решение задачи (71) единственно.
В общем случае, когда , с помощью неравенства
вытекающего из неравенства Юнга, из (90) выводим, что
(93)
Из формулы (93) вытекают следующие оценки устойчивости, которые мы запишем в обозначениях (56):
(94)
(95)
Из оценок (94), (95) и (70) вытекает, что
(96)
где параметры и , , и параметры , , определены соответственно в (70), (84) и (88).
Сформулируем один из основных результатов статьи в виде следующей теоремы.
Теорема 6.1. Пусть выполняются условия (i), (ii), (j ), (jjj ) и (89), . Пусть — решения задачи (71), отвечающие заданным функциям и , , и исходные данные задачи (71) или параметры m0, m1, m2 удовлетворяют условиям (89). Тогда справедливы оценки устойчивости (94)–(96) .
В заключение отметим, что вывод оценок устойчивости оптимального управления, учитывающих возмущение граничной функции ψ, существенно сложнее вывода аналогичных оценок, отвечающих выбору ψ в качестве управления (см. [8]). В последнем случае отношение двойственности легко оценивается через квадрат нормы с использованием соответствующего принципа минимума из системы оптимальности. Также отметим, что при доказательстве разрешимости экстремальной задачи и выводе оценок устойчивости ее оптимальных решений используются некоторые технические приемы работ [9, 26].