Nondifferential Kuhn-Tucker theorems in constrained extremum problems via subdifferentials of nonsmooth analysis

Cover Page

Cite item

Full Text

Abstract

The paper is devoted to obtaining Kuhn-Tucker theorems in nondifferential form in constrained extremum problems in a Hilbert space. The constraints of the problems are specified by operators whose images are also embedded in a Hilbert space. These constraints contain parameters that are additively included in them. The basis for obtaining nondifferential Kuhn-Tucker theorems is the so-called perturbation method. The article consists of two main sections. The first of them is devoted to obtaining the nondifferential Lagrange principle in the case when the constrained extremum problem is convex. In this case, the Kuhn-Tucker theorem is its “regular part”. Various statements are also presented here that relate the Lagrange multipliers to the subdifferentiability properties of the convex value function of the problem. The main purpose of the first section is to trace how the classical construction of the Lagrange function in its regular and nonregular forms is “generated” by subdifferentials and asymptotic subdifferentials of the value function. This circumstance and the results of the first section make it possible to transfer the natural bridge from the convex parametric constrained extremum problems to similar nonlinear parametric problems of the second section in which the value function, generally speaking, is not convex. The central role here is played not by subdifferentials in the sense of convex analysis, but by subdifferentials of nonsmooth (nonlinear) analysis. As a result, in this case, the so-called modified (not classical) Lagrange function acts as the main construction. Its construction depends entirely on how subdifferentiability is understood in the sense of nonsmooth (nonlinear) analysis.

Full Text

\\section*{Введение}\\label{s0} %Понятие накрывания отображений, действующих в упорядоченных пространствах, %определено в работах \\cite{1}, \\cite{2} в связи с исследованием точек совпадения.... Статья посвящена получению теорем Куна--Таккера в недифференциальной форме в задачах на условный экстремум в гильбертовом пространстве с ограничениями, задаваемыми операторами, образы которых также вкладываются в гильбертово пространство. В основе получения указанных недифференциальных теорем Куна--Таккера лежит так называемый метод возмущений (см., например, \\cite[п.~3.3.2]{altifom}), который %главная суть которого, как %известно, состоит в установлении связи свойств субдифференцируемости %в смысле нелинейного (негладкого) анализа функций значений задач на %условный экстремум с множителями Лагранжа соответствующих %(недифференциальных) условий оптимальности. Метод возмущений является классическим подходом к исследованию задач на условный экстремум. Он позволяет изучать взаимосвязь субдифференциального свойств функций значений ($S$-функций) с условиями оптимальности, множителями Лагранжа, двойственностью в выпуклых задачах на условный экстремум в банаховых пространствах \\cite[п.~3.3.2]{altifom}, свойств устойчивости, чувствительности нелинейных конечномерных задач при возмущении их параметров \\cite{levitin,izmailov}. В данной статье рассматривается зависящая от аддитивно входящих в ограничения параметров классическая нелинейная (параметрическая) задача на условный экстремум с операторным ограничением типа равенства и конечным числом функциональных ограничений типа неравенства (ее <<выпуклый>> вариант см. в \\cite[п.~3.3.2]{altifom}) $$ f(z)\\to\\inf,\\,\\,\\, g(z)=p,\\,\\,h(z)\\leq r,\\,\\,z\\in {\\cal D}\\subset Z,\\leqno(P_{p.r}) $$ где $p\\in H,\\,r\\in \\mathbb{R}^m$ --- параметры $f:\\,{\\cal D}\\to \\mathbb{R}^1$ --- непрерывный функционал, $g:\\, {\\cal D}\\to H$ --- непрерывный оператор, $h\\equiv(h_1,\\dots,h_m):\\,{\\cal D}\\to \\mathbb{R}^m$ --- непрерывный векторный функционал, ${\\cal D}\\subset Z$ --- замкнутое множество, $Z,\\,H$ -- гильбертовы пространства. Обозначим: $$ {\\cal D}_{p,r}^\\epsilon \\equiv\\{z\\in{\\cal D}:\\,\\|g(z)-p\\|\\leq\\epsilon,\\,\\,\\min\\limits_{x\\in \\mathbb{R}^m_-}|h(z)-r-x|\\leq\\epsilon\\},\\,\\,\\epsilon\\geq 0,\\,\\,\\,\\mathbb{R}^m_-\\equiv\\{x\\in \\mathbb{R}^m:\\,x\\leq 0\\}. $$ Определим классическую нижнюю грань (классическое значение) задачи ($P_{p,r}$) формулой $\\beta_0(p,r)\\equiv\\inf\\limits_{z\\in{\\cal D}^0}f(z),$ а также ее обобщенную нижнюю грань (обобщенное значение) $\\beta(p,r):$ $$ \\beta(p,r)\\equiv\\lim_{\\epsilon\\to +0}\\beta_ \\epsilon(p,r),\\,\\,\\,\\,\\beta_\\epsilon(p,r)\\equiv \\inf_{z\\in{\\cal D}_{p,r}^\\epsilon}f(z),\\,\\,\\, \\quad\\beta_\\epsilon(p,r)\\equiv +\\infty,\\,\\,\\mbox{если}\\,\\, {\\cal D}_{p,r}^\\epsilon= \\emptyset. $$ Очевидно, в общей ситуации $\\beta(p,r)\\leq\\beta_0(p,r),$ однако, как в выпуклых задачах ($P_{p,r}$) ($f,\\,h_i,\\,\\,i=1,\\dots,m$ --- выпуклые функции, $g:\\,Z\\to H$ --- линейный (аффинный) ограниченный оператор, ${\\cal D}$ --- выпуклое множество), так и в нелинейных (невыпуклых) возможно строгое неравенство $\\beta(p,r)<\\beta_0(p,r).$ Каждая из этих двух естественным образом возникающих функций значений в задаче ($P_{p,r}$) обладает своими характерными особенностями. Классическая функция значений $\\beta_0:\\,H\\times \\mathbb{R}^m\\to \\mathbb{R}^1\\cup\\{\\pm\\infty\\}$ для выпуклой задачи ($P_{p,r}$) является выпуклой \\cite[п.~3.3.2, следствие 1]{altifom} (см. также лемму \\ref{convex}), но не обязана, вообще говоря, быть полунепрерывной снизу (см. примеры в разделе 1.1). В свою очередь, обобщенная функция значений $\\beta:\\,H\\times \\mathbb{R}^m\\to \\mathbb{R}^1\\cup\\{\\pm\\infty\\}$ для задачи ($P_{p,r}$) общего (нелинейного) вида всегда является полунепрерывной снизу (см.~лемму \\ref{nonlinlowersemicont}), но, естественно, не обязана в этом общем случае быть выпуклой. С одной стороны, мы имеем дело в статье с получением для задачи ($P_{p,r}$) условий классической оптимальности в форме недифференциальных теорем Куна--Таккера и, стало быть, должны работать с классической функцией значений $\\beta_0.$ С другой же стороны, желая при этом непосредственно связать такие классические условия оптимальности с субдифференциальными свойствами функций значений, мы <<неизбежно>> должны иметь дело с полунепрерывными снизу функциями значений, так как именно для таких функций, задаваемых на гильбертовом пространстве (впрочем, как на многих других бесконечномерных пространствах), справедливы так называемые теоремы плотности субдифференцируемости как в смысле выпуклого анализа (в случае выпуклых функций) (см. лемму \\ref{lem_24.02.2020} и \\cite[теорема 4.3]{aubin}), так и в смысле анализа нелинейного (в случае нелинейных невыпуклых функций) \\cite{loewen,clarke,mord,claledsterwol} (см. замечание \\ref{rem_22.02.2020}). Последнее обстоятельство говорит в пользу необходимости, одновременно с функцией $\\beta_0,$ иметь дело и с обобщенной функцией значений $\\beta,$ которая и обладает соответствующими свойствами субдифференцируемости. В данной статье мы будем получать недифференциальные теоремы Куна--Таккера в задачах ($P_{p,r}$), для которых имеет место равенство $\\beta(p,r)=\\beta_0(p,r).$ Таким образом мы одновременно сможем использовать как свойство выпуклости функции значений (в выпуклой задаче), так и свойства ее плотной субдифференцируемости (в выпуклой и невыпуклой задачах). Статья состоит из двух основных разделов. Первый из них посвящен получению недифференциальной теоремы Куна--Таккера, а, точнее говоря, недифференциального принципа Лагранжа (теорема Куна--Таккера есть его первая, <<регулярная>>, часть), в выпуклой задаче $(P_{p,r})\\equiv(P_{p,r}^{co}).$ Анализ приводимого здесь доказательства принципа Лагранжа (см. теорему \\ref{teor1}) для задачи ($P_{p,r}^{co}$) говорит о том, что в своей основе он прежде всего опирается на факт существования нормали к надграфику выпуклой функции значений в данной точке $(p,r)$ или, другими словами, на свойство ее субдифференцируемости в этой точке (непустота субдифференциала или наличие ненулевого элемента в асимптотическом субдифференциале). Таким образом, принцип Лагранжа в случае выпуклой задачи является следствием существования нормали в смысле выпуклого анализа к надграфику функции значений, как функции параметра, при данном фиксированном значении параметра. При этом <<регулярная>> часть принципа Лагранжа --- теорема Куна--Таккера является следствием непустоты субдифференциала функции значений при данном фиксированном значении параметра. Данное наблюдение и содержание первого раздела имеют существенное методологическое значение и позволяют перекинуть естественный мостик от выпуклых параметрических задач на условный экстремум к аналогичным нелинейным параметрическим задачам. В них функция значений естественно <<не обязана быть>> выпуклой, и центральную роль в нелинейном случае играют уже нормали в смысле негладкого (нелинейного) анализа к надграфикам функций значений и, соответственно, субдифференциалы негладкого анализа (см.,~например, \\cite{loewen,clarke,mord,claledsterwol}). Получению соответствующих теорем Куна--Таккера для нелинейных (невыпуклых) задач ($P_{p,r}$) посвящен второй основной раздел статьи. В нем показывается как субдифференцируемость в смысле нелинейного анализа функции значений обеспечивает получение соответствующей теоремы Куна--Таккера в задаче ($P_{p,r}$). Однако, в этом случае в качестве основной конструкции будет выступать уже не классическая функция Лагранжа, а так называемая модифицированная, вид которой напрямую зависит от вида субдифференцируемости в смысле нелинейного анализа. В качестве понятий субдифференцируемости в общем нелинейном случае мы рассматриваем во втором разделе два широко используемых в нелинейном (негладком) анализе понятия --- понятие проксимального субградиента и понятие судбдифференциала Фреше \\cite{loewen,clarke,mord,claledsterwol} (оба этих понятия определяются в разделе 2). Подчеркнем, что получение недифференциальных теорем Куна--Таккера как в выпуклом (раздел 1), так и невыпуклом (раздел 2) случаях на основе идеологии метода возмущений и наличие соответствующих результатов по плотности субдифференцируемости полунепрерывных снизу функций (как выпуклых, так и невыпуклых) обеспечивает, если так можно выразиться, дополнительную <<легитимность>> результатов статьи. Свойство плотности субдифференцируемости, в первую очередь, говорит о том, что выполнимость получаемых в статье недифференциальных теорем Куна--Таккера можно трактовать как характерное свойство выпуклых и невыпуклых задач на условный экстремум (в некоторых содержательных частных случаях оно является и свойством общего положения). Одновременно, можно утверждать, что аппарат современного негладкого анализа \\cite{loewen,clarke,mord,claledsterwol}, подобно тому, как это сделано в выпуклом случае задачи $(P_{p,r})\\equiv(P_{p,r}^{co})$ (разделы 1.3 -- 1.5), позволяет также установить тесную связь между регулярными и нерегулярными формами <<нелинейных>> условий оптимальности, между <<нелинейными>> субдифференциалами и множителями Лагранжа, однако эти вопросы в данной статье не рассматриваются. Недифференциальные теоремы Куна--Таккера имеют важное значение при изучении вопросов регуляризации классических условий оптимальности в различных задачах условной оптимизации (см.,~например, \\cite{suminm2011,suminm2014,suminm2015,suminm2018,suminm2019}). \\section{Принцип Лагранжа и теорема Куна--Таккера в недифференциальной форме в выпуклой задаче на условный экстремум}\\label{s1} В данном разделе последовательно ставится выпуклая задача на условный экстремум, доказываются соответствующие недифференциальные принцип Лагранжа и его <<регулярная>> часть --- теорема Куна--Таккера, устанавливается связь между субдифференциалами функции значений и множителями Лагранжа, а также между <<нерегулярной>> и <<регулярной>> частями принципа Лагранжа. \\textbf{1.1. Постановка выпуклой задачи на условный экстремум.} Рассматриваем зависящую от параметров в ограничениях каноническую задачу на условный экстремум (см., например, \\cite[п.~3.3.2]{altifom}) $$ f(z)\\to\\inf,\\,\\,\\, Az=h+p,\\,\\,\\,g(z)\\equiv(g_1(z),\\dots,g_m(z))\\leq r,\\,\\,\\,\\,z\\in {\\cal D}\\subset Z,\\,\\,\\,\\,\\leqno(P_{p,r}^{co}) $$ где $p\\in H,\\,r=(r_1,\\dots,r_m)\\in \\mathbb{R}^m$ --- параметры, $f,\\,g_i:\\,{\\cal D}\\to \\mathbb{R}^1,$ $i=1,\\dots,m,$ --- выпуклые непрерывные функционалы, $A:\\,Z\\to H$ --- линейный ограниченный оператор, $h\\in H$ --- заданный элемент, ${\\cal D}$ --- выпуклое замкнутое множество, $Z,$ $H$ --- гильбертовы пространства. Решения задачи $(P_{p,r}^{co})$ в случае их существования будем обозначать через $z_{p,r}^0,$ а всю совокупность таких решений --- через $Z_{p,r}^0\\equiv\\{z^\\ast\\in{\\cal D}:f(z^\\ast)=\\min\\limits_{z\\in{\\cal D}_{p,r}^0}f(z)\\}.$ Здесь и ниже используется обозначение: ${\\cal D}_{p,r}^{\\epsilon}\\equiv\\{z\\in{\\cal D}:\\,\\|Az-h-p\\|\\leq\\epsilon,\\,\\,g_i(z)\\leq r_i+\\epsilon,\\,\\,i=1,\\dots,m\\}.$ Определим классическую функцию значений (зависящую от параметров $(p,r)$ классическую нижнюю грань) задачи ($P_{p,r}^{co}$) формулой $\\beta_0(p,r)=\\inf\\limits_{z\\in{\\cal D}_{p,r}^0}f(z)\\,\\,\\forall\\,(p,r)\\in H\\times \\mathbb{R}^m.$ Справедлива (см.~\\cite[п.~3.3.2]{altifom}) \\begin{Lemma}\\label{convex} Функция значений $\\beta_0:\\,H\\times \\mathbb{R}^m\\to \\mathbb{R}^1\\cup\\{\\pm\\infty\\}$ является выпуклой. \\end{Lemma} Помимо классической функции значений нам потребуется еще и обобщенная \\linebreak $\\beta:\\,H\\times \\mathbb{R}^m\\to \\mathbb{R}^1\\cup\\{\\pm\\infty\\},$ определяемая посредством соотношений $$ \\beta(p,r)\\equiv\\beta_{+0}(p,r)\\equiv\\lim_{\\epsilon\\to +0}\\beta_{\\epsilon}(p,r),\\,\\,\\,\\,\\beta_{\\epsilon}(p,r)\\equiv \\inf_{z\\in{\\cal D}_{p,r}^{\\epsilon}}f(z),\\,\\,\\, \\quad\\beta_\\epsilon(p,r)\\equiv +\\infty,\\,\\,\\mbox{если}\\,\\, {\\cal D}_{p,r}^{\\epsilon}=\\emptyset. $$ %Справедлива (см.~\\cite[лемма 7]{suminm1997a}) \\begin{Lemma}\\label{lowersemicont} Функция значений $\\beta:\\,H\\times \\mathbb{R}^m\\to \\mathbb{R}^1\\cup\\{\\pm\\infty\\}$ является полунепрерывной снизу и выпуклой. \\end{Lemma} \\proof Для доказательства полунепрерывности снизу зададимся произвольной последовательностью $(p^i,r^i)\\in H\\times \\mathbb{R}^m,\\,\\,\\,i=1,2,\\dots,\\,\\,\\, (p^i,r^i)\\to (p,r)\\in H\\times \\mathbb{R}^m,$ $i\\to\\infty.$ Согласно определению функции значений $\\beta(p^i,r^i)=\\lim\\limits_{k\\to\\infty}\\beta_{\\epsilon_k}(p^i,r^i),$ $\\epsilon_k>0,$ $\\epsilon_k\\to 0,\\,\\,k\\to\\infty,$ причем без ограничения общности считаем, что $\\beta(p^i,r^i)\\to\\overline\\beta(p,r),$ где $\\overline\\beta(p,r)$ некоторое число (конечное или $\\pm\\infty$). Пусть $k_i,\\,\\,i=1,2,\\dots,$ такая подпоследовательность последовательности $k=1,2,\\dots,$ что последовательность $\\beta_{\\epsilon_{k_i}}(p^i,r^i),\\, i=1,2,\\dots,$ имеет предел и к тому же $\\lim\\limits_{i\\to\\infty}\\beta_{\\epsilon_{k_i}}(p^i,r^i)=\\overline\\beta(p,r),$ $\\epsilon_{k_i}>0,$ $\\epsilon_{k_i}\\to 0,$ $i\\to\\infty.$ Но тогда при всех $i=1,2,\\dots$ имеем включение ${\\cal D}_{p^i,r^i}^{\\epsilon_{k_i}}\\subset{\\cal D}_{p,r}^{\\overline\\epsilon_i}$ для некоторой последовательности $\\overline\\epsilon_i,$ $i=1,2,\\dots,$ $\\overline\\epsilon_i>0,$ $\\overline\\epsilon_i\\to 0,$ $i\\to\\infty,$ и, значит, $\\beta_{\\epsilon_{k_i}}(p^i,r^i)\\geq\\beta_{\\overline\\epsilon_i}(p,r),$ $i=1,2,\\dots,$ откуда следует $\\beta(p,r)=\\lim\\limits_{i\\to\\infty}\\beta_{\\overline\\epsilon_i}(p,r) \\leq\\overline\\beta(p,r).$ Последнее неравенство означает, что полунепрерывность снизу доказана. Выпуклость функции $\\beta$ есть следствие ее определения как поточечного предела выпуклых классических функций значений $\\beta_\\epsilon$ в выпуклых задачах $f(z)\\to\\inf,$ $z\\in{\\cal D}_{p,r}^{\\epsilon}.$ Доказательство выпуклости $\\beta_\\epsilon:\\,H\\times R^m\\to R^1\\cup\\{\\pm\\infty\\}$ проводится точно по схеме доказательства следствия 1 в \\cite[п.~3.3.2, с. 265]{altifom}. В нем аффинное по $(z,p)$ равенство $Az-h-p=0$ заменяется на ограничение-неравенство $\\|Az-h-p\\|\\leq\\epsilon$ с выпуклой по $(z,p)$ функцией $\\|Az-h-p\\|,\\,\\,(z,p)\\in{\\cal D}\\times H,$ схема же рассуждений полностью сохраняется. Очевидно, что имеет место неравенство $\\beta(p,r)\\leq\\beta_0(p,r)\\,\\,\\forall\\,(p,r)\\in H\\times \\mathbb{R}^m,$ которое может выполняться в выпуклой задаче и как строгое. Приведем иллюстрирующие это обстоятельство примеры. \\begin{Example}\\label{rem_14.03.2020} В качестве первого примера рассмотрим параметрическую задачу $e^{-x}\\to\\inf,$ $e^{-x}\\leq r,$ $x,r\\in \\mathbb{R}^1.$ Легко заметить, что в этом примере $\\beta(0)=0,$ но $\\beta_0(0)=+\\infty.$ При этом одновременно в этом примере функция $\\beta_0$ не является полунепрерывной снизу. Второй аналогичный пример со строгим неравенством двух граней, но с разрешимой задачей условной минимизации, можно найти в \\cite[с.~173, 174]{gol}: $$ -\\sqrt {x_1}\\sqrt {x_2}\\to\\inf,\\,\\,x_2\\leq r,\\,\\,x=(x_1,x_2)\\in{\\cal D}=\\{x\\in \\mathbb{R}^2:\\,x_1\\geq 0,\\,x_2\\geq 0\\},\\,\\,r\\in \\mathbb{R}^1. $$ Здесь $\\beta_0(0)=0,$ но $\\beta(0)=-\\infty.$ \\end{Example} Далее будем считать, что мы имеем дело с задачей ($P_{p,r}^{co}$), у которой функция значений $\\beta:\\,H\\times \\mathbb{R}^m\\to \\mathbb{R}^1\\cup\\{+\\infty\\}$ является собственной, то есть $\\mbox{dom}\\,\\beta\\neq\\emptyset.$ Это заведомо так, по крайней мере, при условиях следующей леммы. \\begin{Lemma}\\label{equality} Имеет место равенство $\\beta(p,r)=\\beta_0(p,r),$ если выполняется, по крайней мере, одно из следующих двух условий: 1) $f$ сильно выпуклый на ${\\cal D}$ функционал; 2) ${\\cal D}$ ограничено. При этом $$ \\beta_0(p,r)=\\{f(z_{p,r}^0), \\mbox{ если }z_{p,r}^0 \\mbox{ сущест\\-вует};\\,\\,+\\infty\\mbox{ в противном случае}\\}\\,\\,\\forall\\,(p,r)\\in H\\times \\mathbb{R}^m. $$ \\end{Lemma} \\proof Обоснование равенства обобщенной и классической фун\\-кций значений проводится в точном соответствии со схемой доказательства полностью аналогичной леммы в \\cite[лемма 2.4.1]{Sumin2009_textbook}. %\\newpage Введем функционал Лагранжа $$ L_{p,r}(z,\\mu_0,\\lambda,\\mu)\\equiv \\mu_0f(z)+\\langle\\lambda,A z-h-p\\rangle+\\langle\\mu,g(z)-r\\rangle,\\,\\,\\, z\\in {\\cal D},\\,\\mu_0\\geq 0,\\,\\lambda\\in H,\\,\\,\\mu\\in \\mathbb{R}^m, $$ его регулярный вариант $ L_{p,r}(z,1,\\lambda,\\mu)\\equiv L_{p,r}(z,\\lambda,\\mu),$ вогнутый двойственный функционал $V_{p,r}(\\lambda,\\mu)\\equiv \\inf\\limits_{z\\in{\\cal D}}L_{p,r}(z,\\lambda,\\mu),\\,\\,\\,\\lambda\\in H,\\,\\,\\mu\\in \\mathbb{R}^m$ и соответствующую двойственную задачу \\begin{equation}\\label{dual} V_{p,r}(\\lambda,\\mu)\\to\\sup,\\,\\,\\,(\\lambda,\\mu)\\in H\\times \\mathbb{R}^m_+. \\end{equation} Напомним, что вектором Куна--Таккера задачи ($P_{p,r}^{co}$) называется пара $(\\lambda^\\ast,\\mu^\\ast)\\in H\\times \\mathbb{R}^m_+,$ для которой $\\inf\\limits_{z\\in{\\cal D}_{p,r}^0}f(z)\\leq L_{p,r}(z,\\lambda^\\ast,\\mu^\\ast)\\,\\,\\,\\forall\\,z\\in {\\cal D},$ где $\\inf\\limits_{z\\in{\\cal D}_{p,r}^0}f(z)=f(z_{p,r}^0)$ в случае разрешимости задачи ($P_{p,r}^{co}$). Известно (см., например, теорему \\ref{teor1} и ее доказательство), что любой такой вектор Куна--Таккера $(\\lambda^\\ast,\\mu^\\ast)$ в паре с $z_{p,r}^0$ составляют седловую точку функции Лагранжа $L_{p,r}(\\cdot,\\cdot,\\cdot),$ а взятый с обратным знаком, то есть вектор $-(\\lambda^\\ast,\\mu^\\ast)$ --- является одновременно элементом субдифференциала (в смысле выпуклого анализа) $\\partial\\beta(p,r)$ выпуклой полунепрерывной снизу функции значений $\\beta$ в точке $(p,r)$ и нормалью (в смысле выпуклого анализа) вида $(\\zeta,-1)$ к $\\mbox{epi}\\,\\beta$ в точке $(p,r,\\beta(p,r)).$ \\textbf{1.2. Недифференциальные принцип Лагранжа и теорема Куна--Таккера в выпуклой задаче на условный экстремум. } Сформулируем и докажем параметрический принцип Лагранжа в недифференциальной форме в задаче ($P_{p,r}^{co}$). Он жестко связывает как выполнимость, так и свойства регулярности самого принципа Лагранжа в задаче ($P_{p,r}^{co}$) при фиксированной паре $(p,r)\\in\\mbox{dom}\\,\\beta$ с субдифференциальными свойствами функции значений $\\beta$ в точке $(p,r).$ Одновременно в нем формулируются необходимые и достаточные условия того, что $(p,r)\\in\\partial\\mbox{dom}\\,\\beta.$ Естественно, при этом нам не нужны дополнительные предположения о дифференцируемости исходных данных. Приводимая ниже теорема уточняет теорему 2.1 в \\cite{suminm2011}. Ее формулировка и доказательство помогают получению аналогичных результатов в нелинейных задачах на условный экстремум в разделе 2. Автор не исключает, что формулируемый и доказываемый ниже параметрический классический принцип Лагранжа может быть найден еще в какой-либо из большого числа имеющихся к настоящему времени публикаций, посвященных различным вариантам принципа Лагранжа в выпуклых задачах на условный экстремум. Обозначим через $N_{\\Omega}(x)$ конус нормалей в смысле выпуклого анализа к выпуклому множеству $\\Omega$ в точке $x\\in\\Omega\\subset H $ где $H$ --- гильбертово пространство. При доказательстве принципа Лагранжа нам понадобится (см., например, \\cite[замечание 4A.2(b)]{loewen}) \\begin{Lemma}\\label{2l2_2_1} Если $f:\\,H\\to \\mathbb{R}^1\\cup\\{+\\infty\\}$ выпуклая функция, то $\\zeta\\in\\partial f(x),$ где $\\partial f(x)$ --- субдифференциал в смысле выпуклого анализа функции $f,$ тогда и только тогда, когда $(\\zeta,-1)\\in N_{\\mbox{epi}\\, f}(x,f(x)),$ что, в свою очередь, эквивалентно неравенству $$ \\langle(\\zeta,-1),(y,r)-(x,f(x))\\rangle\\leq 0\\,\\,\\forall\\,(y,r)\\in \\mbox{epi}\\, f. $$ \\end{Lemma} Справедливо также следующее важное, в контексте настоящей статьи, утверждение о плотности субдифференцируемости (см., например, \\cite[теорема 4.3]{aubin}). \\begin{Lemma}\\label{lem_24.02.2020} Субдифференциал собственной выпуклой полунепрерывной снизу функции $f:\\,H\\to \\mathbb{R}^1\\cup\\{+\\infty\\},$ где $H$ --- гильбертово пространство, не пуст в точках плотного в $\\mbox{dom}\\, f$ множества. \\end{Lemma} \\begin{Theorem}\\label{teor1} $[$Параметрический принцип Лагранжа в недифференциальной фор\\-ме$]$ Пусть функция $f:\\,{\\cal D}\\to \\mathbb{R}^1$ выпукла, множество ${\\cal D}$ является выпуклым и замкнутым (возможно неограниченным), $\\beta:\\,H\\times \\mathbb{R}^m\\to \\mathbb{R}^1\\cup\\{+\\infty\\}$ --- собственная $($полунепрерывная снизу выпуклая$)$ функция. Пусть также $(p,r)\\in H\\times \\mathbb{R}^m$ такая точка, что $\\beta(p,r)<+\\infty$ и $\\beta_0(p,r)=\\beta(p,r).$ Тогда: %справедливы следующие два утверждения. \\textbf{1.} Если $z_{p,r}^0\\in{\\cal D}_{p,r}^0\\equiv\\{z\\in{\\cal D}:\\,Az-h-p=0,\\,\\,g_i(z)\\leq r_i,\\,\\,i=1,\\dots,m\\}$ --- оптимальный элемент в задаче $(P_{p,r}^{co}),$ то есть $f(z_{p,r}^0)=\\beta_0(p,r),$ и $\\zeta\\in\\partial\\beta(p,r),$ где $\\partial\\beta(p,r)$ --- субдифференциал в смысле выпуклого анализа, то для множителей Лагранжа $\\lambda\\in H,\\,\\,\\mu\\in \\mathbb{R}^m_+,$ $(\\lambda,\\mu)=-\\zeta,$ при $\\mu_0=1$ выполняются соотношения \\begin{equation}\\label{2dis5*12_1_1_1} L_{p,r}(z_{p,r}^0,\\mu_0,\\lambda,\\mu)\\leq L_{p,r}(z,\\mu_0,\\lambda,\\mu)\\,\\,\\forall\\,z\\in{\\cal D},\\,\\,\\,\\,\\mu_i(g_i(z_{p,r}^0)-r_i)=0,\\,\\,\\,i=1,\\dots,m \\end{equation} и при этом $-\\zeta=(\\lambda,\\mu)$ --- вектор Куна--Таккера задачи $(P_{p,r}^{co}).$ И, наоборот, если $\\beta(p,r)=\\beta_0(p,r)$ $\\forall\\,(p,r)\\in H\\times \\mathbb{R}^m$ и $\\tilde z\\in{\\cal D}_{p,r}^0$ такой элемент, что при некоторых $\\mu_0>0,\\,\\,\\lambda\\in H,\\,\\,\\,\\mu\\in \\mathbb{R}^m_+$ выполняются соотношения \\eqref{2dis5*12_1_1_1} с заменой $z_{p,r}^0$ на $\\tilde z,$ то этот элемент оптимален в задаче $(P_{p,r}^{co}),$ то есть $\\tilde z=z_{p,r}^0,$ пара $(\\lambda/\\mu_0,\\mu/\\mu_0)$ является вектором Куна--Таккера для нее и одновременно $(-\\lambda/\\mu_0,-\\mu/\\mu_0)\\in\\partial\\beta(p,r).$ \\textbf{2.} Если $z_{p,r}^0\\in{\\cal D}_{p,r}^0$ --- оптимальный элемент в задаче $(P_{p,r}^{co}),$ $(p,r)\\in\\partial\\,dom\\beta$ и\\linebreak $\\zeta\\in\\partial^\\infty\\beta(p,r),$ $\\zeta\\neq 0,$ где $\\partial^\\infty\\beta(p,r)$ --- сингулярный $($асимпто\\-ти\\-чес\\-кий$)$ субдифференциал $($см., например, \\cite{loewen}$),$ определяемый формулой $$\\partial^\\infty\\beta(p,r)\\equiv\\{(\\lambda,\\mu)\\in H\\times \\mathbb{R}^m:\\,((\\lambda,\\mu),0)\\in N_{\\mbox{epi}\\,\\beta}((p,r),\\beta(p,r))\\}, $$ то для множителей Лагранжа $\\lambda\\in H,\\,\\,\\mu\\in \\mathbb{R}^m_+,$ $(\\lambda,\\mu)=-\\zeta,$ соотношения \\eqref{2dis5*12_1_1_1} выполняются при $\\mu_0=0.$ И, наоборот, если $\\beta(p,r)=\\beta_0(p,r)$ $\\forall\\,(p,r)\\in H\\times \\mathbb{R}^m$ и $\\tilde z\\in{\\cal D}_{p,r}^0$ --- такой элемент, что при $\\mu_0=0$ и некоторых $\\lambda\\in H,\\,\\,\\,\\mu\\in \\mathbb{R}^m_+,$ $(\\lambda,\\mu)\\neq 0,$ выполняются соотношения \\eqref{2dis5*12_1_1_1} с заменой $z_{p,r}^0$ на $\\tilde z,$ то $(p,r)\\in \\partial\\,dom\\,\\beta$ и одновременно $(-\\lambda,-\\mu)\\in\\partial^\\infty\\beta(p,r).$ \\end{Theorem} \\begin{Remark}\\label{zam1} Первая часть теоремы \\ref{teor1} представляет собой, по сути дела, формулировку классической теоремы Куна--Таккера $($см., например, \\cite{altifom,vasil'ev2011,sutife}$)$ с использованием вместо понятия вектора Куна--Таккера эквивалентного в данном контексте понятия субдифференциала функции значений. При этом пара двойственных переменных $(\\lambda/\\mu_0,\\mu/\\mu_0),$ о которой идет речь в обоих утверждениях первой части теоремы, является одновременно вектором Куна--Таккера задачи $(P_{p,r}^{co})$ и решением двойственной задачи \\eqref{dual}. \\end{Remark} \\begin{Remark}\\label{zam3} \\ Важным \\, является то, что \\, принципом \\, Лагранжа тео\\-ре\\-мы \\ref{teor1} <<не охватываются>> задачи $(P_{p,r}^{co}),$ для которых одновременно $\\partial\\beta(p,r)=\\emptyset$ и\\linebreak $\\partial^\\infty\\beta(p,r)=\\{0\\},$ что вполне возможно для задач с ограничениями, задаваемыми операторами с бесконечномерными образами. Из теоремы следует, что обычный невырожденный (регулярный или нерегулярный) принцип Лагранжа в задаче $(P_{p,r}^{co})$ выполняется тогда и только тогда, когда имеет место хотя бы одно из двух соотношений $\\partial\\beta(p,r)\\neq\\emptyset,$ $\\partial^\\infty\\beta(p,r)\\neq\\{0\\}.$ \\end{Remark} \\proof Доказываем первое утверждение первой части теоремы \\ref{teor1}. В силу леммы \\ref{2l2_2_1} можем записать \\begin{equation}\\label{07_1} \\langle((-\\lambda,-\\mu),-1),((\\gamma,\\omega),s)-((p,r),\\beta(p,r))\\rangle\\leq 0\\,\\,\\,\\forall\\,((\\gamma,\\omega),s)\\in \\mbox{epi}\\,\\beta \\end{equation} или $$ -\\langle \\lambda,\\gamma-p\\rangle-\\langle\\mu,\\omega-r\\rangle\\leq s-\\beta(p,r)\\,\\,\\,\\forall\\,((\\gamma,\\omega),s)\\in \\mbox{epi}\\,\\beta $$ или $$ \\langle \\lambda,\\gamma\\rangle+\\langle\\mu,\\omega\\rangle+s\\geq\\langle \\lambda,p\\rangle+\\langle\\mu,r\\rangle+\\beta(p,r)\\,\\,\\,\\forall\\,((\\gamma,\\omega),s)\\in \\mbox{epi}\\,\\beta. $$ Последнее означает, что точка $(z_{p,r}^0,(p,r))\\in{\\cal D}\\times H\\times \\mathbb{R}^m,$ с учетом включения $\\mbox{epi}\\,\\beta_0\\subseteq\\mbox{epi}\\,\\beta$ (так как $\\beta(p,r)\\leq\\beta_0(p,r)$), доставляет минимальное значение в задаче \\begin{equation}\\label{aux} \\widetilde f(z,\\gamma,\\omega)\\equiv f(z)+\\langle \\lambda,\\gamma\\rangle+\\langle\\mu,\\omega\\rangle\\to\\min, \\end{equation} $$ Az-h=\\gamma,\\,\\,\\,\\,g(z)\\leq \\omega\\,\\,\\,\\,(z,(\\gamma,\\omega))\\in {\\cal D}\\times H\\times \\mathbb{R}^m. $$ Действительно, если $Az-h=\\gamma,$ $g(z)\\leq\\omega,$ то $(z,(\\gamma,\\omega))$ такая точка, что $((\\gamma,\\omega), f(z))\\in\\mbox{epi}\\,\\beta$ и, значит, $$ \\langle \\lambda,\\gamma\\rangle+\\langle\\mu,\\omega\\rangle+f(z)\\geq\\langle \\lambda,p\\rangle+\\langle\\mu,r\\rangle+\\beta(p,r). $$ Получим условия оптимальности этой точки в задаче \\eqref{aux}. Покажем сначала, что $\\mu\\geq 0$ и выполняется условие дополняющей нежесткости. Можем записать $ \\langle\\mu,r\\rangle\\leq\\langle\\mu,\\omega\\rangle\\,\\,\\forall\\,\\omega\\in{\\mathbb{R}^m}\\,\\,\\mbox{такого, что }\\,g(z_{p,r}^0)\\leq \\omega,$ так как в силу \\eqref{aux} $$ f(z_{p,r}^0)+\\langle \\lambda,p\\rangle+\\langle\\mu,r\\rangle\\leq f(z_{p,r}^0)+\\langle \\lambda,p\\rangle+\\langle\\mu,\\omega\\rangle\\,\\,\\forall\\,\\omega\\in{\\mathbb{R}^m}\\,\\,\\mbox{такого, что }\\,g(z_{p,r}^0)\\leq \\omega. $$ Тогда в силу указанного произвола $\\omega$ из неравенства $\\langle\\mu,\\omega-r\\rangle\\geq 0,$ справедливого для любого $\\omega\\geq r,$ так как $g(z_{p,r}^0)\\leq r$ и для любого $\\omega\\geq r$ имеет место неравенство $g(z_{p,r}^0)\\leq \\omega,$ выводим включение $\\mu\\in \\mathbb{R}^m_+.$ Одновременно при $\\omega=g(z_{p,r}^0)$ получаем неравенство $\\langle\\mu,g(z_{p,r}^0)-r\\rangle\\geq 0,$ которое в паре с другим неравенством $\\langle\\mu,g(z_{p,r}^0)-r\\rangle\\leq 0,$ являющимся следствием включения $\\mu\\in \\mathbb{R}^m_+$ и неравенства $g(z_{p,r}^0)\\leq r,$ влечет равенство $\\langle\\mu,g(z_{p,r}^0)-r\\rangle=0,$ из которого в силу противоположных знаков сомножителей вытекает условие дополняющей нежесткости $\\mu_i(g_i(z_{p,r}^0)-r_i)=0,\\,\\,\\,i=1,\\dots,m.$ Далее, в силу \\eqref{aux} можем записать, $$ f(z_{p,r}^0)+\\langle \\lambda,p\\rangle+\\langle\\mu,r\\rangle\\leq f(z)+\\langle \\lambda,\\gamma\\rangle+\\langle\\mu,\\omega\\rangle,\\,\\, Az-h=\\gamma,\\,\\,g(z)\\leq \\omega,\\,\\,(z,(\\gamma,\\omega))\\in{\\cal D}\\times H\\times \\mathbb{R}^m, $$ то есть $$ f(z_{p,r}^0)+\\langle \\lambda,Az_{p,r}^0-h-p\\rangle\\leq f(z)+\\langle \\lambda,Az-h-p\\rangle+\\langle\\mu,\\omega-r\\rangle \\,\\,\\forall(z,\\omega)\\in{\\cal D}\\times \\mathbb{R}^m,\\,\\,g(z)\\leq \\omega, $$ откуда в силу доказанного условия дополняющей нежесткости имеем $$ f(z_{p,r}^0)+\\langle \\lambda,Az_{p,r}^0-h-p\\rangle+\\langle\\mu,g(z_{p,r}^0)-r\\rangle\\leq $$ $$ f(z)+\\langle \\lambda,Az-h-p\\rangle+\\langle\\mu,\\omega-r\\rangle\\,\\,\\forall(z,\\omega)\\in{\\cal D}\\times \\mathbb{R}^m,\\,\\,g(z)\\leq \\omega, $$ и при $\\omega=g(z)$ $$ f(z_{p,r}^0)+\\langle \\lambda,Az_{p,r}^0-h-p\\rangle+\\langle\\mu,g(z_{p,r}^0)-r\\rangle\\leq f(z)+\\langle \\lambda,Az-h-p\\rangle+\\langle\\mu,g(z)-r\\rangle\\,\\,\\forall \\,z\\in{\\cal D}, $$ или $$ L_{p,r}(z,\\lambda,\\mu)\\geq L_{p,r}(z_{p,r}^0,\\lambda,\\mu)\\,\\,\\forall\\,z\\in{\\cal D}, $$ то есть получены все соотношения принципа Лагранжа в недифференциальной форме. Заметим здесь же, что одновременно в силу выпуклости задачи нами доказано, что элемент $-\\zeta=(\\lambda,\\mu)$ является и ее вектором Куна-Таккера. Таким образом, первое утверждение первой части теоремы доказано. Доказываем второе утверждение первой части теоремы. Пусть $z_{p,r}^0\\in{\\cal D}_{p,r}^0$ такой элемент, что при некоторых $\\mu_0>0,\\,\\,\\lambda\\in{H},\\,\\,\\,\\mu\\in{\\mathbb{R}^m}$ выполняются соотношения \\eqref{2dis5*12_1_1_1}. Тогда, очевидно, точка $z_{p,r}^0\\in{\\cal D}_{p,r}^0$ доставляет минимальное значение в задаче $$ \\mu_0 f(z)+\\langle \\lambda,Az-h-p\\rangle+\\langle\\mu,g(z)-r\\rangle\\to\\min,\\,\\,\\,\\,z\\in{\\cal D}. $$ Отсюда с учетом условия дополняющей нежесткости в \\eqref{2dis5*12_1_1_1} имеем \\begin{equation}\\label{new2} \\mu_0 f(z_{p,r}^0)=\\mu_0 f(z_{p,r}^0)+\\langle \\lambda,Az^0_{p,r}-h-p\\rangle+\\langle\\mu,g(z_{p,r}^0)-r\\rangle\\leq \\end{equation} $$ \\mu f(z)+\\langle \\lambda,Az-h-p\\rangle+\\langle\\mu,g(z)-r\\rangle\\,\\,\\,\\,\\,\\forall\\,z\\in{\\cal D}. $$ Поэтому для всех $z\\in{\\cal D}_{p,r}^0$ можем записать $\\mu_0 f(z_{p,r}^0)\\leq\\mu_0 f(z),$ и, значит, в силу положительности $\\mu_0$ имеем $f(z_{p,r}^0)\\leq f(z)\\,\\,\\,\\,\\forall\\,z\\in{\\cal D}_{p,r}^0.$ Заметим, что одновременно из \\eqref{new2} вытекает, что $$ \\beta(p,r)= f(z^0_{p,r})\\leq f(z)+\\langle \\lambda/\\mu_0,Az-h-p\\rangle+\\langle\\mu/\\mu_0,g(z)-r\\rangle\\,\\,\\,\\,\\,\\forall\\,z\\in{\\cal D}, $$ то есть $(\\lambda/\\mu_0,\\mu/\\mu_0)$ --- вектор Куна--Таккера. Из последнего неравенства выводим также $$ \\beta(p,r)+\\langle(\\lambda/\\mu_0,\\mu/\\mu_0),(p,r)\\rangle\\leq f(z)+\\langle(\\lambda/\\mu_0,\\mu/\\mu_0),(Az-h,g(z))\\rangle\\,\\,\\,\\forall\\,z\\in{\\cal D}, $$ откуда, в свою очередь, с учетом равенства $\\beta(p,r)=\\beta_0(p,r)$ $\\forall\\,(p,r)\\in H\\times \\mathbb{R}^m,$ получаем $$ \\beta(p,r)-\\langle-(\\lambda/\\mu_0,\\mu/\\mu_0),(p,r)\\rangle\\leq I-\\langle-(\\lambda/\\mu_0,\\mu/\\mu_0),(\\gamma,\\omega)\\rangle\\,\\,\\,\\forall\\,(\\gamma,\\omega)\\in\\mbox{dom}\\,\\beta,\\,\\, I\\geq\\beta(\\gamma,\\omega), $$ или $$ \\langle(-(\\lambda/\\mu_0,\\mu/\\mu_0),-1),((\\gamma,\\omega),I)-((p,r),\\beta(p,r))\\rangle\\leq 0\\,\\,\\,\\forall\\,((\\gamma,\\omega),I)\\in\\mbox{epi}\\,\\beta, $$ что в силу леммы \\ref{2l2_2_1} означает справедливость включения $-(\\lambda/\\mu_0,\\mu/\\mu_0)\\in \\partial\\beta(p,r).$ Доказываем утверждения второй части теоремы. В случае первого утверждения второй части имеем вместо неравенства \\eqref{07_1} неравенство $$ \\langle((-\\lambda,-\\mu),0),((\\gamma,\\omega),s)-((p,r),\\beta(p,r))\\rangle\\leq 0\\,\\,\\forall\\,((\\gamma,\\omega),s)\\in \\mbox{epi}\\,\\beta \\,\\,\\mbox{или }\\forall\\,(\\gamma,\\omega)\\in\\mbox{dom}\\,\\beta $$ и, соответственно, точка $(z_{p,r}^0,(p,r))\\in{\\cal D}\\times H\\times {\\mathbb{R}^m}$ доставляет минимальное значение в задаче (с учетом включения $\\mbox{dom}\\,\\beta_0\\subseteq\\mbox{dom}\\,\\beta$) $$ \\widetilde f(z,\\gamma,\\omega)\\equiv \\langle \\lambda,\\gamma\\rangle+\\langle\\mu,\\omega\\rangle\\to\\min,\\,\\,\\,Az-h=\\gamma,\\,\\,\\,\\,g(z)\\leq \\omega,\\,\\,\\,\\,\\,(z,(\\gamma,\\omega))\\in{\\cal D}\\times H\\times \\mathbb{R}^m. $$ Повторяя \\ далее \\ практически \\ дословно \\ рассуждения \\ доказательства \\ первого \\ ут\\-верж\\-дения первой части, получаем, что для множителей Лагранжа $\\lambda\\in H,$ $\\mu\\in \\mathbb{R}^m_+,$ $(\\lambda,\\mu)=-\\zeta,$ соотношения \\eqref{2dis5*12_1_1_1} выполняются при $\\mu_0=0.$ Доказываем, наконец, второе утверждения второй части теоремы. В том случае, если $\\mu_0=0,$ вместо неравенства \\eqref{new2} при доказательстве второго утверждения первой части, имеем неравенство \\begin{equation}\\label{new2_n} 0\\leq\\langle \\lambda,Az-h-p\\rangle+\\langle\\mu,g(z)-r\\rangle\\,\\,\\,\\,\\,\\forall\\,z\\in{\\cal D}. \\end{equation} Перепишем неравенство \\eqref{new2_n} в виде $$ -\\langle-(\\lambda,\\mu),(p,r)\\rangle\\leq-\\langle -(\\lambda,\\mu),(Az-h,g(z))\\rangle\\,\\,\\,\\,\\,\\forall\\,z\\in{\\cal D}, $$ откуда, также, как и выше в случае $\\mu_0>0,$ получаем $$ -\\langle -(\\lambda,\\mu),(p,r)\\rangle\\leq-\\langle -(\\lambda,\\mu),(\\gamma,\\omega)\\rangle\\,\\,\\,\\,\\,\\forall\\,(\\gamma,\\omega)\\in \\mbox{dom}\\,\\beta. $$ Отсюда, с учетом определения нормали (в смысле выпуклого анализа), следует, что $(-\\lambda,-\\mu)\\in N_{\\mbox{dom}\\,\\beta}(p,r),$ то есть $(p,r)\\in\\partial\\,\\mbox{dom}\\,\\beta$ и одновременно $((-\\lambda,-\\mu),0)\\in N_{\\mbox{epi}\\,\\beta}((p,r),\\beta(p,r)),$ то есть $-(\\lambda,\\mu)\\in\\partial^\\infty\\beta(p,r).$ Теорема полностью доказана.%\\hfill $\\square$ \\vspace{1ex} %\\begin{comment} \\textbf{1.3. Cубдифференциалы функции значений и множители Лагранжа.}\\\\ В~данном разделе изучим на основе принципа Лагранжа теоремы \\ref{teor1} теснейшую связь свойств субдифференцируемости (в смысле выпуклого анализа) функции значений задачи ($P_{p,r}^{co}$) с участвующими в формулировке теоремы множителями Лагранжа. В заключение раздела будут получены явные формулы для субдифференциала $\\partial\\beta(p,r)$ и асимптотического субдифференциала $\\partial^\\infty\\beta(p,r)$ функции значений в терминах множителей Лагранжа. Введем определение стационарного элемента в задаче ($P_{p,r}^{co}$), согласованное с теоремой \\ref{teor1}. \\begin{Definition}\\label{def4} Некоторый элемент $\\tilde z\\in {\\cal D}_{p,r}^0$ $($вообще говоря, не обязательно оптимальный$)$ называется стационарным в задаче ($P_{p,r}^{co}$), если он удовлетворяет всем соотношениям \\eqref{2dis5*12_1_1_1}, в которых $z_{p,r}^0$ следует заменить на $\\tilde z,$ при некотором невырожденном наборе множителей Лагранжа $(\\mu_0,\\lambda,\\mu)\\in \\mathbb{R}^1_+\\times H\\times \\mathbb{R}^m_+.$ \\end{Definition} Важное замечание состоит в следующем. \\begin{Remark}\\label{nostationar} Существуют разрешимые задачи $(P_{p,r}^{co})$ (с бесконечномерным~$H$\\!), в которых нет стационарных элементов. Такие задачи, в которых показывается невыполнимость принципа Лагранжа, можно найти, например, в \\cite{suminm2011,suminm2014,suminm2019}. %\\textbf{Привести пример несуществования в разрешимой задаче % стационарных элементов! 15.03.2016} \\textbf{Надо взять задачу из % примера невыполнимости принципа Лагранжа, 07.02.2019} \\end{Remark} \\begin{Definition}\\label{def5} Стационарный элемент $\\tilde z\\in {\\cal D}_{p,r}^0$ называется нормальным в задаче $(P_{p,r}^{co}),$ если для любого невырожденного набора множителей Лагранжа $(\\mu_0,\\lambda,\\mu)\\in \\mathbb{R}^1_+\\times H\\times \\mathbb{R}^m_+,$ соответствующего ему согласно определению \\ref{def4}, справедливо строгое неравенство $\\mu_0>0.$ \\end{Definition} \\begin{Definition}\\label{def6} Стационарный элемент $\\tilde z\\in {\\cal D}_{p,r}^0$ называется регулярным в задаче $(P_{p,r}^{co}),$ если существует невырожденный набор множителей Лагранжа $(\\mu_0,\\lambda,\\mu)\\in \\mathbb{R}^1_+\\times H\\times \\mathbb{R}^m_+,$ соответствующий ему согласно определению \\ref{def4}, для которого справедливо строгое неравенство $\\mu_0>0.$ \\end{Definition} \\begin{Definition}\\label{def7} Стационарный элемент $\\tilde z\\in {\\cal D}_{p,r}^0$ называется анормальным в задаче $(P_{p,r}^{co}),$ если для любого невырожденного набора множителей Лагранжа $(\\mu_0,\\lambda,\\mu)\\in \\mathbb{R}^1_+\\times H\\times \\mathbb{R}^m_+,$ соответствующего ему согласно определению \\ref{def4}, справедливо равенство $\\mu_0=0.$ \\end{Definition} Введем далее определения нормальной, регулярной и анормальной задачи ($P_{p,r}^{co}$). \\begin{Definition}\\label{def8} Задача $(P_{p,r}^{co}),$ при условии существования в ней стационарных элементов, называется нормальной, если все ее стационарные элементы нормальны. \\end{Definition} \\begin{Definition}\\label{def9} Задача $(P_{p,r}^{co}),$ при условии существования в ней стационарных элементов, называется регулярной, если в ней существует регулярный стационарный элемент. \\end{Definition} \\begin{Definition}\\label{def10} Задача $(P_{p,r}^{co}),$ при условии существования в ней стационарных элементов, называется анормальной, если все ее стационарные элементы анормальны. \\end{Definition} %\\textbf{Сначала здесь надо ввести определение стационарного % элемента, а затем уже будет легче определить нормальную, регулярную % и анормальную задачи. (05.11.2013)} Из теоремы \\ref{teor1} и определений \\ref{def8}, \\ref{def9}, \\ref{def10} вытекают следующие утверждения. %\\begin{Lemma}\\label{norm} %Задача ($P_{p,r}^{co}^0$) является нормальной (регулярной; анормальной) %\\textbf{тогда и убрать?} тогда и только тогда, когда одновременно %выполняются соотношения (выполняется соотношение; одновременно %выполняются соотношения) $\\partial\\beta(p,r)\\neq\\emptyset$ и %$\\partial^\\infty\\beta(p,r)=\\{0\\}$ %($\\partial\\beta(p,r)\\neq\\emptyset$; %$\\partial\\beta(p,r)=\\emptyset$ и %$\\partial^\\infty\\beta(p,r)\\neq\\{0\\}$). %\\end{Lemma} \\begin{Lemma}\\label{norm_29.10.2019} Пусть функция $f:\\,{\\cal D}\\to \\mathbb{R}^1$ выпукла, множество ${\\cal D}$ является выпуклым и замкнутым $($возможно неограниченным$),$ $\\beta:\\,H\\times \\mathbb{R}^m\\to \\mathbb{R}^1\\cup\\{+\\infty\\}$ --- собственная $($полунепрерывная снизу выпуклая$)$ функция и $\\beta_0(p,r)=\\beta(p,r)\\,\\,\\forall\\,(p,r)\\in H\\times \\mathbb{R}^m.$ Пусть также $(p,r)\\in H\\times \\mathbb{R}^m$ такая точка, что $\\beta(p,r)<+\\infty$ и в задаче ($P_{p,r}^{co}$) существует стационарный элемент. Тогда: \\textbf{1.} Задача $(P_{p,r}^{co})$ является нормальной тогда и только тогда, когда одновременно выполняются соотношения $\\partial\\beta(p,r)\\neq\\emptyset$ и $\\partial^\\infty\\beta(p,r)=\\{0\\}$; \\textbf{2.} Если задача $(P_{p,r}^{co})$ является регулярной, то $\\partial\\beta(p,r)\\neq\\emptyset$; \\textbf{3.} Если задача $(P_{p,r}^{co})$ является анормальной, то $\\partial^\\infty\\beta(p,r)\\neq\\{0\\}.$ \\end{Lemma} В то же время, если мы добавим к условиям леммы \\ref{norm_29.10.2019} и условие разрешимости задачи, то легко получить следующее утверждение в качестве следствия теоремы \\ref{teor1}. \\begin{Lemma}\\label{norm} %Пусть функция $f:\\,{\\cal D}\\to \\mathbb{R}^1$ выпукла, множество % ${\\cal D}$ является выпуклым и замкнутым $($возможно неограниченным$),$ % $\\beta:\\,H\\times \\mathbb{R}^m\\to \\mathbb{R}^1\\cup\\{+\\infty\\}$ --- собственная $($полунепрерывная % снизу выпуклая$)$ функция. Пусть также $(p,r)\\in H\\times \\mathbb{R}^m$ такая % точка, что $\\beta(p,r)<+\\infty$ и $\\beta_0(p,r)=\\beta(p,r)\\,\\,\\forall\\,(p,r)\\in H\\times \\mathbb{R}^m.$ %При условиях теоремы \\ref{teor1} и при условии %$\\beta(p,r)=\\beta_0(p,r)$ $\\forall\\,(p,r)\\in H\\times \\mathbb{R}^m$ %\\textbf{$Z_{p,r}^0\\neq\\emptyset,$ 08.02.2019} 20.06.2019 Если, при условиях леммы \\ref{norm_29.10.2019}, задача $(P_{p,r}^{co})$ разрешима, то есть $Z_{p,r}^0\\neq\\emptyset,$ и в ней существуют стационарные элементы, то она является нормальной $($регулярной; анормальной$)$ тогда и только тогда, когда одновременно выполняются соотношения $($выполняется соотношение; одновременно выполняются соотношения$)$ $\\partial\\beta(p,r)\\neq\\emptyset$ и $\\partial^\\infty\\beta(p,r)=\\{0\\}$ $(\\partial\\beta(p,r)\\neq\\emptyset$; $\\partial\\beta(p,r)=\\emptyset$ и $\\partial^\\infty\\beta(p,r)\\neq\\{0\\}).$ \\end{Lemma} Введем далее множества $L_{p,r}^{\\nu}\\equiv\\{-(\\lambda,\\mu)\\in H\\times \\mathbb{R}^m_+:\\,\\xi\\equiv(\\mu_0,\\lambda,\\mu) \\in \\mathbb{R}^1_+\\times H\\times \\mathbb{R}^m_+,\\,\\xi\\neq 0,\\,\\mu_0=\\nu,$ тройка $\\xi$ в совокупности с элементом $z_{p,r}^0$ удовлетворяет соотношениям \\eqref{2dis5*12_1_1_1}\\}, $\\nu=0,1$; $M_{p,r}^{0}\\equiv L_{p,r}^{0}\\bigcup\\{0\\},\\quad M_{p,r}^{1}\\equiv L_{p,r}^{1},$ а также множество $M_{p,r}$ всех векторов Куна--Таккера задачи $(P_{p,r}^{co}).$ Тогда непосредственным следствием теоремы \\ref{teor1} является следующая \\begin{Lemma}\\label{13l7_1_1} Пусть в задаче $(P_{p,r}^{co})$ имеются стационарные элементы и она разрешима. Тогда при условиях теоремы \\ref{teor1} и при условии $\\beta(p,r)=\\beta_0(p,r)$ $\\forall\\,(p,r)\\in H\\times \\mathbb{R}^m$ справедливы равенства $\\partial\\beta(p,r)=M_{p,r}^{1}=-M_{p.r},\\,\\,\\,\\,\\,\\partial^\\infty\\beta(p,r)=M_{p,r}^{0}.$ \\end{Lemma} Различные результаты, связывающие субдифференциальные свойства функций значений задач на условный экстремум с множителями Лагранжа, были получены в разное время целым рядом авторов, среди которых, в первую очередь, укажем на результаты Ф.~Кларка (см. известную монографию \\cite{clarke}, а также список литературы в ней). В то же время, с формальной точки зрения, автору не известны <<координаты>> какой-либо работы, в которой были бы получены формулы леммы \\eqref{13l7_1_1} для задачи вида ($P_{p,r}^{co}$). \\textbf{1.4. Принцип Лагранжа и неустойчивость задач на условный экстремум.} Покажем, прежде всего, что задачам $(P_{p,r}^{co}),$ которые не являются нормальными, свойственна неустойчивость в том смысле, что в любой <<окрестности>> каждой такой задачи существуют другие аналогичные задачи со значением $+\\infty.$ Доказательство этого важного факта заключается, по сути дела, в ссылке на вторую часть второго утверждения теоремы \\ref{teor1}. Из утверждения этой второй части следует, что, если соотношения \\eqref{2dis5*12_1_1_1} с заменой $z_{p,r}^0$ на $\\tilde z$ выполняются для некоторого $\\tilde z\\in{\\cal D}_{p,r}^0$ при $\\mu_0=0$ (это и означает, что задача ($P_{p,r}^{co}$) не является нормальной), то $(p,r)\\in\\partial\\,dom\\,\\beta,$ что и означает, что в любой <<окрестности>> задачи $(P_{p,r}^{co})$ существуют задачи с бесконечным значением. В данном контексте естественно задаться вопросом: много ли неустойчивых задач? Отвечая совсем коротко, можно сказать, что неустойчивых задач <<очень много>>, во всяком случае, <<никак не меньше>>, чем устойчивых. По этой причине классический принцип Лагранжа, если предполагать, что исходные данные могут быть неточными, перестает быть формально корректным (подробности см. в \\cite{suminm2011,suminm2014,suminm2018,suminm2019}) для огромного числа важнейших оптимизационных задач. \\textbf{1.5. <<Нерегулярная часть>> принципа Лагранжа как следствие его <<регулярной части>>.} Покажем далее, что первая часть утверждения \\textbf{2} теоремы \\ref{teor1}, по сути дела, является следствием первой же части утверждения \\textbf{1} той же теоремы. Это обстоятельство вытекает из свойств субдифференциала и асимптотического субдифференциала полунепрерывной снизу выпуклой функции в гильбертовом пространстве, которые можно найти, например, в \\cite[p.~82]{loewen}). Для упрощения изложения предполагаем, что $f$ --- субдифференцируемый в точках ${\\cal D}$ функционал. Предположим для этого сначала, что $f:\\,{\\cal D}\\to \\mathbb{R}^1$ --- сильно выпуклый функционал и в рассматриваемой ситуации $\\partial\\beta(p,r)=\\emptyset,$ а сингулярный (асимптотический) субдифференциал $\\partial^\\infty\\beta(p,r)$ содержит ненулевой элемент. В этом случае воспользуемся известным представлением для асимптотического субдифференциала выпуклого полунепрерывного снизу функционала (см., например, \\cite[p.~82]{loewen}) $$ \\partial^{\\infty\\!}\\beta(p,r)\\!=\\!\\!\\limsup_{(p^\\prime,r^\\prime)\\stackrel{\\beta}{\\to}(p,r),\\,t\\downarrow 0}\\!\\!t\\partial\\beta(p^\\prime,r^\\prime)\\equiv \\{w-\\lim\\limits_{k\\to\\infty} t_k\\zeta_k:\\,t_k\\downarrow 0,\\,\\zeta_k\\in\\partial\\beta(p^k,r^k),\\,(p^k,r^k)\\!\\stackrel{\\beta}{\\to}\\!(p,r)\\}, $$ где символ $(p^\\prime,r^\\prime)\\stackrel{\\beta}{\\to}(p,r)$ означает, что $((p^\\prime,r^\\prime),\\beta(p^\\prime,r^\\prime))\\to ((p,r),\\beta(p,r)),$ а символ $t\\downarrow 0$ означает сходимость к нулю справа. Умножим неравенство в \\eqref{2dis5*12_1_1_1} при $\\mu_0=1$ на $s>0$ \\begin{equation}\\label{lagr2} L_{p,r}(z_{p,r}^0,s,s\\lambda_{p,r},s\\mu_{p,r})\\leq L_{p,r}(z,s,s\\lambda_{p,r},s\\mu_{p,r}) \\end{equation} и поступим следующим образом. Для любой слабой предельной точки вида $$ (\\tilde\\lambda_{p,r},\\tilde\\mu_{p,r})=w-\\lim\\limits_{k\\to\\infty,\\,{(p^k,r^k)}\\stackrel{\\beta} {\\to}(p,r),\\,s_k\\downarrow 0} s_k(\\lambda^k_{p^k,r^k},\\mu^k_{p^k,r^k}) $$ с $(\\lambda^k_{p^k,r^k},\\mu^k_{p^k,r^k})\\in\\partial\\beta(p^k,r^k)$ можем записать после очевидного предельного перехода в \\eqref{lagr2} при $(p,r)=(p^k,r^k),$ $(\\lambda_{p,r},\\mu_{p,r})=(\\lambda^k_{p^k,r^k},\\mu^k_{p^k,r^k}),$ $s=s_k$ \\begin{equation}\\label{lagr3} L_{p,r}(z_{p,r}^0,0,\\tilde\\lambda_{p,r},\\tilde\\mu_{p,r})\\leq L_{p,r}(z,0,\\tilde\\lambda_{p,r},\\tilde\\mu_{p,r}). \\end{equation} Одновременно в силу условия дополняющей нежесткости $ \\mu_{p^k,r^k,i}(g_i(z_{p^k,r^k}^0)-r^k_i)=0,$ $i=1,2,\\dots,m$ в результате предельного перехода при $k\\to\\infty$ и предельного соотношения $z_{p^k,r^k}^0\\to z_{p,r}^0,$ $k\\to\\infty$ (это предельное соотношение является следствием слабой сходимости $z_{p^k,r^k}^0$ к $z_{p,r}^0,$ числовой сходимости $f(z_{p^k,r^k}^0)$ к $f(z_{p,r}^0)$ при $k\\to\\infty,$ субдифференцируемости в точках ${\\cal D}$ и сильной выпуклости $f$) получаем $\\tilde\\mu_{p,r,i}(g_i(z_{p,r}^0)-r_i)=0,$ $i=1,2,\\dots,m,$ что в совокупности с \\eqref{lagr3} и означает выполнимость нерегулярного невырожденного принципа Лагранжа. При этом мы аппроксимировали решение $z_{p,r}^0$ задачи ($P_{p,r}^{co}$) точками $z_{p^k,r^k}^0,$ доставляющими минимальное значение функциям Лагранжа $L_{p^k,r^k}(z,\\lambda_{p^k,r^k},\\mu_{p^k,r^k}),$ $z\\in{\\cal D}.$ Пусть далее $f:\\,{\\cal D}\\to \\mathbb{R}^1$ --- выпуклый функционал и $\\partial\\beta(p,r)=\\emptyset,$ а $\\partial^\\infty\\beta(p,r)\\neq\\{0\\}.$ Пусть также $z_{p,r}^0$ --- произвольный элемент из множества $Z_{p,r}^0.$ Рассмотрим вспомогательную задачу с сильно выпуклым целевым функционалом $$ f(z)+\\|z-z_{p,r}^0\\|^2\\to\\min,\\,\\,\\, Az=h+p,\\,\\,\\,g_i(z)\\leq r_i,\\,\\,i=1,\\dots,m,\\,\\,\\,\\,\\,z\\in {\\cal D}\\subset Z.\\,\\,\\,\\,\\leqno(\\widetilde P_{p,r}^{co}) $$ Ее особенностью является то, что при всех $(p^\\prime,r^\\prime)\\in \\mbox{dom}\\, \\beta=\\mbox{dom}\\, \\widetilde\\beta$ имеет место неравенство $\\widetilde\\beta(p^\\prime,r^\\prime)\\geq\\beta(p^\\prime,r^\\prime),$ а в точке $(p,r)$ --- равенство $\\widetilde\\beta(p,r)=\\beta(p,r).$ При этом $\\mbox{epi}\\,\\widetilde\\beta\\subset\\mbox{epi}\\,\\beta$ и, стало быть, любая нормаль (в смысле выпуклого анализа) к надграфику $\\mbox{epi}\\,\\beta$ в точке $(p,r,\\beta(p,r))$ будет одновременно нормалью (в том же смысле) в той же точке и к надграфику $\\mbox{epi}\\,\\widetilde\\beta.$ По этой причине в задаче $(\\widetilde P_{p,r}^{co})$ с сильно выпуклым целевым функционалом имеет место неравенство $\\partial^\\infty\\widetilde\\beta(p,r)\\neq\\{0\\}.$ Повторяя в этой ситуации проведенные выше для случая сильно выпуклого функционала цели рассуждения и принимая во внимание равенство нулю в точке $z_{p,r}^0$ вспомогательного сильно выпуклого слагаемого, приходим к выводу о том, что и в случае выпуклого функционала цели в задаче ($P_{p,r}^{co}$) для любого оптимального элемента $z_{p,r}^0$ выполняются все соотношения нерегулярного невырожденного принципа Лагранжа. \\section{Модифицированные теоремы Куна--Таккера в нелинейных задачах\\\\ на условный экстремум}\\label{s2} Для формулировки и доказательства модифицированных теорем Куна--Таккера в нелинейных задачах на условный экстремум нам потребуются, прежде всего, понятия проксимального субградиента и субдифференциала Фреше полунепрерывной снизу функции в гильбертовом пространстве (см., например, \\cite{loewen,clarke,mord,claledsterwol}) и некоторые необходимые, связанные с ними факты. Понятия проксимального субградиента и субдифференциала Фреше полунепрерывной снизу функции можно трактовать как обобщения понятия субдифференциала в смысле выпуклого анализа на полунепрерывные снизу функции. Подчеркнем, что ниже, в отличие от раздела 1, будут рассматриваться только соответствующие аналоги первой части теоремы \\ref{teor1} --- <<нелинейные>> модифицированным теоремы Куна--Таккера. Множества допустимых элементов ${\\cal D}$ рассматриваемых ниже в данном разделе нелинейных задач являются ограниченными, что обусловлено естественным желанием разумного упрощения изложения, в частности, и в связи с ограничением на объем статьи. По той же причине мы не занимаемся здесь, в нелинейных задачах, вопросами, аналогичными тем, которые были рассмотрены в разделах 1.3--1.5 в случае выпуклой задачи ($P_{p,r}^{co}$). %\\subsection{Проксимальные нормали, проксимальные субградиенты, нормали Фреше, субдифференциалы Фреше} \\textbf{2.1. Проксимальные нормали, проксимальные субградиенты.} Первым из используемых ниже двух понятий субдифференциалов является понятие проксимального субградиента полунепрерывной снизу функции (см., например, \\cite{loewen,clarke,claledsterwol}) в гильбертовом пространстве. Напомним кратко необходимые факты, связанные с этим понятием. Для этого сначала напомним понятие проксимальной нормали. \\begin{Definition}\\label{2d2} $($а$)$ Пусть $H$ --- гильбертово пространство, $S\\subset H$ --- замкнутое множество, $\\bar s\\in S.$ Вектор $\\zeta\\in H$ называется проксимальной нормалью к множеству $S$ в точке $\\bar s\\in S,$ если существует постоянная $M>0$ такая, что \\begin{equation}\\label{pi} \\langle\\zeta,s-\\bar s\\rangle\\leq M\\|s-\\bar s\\|^2\\,\\,\\,\\forall\\,s\\in S. \\end{equation} Множество всех таких векторов $\\zeta,$ являющееся конусом, обозначим через ${\\hat N}^P_S(\\bar s)$ и назовем проксимальным нормальным конусом. $($б$)$ Пусть $f:\\,H\\to \\mathbb{R}^1\\cup\\{+\\infty\\}$ полунепрерывная снизу функция и $\\bar x\\in \\mbox{dom}\\,f.$ Вектор $\\zeta\\in H$ называется проксимальным субградиентом функции $f$ в точке $\\bar x,$ если $(\\zeta,-1)\\in {\\hat N}^P_{\\mbox{epi}\\,f}(\\bar x,f(\\bar x)).$ Множество всех таких векторов $\\zeta$ обозначим через ${\\partial^P}f(\\bar x)$ и назовем проксимальным субградиентом $f$ в точке $\\bar x.$ \\end{Definition} \\begin{Remark}\\label{1r3} Неравенство \\eqref{pi} может быть записано в виде $$ \\langle\\frac1{2M}\\zeta,s-\\bar s\\rangle\\leq\\frac12 \\|s-\\bar s\\|^2\\,\\,\\,\\forall\\,s\\in S. $$ которое, согласно лемме 3C.2 в \\cite{loewen}, эквивалентно включению $$ \\bar s\\in Pr_S({\\bar s+\\frac1{2M}\\zeta}). $$ Другими словами, $\\zeta$ есть проксимальная нормаль к $S$ в $\\bar s$ тогда и только тогда, когда $\\bar s$ есть ближайшая в $S$ точка к некоторой точке вида $\\bar s+t\\zeta,\\,\\,t>0.$ \\end{Remark} Напомним, наконец, критерий того, что данный вектор является проксимальным субградиентом полунепрерывной снизу функции в заданной точке (см., например,\\linebreak \\cite[утверждение 4A.3]{loewen}). \\begin{Lemma}\\label{2l2_1} Пусть $H$ --- гильбертово пространство, $f:\\,H\\to \\mathbb{R}^1\\cup\\{+\\infty\\}$ --- полунепрерывная снизу функция и $\\bar x\\in \\mbox{dom}\\,f.$ Вектор $\\zeta\\in H$ является проксимальным субградиентом функции $f$ в точке $\\bar x,$ то есть $\\zeta\\in\\partial^Pf(x),$ тогда и только тогда, когда существуют постоянные $R>0$ и $\\delta>0$ такие, что $$ \\langle\\zeta,x-\\bar x\\rangle\\leq f(x)-f(\\bar x)+ R\\|x-\\bar x\\|^2\\,\\,\\,\\forall\\,x\\in S_\\delta(\\bar x)\\equiv\\{x^\\prime\\in H:\\,\\|x^\\prime-\\bar x\\|<\\delta\\} $$ или $$ f(\\bar x)-\\langle\\zeta,\\bar x\\rangle\\leq f(x)-\\langle\\zeta,x\\rangle+ R\\|x-\\bar x\\|^2\\,\\,\\,\\forall\\,x\\in S_\\delta(\\bar x). $$ \\end{Lemma} \\textbf{2.2. Нормали Фреше, субдифференциалы Фреше.} Напомним далее понятие нормали Фреше к замкнутому множеству в банаховом пространстве, а также соответствующее понятие субдифференциала Фреше полунепрерывной снизу функции \\cite{mord}. Следующие определения и утверждения могут быть найдены в \\cite{mord}. \\begin{Definition}\\label{2d3_1} Пусть $\\Omega$ --- непустое множество банахова пространства $X.$ Пусть $\\bar x\\in\\Omega$ и $u\\stackrel\\Omega\\to x$ означает, что $u\\to x$ с $u\\in\\Omega.$ Тогда непустое множество $$ \\hat N_\\Omega^F(\\bar x)\\equiv\\{x^\\ast\\in X^\\ast:\\, \\limsup_{u\\stackrel\\Omega\\to \\bar x}\\frac{\\langle x^\\ast,u-\\bar x\\rangle}{\\|u-\\bar x\\|}\\leq 0\\}, $$ являющееся конусом, называется нормальным конусом Фреше к $\\Omega$ в точке $\\bar x.$ %и обозначается $\\hat N(x;\\Omega).$ \\end{Definition} \\begin{Lemma}\\label{lem_22.02.2020}Пусть $\\Omega$ --- непустое множество банахова пространства $X$ и $\\bar x\\in\\Omega.$ Тогда $x^\\ast\\in\\hat N_\\Omega^F(\\bar x)$ в том и только в том случае, если для любого $\\gamma>0$ функция $$ \\psi(x)\\equiv\\langle x^\\ast,x-\\bar x\\rangle-\\gamma\\|x-\\bar x\\| $$ достигает локального максимума относительно множества $\\Omega$ в точке $\\bar x.$ \\end{Lemma} \\begin{Definition}\\label{2d3_2} Пусть $f:\\,X\\to \\mathbb{R}^1\\cup\\{+\\infty\\}$ --- %полунепрерывная снизу функция, определенная на банаховом пространстве $X,$ $\\bar x\\in \\mbox{dom}\\,f.$ Множество $$ \\hat\\partial^F f(\\bar x)\\equiv\\{x^\\ast\\in X^\\ast:\\, (x^\\ast,-1)\\in \\hat N^F_{\\mbox{epi}\\,f}((\\bar x,f(\\bar x)))\\} $$ называется субдифференциалом Фреше функции $f$ в точке $\\bar x.$ При этом полагается $\\hat\\partial^F f(\\bar x)= \\emptyset$ в случае $\\bar x\\notin \\mbox{dom}\\,f.$ \\end{Definition} %Справедливо следующее \\cite{mord} \\begin{Remark} Субдифференциал $\\hat\\partial^F f(\\bar x)$ может быть записан в виде $$ \\hat\\partial^F f(\\bar x)=\\{x^\\ast\\in X^\\ast:\\,\\liminf_{u\\to x} \\frac{f(u)-f(x)-\\langle x^\\ast,u-x\\rangle}{\\|u-x\\|}\\geq 0\\}. $$ \\end{Remark} \\begin{Lemma}\\label{2l2_3} Пусть $f:\\,X\\to \\mathbb{R}^1\\cup\\{+\\infty\\}$ --- %полунепрерывная снизу функция, определенная на банаховом пространстве $X,$ $\\bar x\\in \\mbox{dom}\\,f.$ Тогда $x^\\ast\\in\\hat\\partial^F f(x)$ в том и только в том случае, если для любого $\\gamma>0$ функция $$ \\psi(x)\\equiv f(x)-f(\\bar x)-\\langle x^\\ast,x-\\bar x\\rangle+\\gamma\\|x-\\bar x\\| $$ достигает локального минимума в точке $\\bar x$ или, другими словами, $$ f(\\bar x)-\\langle x^\\ast,\\bar x\\rangle\\leq f(x)-\\langle x^\\ast,x\\rangle+\\gamma\\|x-\\bar x\\|\\,\\,\\,\\forall\\,x\\in X_\\gamma, $$ где $X_\\gamma$ --- некоторая окрестность точки $\\bar x.$ \\end{Lemma} \\begin{Remark}\\label{rem_22.02.2020} Важнейшим свойством полунепрерывных снизу функций \\linebreak $f:\\,X\\to \\mathbb{R}^1\\cup\\{+\\infty\\}$ является то, что как множество $\\partial^Pf(x)$ в случае гильбертова пространства $X,$ так и множество $\\hat\\partial^F f(x)$ в случае пространства $X$ из достаточно обширного класса банаховых пространств (подробности см., например, в \\cite{loewen,clarke,mord,claledsterwol}) не пусто для плотного в $\\mbox{dom}\\, f$ множества точек $x.$ В настоящей работе в качестве пространства $X$ выступает гильбертово пространство $H,$ для которого указанные выше свойства заведомо справедливы. \\end{Remark} \\begin{Remark}\\label{rem_24.02.2020} Из определений \\ref{2d2} и \\ref{2d3_2} следует, что в случае заданной на гильбертовом пространстве $X$ полунепрерывной снизу функции $f:\\,X\\to \\mathbb{R}^1\\cup\\{+\\infty\\}$ имеет место включение $\\partial^Pf(x)\\subset\\hat\\partial^Ff(x).$ При этом, как отмечено в \\cite{mord}, функция одного переменного $-|x|^{3/2}$ представляет собою пример такой функции, для которой $\\partial^Pf(0)=~\\emptyset,$ но, одновременно, $\\hat\\partial^Ff(0)=0.$ \\end{Remark} \\textbf{2.3. Постановка нелинейной задачи на условный экстремум.} Будем рассматривать сформулированную во введении параметрическую нелинейную задачу ($P_{p,r}$) на условный экстремум в гильбертовом пространстве с операторным ограничением типа равенства и конечным числом функциональных неравенств. %$$ %f(z)\\to\\min,\\,\\,\\,g(z)=p,\\,\\,h(z)\\leq r,\\,\\,z\\in{\\cal D}\\subset Z, %\\leqno(P_{p,r}) %$$ %где $p\\in H,\\,r\\equiv(r_1,\\dots,r_m)\\in \\mathbb{R}^m$ --- параметры, %$f:\\,{\\cal D}\\to \\mathbb{R}^1$ --- непрерывная функция, $g:\\,{\\cal D}\\to H$ %--- непрерывный оператор, $h\\equiv(h_1,\\dots,h_m):\\,{\\cal D}\\to \\mathbb{R}^m$ %--- непрерывная вектор--функция, ${\\cal D}\\subset Z$ --- ограниченное %замкнутое множество, $Z,\\,H$ --- гильбертовы пространства. Будем также считать, что $\\forall\\,z_1,\\,z_2\\in{\\cal D}$ и для некоторой постоянной $L>0$ \\begin{equation}\\label{cond_0_05_02_25.05.2019} |f(z_1)-f(z_2)|\\leq L\\|z_1-z_2\\|,\\,\\|g(z_1)-g(z_2)\\|\\leq L\\|z_1-z_2\\|,\\,|h(z_1)-h(z_2)|\\leq L\\|z_1-z_2\\|. \\end{equation} %где $L>0$ --- постоянная. Будем, как и в случае выпуклой задачи, иметь дело с двумя определенными во введении функциями значений: классической функций значений $\\beta_0$ и обобщенной --- $\\beta.$ В нелинейных задачах строгое неравенство $\\beta<\\beta_0$ возможно и при ограниченном~${\\cal D}.$ \\begin{Example}\\label{ex_17.03.2020} Ситуация строгого неравенства реализуется, например, в задаче нелинейного программирования в виде задачи оптимального управления с ограничени\\-ем-равенством $$ \\int_0^1(x^2(t)-u^2(t))dt\\to\\inf, \\,\\,\\,\\dot x=u(t),\\,\\,x(0)=0, $$ $$ u(t)\\in U \\mbox{ при п.в. } t\\in(0,1),\\,\\,\\,U=\\{-1,1\\},\\,\\,\\,\\,x(t)=p(t) \\mbox{ при п.в. }t\\in[0, 1],\\,\\,\\,p\\in L_2(0,1) $$ c $p=0,$ в которой, как можно заметить, $\\beta(0)=-1,$ но $\\beta_0(0)=+\\infty.$ Если же взять в этой задаче $U=[-1,1],$ то тогда $\\beta(0)=-1<0=\\beta_0(0).$ \\end{Example} В то же время, справедлива следующая важная для дальнейших построений \\begin{Lemma}\\label{nonlinlowersemicont} Функция значений $\\beta:\\,H\\times \\mathbb{R}^m\\to \\mathbb{R}^1\\cup\\{+\\infty\\}$ является полунепрерывной снизу. \\end{Lemma} \\proof Лемма доказывается точно так же, как и в случае выпуклой задачи в лемме \\ref{lowersemicont}. Предположим с целью упрощения изложения, что в задаче ($P_{p,r}$) имеет место равенство $\\beta(p,r)=\\beta_0(p,r)\\,\\,\\forall\\,(p,r)\\in H\\times \\mathbb{R}^m.$ Будем, как и ранее, через $z_{p,r}^0\\in{\\cal D}_{p,r}^0$ обозначать решения задачи ($P_{p,r}$) в случае их существования. \\textbf{2.4. Модифицированная теорема Куна--Таккера в предположении непустоты проксимального субградиента. } Пусть \\ в \\ задаче ($P_{p,r}$) \\ оптимальный эле\\-мент существует и выполняется условие непустоты проксимального субградиента \\linebreak $\\partial^P\\beta(p,r)\\not=~\\emptyset$ и $\\zeta\\equiv(\\zeta_p,\\zeta_r)\\in\\partial^P\\beta(p,r).$ Тогда, применяя лемму \\ref{2l2_1}, можем утверждать, что существуют постоянные $R>0$ и $\\delta>0$ (зависящие от точки $(p,r)$ и элемента $\\zeta$) такие, что \\begin{equation}\\label{25_05_2019} \\beta(p,r)-\\langle\\zeta_p,p\\rangle-\\langle\\zeta_r,r\\rangle\\leq \\beta(p^\\prime,r^\\prime)-\\langle\\zeta_p,p^\\prime\\rangle-\\langle\\zeta_r,r^\\prime\\rangle+ R\\|p^\\prime-p\\|^2+R|r^\\prime-r|^2 \\end{equation} $$ \\forall\\,(p^\\prime,r^\\prime)\\in S_\\delta(p,r)\\equiv\\{(p^\\prime,r^\\prime)\\in H:\\,\\|(p^\\prime,r^\\prime)-(p,r)\\|<\\delta\\}. $$ Учитывая ограниченность $\\beta$ и $\\mbox{dom}\\,\\beta$ (в силу условий \\eqref{cond_0_05_02_25.05.2019} и ограниченности $\\cal D$), из последнего неравенства без ограничения общности выводим, что \\begin{equation}\\label{26_05_2019} \\beta(p,r)-\\langle\\zeta_p,p\\rangle-\\langle\\zeta_r,r\\rangle\\leq \\beta(p^\\prime,r^\\prime)-\\langle\\zeta_p,p^\\prime\\rangle-\\langle\\zeta_r,r^\\prime\\rangle+ R\\|p^\\prime-p\\|^2+R|r^\\prime-r|^2 \\end{equation} $$ \\forall\\,(p^\\prime,r^\\prime)\\in H\\times \\mathbb{R}^m. $$ Покажем, прежде всего, что из неравенства \\eqref{26_05_2019} следует, что $\\zeta_r\\leq 0.$ Для этого заметим, что это неравенство сохранится, если подставить в него $p^\\prime=p=g(z_{p,r}^0),$ вместо $\\beta(p^\\prime,r^\\prime)$ взять $f(z_{p,r}^0)$ и считать, что $h(z_{p,r}^0)\\leq r^\\prime.$ Таким образом, имеем $$ f(z_{p,r}^0)-\\langle\\zeta_p,p\\rangle-\\langle\\zeta_r,r\\rangle\\leq f(z_{p,r}^0)-\\langle\\zeta_p,p\\rangle-\\langle\\zeta_r,r^\\prime\\rangle+ R|r^\\prime-r|^2\\,\\,\\forall\\,r^\\prime\\in \\mathbb{R}^m,\\,\\,h(z_{p,r}^0)\\leq r^\\prime $$ или $$ -\\langle\\zeta_r,r\\rangle\\leq -\\langle\\zeta_r,r^\\prime\\rangle+ R|r^\\prime-r|^2\\,\\,\\forall\\,r^\\prime\\in \\mathbb{R}^m, \\,\\,h(z_{p,r}^0)\\leq r^\\prime $$ или $$ \\langle\\zeta_r,r^\\prime-r\\rangle\\leq R|r^\\prime-r|^2\\,\\,\\forall\\,r^\\prime\\in \\mathbb{R}^m, \\,\\,h(z_{p,r}^0)\\leq r^\\prime. $$ Так как $h(z_{p,r}^0)\\leq r,$ то, с учетом произвола $r^\\prime,$ из последнего неравенства выводим, что, если $h_i(z_{p,r}^0) Далее, опять в силу \\eqref{26_05_2019} можем записать $$ f(z_{p,r}^0)-\\langle\\zeta_p,g(z_{p,r}^0)-p\\rangle\\leq f(z)-\\langle\\zeta_p,g(z)-p\\rangle-\\langle\\zeta_r,r^\\prime-r\\rangle+R\\|g(z)-p\\|^2+R|r^\\prime-r|^2 $$ $$ \\forall\\,(z,r^\\prime)\\in{\\cal D}\\times \\mathbb{R}^m,\\,\\,h(z)\\leq r^\\prime, $$ откуда, в силу доказанного условия дополняющей нежесткости, имеем $$ f(z_{p,r}^0)-\\langle\\zeta_p,g(z_{p,r}^0)-p\\rangle-\\langle\\zeta_r,h(z_{p,r}^0)-r\\rangle\\leq $$ $$ f(z)-\\langle\\zeta_p,g(z)-p\\rangle-\\langle\\zeta_r,r^\\prime-r\\rangle+R\\|g(z)-p\\|^2+R|r^\\prime-r|^2\\forall\\,(z,r^\\prime)\\in{\\cal D}\\times \\mathbb{R}^m,\\,\\,h(z)\\leq r^\\prime, $$ и при $r^\\prime=h(z)$ \\begin{equation}\\label{26_05_2019_1} f(z_{p,r}^0)-\\langle\\zeta_p,g(z_{p,r}^0)-p\\rangle-\\langle\\zeta_r,h(z_{p,r}^0)-r\\rangle\\leq \\end{equation} $$ f(z)-\\langle\\zeta_p,g(z)-p\\rangle-\\langle\\zeta_r,h(z)-r\\rangle+R\\|g(z)-p\\|^2+R|h(z)-r|^2\\,\\,\\forall\\, z\\in{\\cal D}. $$ Неравенство \\eqref{26_05_2019_1}, являющееся следствием факта оптимальности элемента $z_{p,r}^0,$ представляет собою необходимое условие оптимальности в недифференциальной форме в задаче $(P_{p,r}).$ В то же время, из-за штрафного слагаемого $R|h(z)-r|^2,$ вообще говоря, исследовать его на <<достаточность>> представляется затруднительным. Далее мы получим несколько иное необходимое недифференциальное условие оптимальности элемента $z_{p,r}^0$ в задаче ($P_{p,r}$), в котором также будет участвовать вектор множителей $\\zeta=(\\zeta_p,\\zeta_r)$ из неравенства \\eqref{26_05_2019_1}, удовлетворяющий, как уже показано выше, условию неположительности $\\zeta_r\\leq 0$ и условию дополняющей нежесткости (\\ref{31.07.2020}). Указанное необходимое условие, будет, в отличие от \\eqref{26_05_2019_1}, представлять собою одновременно и достаточное условие оптимальности в задаче ($P_{p,r}$). При этом по форме оно будет совпадать с <<регулярной частью>> теоремы \\ref{teor1}, то есть представлять собою, по сути дела, теорему Куна--Таккера в недифференциальной форме в нелинейной задаче ($P_{p,r}$). Для достижения указанной цели будем использовать модифицированную функцию Лагранжа (см., например, \\cite{bertsekas}), конструкция которой <<жестко завязана>> со свойствами проксимального субградиента $\\zeta\\in\\partial^P\\beta(p,r).$ Итак, следуя хорошо известному приему (см., например, \\cite[с. 165]{bertsekas}), приведем задачу на условный экстремум ($P_{p,r}$) к виду эквивалентной задачи с операторными ограничениями типа равенства. Для этого заметим, что задача ($P_{p,r}$) эквивалентна задаче $$ f(z)\\to\\inf,\\,\\,\\, g(z)=p,\\,\\,h(z)+y=r,\\,\\,z\\in {\\cal D}\\subset Z,\\,\\,\\,y\\in \\mathbb{R}^m_+\\leqno(\\widetilde P_{p,r}) $$ в том смысле, что элемент $z_{p,r}^0\\in{\\cal D}$ является оптимальным в задаче ($P_{p,r}$) тогда и только тогда, когда пара $(z_{p,r}^0,-(h(z_{p,r}^0)-r))$ является таковой в задаче ($\\widetilde P_{p,r}$). При этом функции значений задач ($P_{p,r}$) и ($\\widetilde P_{p,r}$) совпадают. Так как функции значений задач ($P_{p,r}$) и ($\\widetilde P_{p,r}$) совпадают и $\\zeta\\equiv(\\zeta_p,\\zeta_r)\\in\\partial^P\\beta(p,r),$ то мы опять можем записать неравенство \\eqref{26_05_2019} %$$ %\\beta(p,r)-\\langle\\zeta_p,p\\rangle-\\langle\\zeta_r,r\\rangle\\leq %\\beta(p^\\prime,r^\\prime)-\\langle\\zeta_p,p^\\prime\\rangle-\\langle\\zeta_r,r^\\prime\\rangle+ %R\\|p^\\prime-p\\|^2+R|r^\\prime-r|^2 %$$ %$$ %\\forall\\,(p^\\prime,r^\\prime)\\in H\\times \\mathbb{R}^m %$$ и заметить, что, без ограничения общности, оптимальным в задаче минимизации \\begin{equation}\\label{27.05.2019_1} \\beta(p^\\prime,r^\\prime)-\\langle\\zeta_p,p^\\prime\\rangle-\\langle\\zeta_r,r^\\prime\\rangle+ R\\|p^\\prime-p\\|^2+R|r^\\prime-r|^2\\to\\min,\\,\\,\\,(p^{\\prime},r^{\\prime})\\in H\\times \\mathbb{R}^m \\end{equation} является лишь элемент $(p,r)$ и никакой другой. Отсюда следует, что в задаче минимизации \\begin{equation}\\label{27.05.2019} f(z)+\\langle-\\zeta_p,g(z)-p\\rangle+\\langle-\\zeta_r,h(z)+y-r\\rangle+ \\end{equation} $$ R\\|g(z)-p\\|^2+R|h(z)+y-r|^2\\to\\min,\\,\\,\\,z\\in{\\cal D},\\,\\,y\\in \\mathbb{R}^m_+ $$ оптимальной является пара $(z_{p,r}^0,-(h(z_{p,r}^0)-r)),$ в которой $z_{p,r}^0$ -- решение задачи ($P_{p,r}$) (оно может быть не единственным). При этом \\begin{equation}\\label{04.11.2019_1} f(z_{p,r}^0)=\\beta(p,r)=\\min_{(z,y)\\in{\\cal D}\\times \\mathbb{R}^m_+} \\{f(z)+\\langle-\\zeta_p,g(z)-p\\rangle+\\langle-\\zeta_r,h(z)+y-r\\rangle+ \\end{equation} $$ R\\|g(z)-p\\|^2+R|h(z)+y-r|^2\\}. $$ Действительно, предположим, что для некоторой пары $(\\bar z,\\bar y)\\in{\\cal D}\\times \\mathbb{R}^m_+$ $$ f(\\bar z)+\\langle-\\zeta_p,g(\\bar z)-p\\rangle+\\langle-\\zeta_r,h(\\bar z)+\\bar y-r\\rangle+R\\|g(\\bar z)-p\\|^2+R|h(\\bar z)+\\bar y-r|^2<\\beta(p,r), $$ но тогда получаем, что $$ \\beta(p,r)-\\langle\\zeta_p,p\\rangle-\\langle\\zeta_r,r\\rangle>f(\\bar z)+\\langle-\\zeta_p,p^\\prime\\rangle+\\langle-\\zeta_r,r^\\prime\\rangle+ R\\|p^\\prime-p\\|^2+R|r^\\prime-r|^2\\geq $$ $$ \\beta(p^\\prime,r^\\prime)+\\langle-\\zeta_p,p^\\prime\\rangle+\\langle-\\zeta_r,r^\\prime\\rangle+ R\\|p^\\prime-p\\|^2+R|r^\\prime-r|^2, $$ где $p^\\prime\\equiv g(\\bar z),$ $r^\\prime\\equiv h(\\bar z)+\\bar y,$ что противоречит оптимальности пары $(p,r)$ в задаче \\eqref{27.05.2019_1}. Таким образом, можем записать $$ f(z_{p,r}^0)=f(z_{p,r}^0)+\\langle-\\zeta_p,g(z_{p,r}^0)-p\\rangle+\\langle-\\zeta_r,h(z_{p.r}^0)-(h(z_{p,r}^0)-r)-r\\rangle+ $$ $$ R\\|g(z_{p,r}^0)-p\\|^2+R|h(z_{p.r}^0)-(h(z_{p,r}^0)-r)-r|^2\\leq $$ $$ f(z)+\\langle-\\zeta_p,g(z)-p\\rangle+\\langle-\\zeta_r,h(z)+y-r\\rangle+ R\\|g(z)-p\\|^2+R|h(z)+y-r|^2\\,\\,\\forall\\,(z,y)\\in{\\cal D}\\times \\mathbb{R}^m_+ $$ или, так как (см. \\cite[с.~166, 167]{bertsekas}), $$ \\min_{(z,y)\\in{\\cal D}\\times \\mathbb{R}^m_+} \\{f(z)+\\langle-\\zeta_p,g(z)-p\\rangle+\\langle-\\zeta_r,h(z)+y-r\\rangle+ $$ $$ R\\|g(z)-p\\|^2+R|h(z)+y-r|^2\\}=\\min_{z\\in{\\cal D}}\\min_{y\\in \\mathbb{R}^m_+}\\{f(z)+\\langle-\\zeta_p,g(z)-p\\rangle+\\langle-\\zeta_r,h(z)+y-r\\rangle+ $$ $$ R\\|g(z)-p\\|^2+R|h(z)+y-r|^2\\}=\\min_{z\\in{\\cal D}}\\{f(z)+\\langle-\\zeta_p,g(z)-p\\rangle+R\\|g(z)-p\\|^2+ $$ $$ \\sum_{i=1}^m\\min_{y_i\\in \\mathbb{R}^1_+}\\{-\\zeta_{r,i}(h_i(z)+y_i-r_i)+R(h_i(z)+y_i-r_i)^2\\}\\}= $$ $$ \\min_{z\\in{\\cal D}}\\{f(z)+\\langle-\\zeta_p,g(z)-p\\rangle+R\\|g(z)-p\\|^2+ \\frac1{4R}\\sum_{i=1}^m\\{[\\max\\{0,-\\zeta_{r,i}+2R(h_i(z)-r_i)\\}]^2-(\\zeta_{r,i})^2\\}\\}, $$ получаем \\begin{equation}\\label{28.05.2019} f(z_{p,r}^0)\\leq f(z)+\\langle-\\zeta_p,g(z)-p\\rangle+R\\|g(z)-p\\|^2+ \\end{equation} $$ \\frac1{4R}\\sum_{i=1}^m\\{[\\max\\{0,-\\zeta_{r,i}+2R(h_i(z)-r_i)\\}]^2-(\\zeta_{r,i})^2\\}\\,\\,\\forall\\,z\\in{\\cal D}. $$ Определим модифицированную функцию Лагранжа ($\\lambda=-\\zeta_p,$ $\\mu=-\\zeta_r,$ $c=2R$) $$ L_{p,r}^{P,c}(z,\\lambda,\\mu)\\equiv f(z)+\\langle\\lambda,g(z)-p\\rangle+\\frac c2\\|g(z)-p\\|^2+ \\frac1{2c}\\sum_{i=1}^m\\{[\\max\\{0,\\mu_i+c(h_i(z)-r_i)\\}]^2-(\\mu_i)^2\\}, $$ где верхний индекс $P$ означает, что конструкция этой функции Лагранжа является следствием непустоты проксимального субградиента $\\partial^P\\beta(p,r).$ Определенная таким образом функция $L_{p,r}^{P,c}$ совпадает по своей конструкции с известной модифицированной функцией Лагранжа для исходной задачи ($P_{p,r}$) с ограничениями типа равенства и неравенства (подробности см. в \\cite[с.~167]{bertsekas}). Тогда мы можем переписать неравенство \\eqref{28.05.2019} в терминах модифицированной функции Лагранжа следующим образом \\begin{equation}\\label{28.05.2019_1} L_{p,r}^{P,2R}(z_{p,r}^0,-\\zeta_p,-\\zeta_r)\\leq L_{p,r}^{P,2R}(z,-\\zeta_p,-\\zeta_r)\\,\\,\\,\\forall\\,z\\in{\\cal D}. \\end{equation} Здесь было использовано полученное выше условие дополняющей нежесткости (\\ref{31.07.2020}), с учетом которого справедливо равенство \\begin{equation}\\label{04.11.2019} f(z_{p,r}^0)=L_{p,r}^{P,2R}(z_{p,r}^0,-\\zeta_p,-\\zeta_r). \\end{equation} Неравенство \\eqref{28.05.2019_1} в совокупности с условием неположительности $\\zeta_r\\leq 0$ и условием дополняющей нежесткости (\\ref{31.07.2020}) представляет собою <<необходимую часть>> недифференциального принципа Лагранжа, а, точнее, теоремы Куна--Таккера (множитель при целевой функции равен единице) в недифференциальной форме в задаче ($P_{p,r}$). Покажем, что неравенство \\eqref{28.05.2019_1} в совокупности с этими полученными выше двумя условиями является и достаточным, чтобы точка $z_{p,r}^0\\in{\\cal D}_{p,r}^0,$ удовлетворяющая ему, была оптимальной в задаче ($P_{p,r}$). Действительно, пусть некоторый допустимый элемент, обозначаемый через $z_{p,r}^0,$ $z_{p,r}^0\\in{\\cal D}_{p,r}^0,$ удовлетворяет этому неравенству c $\\zeta_r\\leq 0$ и выполняется указанное условие дополняющей нежесткости. Тогда подставляя произвольное $z\\in{\\cal D}_{p,r}^0$ в \\eqref{28.05.2019_1} и принимая во внимание, что $$ \\frac1{4R}\\sum_{i=1}^m\\{[\\max\\{0,-\\zeta_{r,i}+2R(h_i(z)-r_i)\\}]^2-(\\zeta_{r,i})^2\\}\\}\\leq 0 $$ для таких $z,$ можем записать, что $f(z_{p,r}^0)\\leq f(z)\\,\\,\\forall\\,z\\in{\\cal D}_{p,r}^0,$ то есть выделенный указанным образом элемент $z_{p,r}^0$ действительно является оптимальным в задаче ($P_{p,r}$). Наконец, если для некоторых $\\zeta_p\\in H,$ $\\zeta_r\\in \\mathbb{R}^m,$ $\\zeta_r\\leq 0,$ $\\langle\\zeta_r,h(z_{p,r}^0)-r\\rangle=0,$ выполняется неравенство \\eqref{28.05.2019_1}, то выполняется равенство \\eqref{04.11.2019} и неравенство \\eqref{28.05.2019}. Стало быть, рассуждая и далее в <<обратном>> порядке, выполняется равенство \\eqref{04.11.2019_1}, то есть в задаче минимизации \\eqref{27.05.2019} оптимальной является пара $(z_{p,r}^0,-(h(z_{p,r}^0)-r)),$ и, как следствие, неравенство \\eqref{26_05_2019}, а также и неравенство \\eqref{25_05_2019}, то есть в силу леммы \\ref{2l2_1} получаем включение $\\zeta=(\\zeta_p,\\zeta_r)\\in\\partial^P\\beta(p,r).$ \\hfill$\\square$ \\begin{Theorem}\\label{KT_28.05.2019} $[$Модифицированная параметрическая теорема Куна--Таккера в не\\-дифференциальной форме в нелинейной задаче на условный экстремум$]$ Пусть в задаче ($P_{p,r}$) имеет место равенство $\\beta_0(p,r)=\\beta(p,r)\\,\\,\\forall\\,(p,r)\\in H\\times \\mathbb{R}^m$ и $(p,r)\\in H\\times \\mathbb{R}^m$ такая точка, что $\\beta(p,r)<+\\infty.$ Тогда справедливо следующее состоящее из двух частей утверждение. Если $z_{p,r}^0\\in{\\cal D}_{p,r}^0\\equiv\\{z\\in{\\cal D}:\\,g(z)-p=0,\\,\\,h(z)\\leq r\\}$ --- оптимальный элемент в задаче $(P_{p,r}),$ то есть $f(z_{p,r}^0)=\\beta(p,r),$ и $\\zeta\\in\\partial^P\\beta(p,r),$ где $\\partial^P\\beta(p,r)$ --- проксимальный субградиент функции значений $\\beta,$ то для множителей Лагранжа $\\lambda\\in H,\\,\\,\\mu\\in \\mathbb{R}^m_+,$ $(\\lambda,\\mu)=-\\zeta,$ и некоторого $c>0$ выполняются соотношения \\begin{equation}\\label{04.11.2019_2} L_{p,r}^{P,c}(z_{p,r}^0,\\lambda,\\mu)\\leq L_{p,r}^{P,c}(z,\\lambda,\\mu)\\,\\,\\forall\\,z\\in{\\cal D},\\,\\,\\,\\,\\mu_i(h_i(z_{p,r}^0)-r_i)=0,\\,\\,\\,i=1,\\dots,m, \\end{equation} %$$ %L_{p,r}^c(z,\\lambda,\\mu)\\equiv %f(z)+\\langle\\lambda,g(z)-p\\rangle+\\frac c2\\|g(z)-p\\|^2+ %$$ %$$ %\\frac1{2c}\\sum_{i=1}^m\\{[\\max\\{0,\\mu_i+c(h_i(z)-r_i)\\}]^2-(\\mu_i)^2\\}, %$$ и при этом $-\\zeta=(\\lambda,\\mu)$ --- обобщенный вектор Куна--Таккера задачи $(P_{p,r}),$ то есть вектор, удовлетворяющий неравенству $f(z_{p,r}^0)\\leq L_{p,r}^{P,c}(z,\\lambda,\\mu)\\,\\,\\forall\\,z\\in{\\cal D}.$ И, наоборот, если $\\tilde z\\in{\\cal D}_{p,r}^0$ такой элемент, что при некоторых $\\lambda\\in H,\\,\\,\\,\\mu\\in \\mathbb{R}^m_+$ выполняются соотношения \\eqref{04.11.2019_2} с заменой $z_{p,r}^0$ на $\\tilde z,$ то этот элемент оптимален в задаче $(P_{p,r}),$ то есть $\\tilde z=z_{p,r}^0,$ пара $(\\lambda,\\mu)$ является вектором Куна--Таккера для нее и одновременно $(-\\lambda,-\\mu)\\in\\partial^P\\beta(p,r).$ \\end{Theorem} \\textbf{2.5. Модифицированная теорема Куна--Таккера в предположении непустоты субдифференциала Фреше. } Докажем в данном разделе модифицированную недифференциальную теорему Куна--Таккера для нелинейной задачи на условный экстремум, аналогичную теореме \\ref{KT_28.05.2019}, но в которой основным предположением, в отличие от этой теоремы, будет предположение непустоты субдифференциала Фреше функции значений. Ради упрощения изложения ограничимся здесь рассмотрением задачи ($P_{p,r}$) предыдущего раздела без ограничений-неравенств, то есть параметрической задачи на условный экстремум в гильбертовом пространстве с операторным ограничением-равенством $$ f(z)\\to\\min,\\,\\,\\,g(z)=p,\\,\\,\\,\\,z\\in{\\cal D}\\subset Z. \\leqno(P_p) $$ %где $p\\in H$ --- параметр, $f:\\,{\\cal D}\\to \\mathbb{R}^1$ --- непрерывная %функция, $g:\\,{\\cal D}\\to H$ --- непрерывный оператор, ${\\cal %D}\\subset Z$ --- ограниченное замкнутое множество, $Z,\\,H$ --- %гильбертовы пространства. Все условия на исходные данные считаем такими же, как и в предыдущем разделе с естественным учетом того, что в задаче ($P_p$) отсутствуют ограничения-неравенства. Опять предполагаем для простоты, что имеет место равенство $\\beta(p)=\\beta_0(p)\\,\\,\\forall\\,p\\in H.$ Как и ранее, обозначаем через $z_p^0\\in{\\cal D}_p^0$ решение задачи ($P_p$), в случае его существования. Пусть в задаче ($P_p$) оптимальный элемент существует и не пуст субдифференциал Фреше $\\hat\\partial^F\\beta(p)\\not=\\emptyset$ и $\\zeta\\in\\hat\\partial^F\\beta(p).$ Тогда применяя лемму \\ref{2l2_3}, можем утверждать, что для любого $R>0$ найдется $\\delta(R)>0$ (зависящие от точки $p$ и элемента $\\zeta$) такие, что \\begin{equation}\\label{25_05_2019_27_03_2020} \\beta(p)-\\langle\\zeta,p\\rangle\\leq \\beta(p^\\prime)-\\langle\\zeta,p^\\prime\\rangle+ R\\|p^\\prime-p\\|\\,\\,\\,\\forall\\,p^\\prime\\in S_{\\delta(R)}(p)\\equiv\\{p^\\prime\\in H:\\,\\|p^\\prime-p\\|\\leq\\delta(R)\\}. \\end{equation} Из неравенства (\\ref{25_05_2019_27_03_2020}) получаем, взяв $g(z)$ в качестве $p^\\prime$ и учитывая, что $f(z)\\geq\\beta(p^\\prime),$ если $z\\in{\\cal D},$ $g(z)=p^\\prime$ и $\\|g(z)-p\\|\\leq\\delta(R),$ \\begin{equation}\\label{21_02_2020} f(z_p^0)-\\langle\\zeta,g(z_p^0)-p\\rangle\\leq f(z)-\\langle\\zeta,g(z)-p\\rangle+R\\|g(z)-p\\|\\,\\,\\,\\forall\\,z\\in\\{x\\in{\\cal D}:\\,\\,\\,\\|g(x)-p\\|\\leq\\delta(R)\\}. \\end{equation} Учитывая ограниченность $\\beta$ и $\\mbox{dom}\\,\\beta$ (в силу условий \\eqref{cond_0_05_02_25.05.2019} и ограниченности ${\\cal D}$), из неравенства \\eqref{25_05_2019_27_03_2020} одновременно следует, что найдется такое $L>0,$ для которого $\\beta(p)-\\langle\\zeta,p\\rangle\\leq \\beta(p^\\prime)-\\langle\\zeta,p^\\prime\\rangle+ L\\|p^\\prime-p\\|\\,\\,\\,\\forall\\,p^\\prime\\in H.$ Из последнего неравенства, в свою очередь, получаем, взяв $g(z)$ в качестве $p^\\prime$ и учитывая, что при этом $f(z)\\geq\\beta(p^\\prime),$ если $z\\in{\\cal D}$ и $g(z)=p^\\prime$ \\begin{equation}\\label{25_05_2019_1} f(z_p^0)-\\langle\\zeta,g(z_p^0)-p\\rangle\\leq f(z)-\\langle\\zeta,g(z)-p\\rangle+L\\|g(z)-p\\|\\,\\,\\,\\forall\\,z\\in{\\cal D}. \\end{equation} Как неравенство в \\eqref{21_02_2020} при условии $\\|g(z)-p\\|\\leq\\delta(R),$ так и неравенство \\eqref{25_05_2019_1} представляют собою необходимые условия оптимальности элемента $z_p^0.$ Для формулировки недифференциального принципа Лагранжа, а, точнее, теоремы Куна--Таккера (множитель при целевой функции равен единице) в недифференциальной форме в задаче ($P_p$) осталось показать, что неравенство \\eqref{25_05_2019_1} является и достаточным условием для того, чтобы точка $z_p^0,$ удовлетворяющая ему, была оптимальной в задаче ($P_p$). Действительно, пусть некоторый допустимый элемент, обозначаемый через $z_p^0,$ $z_p^0\\in{\\cal D}_p^0,$ удовлетворяет этому неравенству. Тогда рассматриваем $z\\in{\\cal D}$ такие, что $g(z)=p.$ Подставляя такие $z$ в \\eqref{25_05_2019_1}, можем записать, что $f(z_p^0)\\leq f(z)\\,\\,\\forall\\,z\\in{\\cal D}_p^0,$ то есть выделенный указанным образом элемент $z_p^0$ действительно является оптимальным в задаче ($P_p$). Если же, одновременно, для любого $R>0$ найдется такое $\\delta(R)>0,$ что выполняются соотношения \\eqref{21_02_2020}, то рассуждая в обратном порядке, можно заметить, что выполняются и соотношения \\eqref{25_05_2019_27_03_2020}, что, в силу леммы \\ref{2l2_3}, означает справедливость включения $\\zeta\\in\\hat\\partial^F\\beta(p).$ Определим модифицированную функцию Лагранжа ($\\lambda=-\\zeta,$ $c=R$) $$ L_{p}^{F,c}(z,\\lambda)\\equiv f(z)+\\langle\\lambda,g(z)-p\\rangle+c\\|g(z)-p\\|, $$ где верхний индекс $F$ означает, что ее конструкция является следствием непустоты субдифференциала Фреше $\\hat\\partial^F\\beta(p).$ Тогда следствием проведенных рассуждений является \\begin{Theorem}\\label{KT_06.11.2019} $[$Модифицированная параметрическая теорема Куна--Таккера в не\\-дифференциальной форме в нелинейной задаче на условный экстремум$]$ Пусть в задаче ($P_p$) $\\beta_0(p)=\\beta(p)\\,\\,\\forall\\,p\\in H$ и $p\\in H$ такая точка, что $\\beta(p)<+\\infty.$ Тогда справедливо следующее состоящее из двух частей утверждение. Если $z_p^0\\in{\\cal D}_p^0\\equiv\\{z\\in{\\cal D}:\\,g(z)-p=0\\}$ --- оптимальный элемент в задаче $(P_p),$ то есть $f(z_p^0)=\\beta(p),$ и $\\zeta\\in\\hat\\partial^F\\beta(p),$ где $\\hat\\partial^F\\beta(p)$ --- субдифференциал Фреше функции значений $\\beta,$ то для множителя Лагранжа $\\lambda\\in H,$ $\\lambda=-\\zeta,$ и любого $R>0$ существует $\\delta(R)>0$ такое, что выполняется неравенство \\begin{equation}\\label{06.11.2019_1} L_p^{F,R}(z_p^0,\\lambda)\\leq L_p^{F,R}(z,\\lambda)\\,\\,\\forall\\,z\\in\\{x\\in{\\cal D}:\\,\\,\\,\\|g(x)-p\\|\\leq\\delta(R)\\}, \\end{equation} %$$ %L_p^R(z,\\lambda)\\equiv %f(z)+\\langle\\lambda,g(z)-p\\rangle+R\\|g(z)-p\\|, %$$ следствием которого является неравенство \\begin{equation}\\label{21.02.2020_1} L_p^{F,c}(z_p^0,\\lambda)\\leq L_p^{F,c}(z,\\lambda)\\,\\,\\forall\\,z\\in{\\cal D} \\end{equation} при некотором $c>0.$ При этом $-\\zeta=\\lambda$ --- обобщенный вектор Куна--Таккера задачи $(P_p),$ то есть вектор, удовлетворяющий неравенству $f(z_p^0)\\leq L_p^{F,c}(z,\\lambda)\\,\\,\\forall\\,z\\in{\\cal D}.$ И, наоборот, если $\\tilde z\\in{\\cal D}_p^0$ такой элемент, что при некотором $\\lambda\\in H$ выполняются соотношения \\eqref{21.02.2020_1} с заменой $z_p^0$ на $\\tilde z,$ то этот элемент оптимален в задаче $(P_p),$ то есть $\\tilde z=z_p^0,$ а элемент $\\lambda$ является вектором Куна--Таккера для нее. Если же для любого $R>0$ существует $\\delta(R)>0$ такое, что выполняются и соотношения \\eqref{06.11.2019_1}, то $-\\lambda\\in\\hat\\partial^F\\beta(p).$ \\end{Theorem}
×

About the authors

Mikhail I. Sumin

Derzhavin Tambov State University; Nizhnii Novgorod State University

Email: m.sumin@mail.ru
Doctor of Physics and Mathematics, Chief Researcher; Professor 33 Internatsionalnaya St., Tambov 392000, Russian Federation; 23 Gagarin Ave., Nizhnii Novgorod 603950, Russian Federation

References

  1. В. М. Алексеев, В. М. Тихомиров, С. В. Фомин, Оптимальное управление, Наука, М., 1979.
  2. Е. С. Левитин, Теория возмущений в математическом программировании и приложения, Наука, М., 1992.
  3. А. Ф. Измаилов, Чувствительность в оптимизации, Физматлит, М., 2006.
  4. Ж.-П. Обен, Нелинейный анализ и его экономические приложения, Мир, М., 1988.
  5. P. D. Loewen, CRM Proceedings and Lecture Notes. V. 2: Optimal Control via Nonsmooth Analysis, Amer. Math. Soc., Providence, RI, 1993.
  6. Ф. Кларк, Оптимизация и негладкий анализ, Наука, М., 1988.
  7. B. S. Mordukhovich, Variational Analysis and Generalized Differentiation, I: Basic theory; II: Applications, Springer, Berlin, 2006.
  8. F. H. Clarke, Yu. S. Ledyaev, R. J. Stern, P. R. Wolenski, Nonsmooth Analysis and Control Theory. Graduate Texts in Mathematics. V. 178, Springer-Verlag, New York, 1998.
  9. М. И. Сумин, “Регуляризованная параметрическая теорема Куна-Таккера в гильбертовом пространстве”, Журн. вычисл. матем. и матем. физ., 51:9 (2011), 1594-1615.
  10. М. И. Сумин, “Устойчивое секвенциальное выпуклое программирование в гильбертовом пространстве и его приложение к решению неустойчивых задач”, Журн. вычисл. матем. и матем. физ., 54:1 (2014), 25-49.
  11. М. И. Сумин, “Устойчивая секвенциальная теорема Куна-Таккера в итерационной форме или регуляризованный алгоритм Удзавы в регулярной задаче нелинейного программирования”, Журн. вычисл. матем. и матем. физ., 55:6 (2015), 947-977.
  12. М. И. Сумин, “Зачем нужна регуляризация принципа Лагранжа и принципа максимума Понтрягина и что она дает”, Вестник Тамбовского университета. Серия: естественные и технические науки, 23:4(124) (2018), 757-775.
  13. М. И. Сумин, “Регуляризованные принцип Лагранжа и принцип максимума Понтрягина в оптимальном управлении и обратных задачах”, Тр. Ин-та математики и механики УрО РАН, 25:1 (2019), 279-296.
  14. Е. Г. Гольштейн, Теория двойственности в математическом программировании и ее приложения, Наука, М., 1971.
  15. М. И. Сумин, Некорректные задачи и методы их решения. Материалы к лекциям для студентов старших курсов, Изд-во Нижегородского госуниверситета, Нижний Новгород, 2009.
  16. Ф. П. Васильев, Методы оптимизации: В 2-х кн., МЦНМО, М., 2011.
  17. А. Г. Сухарев, А. В. Тимохов, В. В. Федоров, Курс методов оптимизации, Наука, М., 1986.
  18. Д. Бертсекас, Условная оптимизация и методы множителей Лагранжа, 1-е изд., Радио и связь, М., 1987.

Supplementary files

Supplementary Files
Action
1. JATS XML


Creative Commons License
This work is licensed under a Creative Commons Attribution 4.0 International License.

Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».