Введение. Приведем постановку общей задачи и основные результаты ее решения [1].
0.1. Постановка задачи при неполных измерениях. Если часть случайного вектора состояния динамического объекта управления измеряется точно, то он описывается системой из двух стохастических дифференциальных уравнений Ито (двойная марковская модель управляемой системы):
(0.1)
Здесь — время работы объекта, — неизмеряемая часть вектора состояния объекта, — вектор управления, — вектор стандартного винеровского процесса, закон распределения неизмеряемого вектора определяется условной плотностью вероятности , в то время как плотность вероятности измеряемого вектора может быть произвольной.
Требуется найти дифференциальное уравнение состояния динамического регулятора
(0.2)
с вектором состояния размерности , выбираемой из условия компромисса между достижением приличного качества управления и обеспечением желаемого быстродействия этого регулятора на реализующем его вычислителе, и формулу его выхода
. (0.3)
При этом неизвестные структурные функции регулятора — смещения , усиления , начального состояния и выхода — определяются из условия минимума функционала качества всей замкнутой системы управления:
. (0.4)
Здесь — оператор математического ожидания, конечный момент времени является фиксированным, а функции потерь — неотрицательными . Такая зависимость последних от переменной z позволяет накладывать ограничения и на желаемую эффективность регулятора.
Задача построения такого же конечномерного регулятора, но для зависящего от времени оперативного критерия качества рассмотрена в [2].
0.2. Сведение задачи к детерминированной. Подстановка формулы выхода регулятора (0.3) в функционал (0.4) позволяет записать последний через совместную плотность вероятности всех элементов случайного вектора состояния замкнутой системы управления (0.1)—(0.3):
. (0.5)
Здесь и далее верхним индексом отмечены сложные функции, содержащие функцию выхода регулятора , например , угловыми скобками обозначен интеграл усреднения функции с весом в виде совместной плотности :
,
а интегралы по переменным берутся по всему евклидову пространству соответствующей размерности, в частности
.
Совместная плотность вероятности при определенных условиях гладкости функций дифференциальных уравнений объекта-измерителя (0.1) и регулятора (0.2) является решением уравнения Фоккера—Планка—Колмогорова (ФПК):
(0.6)
Здесь — прямой производящий оператор диффузионного марковского процесса :
где — коэффициенты диффузии исходного процесса :
.
Начальным для уравнения (0.6) является условие
(0.7)
где — функция Дирака.
При недифференцируемости коэффициентов уравнения (0.6) по переменным его решение будем понимать в обобщенном смысле как удовлетворяющее справедливому для любой пробной функции интегродифференциальному тождеству
(0.8)
с начальным условием
(0.9)
и с сопряженным к оператору обратным производящим оператором процесса :
(0.10)
Здесь нижними индексами обозначены столбцы первых и матрицы вторых частных производных скалярной функции соответственно.
Однако неопределенность в начальных условиях (0.7) или (0.9) функций , не позволяет пользоваться уравнениями (0.6) или (0.8). В этих условиях совместную плотность удается заменить [3] на соответствующую ей условную плотность вероятности (УПВ) случайной величины :
Далее операцию условного усреднения функции только по переменной х с весом будем обозначать чертой сверху:
. (0.11)
В [3] показано, что УПВ в общем случае полностью определяется своим известным начальным значением и нелинейным интегродифференциальным тождеством:
, (0.12)
в котором новый оператор имеет вид
(0.13)
а его коэффициенты , зависят от плотности как функции условного среднего (0.11).
Если функции , из (0.1) непрерывно дифференцируемы по один и два раза соответственно, то из (0.12) следует, что плотность удовлетворяет интегродифференциальному уравнению в частных производных:
. (0.14)
В результате исходная стохастическая задача (0.1)—(0.4) сведена к задаче управления детерминированным объектом (0.14) с распределенными параметрами в виде функций его состояния и управления , оптимизируемых по критерию (0.5).
0.3. Достаточные условия оптимальности структуры регулятора. Пусть — функция Лагранжа—Кротова, тогда как — “стохастический” гамильтониан
, (0.15)
который является линейным относительно функций функционалом с шестью параметрами . Тогда справедливо следующее утверждение.
Теорема 1 [1]. Достаточным условием оптимальности в смысле (0.4) всех структурных функций регулятора (0.2), (0.3) является наличие такой дифференцируемой функции , что экстремумы
(0.16)
(0.17)
(0.18)
существуют и достигаются на множестве допустимых функций , связанных тождеством для УПВ (0.12) или ее уравнением (0.14). При этом минимальное значение критерия (0.4) находится по функции (0.17) и плотности начального измерения :
.
Из соотношения (0.18) следует, что оптимальные функции , уравнения состояния регулятора и оптимальная функция его выхода находятся в результате максимизации гамильтониана (0.15) по трем его параметрам из шести:
. (0.19)
Функцию же начального состояния регулятора получим из (0.17) подобной максимизацией условного среднего начального значения функции :
. (0.20)
0.4.Соотношения для экстремалей. Используя в (0.16), (0.18) необходимое условие экстремума оптимизируемых там функционалов, получим для рассматриваемой задачи управления детерминированным объектом с распределенными параметрами следующий аналог принципа максимума Понтрягина. Для наиболее простого случая дифференцируемости функций имеем следующий результат.
Теорема 2 [1].Экстремали уравнений регулятора , порождаемая ими плотность вероятности и соответствующая им сопряженная функция удовлетворяют следующей системе уравнений:
,
,
.
Эти уравнения образуют на интервале времени двухточечную краевую задачу, решая которую можно найти все пять экстремалей. После этого экстремаль начального условия регулятора находится из (0.17):
.
0.5. Оптимальная структура динамического регулятора. Решая задачу (0.19) нахождения частного максимума гамильтониана с помощью известного принципа сечений последовательно, от простого к сложному:
(0.21)
можно найти следующие соотношения для нахождения структурных функций регулятора.
0.5.1. Функция смещения. Вычисляя в (0.21) первый, внутренний, частный максимум функции по параметру , получим следующий результат.
Теорема 3 [1]. Частный максимум гамильтониана по линейно входящему в него параметру существует при условии инвариантности (независимости) от :
,
а соответствующая оптимальная функция смещения регулятора определяется по формуле
Здесь действие оператора на вектор-функцию осуществляется поэлементно:
.
0.5.2. Функция усиления. Согласно (0.21), сначала находится зависящая от переменной управления частично-оптимальная функция усиления
(0.22)
и соответствующее ей значение второго частного максимума гамильтониана
(0.23)
для его последующей максимизации по переменной .
Теорема 4 [1]. Если шум измерителя не вырожден , а матрица вторых производных функции Лагранжа—Кротова отрицательно определена , то частично-оптимальная функция усиления находится из алгебраического уравнения
а гамильтониан (0.23) имеет вид
Здесь уже верхний индекс u у функций просто подчеркивает их зависимость от этой переменной, например .
0.5.3. Функция выхода. Осталось максимизировать функцию (6.9) по переменной управления.
Теорема 5[1]. Если функция (6.9) выпукла по переменной управления , то оптимальная функция выхода регулятора определяется как единственное решение задачи параметрического нелинейного программирования:
Оптимальная же функция усиления регулятора находится подстановкой этого результата в частично-оптимальную функцию усиления (0.22):
0.5.4. Функция начального состояния. Наконец, из (0.20) легко получим такое утверждение.
Теорема 6[1]. Оптимальная функция определяется из условий
,
первое из которых есть алгебраическое уравнение относительно переменной , а второе гарантирует наличие соответствующего максимума.
1. Стохастические измерения состояния объекта. Рассмотрим теперь более простую скрытую марковскую модель управляемой системы, когда система уравнений (0.1) распадается на независимое от измерения уравнение состояния объекта управления
(1.1)
и на уравнение управляемого, в общем случае, измерителя
(1.2)
Нулевое начальное условие в (1.2) общности измерений не ограничивает, так как это уравнение является дифференциальной формой записи формулы неточных измерений:
Отметим, что объект (1.1) и измеритель (1.2) возмущаются одним и тем же гауссовским белым шумом . Чтобы обеспечить независимость отдельных возмущений для объекта и для измерителя, достаточно потребовать выполнения условия [2]. Кроме того, если , то уравнение задает поведение пучка траекторий объекта, порождаемых случайным начальным условием . Если же , то измерение является точным, но может быть неполным, а если еще и , что возможно только при равенстве размерностей , то и вектор состояния объекта измеряется точно и полностью.
Для управляемой системы (1.1), (1.2) уравнения регулятора (0.2), (0.3) тоже будем искать в более простом виде:
, (1.3)
а его структурные функции найдем из условия минимума частного вида критерия (0.4):
. (1.4)
Формально соотношения (1.1)—(1.4) отличаются от (0.1)—(0.4) лишь независимостью всех своих функций ..., от переменной выхода . Поэтому ее следует исключить и из приведенного выше алгоритма синтеза структуры регулятора. Например, теперь полное (совместное) усреднение функции производится по формуле
.
В результате получим следующие результаты.
2. Плотности вероятности. Согласно (0.6)—(0.10), совместная плотность вероятности состояний объекта (1.1) и регулятора (1.3) в случае выполнения известных условий гладкости является решением прямой задачи Коши для линейного уравнения ФПК:
с прямым оператором
.
Иначе она удовлетворяет линейному интегродифференциальному тождеству
с сопряженным оператором
(2.1)
и с начальным условием . Отметим, что начальные условия этих уравнения и тождества содержат неизвестный параметр , так что и в этом случае уравнение ФПК и соответствующее ему тождество для решения задачи синтеза неприменимы.
Поэтому вместо совместной плотности тоже будем использовать условную плотность
Она в соответствии с (0.12)—(0.14) либо является гладким решением задачи Коши
(2.2)
с операторами
где чертой над функцией обозначено ее условное среднее:
либо определяется из своего нелинейного интегродифференциального тождества
(2.3)
3. Достаточные условия оптимальности. Аналогично из разд. 0.3 получаем, что достаточным условием оптимальности функций регулятора (1.3) является наличие такой дифференцируемой функции Лагранжа—Кротова, что экстремумы
(3.1)
(3.2)
(3.3)
существуют и достигаются на функциях , , , , связанных уравнением (2.2) или тождеством (2.3). Здесь гамильтониан имеет вид
,
а минимальное значение критерия (1.4) определяется как .
4. Уравнения для экстремалей. В свою очередь из разд. 0.4 имеем следующую систему уравнений для экстремалей:
а после решения этой двухточечной краевой задачи вычисляется и экстремальное начальное состояние регулятора:
5. Оптимальная структура регулятора. Наконец, аналогичной модификацией утверждений теорем 1—6 из Введения получаем, что функция смещения регулятора (1.3) находится из условия инвариантности
(5.1)
и определяется по формуле
(5.2)
Частично-оптимальная функция усиления при выполнении условия находится при любых допустимых значениях переменной из линейного матричного уравнения:
(5.3)
после чего функция выхода регулятора по-прежнему определяется частной максимизацией гамильтониана:
который теперь имеет вид
(5.4)
После этого сама оптимальная функция усиления регулятора находится подстановкой этой функции выхода в полученную из (5.3) частично-оптимальную функцию усиления:
(5.5)
Наконец, вектор начального состояния регулятора определяется из условий
. (5.6)
6. Пример теоремы разделения. Для проверки правильности приведенных в разд. 3, 5 достаточных условий оптимальности конечномерного регулятора (1.3) и процедур синтеза его структуры рассмотрим известную линейно-квадратично-гауссовскую (ЛКГ) задачу управления по неточным измерениям. Пусть возмущаемые стандартным винеровским процессом уравнения объекта (1.1) и измерителя (1.2) линейные, а начальная плотность вероятности гауссовская с параметрами :
(6.1)
(6.2)
Пусть также управление не ограниченное , а критерий оптимальности (1.4) не зависит от состояния регулятора и является квадратическим:
(6.3)
с весовыми матрицами . Далее очевидные зависимости параметров системы и критерия от времени t будем опускать.
Исходные соотношения (6.1)—(6.3) этой задачи отличаются от общих выражений (1.1), (1.2), (1.4) линейностью функций сноса объекта и измерителя, зависимостью интенсивностей гауссовских белых шумов , только от времени, гауссовостью начального состояния , а также квадратичностью интегранта и терминанта критерия (6.3) при их независимости от переменной z состояния регулятора:
au = Ax+Ku, cu = Cx+Mu, Qu = Q, Ru = R, Su = S,
p0(x) = N(x||mx0, Dx0), μu = 0.5(xTXx+uTФu), ν = 0.5xTПx. (6.4)
6.1. Классический регулятор. Известно, что в случае (6.1), (6.2) апостериорная плотность вероятности гауссовская, а потому для критерия (6.3) справедлива теорема разделения [4, 5], согласно которой оптимальный нелинейный бесконечномерный регулятор Стратоновича—Мортенсена становится линейным конечномерным и распадается на два независимо синтезируемых блока.
Сначала по всей предыстории измерений инерционно вырабатывается оценка состояния управляемым линейным фильтром Калмана—Бьюси:
(6.5)
который, однако, оптимален в не связанном с критерием (6.3) среднеквадратическом смысле . Его -матрица усиления G обновляющего процесса по формуле
(6.6)
выражается через симметрическую матрицу ковариаций ошибки оценивания , которая определяется с помощью не зависящего от управления прямого уравнения Риккати:
. (6.7)
Затем найденная оценка используется для получения управления с помощью безынерционного линейного регулятора
. (6.8)
Последний синтезируется независимо от фильтра (6.5), так как подобная зависимость оптимальна в детерминированной задаче с полными измерениями вектора состояния:
.
Поэтому симметрическая -матрица находится из соответствующего детерминированному регулятору обратного уравнения Риккати:
(6.9)
Преимуществом такого линейного инерционного регулятора по сравнению с более общими нелинейными является наличие двух решаемых заранее независимых уравнений Риккати и быстрота обработки измерений фильтром (6.5), так как он имеет относительно малый порядок n.
6.2. Предлагаемый регулятор. Проверим, что в ЛКГ-задаче (6.1)—(6.3) предлагаемый регулятор (1.3) соответствующего уравнению фильтра (6.5) порядка , так что далее , а потому сушествует разность , является линейным и удовлетворяет соотношениям (6.5)—(6.9) теоремы разделения. Для этого убедимся, что приведенным выше достаточным условиям оптимальности удовлетворяют структурные функции регулятора:
(6.10)
и порождаемая ими условная плотность вероятности . С этой целью выберем подходящую функцию Лагранжа—Кротова и получим связи функций (6.10) и начального состояния регулятора h с параметрами задачи. Например, функция смещения регулятора должна соответствовать уравнению фильтра (6.5) и иметь вид
(6.11)
Зададим функцию Лагранжа—Кротова как сумму двух отрицательно определенных квадратических форм, стационарной и нестационарной :
(6.12)
с подлежащими определению весовыми матрицами . Производные этой функции имеют вид
(6.13)
На этой основе далее последовательно получим следующие соотношения.
6.2.1. Условная плотность . Исключая из рассмотрения переменную измерений подставкой (6.2) в (1.3), получаем, что на предполагаемых оптималях (6.10) система уравнений состояния объекта (6.1) и регулятора (1.3) является линейной:
,
а ее начальные условия — гауссовские: . Поэтому совместная плотн cость вероятности этих состояний тоже гауссовская:
,
а ее параметры могут быть найдены из уравнений метода моментов Пугачева—Дункана. Следовательно, по теореме о нормальной корреляции [6] гауссова и условная плотность
(6.14)
а ее среднее и ковариация
,
в этом случае находятся по формулам
(6.15)
где — символ псевдообращения матрицы по Муру—Пенроузу. Подчеркнем, что относительно переменной z условное среднее является функцией линейной, тогда как ковариация зависит только от времени.
6.2.2. Функция смещения . Из определяющего ее условия инвариантности (5.1), которое в данном случае принимает вид , получаем, что в (6.15) условное среднее равно значению его условия :
. (6.16)
В результате связь ковариации с плотностью вероятности упрощается:
(6.17)
Подставляя же (6.16) в первое равенство из (6.15), находим справедливое для любых z тождество , где Е — единичная матрица. Из него следуют два равенства , , откуда находим . Тогда упрощается и второе равенство из (6.15), принимая вид
, (6.18)
а разность оказывается центрированной: .
В начальный момент времени из (6.18) имеем , где, согласно (1.3), . Таким образом, найдено начальное значение условной ковариации
. (6.19)
Для определения самой функции смещения используем формулу (5.2). В ней, согласно (6.13), имеем , так что теперь
, (6.20)
где действие оператора на скалярную функцию задается выражением (2.1), которое здесь имеет вид
Применять же этот оператор к вектор-функции нужно поэлементно. Чтобы сохранить матричную форму записи, учтем, что ее первые производные имеют вид , , а вторые производные обращаются в нули: . Тогда, используя для справедливости последующих матричных соотношений свойство коммутативности скалярного произведения , получаем вектор-функцию
,
подставляя которую в (6.20) и интегрируя ее по переменной х с весом (6.14), находим
.
Наконец, учитывая здесь равенство (6.16), окончательно имеем формулу
, (6.21)
которая похожа на желаемое выражение (6.11).
6.2.3. Функция усиления . Сначала определим ее частично-оптимальную версию . Так как , то достаточное условие справедливости ее уравнения (5.3) выполняется, а оно само принимает вид
Используя здесь выражения (6.13) для производных функции , имеем
а умножая это равенство на и учитывая, что из (6.16), (6.17) следуют равенства получаем частично-оптимальную функцию усиления независимой от переменной управления :
Тогда подстановка (5.5) не нужна, и сама оптимальная функция усиления действительно в соответствии с (6.10) зависит только от времени и определяется по формуле
(6.22)
Последняя отличается от классической (6.6) только заменой матрицы , определяемой по уравнению Риккати (6.7), на неизвестную пока матрицу . Этот факт упрощает и функцию смещения (6.21):
, (6.23)
делая ее вид уже совпадающим с классическим (6.11).
6.2.4. Функция выхода . Максимизируем по переменной гамильтониан (5.4). Он в данном случае принимает вид
Выделяя в нем только зависящие от u слагаемые и выполняя интегрирование по х, имеем
Учитывая здесь условие инвариантности (5.1) и то, что из (6.13), (6.16) следует зависимость
,
получаем независимую от G квадратическую функцию
которая вследствие исходного условия имеет по u единственный максимум
(6.24)
Найденная функция выхода действительно, как в (6.10), является линейной с коэффициентом и с точностью до его последнего сомножителя совпадает с ее классическим видом (6.8). Подставляя же (6.22), (6.24) в (6.21), получаем, что функция смещения тоже соответствует оптимальной (6.10), являясь линейной с коэффициентом
6.2.5. Начальное состояние . Из (6.13) следует, что необходимое и достаточное условия его оптимальности (5.6) принимают вид
.
Второе из них выполняется по (6.12), а из первого легко получаем
, (6.25)
что соответствует уравнению фильтра Калмана—Бьюси (6.5).
В результате применением достаточных условий показано, что в ЛКГ-задаче (6.1)—(6.3) оптимальный регулятор (1.3) действительно является линейным с функциями (6.10), причем их связи с параметрами задачи соответствуют теореме разделения. Остается получить ковариацию (6.17), которая определяет функцию усиления регулятора (6.22), а также найти входящую в функцию его выхода (6.24) весовую матрицу нестационарной части квадратичной функции Лагранжа—Кротова (6.12). Отметим, что весовая матрица ее стационарной части на структурные функции оптимального регулятора не влияет и искать ее не нужно.
6.2.6. Условная ковариация . Найдем ее двумя способами.
1. Метод моментов. Учитывая в уравнении регулятора (1.3) функции усиления (6.22) и смещения (6.23), имеем
Подставляя сюда уравнение измерителя (6.2), после приведения подобных членов получаем
Вычитая это равенство из уравнения состояния линейного объекта (6.1), находим замкнутое линейное уравнение для разности :
Тогда, используя известное [7, с. 268] уравнение Пугачева—Дункана для матрицы ковариаций линейной стохастической системы получаем, что матрица удовлетворяет уравнению
или, группируя в нем слагаемые в зависимости от наличия в них матрицы G,
(6.26)
Подставляя сюда выражение (6.22), можно убедиться, что последние три слагаемых здесь представляют собой одинаковые подобные члены, равные . В итоге получаем матричное дифференциальное уравнение Риккати
(6.27)
а его начальное условие имеет вид (6.19). Все это отличается от (6.7) лишь обозначением, так что , что и требовалось доказать.
2. Тождество для УПВ. Из (6.17) следует, что искомая ковариация является условным средним матричной функции , так как . Подставляя в тождество (2.3) каждый элемент этой матрицы , , и учитывая равенства , , , получаем тождество
(6.28)
Определяющий его оператор в соответствии с (2.1), (6.4) и свойством имеет вид
и содержит не зависящие от переменной интегрирования х функции . Тогда, выполняя дифференцирование склярной функции , находим, что ее первые производные по переменной х линейны:
где — символ Кронекера, тогда как вторые производные от нее не зависят:
Поэтому упорядочим в операторе слагаемые по степеням этой переменной. Используя для конкретности только основные производные , , получаем
а после подстановки этого равенства в тождество (6.28) и выполнения интегрирования находим
Учитывая, что здесь во втором слагаемом , и выполняя в третьем симметризацию матрицы по свойству , имеем более простое тождество:
(6.29)
с матрицами
, ,
причем последняя из них симметрическая . Усредняя здесь произведение
,
получаем его представление только через ковариацию Г:
.
Наконец, вычисляя входящие в (6.29) слагаемые
,
окончательно находим скалярные соотношения
которым соответствует матричное равенство . Учитывая в нем обозначения матриц , получаем
а группируя и здесь слагаемые по степеням G, имеем уравнение
(6.30)
которое совпадает с промежуточным результатом метода моментов (6.26), а значит тоже дает уравнение Риккати (6.27). Отметим, что этим вторым способом продемонстрирована справедливость для данного случая и тождества для УПВ.
6.2.7. Весовая матрица функции Лагранжа—Кротова. Воспользуемся достаточными условиями (3.1), (3.3), согласно которым значения экстремумов на оптималях из (6.14), (6.22)—(6.24) представляют собой алгебраические тождества:
В данной задаче они имеют вид
с оператором
в котором учтена одинаковая размерность векторов , а функции , , не зависят от переменной интегрирования х. Подставляя сюда выражения для функции Лагранжа—Кротова (6.12) и ее производных (6.13), после умножения на два получаем два тождества:
Записывая в них все билинейные и квадратичные формы как следы соответствующих матриц вроде , группируя слагаемые по степеням переменной х и выполняя интегрирование по ней, имеем
Так как здесь, согласно (6.16), (6.17), условные средние определяются по формулам , , то в первом из этих тождеств слагаемое с функцией исчезает и в результате получаем
(6.31)
(6.32)
Эти два полиномиальных тождества должны выполняться при любых значениях векторной переменной z, поэтому, так как тождество справедливо только при условиях из (6.31) легко находим конечное значение искомой функции
. (6.33)
Аналогично и в тождестве (6.32), учитывая линейность (6.24) оптимальной функции по z, приравняем слева и справа слагаемые, содержащие квадраты этой переменной:
или, подставляя сюда саму зависимость (6.24),
Используя здесь для симметризации матриц свойство следа от их произведения и приводя подобные члены, имеем тождество
из которого для матрицы окончательно получаем обратное уравнение Риккати:
(6.34)
Вместе со своим конечным условием (6.33) оно отличается от (6.9) лишь обозначением, так что , что и требовалось доказать.
Таким образом, выбрав в ЛКГ-задаче (6.1)—(6.3) порядок предлагаемого регулятора (1.3) равным порядку объекта управления, с помощью достаточных условий оптимальности (3.1)—(3.3), процедур их применения (5.1)—(5.6) и тождества для УПВ (2.3) показано, что существует такая функция Лагранжа—Кротова (6.12), при которой структурные функции линейного регулятора (6.10) являются оптимальными, а их вид и параметры удовлетворяют теореме разделения. Тем самым доказано, что из теорем 1, 3—6 следует такое утверждение.
Следствие. Если в условиях ЛКГ-задачи (6.1)—(6.3) синтезировать линейную версию (6.10) регулятора (1.3) порядка объекта управления , то найденные с помощью полученных достаточных условий оптимальности его структурные функции и их параметры удовлетворяют теореме разделения.
Отметим, что этим подтверждена оптимальность всех структурных функций линейного регулятора (6.10) в смысле единого квадратического критерия оптимальности (6.3). В отличие от этого в классическом регуляторе его инерционная часть, линейный фильтр Калмана—Бьюси (6.5)—(6.7), и безынерционная часть, детерминированный позиционный регулятор (6.8), (6.9), оптимальны в разных смыслах. Действительно, уравнения и параметры этого фильтра не зависят от весовых матриц критерия (6.3), которые определяют только позиционный регулятор.
Заключение. Для случая неточных измерений состояния объекта управления приведены достаточные условия оптимальности конечномерного динамического регулятора и соотношения для определения соответствующих экстремалей, а также алгоритмы нахождения каждой из оптимальных структурных функций регулятора. На примере ЛКГ-задачи эти алгоритмы проверены сравнением получаемых результатов с известной теоремой разделения.
В следующей части статьи из-за сложности точного вычисления в нелинейной задаче условной (усечено-апостериорной) плотности вероятности планируется рассмотреть процедуру построения гауссовского приближения к оптимальному конечномерному регулятору. Применение этой процедуры будет продемонстрировано на задаче синтеза оптимального нелинейного закона конечномерного управления линейным стохастическим объектом по квадратично-биквадратному критерию качества. В подобной детерминированной задаче линейно-кубический закон позиционного управления был предложен в [8, 9].