On a numerical estimation method with a given accuracy of a quantile criterion in the case of a piece-linear loss function and a gaussian probability density
- Authors: Nefedov V.N.1
-
Affiliations:
- Moscow Aviation Institute (National Research University)
- Issue: No 2 (2024)
- Pages: 3-24
- Section: INFORMATION PROCESSING AND IDENTIFICATION
- URL: https://journals.rcsi.science/0002-3388/article/view/264488
- DOI: https://doi.org/10.31857/S0002338824020021
- EDN: https://elibrary.ru/VOTPQP
- ID: 264488
Cite item
Full Text
Abstract
The solution of many practical problems leads to the calculation of the values of probabilistic criteria, the most common of which are the quantile and probability functionals. It is known that, under fairly general assumptions, methods suitable for solving problems of finding the values of a probabilistic criterion can be used to solve the problem of quantile analysis. The proposed method for solving the problem of quantile analysis is based on the use of the method of numerical multidimensional integration described in the previous works of the author. One of the important properties of this integration method is universality (when using it, we can set an arbitrary number of variables n and an arbitrary number of linear constraints r). The only limitation is the case of an unacceptably long solution time. Thus, the indicated universality is transferred to the solution of the considered problem of quantile analysis.
Full Text
Введение. Решение многих практических задач приводит к вычислению значений вероятностных критериев. Наиболее распространенными вероятностными критериями качества технических систем при случайных воздействиях являются функционалы квантили [1] и вероятности. Квантильный критерий может характеризовать точность системы управления при случайных возмущениях [1], гарантированную площадь взлетно-посадочной полосы, на которую летательный аппарат садится с заданной вероятностью в условиях ветровых помех [2] и т.д. Функционал вероятности характеризует обычно вероятность выполнения условий рассматриваемой задачи.
Как установлено в [1], при достаточно общих предположениях методы, пригодные для решения задач нахождения значений вероятностного критерия, могут быть использованы для решения задачи квантильного анализа.
Во многих случаях нахождение значения вероятностного критерия сводится к вычислению многомерного интеграла от плотности вероятности некоторого случайного вектора по заданному множеству, что представляет собой сложную вычислительную задачу [1]. Применение традиционных методов решения этой задачи (см., например, [3–5]), таких, как прямое интегрирование плотности вероятности или метод Монте-Карло, при высоких требованиях к точности получаемого результата приводит к недопустимо большим вычислительным затратам.
Таким образом, нахождение значения вероятностного критерия, а также решение задачи квантильного анализа упирается в разработку численных методов многомерного интегрирования с любой желаемой точностью. Понятно, что размерность n решаемой задачи будет невелика. Автором был проведен численный эксперимент при . В случае когда подынтегральная функция является плотностью нормального распределения, множеством интегрирования является многогранник, заданный несколькими линейными ограничениями (количество линейных ограничений в используемом методе не имеет большого значения), приближенное значение интеграла было вычислено с абсолютной погрешностью (см. ниже пример 1). Соответственно, относительная погрешность составила 0.0634%. При этом применялся численный метод интегрирования, описанный в работах [6–9], являющийся универсальным в том смысле, что мы можем задавать произвольное количество переменных n и произвольное количество линейных ограничений r, но при этом при больших n время счета может оказаться неприемлемо большим.
Задача многомерного интегрирования с заданной точностью рассматривалась и в других публикациях, в частности в работе [12], в которой предлагаются методы, не обладающие указанным свойством универсальности. Например, случай, когда множеством интегрирования является многогранник, описан в [12] для максимального значения , а в случае эллипсоида – для . Между тем в [6] (см. табл. 1, 2 из этой работы), приводятся результаты численного эксперимента для эллипсоида при (а сам метод универсален для любого n).
Предлагаемый в этой статье метод решения задачи квантильного анализа основан на применении метода численного многомерного интегрирования, описанного в [6–9], использующего последовательное k-этапное дробление исходного “внешнего” (для заданного подынтегрального множества) куба на кубы, получаемые последовательным делением ребер кубов пополам. Краткое описание этого метода приводится в разд. 1. В разд. 2 представлены основные определения и используемые в настоящей работе обозначения, связанные с функцией квантили. В разд. 3 приводятся некоторые вспомогательные методы и алгоритмы, связанные с рассматриваемым в этой работе кусочно-линейным случаем для целевой функции. В разд. 4 предлагается алгоритм вычисления с заданной точностью функции квантили, основанный на алгоритме вычисления многомерного интеграла с помощью последовательного k-этапного дробления исходного “внешнего” куба. Приводится его обоснование, а также весьма оптимистическая оценка для основного параметра алгоритма – k, т.е. количества этапов дробления, необходимого для достижения требуемой точности вычисления . В зависимости от использования модификации алгоритма интегрирования (см. разд. 1) эта оценка имеет вид (с помощью 1-го наиболее простого метода интегрирования) или (с помощью 2-го более сложного метода интегрирования), где – некоторые константы (которые можно приблизительно оценить уже в самом начале процесса вычислений). Замечательно, что в этих оценках не присутствует число n – размерность задачи. Для получения этих оценок применялось геометрическое неравенство (4.6). В разд. 5 описываются некоторые свойства выпуклых многогранников, необходимые для обоснования этого неравенства.
- Численный метод многомерного интегрирования с заданной точностью в случае кусочно-линейной функции потерь и гауссовской плотности вероятности. Укажем лишь общие идеи метода, который будем далее называть а л г о р и т м о м 1. Все необходимые детали можно найти в работах [6–9]. Рассматривается задача приближенного вычисления с заданной точностью интеграла:
(1.1)
где , ,
(1.2)
(1.3)
Этот метод использует некоторые идеи метода ветвей и границ, применяемого в алгоритмах дискретной оптимизации (см., например, [10]).
В замечании 2 из [6] говорится о том, что куб может иметь более общий вид , т.е. являться n-мерным координатным параллелепипедом (будем кубы или параллелепипеды, заданные указанным образом, называть координатными). Однако программная реализация предлагаемого в [6–9] метода оказывается наиболее экономичной (см., например, [6, С. 57]) в случае (1.3). Действительно, в этом случае можно заранее создать одномерный массив Ф(a,b,k) значений функции
(1.4)
где , на равномерной сетке (т.е. ), и тогда многие вспомогательные задачи интегрирования будут решаться путем выбора соответствующих элементов из этого массива и совершения над ними арифметических действий (умножения, сложения и т.д.).
Алгоритм 1 основан на многоэтапном дроблении куба . Для этого выбирается k – количество этапов дробления. Точность приближенного вычисления интеграла (1.1) непосредственно зависит от величины количества этапов дробления k. Обозначим через – приближенное значение интеграла (1.1), вычисляемое с помощью алгоритма 1, – достигаемая при выбранном k точность вычисления, при этом после окончания работы алгоритма для приближенного значения интеграла выполняется
(1.5)
Сначала присваиваем , и дробим исходный куб на кубов (делением ребер куба пополам), которые назовем кубами первого этапа дробления (соответственно, кубы, являющиеся элементами аналогичного дробления кубов первого этапа дробления, назовем кубами второго этапа дробления и т.д.). На каждом этапе перебираем кубы Q j-го этапа дробления и проверяем выполнение условия “погружения”:
(1.6)
Если (1.6) справедливо, то полагаем , где
и исключаем куб Q из дальнейшего рассмотрения. В нашем случае с линейными ограничениями проверка условия (1.6) осуществляется точно и достаточно экономично (см. [9. С. 1114–1115]) и в случае (1.6) вычисление интеграла осуществляется за арифметических операций с использованием заготовленного массива Ф(a,b,k) (см. [9, С. 1114]). В противном случае проверяем выполнение условия “отсечения”:
(1.7)
Если (1.7) справедливо, то исключаем куб Q из дальнейшего рассмотрения и переходим к очередному кубу j-го этапа дробления (см. ниже замечание 1); если все кубы j-го этапа дробления исчерпаны, то переходим к очередному кубу Q -го этапа дробления (пока еще ) и т.д. Если же все кубы первого этапа дробления исчерпаны, то конец работы алгоритма.
Если для очередного куба Q (некоторого j-го этапа дробления) не выполняется ни условие погружения (1.6), ни условие отсечения (1.7), то осуществляем дальнейшее дробление этого куба, а в случае полагаем
(1.8)
Нетрудно показать (см. утверждение 1 из [7, С. 45]), что одновременное невыполнение условий погружения (1.6) и отсечения (1.7) для некоторого координатного куба равносильно тому, что , где – граница множества .
После выполнения алгоритма справедливо равенство
(1.9)
(здесь суммирование осуществляется по всем кубам Q k-го (т.е. последнего) этапа дробления, для которых не выполняется ни условие отсечения, ни условие погружения).
З а м е ч а н и е 1. В [8, 9] трудоемкая проверка условия отсечения (1.7) заменена на достаточное для (1.7) гораздо менее трудоемкое условие (см. условие (3.4) из [9]).
З а м е ч а н и е 2. В приведенном описании алгоритма 1 даны лишь общие идеи и опущены технические детали, позволяющие модифицировать этот алгоритм для уменьшения погрешности . Например, в [8, 9] формула присвоения (1.8) уточняется. Для этого вычисляются верхняя и нижняя оценки для величины
и вместо к прибавляется разность между верхней и нижней оценками. Одновременно с этим нижняя оценка прибавляется к . В [8, 9] приведены две модификации для приближенного вычисления с разными порядками точности. Пусть , где – длина ребер куба , т.е. – половина длины ребер кубов k-го (последнего) этапа дробления куба . В первой модификации для результирующего значения выполняется при (метод второго порядка точности), а во второй гораздо более сложной модификации при (метод третьего порядка точности). Первая модификация была реализована на компьютере (см. ниже пример 1, из которого видно, что при увеличении k на единицу (соответственно, при уменьшении в 2 раза) уменьшается приблизительно в 4 раза.
З а м е ч а н и е 3. Для уменьшения времени работы алгоритма возможно распараллеливание. Например, всякий раз при дроблении любого куба -го этапа дробления на кубы k-го этапа дробления можно параллельно решать подзадач (для каждого куба Q k-го этапа дробления) проверки выполнения условий (1.6), (1.7) и в случае невыполнения этих условий – вычисления верхней и нижней оценок для (см. замечание 2). Можно провести распараллеливание по-другому принципу: параллельно вычислять значения интегралов для кубов Q первого этапа дробления с последующим сложением результатов, т.е. приближенных значений интегралов. Используя равенство (1.9), нетрудно показать, что при этом сумма погрешностей при вычислении интегралов даст точную погрешность в случае вычисления без распараллеливания всего интеграла I. Такие распараллеливания могут значительно уменьшить общее время счета.
З а м е ч а н и е 4. Поскольку множество ограничено, то, решая соответствующие задачи линейного программирования (ЗЛП), можно определить , , и тем самым сузить куб до параллелепипеда , где , , и при этом , откуда . Более того, можно считать, что числа , являются узлами сетки (наиболее близкими к точным их значениям), поскольку при любых , , , очевидно, снова выполняется , где , откуда . Тогда, следуя [8], алгоритм 1 можно модифицировать следующим образом. Снова последовательно дробим куб . Но теперь для каждого текущего куба перед проверкой условий (1.6), (1.7) проверяем выполнение условия (осуществляется за арифметических операций). Если это условие верно, то исключим Q из дальнейшего рассмотрения и перейдем к анализу очередного куба. В противном случае действуем согласно алгоритму 1. Такая модификация позволит за незначительное время отсечь “лишние” области в кубе по сравнению с параллелепипедом . Кроме того, условие погружения (1.6) можно теперь ослабить, заменив его на (проверяется аналогично (1.6)), в случае выполнения которого присваиваем , где
При этом – координатный параллелепипед, координаты вершин которого являются элементами сетки S(a,b,k). Но тогда значение интеграла легко вычисляется, используя элементы массива Ф(a,b,k). Аналогичным образом можно ослабить и условие отсечения, заменяя в нем Q на .
З а м е ч а н и е 5. Отметим, что процесс нахождения величины , удовлетворяющей (1.5) для заданного , является, вообще говоря, многошаговым. Нам редко удастся сразу “угадать” требуемое количество этапов дробления k. Начинаем с некоторого , а затем увеличиваем значение k до достижения (1.5) для заданного . При этом следует отметить три момента. Во-первых, при увеличении k на 1 можно снова использовать Ф(a,b,k), поскольку , (в Ф(a,b,k + 1) помимо элементов из Ф(a,b,k) войдут значения функции в серединах отрезков, соединяющих каждые из двух последовательных членов из S(a,b,k)). Во-вторых, применив алгоритм 1 при некотором начальном , можно в процессе работы этого алгоритма определять для всякого куба Q (любого этапа дробления), для которого было выполнено условие погружения (1.6), а также для всех кубов последнего k-го этапа дробления, для которых не было выполнено условие отсечения (1.7) (объединение указанных кубов покрывает ), минимальный номер и максимальный номер элементов сетки , являющихся координатами вершин этих кубов. Обозначим , . Тогда выполняется включение Таким образом, в случае применения алгоритма 1 для можно теперь в качестве куба взять куб (при этом ). Более того, следуя замечанию 4, можно в процессе работы алгоритма 1 для тех же кубов определять по каждой координате минимальный и максимальный номера элементов сетки S(a,b,k), являющихся координатами вершин этих кубов. Обозначим , , . Тогда верно включение . Таким образом, при выполнении алгоритма 1 при можем теперь применить модификацию этого алгоритма в соответствии с замечанием 4 (минуя необходимость дополнительного решения указанных в этом замечании ЗЛП). В-третьих, может также возникнуть следующая ситуация, которую поясним на примере. Предположим, что и соответственно в сетке S(a,b,k0) содержится элементов. Пусть в результате работы алгоритма 1 при оказалось, что , , т.е. имеем, “активных” членов сетки S(a,b,k0). Это указывает на то, что полученные значения , в результате применения алгоритма 1 при количестве этапов дробления к рассматриваемой задаче с использованием куба , удовлетворяющего (1.3), дают одинаковый результат, если бы вместо куба применялся куб (здесь , 4 – минимальный показатель степени l, при котором ), при количестве этапов дробления (вместо ). В связи с этим в этом примере можно для дальнейшего уменьшения использовать алгоритм 1, применяя вместо при количестве этапов дробления вместо , что может дать существенное сокращение объема вычислений. Здесь используется простое утверждение, заключающееся в том, что значения величин , однозначно определяются множеством кубов последнего этапа дробления, для которых либо верно условие погружения (в том числе, в случае его выполнения для некоторого куба меньшего этапа дробления, в котором он содержится), либо в случае одновременного невыполнения ни условия погружения, ни условия отсечения. В приведенном примере в обоих рассматриваемых случаях множества этих кубов совпадают (несмотря на отличие в максимальном количестве этапов дробления в каждом из этих случаев).
П р и м е р 1. Автором была составлена программа для вычисления интеграла I вида (1.1) для случая, когда – многогранник, реализующая метод второго порядка точности. Рассматривался пример, когда ,
т.е. при Результаты вычислений величин удовлетворяющих (1.5), приведены в табл. 1 при различных Из этой таблицы видно, что погрешность уменьшается примерно в 4 раза при каждом увеличении k на 1.
Таблица 1
k | |||
4 | 0.781744375667924 | 0.792289376178296 | 0.0105450005103716 |
5 | 0.784924691133069 | 0.787097696396805 | 0.00217300526373691 |
6 | 0.785685556863937 | 0.786183881161937 | 0.00049832429799992 |
- Функция квантили. Пусть
где , , – целевая функция, например кусочно-линейная (как всюду в этой статье), квадратичная (как в статье [8]) или возможны другие случаи, – плотность вероятности вектора случайных факторов , а следовательно , . В этой статье всюду в дальнейшем .
Обозначим . Функцией квантили (quantile function) называется функция
В сделанных обозначениях
Тогда , где – заданная доверительная вероятность. Предполагается, что – непрерывная функция при всех , таких, что (в рассматриваемом кусочно-линейном случае с ограниченными множествами это условие очевидным образом выполняется). В любом случае такого, что , для любых справедливо .
Таким образом, в рассматриваемом случае функция монотонно не убывает и непрерывна при (где – любое число, такое, что ), а следовательно, в случае, если
(2.1)
верно
(2.2)
(здесь и далее знак перед некоторым множеством действительных чисел означает минимальный элемент в нем и соответственно – точную нижнюю грань на этом множестве).
- Кусочно-линейный случай. В настоящей работе исследуется случай, когда
(где удовлетворяют (1.2)). Для произвольного измеримого (по Лебегу) множества будем его меру обозначать через . Пусть для некоторого – ограниченное непустое множество. Тогда (см. теорему 17, С. 177 из [11]) – ограниченное множество и , поскольку – компакт. При этом, очевидно, , откуда , а следовательно, , т.е. величина дает нижнюю границу для и может быть найдена, решая задачу линейного программирования:
(3.1)
(в (3.1) и ниже в аналогичных случаях выражение означает, что в рассматриваемой задаче ищется значение минимума функции при указанных ограничениях и при этом в скобках дается обозначение для искомого значения минимума).
Заметим, что в кусочно-линейном случае с ограниченным множеством функция непрерывна и монотонно возрастает. Это следует из рассмотрения монотонно возрастающей непрерывной функции (нетрудно даже показать, что она удовлетворяет условию Липшица).
Опишем также метод определения верхней границы для . Пусть имеется программа вычисления функции , где , по формуле (1.4). Рассмотрим задачу поиска :
(3.2)
Пусть . Тогда
Поскольку функция является монотонно возрастающей всюду на , то величину , удовлетворяющую (3.2), можно определить со сколь угодной точностью , т.е. вычислить . При этом . Пусть , где – произвольное небольшое число (например, ). Тогда
Рассмотрим для каждого задачу
Каждая из этих задач решается точно за арифметических операций (см. аналогичную задачу в [9, С. 1113]). Тогда для величины выполняется , а следовательно,
т.е. величина является верхней оценкой для . Таким образом,
(3.3)
Кроме того, для работы алгоритма многомерного интегрирования функции на многогранниках , где понадобится (см. разд. 2) куб вида (1.3), такой, что . Для нахождения чисел , b из (1.3) достаточно решить задач линейного программирования
(3.4)
(3.5)
а затем положить , .
З а м е ч а н и е 6. В процессе работы приводимого ниже алгоритма 2 величина будет оценена сверху и снизу гораздо более точно, чем в (3.3), и тогда мы можем уточнить величины a, b заменяя в (3.4), (3.5) величину на новую гораздо более точную оценку сверху величины . Такие уточнения можно производить периодически (см. далее замечание 7).
- Численный метод нахождения с заданной точностью . Опишем алгоритм 2 нахождения с заданной точностью величины , основанный на использовании алгоритма 1. Шаги алгоритма 2 вполне очевидны (в частности, сходны с соответствующим алгоритмом в [12]) и не претендуют на новизну. Для автора важным было показать возможность применения в этом алгоритме универсального (относительно размерности n) алгоритма 1 и тем самым придать алгоритму 2 ту же универсальность. В разд. 3 величина была уже оценена сверху и снизу (см. неравенства (3.3)). Кроме того, в разд. 3 был описан алгоритм нахождения куба вида (1.3) такого, что , а следовательно, . Но тогда (, чтобы ) интеграл
является интегралом вида (1.1)–(1.3), и мы можем применить к нему алгоритм 1, описанный в разд. 1, который позволяет вычислять значение этого интеграла с любой желаемой точностью (задавая необходимое количество последовательных дроблений куба ). Используя алгоритм 1, при любом выбранном значении вместо точного значения интеграла находим числа , , такие, что (см. далее замечание 7)
(4.1)
Заметим, что в рассматриваемом нами кусочно-линейном случае с ограниченными множествами , где , функция непрерывна и монотонно возрастает при , а следовательно, существует единственное число . Нам понадобятся следующие простые утверждения, непосредственно следующие из определения .
У т в е р ж д е н и е 1. Пусть выполняется (4.1). Тогда в случае (откуда в силу (4.1) ) справедливо .
Д о к а з а т е л ь с т в о. Предположим, что . Из монотонности F следует, что , а это противоречит тому, что . Утверждение 1 доказано.
У т в е р ж д е н и е 2. Пусть верно (4.1). Тогда в случае справедливо .
Д о к а з а т е л ь с т в о. Используя (4.1), получаем , откуда в силу монотонности имеем Утверждение 2 доказано.
А л г о р и т м 2 (нахождения с заданной точностью величины ).
Ш а г 1. Пусть — найденные ранее величины, удовлетворяющие (3.3), , , k — количество этапов дробления куба , от которого зависит величина из (4.1), — начальное значение этой величины. Тогда справедливы неравенства
(4.2)
Ш а г 2. Проверяем выполнение неравенства . Если оно верно, то в силу (4.2) имеем: , т.е. задача решена и в качестве приближенного значения берем . В противном случае переходим к шагу 3.
Ш а г 3. Находим числа , методом “золотого сечения” (см. ниже замечание 8):
Ш а г 4. Используя алгоритм 1, определяем числа ,,, такие, что , . Если , то в силу утверждения 1 . Тогда полагаем , , присваиваем , переходим к шагу 2 и при этом сохраняется (4.2).
Если , то в силу утверждения 2 . Тогда полагаем , присваиваем , переходим к шагу 2 и при этом сохраняется (4.2).
Ш а г 5. К шагу 5 переходим только в случае
(4.3)
Увеличиваем число этапов дробления куба на 1, т.е. присваиваем и переходим к шагу 4.
О б о с н о в а н и е а л г о р и т м а 2. Покажем, что работа алгоритма 2 закончится через конечное число шагов.
Предположим противное, т.е. пусть при работе алгоритма 2 совершается бесконечное число шагов. Заметим, что после каждого присвоения (на шаге 4) переходим к шагу 2 с новым набором величин , и при этом , где , а следовательно, при достаточно большом i будет справедливо , что приведет к остановке алгоритма на шаге 2, а это противоречит бесконечности выполнения шагов алгоритма. Таким образом, для некоторого фиксированного i будет происходить бесконечное число переходов: шаг 4 шаг 5 шаг 4 шаг 5 ⋅⋅⋅ шаг 4 шаг 5 ⋅⋅⋅, т.е. бесконечное увеличение количества этапов дробления k при вычислении интегралов: , ,
где , . При этом , а следовательно, , .
Таким образом, выполнены все условия, необходимые для применения алгоритма 1 и при увеличении k — количества этапов дробления куба величины , стремятся к 0 (см. далее замечание 7). Из (4.3), используя (4.1), для фиксированного i имеем , , и при этом в силу монотонности справедливо (поскольку ), а следовательно,
(4.4)
Заметим, что в левой части неравенства (4.4) находится постоянная положительная величина, а выражение справа стремится к 0 при . Полученное противоречие и завершает обоснование алгоритма 2.
Таким образом, установлена принципиальная возможность вычисления с заданной точностью значения . Получим также в рассматриваемом кусочно-линейном случае некоторые оценки. Обозначим через переменную величину, меняющуюся в процессе работы алгоритма 2. Поскольку в силу (4.2) , то , т.е. величину можно рассматривать как достигнутую при текущем значении параметра i точность вычисления . Цель дальнейшего рассуждения — получение неравенства, показывающего, что между величиной и величиной из условия (4.4), являющегося следствием неравенств (4.3), выполняющихся на шаге 5, можно установить “линейную” зависимость так, что для некоторой константы справедливо
(4.5)
Из этого неравенства, в частности, следует, что на шаге 5 не может выполняться , поскольку в этом случае и на шаге 2 должна была произойти остановка по условию . Таким образом, оценка (4.5) накладывает ограничение на максимальное количество этапов дробления k (более подробно об этом говорится в замечании 7, приведенном ниже).
Для установления справедливости указанного условия (4.5) потребуется геометрическое неравенство, обоснование которого приводится в разд. 5. Чтобы его сформулировать, потребуются некоторые обозначения. При любом множество является выпуклым ограниченным и многогранным (кратко — многогранником). В случае имеем , т.е. множество является многогранником размерности n и мы можем ввести в рассмотрение поверхность множества , т.е. его границу, которая является объединением граней размерности многогранника . Кроме того, в этом случае можно говорить о площади поверхности как сумме площадей граней размерности многогранника (площадь каждой грани размерности многогранника понимается как мера Лебега , рассматриваемая в плоскости размерности , включающей в себя ; этой плоскостью будет аффинная оболочка множества ). Обозначим через площадь поверхности многогранника , где . Пусть , . Тогда (см. ниже утверждение 21) справедливо геометрическое неравенство
(4.6)
откуда
Пусть теперь
(4.7)
Тогда
(4.8)
Заметим, что в формуле, определяющей постоянную L, присутствует неопределенный параметр . Он легко находится в результате совершения нескольких шагов алгоритма 2 без проверки справедливости условия остановки алгоритма . Поскольку и при обосновании алгоритма 2 была по существу доказана сходимость , к в процессе его выполнения, то после конечного числа шагов алгоритма при некотором обязательно верно , и тогда при будет справедливо , где . Таким образом, можно для простоты обозначений предполагать, что уже при верно
(4.9)
В этом случае, если мы находимся на шаге 5 при некотором , то справедливы неравенства (4.3), а следовательно, и (4.4), откуда, используя выполнение (4.8) в случае (4.7), имеем
(4.10)
т.е. на шаге 5 при верно
и тем самым обосновано существование величины из условия (4.5). Кроме того, необходимо обосновать, что
Выполнение очевидно. Осталось доказать, что
Заметим, что функция монотонно возрастает и при этом , поскольку в силу верно . Пусть — площадь поверхности n-мерного шара объема . Тогда , а следовательно, , откуда
З а м е ч а н и е 7. Как уже отмечалось, мы находимся в условиях применения алгоритма 1, и при этом возможны по крайней мере две модификации, предложенные в [8, 9]. В одной из них (1-я модификация) для величины из условия (5.1) выполняется при , а в другой (более сложной 2-й модификации) при , где — длина ребер куба , т.е. — половина длины ребер кубов k-го (т.е. последнего) этапа дробления куба , k — параметр алгоритма 2. Более того, можно показать, что в случае выполнения условий (4.9) найдутся константы (общие для всей работы алгоритма 2), такие, что при для величин , вычисляемых на шаге 4 алгоритма 2, в случае 1-й модификации будет верно а в случае 2-й модификации — . Следствием этих условий, а также неравенства (4.5) является условие (для 1-й модификации) и (для 2-й модификации) при . Условие при говорит о том, что при увеличении k на 1 (см. на шаге 5) величина уменьшается в 2 раза и можно ожидать, что величина уменьшится в 4 раза (в рассмотренных автором примерах такая зависимость, как правило, наблюдается). Соответственно, в случае 2-й модификации при увеличении k на 1 можно ожидать уменьшение величины в 8 раз.
Используя эти соображения, можно при решении практической задачи сделать предварительные расчеты для некоторого и по достигнутой для этого случая величине спрогнозировать количество этапов , необходимых для вычисления с заданной точностью значения . Затем, как уже отмечалось ранее, можно заранее создать одномерный массив Ф(a,b,k) значений функции , удовлетворяющей равенству (1.4), на равномерной сетке , которые можно использовать при решении всех вспомогательных задач интегрирования, возникающих в процессе выполнения алгоритма 2. Это дает значительное снижение вычислительных затрат.
Кроме того, действуя, согласно замечанию 5, можно при каждом вычислении величины для всяких текущих i, k находить минимальный и максимальный номера используемых узлов сетки S(a,b,k). Тогда в первом же случае присвоения на шаге 4 алгоритма 2 (при выполнении ) можно теперь уточнить границы внешнего куба , используемого при решении дальнейших задач интегрирования, заменяя его на более узкий , где , — элементы сетки S(a,b,k), определяемые по указанным номерам (см. замечание 5). Кроме того, как показано в замечании 5, при замене внешнего куба на может появиться возможность для уменьшения текущего (а следовательно, и последующих) количества этапов дробления k для нового внешнего куба .
Более того, следуя замечанию 4, можно при каждом вычислении величины для всяких текущих i, k определять по каждой координате минимальный и максимальный номера элементов сетки S(a,b,k), являющихся координатами вершин этих кубов. Обозначим , . Тогда в первом же случае присвоения на шаге 4 алгоритма 2 (при выполнении ) происходит включение . Таким образом, при решении дальнейших задач интегрирования с помощью алгоритма 1 можем теперь применять модификацию этого алгоритма в соответствии с замечанием 4 (минуя необходимость дополнительного решения указанных в этом замечании ЗЛП).
Приведем также следующие “оптимистические” оценки для количества этапов дробления k. В случае 1-й модификации неравенства (4.5), , а также равенство приводят к неравенству , где — некоторое число, т.е. найдется число , для которого верно . Соответственно, в случае 2-й модификации аналогичным образом получаем, что для некоторого числа выполняется . Отметим, что в этих оценках не присутствует число n — размерность задачи (тем не менее, от n зависит общее число кубов на каждом этапе дробления, которое очевидным образом влияет на время решения задачи).
З а м е ч а н и е 8. Как известно (см., например, [11, С. 19]), золотым сечением отрезка называется деление его (с помощью любой из точек ,) на две неравные части так, чтобы отношение длины всего отрезка к длине большей части равнялось отношению длины большей части к длине меньшей части отрезка. Замечательно здесь то, что в свою очередь производит золотое сечение отрезка . Аналогично точка производит золотое сечение отрезка . Используя указанное, можно получить экономию в вычислениях.
З а м е ч а н и е 9. Чтобы расширить множество задач, к которым может быть применен алгоритм 2, перечислим все условия, которые потребовались для его обоснования. Это прежде всего строгая монотонность , которая применялась на втором этапе обоснования при рассмотрении (4.4). Кроме того, использовалась применимость алгоритма 1 для вычисления интегралов с точностью , т.е. возможность вычисления чисел удовлетворяющих (4.1). При любом фиксированном с увеличением k (параметр алгоритма 1) величина в условии (4.1) должна стремиться к нулю (это также использовалось на втором этапе обоснования при рассмотрении (4.4)). В работе [9] (см. также [6, С. 53]) показано, что если , где удовлетворяет (1.3), — определенные и измеримые на функции, то в случае при применении алгоритма 1 к вычислению
верно при . В связи с этим потребуется выполнение условия при . Соответственно для существования и возможности определения границ куба понадобится ограниченность множеств при . Перечисленные условия являются справедливыми для широкого круга задач. Кроме того, для работы алгоритма 2 необходимы “стартовые” значения , , такие, что . Как правило они находятся “простым подбором” (в результате вычисления значений на сетке значений t при достаточно малом ).
П р и м е р 2. Рассматривался случай с , , , , , , , , . Величина вычислялась для . Была задана точность . Начальное значение . Был использован метод интегрирования второго порядка точности. Составлена табл. 2 текущих значений величин k, i, , на шаге 5 алгоритма 2. Именно на этом шаге происходит увеличение количества этапов дробления k. Поэтому представляет интерес достигнутое минимальное значение величины (текущая точность вычисления для текущего значения k). Как и было предсказано теоретически, в последнем столбце устанавливается значение 4 (поскольку был использован метод интегрирования второго порядка точности). Алгоритм закончил работу при , ,
Таблица 2
k | i | |||
5 | 3 | 2.48277907312568 | 2.55166278062295 | 5.136 |
6 | 5 | 0.948337219377051 | –2.189430195617486 | 2.618 |
7 | 7 | 0.362232585005468 | –2.05106965997813 | 6.854 |
8 | 11 | 0.0528490219125919 | –2.0837321517923 | 2.618 |
9 | 13 | 0.0201865300984221 | –2.09144272017497 | 4.236 |
10 | 16 | 0.00476539333307313 | –2.09144272017497 | 4.236 |
11 | 19 | 0.00112495676612956 | –2.09283324320966 | — |
- Некоторые свойства выпуклых многогранников. Целью этого раздела является получение геометрического неравенства (4.6), позволяющего в свою очередь получить неравенство (4.5), устанавливающее линейный характер зависимости между вычисляемой на шаге 2 алгоритма 2 величиной (точность достигнутого приближения к искомому значению ) и суммарной погрешностью вычисления интегралов на шаге 2. Расчет этих интегралов дает основной вклад в трудоемкость алгоритма 2, которая определяется максимальным значением параметра k — количества этапов дробления “внешнего” куба , необходимого для вычисления этих интегралов. На основании оценки (4.5) в замечании 7 приведены весьма “оптимистические” оценки для величины k в зависимости от , не зависящие от размерности задачи n.
Нам понадобятся некоторые вспомогательные утверждения. Пусть , . Обозначим — шар радиуса с центром в точке . Кроме того, для произвольного множества считаем, что — граница .
Утверждение 3. Допустим, что , , и удовлетворяют условиям (1.2). Тогда при любом множество содержит каждую точку вместе с шаром , где .
Д о к а з а т е л ь с т в о. Из условия следует, что Пусть , . Докажем, что . Действительно,
Утверждение 3 доказано.
Следствием утверждения 3 является утверждение 4.
У т в е р ж д е н и е 4. Пусть мы находимся в условиях утверждения 3, , Тогда множество содержит каждую точку вместе с шаром .
У т в е р ж д е н и е 5. Пусть , , , , ,
(5.1)
Тогда если векторы линейно независимы, то .
Д о к а з а т е л ь с т в о. Из того, что векторы линейно независимы, следует, что
(5.2)
Пусть
(5.3)
Тогда
(5.4)
(действительно, , что противоречит (5.2)). Нетрудно показать, что в случае (5.2) выполняется
(5.5)
Действительно, используя (5.3), (5.4), имеем
откуда и следует (5.5). Предположим, что . Тогда в силу (5.5) для e, удовлетворяющего (5.3), выполняется
т.е. , а это противоречит (5.1).
Утверждение 5 доказано.
Приведем некоторые простые утверждения, связанные с выпуклыми многогранными множествами. Пусть
(5.6)
где удовлетворяют (1.2), . Множество называется выпуклым многогранным (полиэдральным), а в случае, если — компакт, оно называется выпуклым многогранником (полиэдром).
Обозначим через гиперплоскость размерности (поскольку ), , . Кроме того, для любого множества обозначим
(в частности, ).
Будем ограничение , где , называть существенным для , если
(5.7)
(очевидно, что ), т.е. (действительно, если , то , что противоречит (5.7)).
Условие (5.7) делит множество ограничений на существенные для и не являющиеся таковыми. Как следует из определения, ограничение , где не будет существенным, если
(5.8)
Обозначим через множество номеров ограничений, существенных для , а через — множество номеров ограничений, не являющихся существенными для . Тогда
(5.9)
У т в е р ж д е н и е 6. .
Д о к а з а т е л ь с т в о. Рассмотрим нетривиальный случай, когда , т.е. Пусть для простоты обозначений , где (если , то , а это противоречит условию ; см. (1.2)). Тогда, используя (5.8), получаем
Утверждение 5 доказано.
Назовем ограничения , , где , эквивалентными, если
(5.10)
(т.е. ).
З а м е ч а н и е 10. Очевидно, что если среди ограничений, задающих множество имеются ограничения, эквивалентные некоторому ограничению , где , то множество не изменится, если оставить только это ограничение, а другие, эквивалентные этому, отбросить. Заметим, что выделение ограничений, эквивалентных данному, представляет собой очень простую вычислительную задачу, поэтому часто можно предполагать, что среди ограничений, задающих множество , нет эквивалентных. Отметим, кроме того, что при рассмотрении множества из утверждения 3 следует иметь в виду, что из эквивалентности ограничений при некотором не следует их эквивалентность при другом t. То же замечание следует сделать и относительно существенных (или несущественных) ограничений.
Используя то, что (см. (1.2)), нетрудно доказать следующее утверждение.
У т в е р ж д е н и е 7. (а) ; (б) для любого множества такого, что , справедливо .
Обозначим .
У т в е р ж д е н и е 8. Пусть , векторы линейно зависимы, . Тогда ограничения эквивалентны.
Д о к а з а т е л ь с т в о. Из линейной зависимости , а также того, что следует, что . Поскольку , то
Осталось доказать, что . Предположим, что . Тогда
а это противоречит условию . Таким образом, условие (5.10) выполнено, а следовательно, ограничения эквивалентны. Утверждение 8 доказано.
У т в е р ж д е н и е 9. Пусть среди ограничений, задающих множество , нет эквивалентных. Тогда, если , то
(а)
(б) .
Д о к а з а т е л ь с т в о. Покажем справедливость (а). Пусть . Если , то ограничение является существенным для , т.е. Допустим теперь . Покажем, что . Предположим противное. Пусть
(5.11)
Из получаем (см. (5.7)), что , а следовательно, , откуда , , . Пусть . Тогда (см. утверждение 7(б)) . Заметим, что
, а следовательно, , откуда
Но тогда , так как в силу утверждения 5, если , то линейно зависимы, а следовательно ограничения , эквивалентны (см. утверждение 8), что противоречит исходным предположениям. Таким образом, , а следовательно, входит в вместе с некоторым шаром, а это противоречит (5.11), поскольку и в силу выполняется . Утверждение 9(а) доказано.
Для доказательства (б) осталось заметить, что условие (б) выполняется для (см. из доказательства (а); при этом в силу (а) можно при нахождении сразу положить ). Утверждение 9(б) доказано.
З а м е ч а н и е 11. Из утверждения 9(а) следует, что в случае, когда среди ограничений, задающих , нет эквивалентных, то для выделения существенных ограничений достаточно решить следующие ЗЛП:
где . Тогда .
З а м е ч а н и е 12. Из замечаний 10, 11 следует, что, не теряя общности рассуждений, можно считать, что среди ограничений, задающих , нет эквивалентных, и при этом все ограничения существенные. Однако это замечание нельзя перенести на случай, когда рассматривается множество из утверждения 3 (см. замечание 10).
Допустим, что . Обозначим , . Пусть — выпуклое замкнутое множество, — выпуклое замкнутое непустое подмножество . Множество F называется гранью , если
У т в е р ж д е н и е 1 0. Допустим, что , . Тогда — грань
Д о к а з а т е л ь с т в о. Пусть . Тогда
(5.12)
Из условий следует, что
(5.13)
Докажем, что , откуда . Пусть, например, . Тогда из (5.12) получаем , что противоречит (5.13). Утверждение 10 доказано.
Совершенно аналогично доказывается утверждение 11.
У т в е р ж д е н и е 1 1. Пусть , ,
Тогда — грань
У т в е р ж д е н и е 1 2. Пусть среди ограничений, задающих множество , нет эквивалентных, . Тогда,
(а) — грань размерности ;
(б) .
Д о к а з а т е л ь с т в о. Утверждение (а) является очевидным следствием утверждения 9(б). Покажем справедливость утверждения (б). Включение следует из утверждения 7(б). Докажем обратное включение. Пусть . Тогда , и в силу утверждений 6, 7(б) : , откуда . Утверждение 12(б) доказано.
Для дальнейшего понадобятся некоторые дополнительные понятия и обозначения. Пусть , , , , — гиперплоскость размерности (поскольку , которая может соответствовать любому из введенных ранее , ).
Пусть . Рассмотрим точку , удовлетворяющую следующим двум условиям: (а) , т.е. ; (б) , т.е. , где . Тогда из (б) получаем , откуда в силу (а) , а следовательно,
(5.14)
Таким образом, точка h определяется из условий (а), (б) однозначно. Она называется проекцией точки y на гиперплоскость H и обозначается .
Пусть . Тогда — проекция множества A на гиперплоскость H. Пусть , . Тогда — призма с основанием U и высотой . Приведем некоторые простые свойства проекции точки на гиперплоскость H, а также призм.
У т в е р ж д е н и е 13. Пусть , где . Тогда .
Д о к а з а т е л ь с т в о. Используя условия (5.14), , получаем: ,
, откуда . Утверждение 13 доказано.
Следствием утверждения 13 является утверждение 14.
У т в е р ж д е н и е 14. Пусть , . Тогда .
У т в е р ж д е н и е 15. .
Д о к а з а т е л ь с т в о: . Утверждение 15 доказано.
У т в е р ж д е н и е 16. Справедливо неравенство
(5.15)
Д о к а з а т е л ь с т в о. Пусть определяются согласно (5.14) для , соответственно. Используя утверждение 15, имеем
откуда и следует (5.15). Утверждение 16 доказано.
У т в е р ж д е н и е 17. Пусть , . Тогда .
Д о к а з а т е л ь с т в о. Пусть . Покажем, что . Из следует, что , : . Но тогда, используя утверждение 16, получаем , что и требовалось доказать. Пусть теперь . Покажем, что . Пусть удовлетворяет (5.14) при . Тогда . Пусть . Тогда в силу утверждения 13 , а следовательно, , что и требовалось доказать. Утверждение 17 доказано.
Следствием утверждений 14, 17 является утверждение 18.
У т в е р ж д е н и е 18. Пусть . Тогда .
У т в е р ж д е н и е 19. Пусть , . Тогда не существует , таких, что
(5.16)
Д о к а з а т е л ь с т в о. Предположим, что нашлись такие , что выполняется (5.16). Тогда
(5.17)
(5.18)
Из (5.17), (5.18) заключаем, что , т.е. , и при этом , , , откуда , т.е. пришли к противоречию. Утверждение 19 доказано.
У т в е р ж д е н и е 20. Пусть среди ограничений, задающих множество нет эквивалентных, , . Пусть далее , — призма с основанием и высотой . Тогда (а) — грань размерности ; (б) не существует точки .
Д о к а з а т е л ь с т в о. Утверждение (а) следует из утверждения 9(б). Докажем (б). Рассмотрим сначала случай, когда векторы не коллинеарные. Тогда они являются линейно независимыми. Предположим, что нашлась точка . Пусть , . Тогда в силу утверждений 13, 14, 17 , , а в силу утверждения 5 получаем, что . Совершенно аналогично для , , таких, что , имеем . Полученное равенство , где , противоречит утверждению 19.
Пусть теперь векторы коллинеарные. Тогда . Очевидно, что . Предположим, что . Возможны случаи: (а) , (б) , (в) . В случае (а) условия 1, 2 эквивалентны, что противоречит условиям доказываемого утверждения. В случаях (б), (в) приходим к противоречию с условием ,. Пусть теперь . Предположим, что нашлась точка . Тогда аналогично предыдущему найдутся : , откуда , где , а следовательно, , а это противоречит тому, что . Утверждение 20(б) доказано.
Пусть мы находимся в условиях утверждения 1 и . Тогда , и мы можем ввести в рассмотрение поверхность множества , т.е. его границу (см. утверждение 12(б)):
где — множество номеров ограничений, существенных для , которая в силу утверждения 12(а) является объединением граней размерности многогранного множества . Как уже отмечалось, если — ограниченное множество, множество также является ограниченным, т.е. является многогранником и в этом случае можно говорить о площади поверхности как сумме площадей попарно различных граней размерности многогранника (площадь каждой грани размерности многогранника понимается как мера Лебега , рассматриваемая в плоскости размерности , включающей в себя (эта плоскость является аффинной оболочкой множества ). Обозначим через площадь поверхности многогранника
У т в е р ж д е н и е 21. Пусть мы находимся в условиях утверждения 3, , Тогда
Д о к а з а т е л ь с т в о. Из следует, что . В силу утверждения 4 каждая точка любой грани размерности многогранника войдет в множество вместе с внешним перпендикуляром к этой грани длины , а следовательно, будет содержать вместе с призму с основанием и высотой , т.е. с объемом (мерой Лебега) , где — мера Лебега размерности грани . Из утверждения 20 следует, что для различных граней , размерности многогранника в случае (где — множество номеров ограничений, существенных для ) соответствующие им призмы попарно не пересекаются в своих внутренних точках, а в силу утверждения 12(б)
откуда
Утверждение 21 доказано.
Заключение. Настоящую статью можно рассматривать как продолжение серии работ [6—9], посвященных численным методам многомерного интегрирования. Предлагается приложение этих методов к задаче квантильного анализа (вычисления с заданной точностью значения функции квантили).
Поскольку наиболее значимые результаты были получены в [6—9] для многогранной области интегрирования и случая, когда подынтегральная функция является плотностью нормального распределения, то и в настоящей работе основной упор делается именно на этот случай. При этом приведена оценка для основного параметра метода (см. алгоритм 2) — величины k (количества этапов последовательного дробления кубов), в наибольшей степени определяющего общий объем вычислений. Найдены оценки для каждой из двух описанных в [8, 9] возможных модификаций используемого метода интегрирования, а именно (для 1-й модификации) и (для 2-й модификации), где , — некоторые постоянные, — погрешность решения задачи. Замечательно, что в этих оценках не присутствует число n — размерность задачи. Например, вторая из этих оценок говорит о том, что при каждом увеличении величины k на 1 можем ожидать уменьшения погрешности в 8 раз.
В замечании 9 также рассматривается вопрос о применимости алгоритма 2 к возможно более широкому множеству задач. Перечислены условия, необходимые для его реализации. Используя результаты из [6—9], показывается, что во многих случаях эти условия выполняются.
About the authors
V. N. Nefedov
Moscow Aviation Institute (National Research University)
Author for correspondence.
Email: nefedovvn54@yandex.ru
Russian Federation, Moscow
References
- Малышев В.В., Кибзун А.И. Анализ и синтез высокоточного управления летательными аппаратами. М.: Машиностроение, 1987.
- Кибзун А.И., Курбаковский В.Ю. Численные алгоритмы квантильной оптимизации и их применение к решению задач с вероятностными ограничениями // Изв. АН СССР. Техн. кибернетика. 1991. № 1.
- Бахвалов Н.С. Численные методы. М.: Наука, 1975.
- Никольский С.М. Квадратурные формулы. М.: Наука, 1979.
- Мысовских И.П. Интерполяционные кубатурные формулы. М.: Наука, 1981.
- Нефедов В.Н. К вопросу о вычислении вероятностного критерия оптимизации с использованием методов ветвления и отсечения. Изв. РАН. Техн. кибернетика. 1993. № 4. С. 51—60.
- Нефедов В.Н. К вопросу об отыскании глобального экстремума в липшицевых и полиномиальных задачах оптимизации. Деп. в ВИНИТИ. 26.04.1991. № 1759-В91. М.: ВИНИТИ, 1991.
- Нефедов В.Н. О приближенном вычислении многомерного интеграла с заданной точностью. Деп. в ВИНИТИ. 11.11.1991. № 4838-В91. М.: ВИНИТИ, 1991.
- Нефедов В.Н. Некоторые численные методы приближенного вычисления вероятностной меры многогранника второго и третьего порядков точности // ЖВМ и МФ. 2019. Т. 59. № 7. С. 1108—1124.
- Кристофидес Н. Теория графов. Алгоритмический подход. М.: Мир, 1978.
- Васильев Ф.П. Численные методы решения экстремальных задач. М.: Наука, 1988.
- Травин А.А. Алгоритмы оценки квантильного критерия с заданной точностью в задачах стохастического программирования с кусочно-линейными и квадратичными функциями потерь: Автореф. дис. канд. физ.-мат. наук. М.: МАИ, 2015.
Supplementary files
