1 Предварительные сведения
Исследования непараметрических оценок, экспоненциальной, множительной и степенной структур показывают их асимптотическую эквивалентность (при ). Некоторые отличительные свойства этих оценок проявляются при фиксированном объеме выборки, и они проведены в монографии .
Пусть и взаимонезависимые последовательности, независимые и одинаково распределенные случайная величина с непрерывными функциями распределения и соответственно. Наблюдается выборка объема :
где
( это индикатор события .
Если , то , , и в этом случае мы можем наблюдать ;
Если , то , , это будет случай цензурирования.
Задача состоит в оценивании функции выживания по выборке при мешающей функции распределения . Для справедливо представление [2]:
где
где
Таким образом, рассматриваемая модель является моделью случайного цензурирования справа при помощи , где наблюдаемы лишь при .
Пусть , и соответствующие оценки мешающей функции распределения , определяемые формулами (1) с заменой на В рассматриваемой модели для всех . Однако для этих трех типов оценок имеем:
I.
и при
II.
и при
оценки и неопределенны.
III. Для степенных оценок
и, следовательно, при ,
Таким образом, для случая непрерывных распределений H и G, только оценки степенной структуры H и G являются идентифицируемыми с моделью. Для демонстрации свойств оценок (1) рассмотрим выборку объема из работ [3; 5]. Это данные из центра уединения Ченнинг Хаус (Channing House) в г. Пало Альто (Palo Alto) в Калифорнии (США). Вариационный ряд, построенный по этим данным, есть:
(777;1), (781;0), (843;0), (866;0), (869;1), (872;1), (876;1), (893;1), (894;1), (895;0), (898;1), (906;0), (907;1), (909;1), (911;1), (911;0), (914;0), (927;1), (932;1), (936;0), (940;0), (942,5;0), (943;0), (945;1), (945;0), (948;1), (951;0), (953;0), (956;0), (957;1), (957;0), (959;0), (960;0), (966;1), (966;0), (969;1), (970;0), (971;1), (972;0), (973;0), (977;0), (983;1), (984;0), (985;1), (989;1), (992,5;1), (993;1), (996;1), (998;1), (1001;0), (1002;0), (1005;0), (1006;0), (1009;1), (1011,5;1), (1012;1), (1012;0), (1013;0), (1015;0), (1016;0), (1018;0), (1022;1), (1023;0), (1025;1), (1027;0), (1029;1), (1031;1), (1031;0), (1031,5;0), (1033;1), (1036;1), (1043;1), (1043;0), (1044;1), (1044;0), (1045;0), (1047;0), (1053;1), (1055;1), (1058;0), (1059;1), (1060;1), (1060;0), (1064;0), (1070;0), (1073;0), (1080;1), (1085;1), (1093;0), (1093,5;1), (1094;1), (1106;0), (1107;0), (1118;0), (1128;1), (1139;1), (1153;0).
Здесь данные представлены в месяцах, причем находящееся с рядом число в парах означает нецензурирование (т. е. смерть), а цензурирование. При этом 46 человек умерли с начала открытия центра в 1964 году по 1 июля 1975 года ко дню сбора данных. Это нецензурированные данные. Из остальных данных о 51 человеке 5 были выписаны из центра, а 46 еще были живы к 1 июля 1975 года. Это цензурированные данные. По этим 97 данным приведены графики оценок на рис. 13 по отдельности и на рис. 4 вместе:
Figure 1: Оценка
Fig. 1. Estimator
Figure 2: Оценка
Fig. 2. Estimator
Figure 3: Оценка
Fig. 3. Estimator
Figure 4: Оценка
Fig. 4. Estimator
Из рисунков видно, что в отличие от экспоненциальных и множительных оценок только степенные оценки определены на всей прямой. Теперь при помощи оценок (1) построим доверительные полосы для неизвестной функции . Для этого будем следовать работам [3; 4] и используем доверительные полосы вида
где
; ; и Эти полосы для данных объема n=97 с использованием оценок (1) приведены на рис. 57.
Figure 5: Доверительные полосы
Fig. 5. Confidence bands
Figure 6: Доверительные полосы
Fig. 6. Confidence bands
Figure 7: Доверительные полосы
Fig. 7. Confidence bands
Заключение
Сравнивают три вида оценок: экспоненциальной, множительной и степенной для функции выживания при случайном цензурировании справа. Ранее была установлена асимптотическая эквивалентность этих трех видов оценок при растущем объеме выборки в смысле сходимости к одному и тому же гауссовскому процессу. Для конкретной конечной выборки объема показаны некоторые преимущества степенной оценки по сравнению с остальными двумя. Следовательно, эта оценка лучше, чем остальные. Имеются численные примеры демонстрации результатов.