Исследование точности оценки параметра экспоненциального распределения методом максимального правдоподобия
1. Введение
Цели работы:
) Изучить метод максимального
правдоподобия;
) Рассмотреть методы вычисления 95%
доверительного интервала;
) Создать программу-функцию на Matlab
для исследования точности оценки параметра экспоненциального распределения
методом максимального правдоподобия.
2. Теоретическая часть
.1 Экспоненциальное распределение
Экспоненциальное распределение определяется
следующим образом:
(x) = λ
* e- λ x
≤ x <∞ , λ
> 0
Где λ
(лямбда) - параметр экспоненциальной функции (альтернативной параметризацией
является параметр масштаба b=1/ λ)-
основание натуральных логарифмов
Для экспоненциального распределения:
Функция дожития: s(t)=e-
λt ;
Плотность: f(x) = λ
* e- λ x
Интенсивность: µ=λ
(нет старения);
Кумулятивный риск: H=λt
В данной работе задача в оценке параметра λ
методом
максимального правдоподобия и вычислении 95% доверительного интервала.
.2 Метод максимального правдоподобия
Оценкой максимального правдоподобия ƛ
неизвестного параметра λ
называют значение λ,
при котором функция f(T,
λ) достигает
максимума (как функция от λ
при фиксированных t1, t2,
… tn).
λ(t1,
t2, … tn)
- плотность вероятности наблюдать выборку t1,
t2, … tn
при значении параметра λ.
L
λ - правдоподобие
L λ(t1,
t2, … tn) λ max
ƛ=arg
max L
λ(t1,
t2, … tn)
- оценка максимального правдоподобия.
Независимая выборка.
L λ(t1, t2, … tn)
ƛ=arg
max ln L
λ
λ
ln L
λ(t1,
t2, … tn) ln L
λ (ti)
Оценка параметра λ:
{T>ti}=e-λt
f(ti)=λ*e-λti
L λ(t)=λ*e-λti
ln L λ(t)= ln L λ(t1, t2, … tn) ln λ-λ * ti λ max
ln L
λ(ti)= ln
λ - λ*ti
ƛ= - оценка
максимального правдоподобия параметра λ
проверка того, что ƛ -
максимум:
<0 => максимум
функции
2.3
Доверительный интервал
Доверительный интервал - термин, используемый в
математической статистике при интервальной (в отличие от точечной) оценке
статистических параметров, что предпочтительнее при небольшом объёме выборки.
Доверительным называют интервал, который покрывает неизвестный параметр с
заданной надёжностью.
.95 - доверительная вероятность α
Доверительный интервал - интервал,
на который попадает случайная величина с доверительной вероятностью α. На рисунках
1 и 2 представлена функция нормального распределения.
рис. 1. Функция нормального
распределения
рис. 2. Нормальное распределение,
связь между вероятностью и дисперсией.
При вероятности α=0.95 случайная
величина X будет
лежать в интервале xср-1,96≤x≤ xср+1,96
2.4 Методы вычисления
доверительного интервала
А. Через асимптотическую нормальность
производной логарифма правдоподобия.
Асимптотически нормальная оценка - в
математической статистике оценка, распределение которой стремится к
нормальному, при увеличении размера выборки.
;
;
.96* ≤ ≤
1.96*
решаем неравенство относительно
B. Через асимптотическую нормальность
оценки максимального правдоподобия.
;
;
C. Через профиль функции правдоподобия.
максимальный правдоподобие программа
экспотенциальный
;
вероятностью 0.95
;
;
;
[2].
Очень часто все три метода (A-C) дают
практически совпадающие результаты. Преимущество метода В) - через
асимптотическую нормальность оценки максимального правдоподобия - состоит в
простом представлении выводов. К недостаткам можно отнести неинвариантность
процедуры B)
относительно перепараметризации. Метод А) более удобен с вычислительной точки
зрения. Метод C) - через
профиль функции правдоподобия рекомендуется использовать в сомнительных
случаях. Он инвариантен относительно перепараметризации, и форма полученной
доверительной области определяется самими данными [1].
В качестве практического задания, требуется
написать программу-функцию на Matlab,
предусмотрев ввод параметров λ и
n через список
формальных параметров функции, генерирование независимой случайной выборки
объёма n длительностей,
имеющих экспоненциальное распределение с параметром λ,
расчёт
и вывод на экран оценки максимального правдоподобия и её 95% доверительного
интервала, рассчитанного методом:
) через асимптотическую нормальность
производной логарифма правдоподобия;
) через профиль функции правдоподобия.
Провести результаты и составить таблицу
результатов (Таблица 1, стр. 13) для значений параметров.
На странице 10 представлен алгоритм программы
(рис. 3).
Алгоритм программы.
Код программы.
function
Lab3 (lambda,
n);
T=exprnd (ones (1,
n)/lambda);=n/sum(T);=(1-1.96/sqrt(n))*lambdah;=(1+1.96/sqrt(n))*lambdah;=a/2:0.01:2*b;=n*log(x)-x*sum(T);=n*log(lambdah)-lambdah*sum(T);(x,
L, [a/2, 2*b], [Lmax-1.92]);([a, b,
Lmax]);=lambdah;(n*log(x)-x*sum(T)>Lmax-1.92);=x+0.01;;=x;=lambdah;(n*log(x)-x*sum(T)>Lmax-1.92);=x-0.01;;=x;([a2,
b2]);('lambda');('L');
Код программы.pravdopodobie
(lambda, n);
%Крупеня
Дарья,
КББ-1-11
%Задаём функцию, lambda - параметр
экспоненциального распределения;
%n - число данных=exprnd (ones (1, n)/lambda); %
генерирование выборки=n/sum(T); % оценка максимального
правдоподобия([lambdah]);=(1-1.96/sqrt(n))*lambdah; % левый предел
доверительного интервала=(1+1.96/sqrt(n))*lambdah; % правый предел
доверительного интервала=a/2:0.01:2*b;=n*log(x)-x*sum(T); % логарифм
правдоподобия=n*log(lambdah)-lambdah*sum(T); % максимальное значение логарифма
правдоподобия
plot (x, L, [a/2, 2*b],
[Lmax-1.92]); % рисует график([a,
b, Lmax]);
% выводит на экран значения концов
доверительного интервала и Lmax=lambdah;(n*log(x)-x*sum(T)>Lmax-1.92); %
ищет правый предел доверительного интервала
% через профиль функции правдоподобия=x+0.01; end;
b2=x;
x=lambdah;
while (n*log(x)-x*sum(T)>Lmax-1.92);
% левый предел=x-0.01; end;=x;([ a2, b2]); % выводит на экран пределы
доверительного интервала
xlabel ('lambda');
ylabel ('L');
Таблица результатов:
Таблица 1. Подсчёт оценки максимального
правдоподобия и 95 % доверительного интервала 1 способ - через асимптотическую
нормальность производной логарифма правдоподобия, 2 способом - через профиль
функции правдоподобия.
λ
|
0.1
|
0.1
|
0.1
|
0.01
|
0.01
|
0.01
|
|
n
|
10
|
50
|
150
|
10
|
50
|
150
|
|
OМП λ
|
0.102
|
0.0842
|
0.0969
|
0.0204
|
0.0118
|
0.0114
|
|
95%
доверительный интервал, 1 способ
|
[0.0388;
0.1654]
|
[0.0609;
0.1076]
|
[0.0814;
0.1124]
|
[0.0078;
0.0331]
|
[0.0085;
0.0150]
|
[0.0096;
0.0133]
|
|
95%
доверительный интервал, 2 способ
|
[0.0421;
0.1821]
|
[0.0542;
0.1142]
|
[0.0769;
0.1169]
|
[0.0004;
0.0404]
|
[0.0018;
0.0218]
|
[0.0014;
0.0214]
|
|
λ
|
0.5
|
0.5
|
0.5
|
1
|
0.5
|
1
|
n
|
10
|
50
|
150
|
10
|
500
|
OМП λ
|
0.5733
|
0.4155
|
0.4843
|
1.2866
|
0.0005
|
0.9701
|
95%
доверительный интервал, 1 способ
|
[0.2179;
0.9286]
|
[0.3003;
0.5307]
|
[0.4068;
0.5618]
|
[0.4892; 2.0841]
|
[0.0005; 0.0005]
|
[0.8850; 1.0551]
|
95%
доверительный интервал, 2 способ
|
[0.2833;
1.0133]
|
[0.3055;
0.5455]
|
[0.4043; 0.5743]
|
[0.6366; 2.2566]
|
[0.4597; 0.5397]
|
[0.8801; 1.0601]
|
|
|
|
|
|
|
|
|
|
|
Заключение
В данной работе теоретически описаны:
экспоненциальное распределение, метод максимального правдоподобия и методы
вычисления 95% доверительного интервала. На основе изученных методов написана
программа на Matlab.
Составлена таблица результатов. По которой можно
судить о том, что
при конкретных значениях λ
и
достаточно небольшом разбиении (n)
- лучше использовать 1 метод - через асимптотическую нормальность производной
логарифма правдоподобия. Так как интервал получается более точный.
При большем значении n
пределы интервала 2 методами становятся более точными и их значения между собой
приближаются, но всё равно в конкретной ситуации лучше использовать 1 метод.
В приложении, на рис. 5 и рис. 6, представлены
изображения работающей программы.
Использованные источники
1. Д.
Р. Кокс, Д. Оукс. Анализ данных типа времени жизни. Москва, Финансы и
Статистика, 1988
. Михальский
А.И. Лекционные материалы по курсу КТ в МБС,2013
. Половко
А.М., Бутусов П.Н. MATLAB для студента. - СПб.: БЧВ-Петербург, 2005. - 320 с.;
4. <#"722258.files/image025.jpg">
Вывод: a=0.0439;
b= 0.1870 Lmax = -31.5892=0.0555; b2=0.2055
2) Параметры ввода: λ=0.5;
n=100
Вывод: a=0.3350;
b=0.4984; Lmax=-187.5405; a2=0.3367; b2=0.5067