Критерий согласия Пирсона

  • Вид работы:
    Курсовая работа (т)
  • Предмет:
    Математика
  • Язык:
    Русский
    ,
    Формат файла:
    MS Word
    317,71 Кб
  • Опубликовано:
    2013-08-07
Вы можете узнать стоимость помощи в написании студенческой работы.
Помощь в написании работы, которую точно примут!

Критерий согласия Пирсона














Курсовая работа

На тему

Критерий согласия Пирсона

Сдал: Кудюмов В.В.

Задание

математический статистика критерий пирсон

В50-ти слуаях зарегистрировано время /в сек./ обнаружения цени оператором РЛС с момента ее появления в зоне РЛС. Результаты приведены в следующей таблице:

31

42

67

141

20

79

31

29

7

58

117

0

17

58

65

0

32

4

132

98

101

52

21

21

19

55

102

96

20

42

31

7

112

28

99

38

63

91

0

30

13

24

26

5

79

16

68

9

26

65


1.Теоретическая часть


Основные непрерывные распределения

Непрерывные распределения характеризуются функцией плотности вероятности f(x), по определению равной

=,

где F(x)=P(о≤x) - функция распределения.

Укажем основные свойства этой функции:

) f(x)≥0;

)=1 - условие нормировки.

При помощи функции плотности можно вычислять моментные характеристики случайной величины:

=

=.

Рассмотрим основные распределения.

Равномерное распределение

Случайная величина о имеет равномерное распределение на отрезке [a; b], если


В таком случае вводится обозначение о~R[a,b].

Функция распределения находится, как интеграл от f(x):

=

и имеет вид:

=, a≤x≤b; 0, x<a; 1, x>b.

Числовые характеристики равны:

=,

=.

Экспоненциальное распределение

Случайная величина о имеет экспоненциальное (показательное) распределение c параметром l, если

=, l>0, x≥0.

В таком случае вводится обозначение о~E[l].

Функция распределения находится, как интеграл от f(x) и имеет вид:

=

Числовые характеристики равны:

=,

=

Нормальное распределение

Случайная величина о имеет нормальное (гауссовское) распределение с параметрами m и у2, если

=

В таком случае вводится обозначение о~N[m, у2].

Случайная величина с параметрами m=0 и у2=1 называется стандартной нормальной величиной. Важным фактом является возможность выразить любую нормальную величину через стандартную при помощи преобразования

=,

где ~.

Функция распределения не имеет явного выражения, так как не существует интеграла от функции плотности, выраженного аналитическими функциями. Однако, учитывая возможность указанного выше преобразования, а также тот факт, что вероятность отклонения от нормально распределенной случайной величины от своего среднего m более, чем на 5у, не превышает 10-6, достаточно определить численно значения функции распределения стандартной нормальной величины в относительно небольшом интервале. Эти значения с небольшим шагом по аргументу занесены в специальные таблицы.

=

=

Основные распределения, связанные с набором независимых одинаково распределенных по стандартному нормальному закону случайных величин

При работе с , , ...,  - набором случайных величин, каждая из которых распределена по закону , часто возникает необходимость рассматривать распределение случайных величин, получающихся, как какая-либо комбинация всех этих величин. Основные такие распределения также, как и стандартное нормальное, посчитаны таблично для различных значений n.

) Распределение хи-квадрат.

Распределение хи-квадрат с n степенями свободы, , - это распределение случайной величины


Распределение Стьюдента

Распределение Стьюдента (или t-распределение) с n степенями свободы - это распределение случайной величины


Распределение Снедекора-Фишера, или F-распределение с n, m степенями свободы - это распределение случайной величины


Основные понятия математической статистики

Выборкой объема n называется случайный вектор X=(X1, X2,..., Xn)Т, где СВ (случайные величины) Xi, i=1..n являются независимыми одинаково распределенными с функцией распределения F(x). Апостериорно выборка X является неслучайным вектором - набором n независимых реализаций одной и той же случайной величины. Упорядоченный по возрастанию набор из неслучайных значений выборки X обозначается X(i) i=1...n и называется вариационным рядом выборки. Разница между наибольшим и наименьшим значениями выборки называется размахом выборки. Эмпирической функцией распределения (или выборочной функцией распределения) называется ступенчатая функция Fn(x), построенная следующим образом:

F(x)=M(x)/n,

где M(x)={число реализаций, значение которых меньше x}.

Выборочная функция распределения в каждой точке является оценкой F(x).

Гистограммой называется оценка функции плотности вероятности, состоящая из столбцов. Для ее построения вся область значений выборки разбивается на k одинаковых интервалов, k<<n. Далее подсчитывается количество значений выборки, принадлежащих каждому из интервалов m1, m2, … m2. Затем подсчитываются соответствующие частоты vi= mi/n. Для выполнения условия нормировки (см пункт 1) необходимо значения полученных частот разделить на длину интервалов, и далее строить над каждым интервалом столбец найденной высоты.

Свойства оценок

Для того, чтобы статистические оценки давали «хорошие» приближения оцениваемых параметров, они должны удовлетворять определенным требованиям. Ниже приведены важнейшие из них.

Пусть Q* - оценка неизвестного параметра Q какого-то теоретического распределения. Допустим, по выборке объема n найдена оценка Q*1. При использовании другой выборки, полученной по тому же распределению, будет определена оценка Q*2. Повторяя опыт многократно с новыми выборками, получим набор значений Q*1, Q*2, …, Q*n, которые будут различаться между собой. Таким образом, оценку Q* можно рассматривать, как случайную величину, а - как ее Q*1, Q*2, …, Q*n возможные значения.

Несмещенность

Несмещенной называется оценка, математическое ожидание которой равно оцениваемому параметру:

M(Q*)=Q

2) Состоятельность.

Состоятельной называется оценка, для которой вероятность

P{|Q*-Q|<e} ® 1, при n ® µ, для любого e>0.

Т.е., при достаточно большом n вероятность того, что отклонение оценки от оцениваемого параметра не превысит любую, сколь угодно малую, величину стремится к единице. Иначе говоря, Q* стремится к Q по вероятности.

Эффективность

Эффективной называется статистическая оценка, имеющая (при заданном объеме выборки n) наименьшую возможную дисперсию

Интервальные оценки

Все рассмотренные выше оценки - точечные, т.е., определяемые одним числом. Но при выборке малого объема точечная оценка может значительно отличаться от оцениваемого параметра, т.е., приводить к грубым ошибкам. По этой причине распространены интервальные оценки.

Интервальной называется оценка, характеризующаяся двумя числами - концами интервала. Интервальные оценки позволяют установить надежность и точность оценок.

Пусть Q* - оценка неизвестного параметра Q какого-то теоретического распределения. Чем точнее эта оценка, тем меньше абсолютная величина

д=|Q*-Q|.

Величина д, таким образом, характеризует точность оценки.

Надежностью (доверительной вероятностью) называют вероятность г, с которой осуществляется неравенство |Q*-Q|<д. Обычно надежность задается заранее, причем в качестве г берут число, близкое к единице. Стандартный уровень доверительной вероятности равен 0,9, 0,95, 0,99.

Соответственно, доверительным интервалом называется интервал, в который неизвестный параметр попадает с заданной надежностью г.

Метод моментов и метод максимального правдоподобия

При известном виде распределения случайной величины, зависящем от векторного параметра q=(q1,...,qm), оценки этого параметра можно находить различными способами. Простейшим является метод моментов, основанный на использовании моментных характеристик. Например, для двумерного параметра можно получить такую систему

=m; =D,

где m и D - оценки из пункта 2, gi() - некоторые функции.

Решая систему, найдем оценки параметров.

При определенных условиях бывает удобно использовать метод максимального правдоподобия. Этот метод использует функцию правдоподобия, которая представляет собой произведения вероятностей того, что в результате статистических испытаний случайная величина даст именно полученный набор элементов выборки, т.е.

=P(=|Q)P(=|Q)...P(=|Q)

Если основным достоинством метода моментов является простота, то к положительным качествам метода наибольшего правдоподобия следует отнести состоятельность и эффективность получаемых оценок, в то время, как вычисления, сопряженные с его применением, могут быть очень сложны.

Проверка статистических гипотез о виде закона распределения при помощи критерия Пирсона

Статистической называется гипотеза о виде неизвестного распределения или о параметрах известных распределений.

Для того, чтобы можно было воспользоваться критерием Пирсона и определить, насколько некоторая предлагаемая модель функции распределения (и, соответственно, плотности вероятности) соответствует экспериментальным данным, необходимо построить статистику c2, вычисляемую по формуле:

При этом область значений вариационного ряда разбита на j интервалов. vi - частота попадания значений выборки в i-ый интервал, pi - теоретическое значение вероятности этого события, вычисляемое на основе проверяемой модели. Затем по заданному уровню значимости a определяется квантиль распределения c2(j-m-1) и сравнивается со значением G статистики критерия Пирсона, которая для принятия гипотезы о виде распределения должна не превосходить найденную квантиль.

. Практическая часть





Гистограмма


Литература

1. Болдин М.В. и др. Теория вероятностей и математическая статистика. Лабораторные работы. М.: МАИ, 1992

2. Ивченко Г.И., Медведев Ю.И. Математическая статистика. М.: Высшая школа, 1992

3. Кибзун А.И., Наумов А.В. Лекции по теории вероятностей. М.: МАИ, 2000

Похожие работы на - Критерий согласия Пирсона

 

Не нашли материал для своей работы?
Поможем написать уникальную работу
Без плагиата!