Проверка гипотезы о законе распределения генеральной совокупности X по критерию Пирсона
Федеральное
агентство по образованию РФ
Сибирская
государственная автомобильно-дорожная академия (СибАДИ)
Кафедра:
«Высшая математика»
РАСЧЕТНО-ГРАФИЧЕСКАЯ РАБОТА
Тема: «Проверка гипотезы о законе распределения генеральной
совокупности X по критерию Пирсона»
Выполнила:
студентка 23ЭУТ
Хасянова А.Ф.
Проверил: Матвеева С.В
Дата_______________
Оценка_____________
Омск-2010
Содержание
1. Введение.
Исходные данные
2. Вариационный ряд
3. Интервальный вариационный ряд
4. Построение гистограммы плотности
относительных частот. Выдвижение гипотезы о законе распределения генеральной
совокупности Х
5. Оценки
числовых характеристик и параметров выдвинутого закона
6. Теоретическая функция плотности рассматриваемого
закона распределения «Построение ее на гистограмме»
7. Проверка критерия Пирсона
Вывод
1. Исходные данные варианта №20
Дана выборка из
генеральной совокупности случайной величины Х. Данные представлены в таблице 1.
Таблица 1
79,02
|
79,70
|
74,68
|
20,47
|
11,70
|
44,64
|
40,75
|
8,59
|
96,42
|
6,17
|
91,75
|
93,29
|
77,57
|
81,25
|
76,59
|
51,84
|
6,17
|
42,79
|
80,87
|
92,81
|
48,04
|
14,70
|
100,64
|
69,83
|
94,56
|
70,42
|
47,93
|
47,48
|
66,79
|
42,12
|
20,27
|
51,36
|
62,51
|
66,86
|
87,99
|
99,29
|
5,96
|
60,38
|
62,53
|
75,50
|
46,55
|
83,53
|
55,65
|
59,26
|
77,05
|
101,10
|
29,93
|
102,21
|
86,11
|
45,92
|
90,93
|
24,30
|
9,76
|
90,25
|
36,72
|
84,96
|
20,50
|
81,99
|
56,29
|
31,75
|
43,61
|
68,70
|
80,47
|
100,66
|
29,98
|
48,88
|
40,37
|
67,46
|
91,46
|
59,11
|
90,75
|
4,64
|
36,53
|
32,39
|
6,99
|
8,41
|
30,85
|
37,30
|
64,44
|
25,60
|
18,00
|
84,27
|
98,88
|
36,39
|
34,64
|
49,49
|
10,53
|
50,97
|
39,40
|
3,59
|
100,39
|
18,57
|
9,27
|
10,89
|
65,91
|
35,62
|
75,45
|
37,86
|
89,74
|
4,57
|
Выборка содержит 100
наблюдаемых значений, поэтому выборка имеет объем n=100.
2. Построение
вариационного ряда
Операция расположения
значений случайной величины по не убыванию называется ранжированием. Последовательность
элементов х(1) ≤ х(2) ≤…≤ х(k) называется вариационным рядом, элементы которого называют
вариантами.
Проранжировав
статистические данные, получаем вариационный ряд (табл. 2).
Таблица 2
3,59
|
9,76
|
24,30
|
36,53
|
44,64
|
51,84
|
66,68
|
77,05
|
84,96
|
93,29
|
4,57
|
10,53
|
25,60
|
36,72
|
45,92
|
55,65
|
66,79
|
77,75
|
86,11
|
94,56
|
4,64
|
10,89
|
29,93
|
37,30
|
46,55
|
56,29
|
67,46
|
79,02
|
87,99
|
96,42
|
5,96
|
11,70
|
29,98
|
37,86
|
47,48
|
59,11
|
68,78
|
79,70
|
89,74
|
98,88
|
6,17
|
14,70
|
30,85
|
39,40
|
47,93
|
59,26
|
69,83
|
80,47
|
90,25
|
99,29
|
6,17
|
18,00
|
31,75
|
40,37
|
48,04
|
60,38
|
70,42
|
80,87
|
90,75
|
100,39
|
6,99
|
18,57
|
32,39
|
40,75
|
48,88
|
62,51
|
74,68
|
81,25
|
90,93
|
100,46
|
8,41
|
20,27
|
34,64
|
42,12
|
49,49
|
62,53
|
75,45
|
81,99
|
91,46
|
100,66
|
8,59
|
20,47
|
35,62
|
42,79
|
50,97
|
64,44
|
75,50
|
83,53
|
91,75
|
101,10
|
9,27
|
20,50
|
36,39
|
43,61
|
51,36
|
65,71
|
76,59
|
84,27
|
92,81
|
102,21
|
3. Построение
интервального вариационного ряда
Опытные данные объединяем
в группы так, чтобы в каждой отдельной группе значения вариант будут одинаковы,
и тогда можно определить число, показывающее, сколько раз встречается
соответствующая варианта в определенной (соответствующей) группе.
Численность отдельной
группы сгруппированного ряда опытных данных называется выборочной частотой
соответствующей варианты x(i) и обозначается mi; при этом , где n – объем выборки.
Отношение выборочной
частоты данной варианты к объему выборки называется относительной выборочной
частотой и обозначается Pi*,
т.е. –
число (частота) попаданий значений X в i-й разряд, n –
объем выборки.
Т.к. согласно теореме
Бернулли имеем, что т.е.
выборочная относительная частота сходится по вероятности соответствующей
вероятности, тогда из условия:
Интервальным
вариационным рядом распределения называется упорядоченная совокупность
частичных интервалов значений С.В. с соответствующими им частотами или
относительными частотами.
Для построения
интервального вариационного ряда выполняем следующие действия.
1.
Находим размах
выборки R = xmax – xmin. Имеем
R = 102,21-3,59=98,62 .
2.
Определяем длину
частичного интервала ∆ – шаг разбиения по формуле Стерджеса: где n – объем выборки, К– число частичных
интервалов . ,
3.
∆=10
4.
Определяем начало
первого частичного интервала
После разбиения на частичные интервалы просматриваем
ранжированную выборку и определяем, сколько значений признака попало в каждый
частичный интервал, включая в него те значения, которые ≥ нижней границы
и меньше верхней границы.
Строим интервальный
вариационный ряд (табл. 3).
Таблица 3
|
Разряды
|
mi
|
|
|
=
|
1
|
[3.5-13.5)
|
14
|
0.14
|
0.014
|
8.5
|
2
|
[13.5-23.5)
|
6
|
0.06
|
0.006
|
18.5
|
3
|
[23.5-33.5)
|
7
|
0.07
|
0.007
|
28.5
|
4
|
[33.5-43.5)
|
12
|
0.12
|
0.012
|
38.5
|
5
|
[43.5-53.5)
|
12
|
0.12
|
0.012
|
48.5
|
6
|
[53.5-63.5)
|
7
|
0.07
|
0.007
|
58.5
|
7
|
[63.5-73.5)
|
8
|
0.08
|
0.008
|
68.5
|
8
|
[73.5-83.5)
|
12
|
0.12
|
0.012
|
78.5
|
9
|
[83.5-93.5)
|
13
|
0.13
|
0.013
|
88.5
|
10
|
[93.5-103.5)
|
9
|
0.09
|
0.009
|
98.5
|
Контроль
|
|
=100
|
=1
|
|
|
Где -плотность относительной частоты
-середина частичных интервалов
4.
Построение
гистограммы
Гистограммой частот называют
ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат
частичные интервалы длины , а высоты равны отношению – плотность частоты (или – плотность частности).
По данным таблицы 4 строим
гистограмму (рис. 1).
Гистограмма частот является статистическим аналогом
дифференциальной функции распределения (плотности) случайной величины Х. Площадь гистограммы
равна единице.
Выдвижение гипотезы о
законе распределения генеральной совокупности
По данным наблюдений
статистическое среднее и
выборочное среднее квадратическое отклонение у* по значению почти совпадают.
Учитывая данный факт, а также вид гистограммы можно предположить, что случайная
величина имеет равномерное распределение.
По виду гистограммы выдвигаем
гипотезу о равномерном законе распределения генеральной совокупности Х.
5.
Оценка числовых характеристик и параметров закона распределения
Оценками
математической статистики называют приближенные значения числовых характеристик
или параметров законов распределения генеральной совокупности Х вычисленные на
основе выборки.
Оценка
называется точечной, если она определяется числом или точкой на числовой оси.
Оценка
(как точечная, так и интервальная) является случайной величиной, так как она
вычисляется на основе экспериментальных данных и является функцией выборки.
При
вычислении точечных оценок для удобства берут не сами элементы выборки, а
середины частичных интервалов из интервального вариационного ряда (табл. 1) и
применяют формулы:
где n - объем выборки, – i-й элемент выборки
Составим таблицу для
нахождения и
Таблица 4
i
|
|
|
1
|
|
8.5*14=119
|
2
|
|
18.5*6=111
|
3
|
|
28.5*7=199.5
|
4
|
|
38.5*12=462
|
5
|
|
48.5*12=582
|
6
|
|
58.5*7=409.5
|
7
|
|
68.5*8=548
|
8
|
|
78.5*12=942
|
9
|
|
10
|
|
98.5*9=886.5
|
|
|
|
6. Равномерный закон
интервальный вариационный генеральный совокупность
Выдвинута
гипотеза о распределении генеральной совокупности Х по равномерному закону
найдем функцию плотности
равномерного закона вычислив
оценки параметров и
,
Т.к М(x)= , , D(x)=
Таблица 5
i
|
|
1
|
|
2
|
|
3
|
|
4
|
|
5
|
|
6
|
|
7
|
|
8
|
|
9
|
|
10
|
|
|
186
|
После того, как найдены
значения функции плотности для каждого разряда, нанесем их прямо на гистограмму,
получая тем самым кривую функции плотности
7
Проверка гипотезы
о законе распределения генеральной совокупности по критерию Пирсона
В качестве
меры расхождения между статистическим и гипотетическим (теоретическим)
распределениями возьмем критерий Пирсона К = ч2.
Пирсон
доказал, что значение статистического критерия не зависит от функции и от числа опытов n, а зависит от числа частичных интервалов интервального вариационного ряда.
При увеличении ч2, и находится по формуле:
К = или К =
Дальнейшие
вычисления, необходимые для определения расчетного значения выборочной
статистики , проведем в
таблице 5.
Таблица 6
i
|
|
|
|
|
|
/
|
1
|
0.14
|
14
|
0.1029
|
10.29
|
|
13.76/10.37=1.33
|
2
|
0.06
|
6
|
0.1
|
10
|
|
16/10=1.6
|
3
|
0.07
|
7
|
0.1
|
10
|
|
16/10=1.6
|
4
|
0.12
|
12
|
0.1
|
10
|
|
16/10=1.6
|
5
|
0.12
|
12
|
0.1
|
10
|
|
16/10=1.6
|
6
|
0.07
|
7
|
0.1
|
10
|
|
16/10=1.6
|
7
|
0.08
|
8
|
0.1
|
10
|
|
16/10=1.6
|
8
|
0.12
|
12
|
0.1
|
10
|
|
16/10=1.6
|
9
|
0.13
|
13
|
0.1
|
10
|
|
16/10=1.6
|
10
|
0.09
|
9
|
0.1149
|
11.49
|
|
6.3/11.49=0.548
|
|
|
|
|
|
01.86
|
|
Чтобы найти значение надо воспользоваться
табличными распределениями в которых значение сл. величины
находят по заданному уровню значимости и вычисленному числу степеней свободы
R- число частичных интервалов в
таблице 1 но если в некоторых из интервалов значения то надо объединить расположенные рядом
интервалы так, чтобы тогда
число
R-это число из необъединенных
интервалов
i- число неизвестных параметров
В
рассматриваемом эмпирическом распределении не имеются частоты, меньшие 5. Случайная
величина ч2 (мера расхождения) независимо от вида закона распределения
генеральной совокупности при (n ≥
50) имеет распределение ч2 с числом степеней свободы
1) К =
уровень
значимости б =1–=0,05
,
найдем по
таблице значений критическое
значение для б = 0,05 и =9
Имеем =16.9. Так как то предполагаемая гипотеза о показательном
законе распределения генеральной совокупности не противоречит опытным данным и
принимается на уровне значимости б.
2)=,
=
3) M(x)= ,
M(x)=
4) D(x)=
D(x.1)=
5) Таким
образом, критическая область для гипотезы задается неравенством ; P()= Это означает, что нулевую гипотезу можно
считать правдоподобной и гипотеза Но
принимается
Вывод: В
ходе расчетно-графической работы мы установили, что генеральная совокупность X распределена по равномерному закону, проверив это по
критерию Пирсона. Определили параметры и числовые характеристики закона и
построили для них доверительные интервалы.