Распределение данных
Задание 1
Описание данных. Измерялась
прочность металла контрольных образцов, снятых с дисков турбин авиадвигателя
(по одному с каждого диска).
Лист2, столбец А
Статистическая задача.
Вычислить основные статистические
характеристики распределения данных: объем наблюдений, среднее значение,
медиану, дисперсию, стандартное отклонение, минимальное и максимальное значения
выборки, размах (широту) выборки, асимметрию, эксцесс.
Проверить значимость отклонения от
нуля коэффициентов асимметрии и эксцесса с заданным уровнем значимости:
α = 0.10.
Результаты.
Объём выборки
|
101
|
|
Среднее
|
121,529703
|
|
Медиана
|
121,5
|
|
Дисперсия
|
5,943870209
|
|
Станд.отклонение
|
2,438005375
|
|
Минимум
|
115,2
|
|
Максимум
|
130
|
|
Размах
|
14,8
|
|
|
границы
|
|
Асимметрия
|
0,229715932
|
(-0,389; 0,389)
|
незначимо
|
Эксцесс
|
0,868236435
|
(-0,65; 0,77)
|
значимо
|
Задание 2
распределение отклонение эксцесс
значимость
Описание данных. Измерялась
прочность металла контрольных образцов, снятых с дисков турбин авиадвигателя
(по одному с каждого диска).
Лист2, столбец А
Статистическая задача. Построить
гистограмму выборочных данных по заданным интервалам группировки:
X0 = 113.25 - правая граница первого интервала (от -¥ до X0),
D = 1 - ширина
интервалов,
r = 16 - общее число интервалов с учётом двух крайних.
Найти оценку моды распределения.
На график гистограммы наложить
график функции плотности гипотетического распределения:
H0: нормальное.
Результаты.
Мода распределения =121,53.
Задание 3
Описание данных. Измерялась
прочность металла контрольных образцов, снятых с дисков турбин авиадвигателя
(по одному с каждого диска).
Лист2, столбец А
Статистическая задача. Построить
график эмпирической функции распределения выборочных данных, совмещенный с
графиком функции распределения гипотетического распределения:
H0: нормальное.
Вычислить максимальное расхождение
между эмпирической и гипотетической функциями распределения.
Результаты.
Задание 4
Описание данных. Измерялась
прочность металла контрольных образцов, снятых с дисков турбин авиадвигателя
(по одному с каждого диска).
Лист2, столбец А
Статистическая задача. Проверить (по
критерию хи-квадрат) гипотезу согласия выборочных данных с гипотетическим
распределением:
α=0.01, H0: нормальное.
Результаты.
Группированные
|
среднее
|
121.53
|
дисперсия
|
5.944
|
границы
|
частоты
|
χ2 (ni- n pi)2/ n pi
|
|
выборочные ni
|
|
£113.25
|
0
|
0,034518824
|
0,0345188
|
114.25
|
0
|
0,108255433
|
0,1082554
|
115.25
|
1
|
0,362335206
|
1,1222105
|
116.25
|
1
|
1,027215438
|
0,0007211
|
117.25
|
1
|
2,466715838
|
0,8721132
|
118.25
|
5
|
5,017616122
|
6,185Е-05
|
119.25
|
11
|
8,645859537
|
0,6409978
|
120.25
|
12
|
12,62003256
|
0,0304627
|
121.25
|
11
|
15,60489144
|
1,3588704
|
122.25
|
18
|
16,34604295
|
0,1673539
|
123.25
|
20
|
14,504973
|
2,081722
|
124.25
|
12
|
10,90364163
|
0,1102386
|
125.25
|
5
|
6,943392251
|
0,5439378
|
126.25
|
1
|
3,745499088
|
2,0124862
|
127.25
|
1
|
1,711493588
|
0,2957786
|
³127.25
|
2
|
0,957517088
|
1,1349882
|
Всего
|
101
|
101
|
χ2=10,514717
|
15
степеней свободы
|
a15=0,213824
|
a13=0,348601
|
|
|
1%-ое критическое значение
|
32
|
|
гипотеза нормальности
|
отвергается
|
|
с критическим уровнем значимости
|
αcrit = 0.348601
|
Вывод. Данные слабо значимо
свидетельствуют против предположения о нормальности распределения выборки.
Задание 5
Описание данных. Измерялось верхнее
артериальное давление до и после проведения комплекса оздоровительных
мероприятий в некоторой группе пациентов. Каждое значение представляет собой
среднее арифметическое многократных измерений давления у одного пациента в
течение дня.
Sheet2, столбцы В, С
Статистическая задача. Проверить
гипотезу отсутствия эффекта оздоровительных мероприятий по критерию Стьюдента
(в предположении нормальности распределения наблюдений) при заданном уровне
значимости и выбранной альтернативе относительно истинного среднего значения:
α=0.05, K: Уменьшится.
Результаты.
|
До
|
После
|
Разность
|
Объём выборки
|
69
|
69
|
69
|
Среднее
|
153,5434783
|
124,3492754
|
29,1942029
|
Станд.отклонение
|
8,950612938
|
7,317016561
|
5,451602186
|
Станд.ошибка среднего
|
1,085421252
|
0,887318593
|
0,661103872
|
Статистика Стьюдента
|
T=44.16
|
5%-ая критическая область
|
> 1,667572281
|
Гипотеза отсутствия эффекта
|
отвергается
|
с критическим уровнем значимости
|
αcrit <0.001
|
Вывод. Данные подтверждают
предположение об уменьшении давления после лечения.
По смыслу задачи каждое значение в
одной выборке зависит от соответствующего значения в другой, поэтому вместо
двух измерений рассмотрим их разность. Если верна гипотеза H0, т.е. эффект отсутствует, то
статистика Стьюдента Т имеет распределение Стьюдента с n-1 степенями свободы. Полученное
значение статистики Стьюдента попадает в критическую область с заданным уровнем
значимости, поэтому мы отвергаем гипотезу об отсутствии эффекта.
Пояснения:
Альтернатива: уменьшится, тогда αcrit =1-S(t). Поэтому мы используем αcrit =СТЬЮДРАСП (x, n - 1,1), а для критической константы
СТЬЮРАСПОБР.
Задание 6
Описание данных. Измерялось
содержание некоторой примеси в пищевом продукте до и после специальной
обработки. Нет оснований предполагать нормальность распределения данных.
Sheet2, столбцы E, F
Статистическая задача. Проверить
гипотезу отсутствия влияния обработки на содержание примеси по критерию знаков
при заданном уровне значимости и ожидаемом эффекте:
α=0.05, Ожидается: Уменьшается.
Результаты.
Частота ожидаемого эффекта
|
1
|
|
30 из 30
|
5%-ая критическая область
|
>20
|
Гипотеза отсутствия эффекта
|
отвергается
|
с критическим уровнем
|
αcrit << 0.001
|
Вывод. Данные высоко значимо
подтверждают предположение о влиянии специальной обработки на величину примеси.
Пояснения:
Критический уровень значимости по
формуле биномиального распределения равен:
αcrit=1-sup P
{M£m|n, p} (*)
При условии, что p³0,5.
Очевидно, что supremum достигается при p=0.5.
Критическую константу же мы находим,
исходя из заданного уровня значимости варьируя число успехов.
Задание 7
Описание данных. Фиксировалось
среднее значение нескольких измерений в течение суток верхнего артериального
давления у пациентов в двух, не связанных между собой, группах. Можно
предположить, что для каждого пациента усредненный результат представляет собой
реализацию нормальной случайной величины с одинаковой для обеих групп
дисперсией.
Sheet2, столбцы G, H
α=0.05,
K: 1-ая
группа меньше.
Результаты.
|
Группа A
|
Группа B
|
Объём наблюдений
|
28
|
40
|
Среднее
|
168,9571429
|
168,455
|
Станд.отклонение
|
10,58261474
|
9,77453196
|
Станд.ошибка среднего
|
2,096625156
|
1,56517776
|
Статистика Стьюдента T
|
0,198
|
5%-ая
критическая область
|
> 1.667916
|
Гипотеза совпадения групп
|
принимается
|
с критическим уровнем значимости
|
αcrit = 0.58
|
Вывод. Расхождение в измерениях
артериального давления у пациентов в двух группах статистически незначимо.
Группы можно считать однородными.
Задание 8
Описание данных. Измерялось
содержание витаминов группы В (в у. е.) в овощах, выращенных с использованием
двух различных типов удобрений.
Sheet2, столбцы I, J
Статистическая задача. При заданном
уровне значимости α и альтернативе K проверить по критерию Вилкоксона гипотезу о том, что функции
распределения измерений в каждой группе совпадают:
α=0.01, K: 1-ая гр. Меньше
Результаты.
Объемы выборок
|
n1=29
|
n2=19
|
Сумма рангов 1-й выборки
|
669
|
Среднее значение (стат Виликсона)
|
710,5
|
1%-я критическая область
|
>599.7
|
Гипотеза идентичности групп
|
принимается
|
с критическим уровнем значимости
|
αcrit =0,19
|
Вывод. Тип удобрения влияет на
витамины в овощах.
Задание 10
Описание данных. Измерялось
содержание сахара в крови в двух группах больных сахарным диабетом.
Исследователь не обладает никакой информацией о типе распределения измерений в
группах, а также о возможном соотношении между этими распределениями.
Sheet2, столбцы M, N
Статистическая задача. При заданном
уровне значимости α и границах интервалов разбиения проверить по критерию хи-квадрат
гипотезу об однородности измерений в группах:
α=0.1;
X0=13 Δ=2 r=7
Результаты.
|
Относительные частоты
|
|
Границы
|
Группа А
|
Группа В
|
χ2
|
13
|
0,147059
|
0,12381
|
0,206753
|
14
|
0,127451
|
0,038095
|
5,030203
|
15
|
0,107843
|
0,085714
|
0,262227
|
16
|
0,068627
|
0,108662
|
17
|
0,107843
|
0,114286
|
0,019328
|
18
|
0,088235
|
0,066667
|
0,311397
|
>19
|
0,352941
|
0,514286
|
3,097815
|
Σ
|
1
|
1
|
9,036384
|
Объём
|
102
|
88
|
|
10%-я
критическая область
|
>10,644
|
Гипотеза однородности групп
|
принимается
|
с критическим уровнем значимости
|
αcrit = 0.1715
|
Вывод. Группы больных не значимо
различаются по содержанию сахара в крови.
Задание 11
Описание данных. Измерялась длина
хвоста редкой породы ящериц.
Sheet2, столбец O
Статистическая задача. Предполагая
нормальность распределения выборочных данных, построить доверительный интервал
для среднего значения длины хвоста ящериц изучаемой породы при заданном уровне
надежности:
Q = 0.9,
Граница: верхняя.
Результаты.
Выборочное среднее
|
51,00816
|
Дисперсия
|
27,02728
|
Объём выборки
|
49
|
Станд. ошибка среднего
|
0,750379
|
α квантиль
|
1,299439
|
90%-ый доверительный интервал для среднего всей совокупности
|
51,98323
|
Пояснения:
Найдем -
выборочное среднее, -
выборочную дисперсию. Отношение стандартного отклонения и корня из числа
степеней свободы дает нам стандартную ошибку среднего.
Опорная функция монотонно
убывает и имеет
распределение Стьюдента S с (n-1) степенью свободы.
Вычисляем верхнюю квантиль(tα),
т.е. решение уравнения S(t)=1-α. Тогда верхняя доверительная граница для среднего
Задание 12
Описание данных.
Измерялась наполняемость консервной банки со шпротами, произведенными на
экспериментальной производственной линии.
Sheet2,
столбец P
Статистическая задача.
Предполагая нормальность распределения выборочных данных, построить
доверительный интервал для дисперсии при заданном уровне надежности:
Q=0.95,
Граница: Двусторонняя.
Результаты.
Объём выборки
|
57
|
Дисперсия
|
22,915
|
1-α квантиль распределения
|
39,80128
|
α квантиль распределения
|
74,46832
|
90%-ая двусторонняя граница для дисперсии для станд. отклонения
|
[17.53974;
32.8169] [4.188047; 5.728604]
|
Пояснения:
Квантили хи-квадрат распределения
находятся по следующим формулам:
= ХИ2ОБР (1-p; m).
= ХИ2ОБР (p; m).
Строятся доверительные
границы