Оценивание параметров распределения. Сравнения средних. Критерий Хи-квадрат
Курсовая
работа на тему:
«Оценивание
параметров распределения. Сравнения средних. Критерий Хи-квадрат»
Введение
Курс «Теория вероятности и
математическая статистика» имеет особое место среди предметов, изучаемых
студентами специальности ПМ. Он является одним из базовых, поскольку решение
многих прикладных задач в математике требует статистического подхода.
Данная работа направлена на изучение
статистических методов обработки результатов эксперимента.
1. Основные понятия
Непрерывные случайные величины
Пусть - произвольное вероятностное пространство.
Случайной величиной считают измеримую функцию , отображающую пространство элементарных событий в
множество действительных чисел , т.е.
функция, для которой прообраз любого
борелевского множества есть
множество из -алгебры
.
Случайная величина называется дискретной, если она принимает не более, чем счетное
число значений.
Функцией распределения случайной
величины является функция вещественной переменной, удовлетворяющая
(1.1)
Иными словами, значение функции
распределения случайной
величины - это вероятность того, что принимает значение меньшее, чем x.
Случайная величина называется абсолютно непрерывной, если существует неотрицательная
борелевская функция ,
такая, что для любого борелевского множества
,
(1.1.1)
Причем выполнено условие нормировки
(1.1.2)
В этом случае
(1.4.3)
И почти всюду (по мере Лебега)
(1.1.4)
Функция называется плотностью вероятности случайной величины или просто плотностью.
График плотности называют кривой
распределения.
Распределение абсолютно непрерывной
случайной величины полностью определяется плотностью распределения. Очевидно,
что функция распределения абсолютно непрерывной случайной величины непрерывна.
Числовые характеристики непрерывных
случайных величин и их свойства.
Математическое ожидание случайной
величины
Математическим ожиданием непрерывной
случайной величины с
известной плотностью распределения считают число
, (1.1.5)
если интеграл абсолютно сходится.
Некоторые свойства математического
ожидания:
1.
Математическое ожидание постоянной равно этой постоянной, т.е.
(1.1.6)
2.
Математическое ожидание суммы случайных величин равно сумме их
математических ожиданий, т.е.
(1.1.7)
(предполагается, что математические
ожидания справа существуют).
3.
Математическое ожидание произведения независимых случайных величин
равно произведению их математических ожиданий, т.е.
(1.1.8)
(предполагается, что математические
ожидания справа существуют).
Дисперсия случайной величины
Дисперсией D случайной
величины является математическое ожидание квадрата центрированной
случайной величины
т.е. . (1.1.9)
Для непрерывной случайной величины дисперсию вычисляют по формуле:
(1.1.10)
Среднеквадратическое отклонение
есть .
Некоторые свойства дисперсии:
1.
Дисперсия постоянной равна нулю, т.е.
(1.1.11)
2.
Дисперсия суммы независимых случайных величин равна сумме их
дисперсий, т.е.
(1.1.12)
(предполагается, что и существуют).
Вероятность того, что случайная
величина принимает значение в заданном числовом промежутке, вычисляется по
одной из формул:
(1.1.13)
непрерывный
величина средняя распределение
или
(1.1.14)
Моменты
Начальный момент порядка - это математическое ожидание от случайной величины
(1.1.15)
Центральным моментом порядка называется математическое ожидание случайной величины
(1.1.16)
Центральный момент случайной
величины есть начальный момент центрированной случайной величины
Асиметрией называют величину,
вычисляемую по формуле
,
(1.1.17)
где - центральный момент третьего порядка
(1.1.18)
Знак указывает на право- или левостороннюю асимметрию. Если <0, то распределение скошено вправо, если >0, то распределение скошено влево. Если =0, то распределение симметрично относительно прямой .
Для характеристики «сглаженности»
кривой плотности около ее центра используют четвертый центральный момент , вводя коэффициент эксцесса
(1.1.19)
Для нормального распределения , и следовательно, коэффициент эксцесса равен нулю. Если >0,
то кривая плотности в окрестности центра имеет более высокую и более острую
вершину, чем нормальная кривая. При <0 вершина кривой плотности более низкая и более плоская, чем
нормальная кривая.
Моменты более высоких порядков в
простейших приложениях теории вероятностей не используются.
Величина , ,
определяемая из уравнения
,
(1.1.20)
называется -квантилью (квантилью порядка) распределения случайной величины . Для абсолютно непрерывных случайных величин функция непрерывна и решение уравнения существует всегда.
Квантиль порядка 0.5 называется
медианой. Медиана в общем случае определяется неоднозначно.
Модой абсолютно непрерывной случайной величины называется такое значение , при котором плотность достигает своего наибольшего значения. Мода может не существовать
или определяться неоднозначно. Если мода существует и единственна, то
соответствующее распределение называется унимодальным.
Нормальное распределение случайной
величины
Наиболее часто встречающимся в
теории вероятностей и приложениях является нормальное распределение. Основная
особенность нормального распределения состоит в том, что оно является
предельным распределением для многих другиъ распределений при выполнении
некоторых условий, которые часто встречаются на пратике.
Нормальным распределением с
параметрами (a,s),
называется распределение вероятностей с плотностью распределения:
(1.1.21)
Если случайная величина имеет нормальное распределение с параметрами (a,s), то говорят что распределена
. Математическое ожидание нормального распределения , дисперсия - .
Кривая плотности распределения симметрична и унимодальна. Своего максимума она
достигает в точке , так
что является одновременно и математическим ожиданием, и модой, и
медианой. При кривая
имеет две точки перегиба.
В силу симметрии распределения все
нечетные центральные моменты равны нулю, а четные
, (1.1.22)
где означает произведение всех нечетных чисел от 1 до .
Параметр а - центр нормального
распределения. Он характеризует сдвиг кривой распределения вдоль оси Ох.
Параметр (>0),
называется стандартным отклонением, характеризует рассеяние случайной величины : с уменьшением кривая
распределения сжимается вдоль оси Ох и «выпячивается» вверх вдоль вертикали
х=а, что приводит к увеличению вероятности попадания случайной величины в любую фиксированную окрестность точки а.
2. Статистические оценки
параметров распределения
Генеральной совокупностью называется
множество возможных значений наблюдаемой случайной величины . Случайная выборка из генеральной совокупности - это совокупность независимых случайных величин , каждая из которых имеет то же самое распределения, что и
генеральная совокупность.
Выборкой называется n-мерная
случайная величина с
независимыми одинаково распределенными компонентами xi, i=1,2,…,
n. Число n называют объемом выборки.
Произвольная функция выборочных значений называется статистикой. Иными словами,
статистика - это любая измеримая функция от случайной выборки.
Статистической оценкой неизвестного
параметра теоретического распределения называют функцию от наблюдаемых
случайных величин.
Классификация оценок
1.
Статистика называется
состоятельной оценкой параметров , если, при , она
стремится по вероятности к оцениваемому параметру
, при (1.2.1)
Состоятельность означает, что с
увеличением объема выборки, качество оценки улучшается.
2.
Статистика является
несмещенной оценкой параметра , если
при любом фиксированном n математическое ожидание оценки равно
оцениваемому параметру
(*)
(1.2.2)
Таким образом, оценка не дает
систематичного завышения или занижения результатов. В другом случае оценка
называется смещенной.
Соблюдение требования (*) не
устранит ошибок, но гарантирует от получения систематических ошибок.
3.
Оценка является
асимптотически несмещенной, если выполняется условие
, при (1.2.3)
4.
Если в некотором классе несмещенных оценок параметра , имеющих конечную дисперсию существует такая оценка , что неравенство
(1.2.4)
выполняется для всех оценок из этого класса, то говорят, что оценка является эффективной в данном классе. Иными словами, эффективная
оценка - это оценка с минимальной дисперсией.
Для того, чтобы оценку можно было использовать вместо неизвестного параметра она должна быть состоятельной, несмещенной и эффективной.
Точечные оценки
Точечной оценкой неизвестного
параметра называют
функцию от выборочных значений случайной величины , реализация которой принимается в качестве неизвестного параметра
.
Несмещенной оценкой генеральной
средней (математического ожидания) служит выборочная средняя
,
(1.2.5)
где ni - частота
значения xi, -
объем выборки.
Смещенной оценкой генеральной
дисперсии служит выборочная средняя
.
(1.2.6)
Более удобная формула
.
(1.2.7)
Несмещенной оценкой генеральной
дисперсии служит исправленная выборочная дисперсия
.
(1.2.8)
Более удобная формула
.
(1.2.9)
Точечные оценки и нормального
распределения:
;
(1.2.10)
(1.2.11)
Точечная оценка определяется одним
числом. При выборке малого объема точечная оценка может значительно отличаться
от оцениваемого параметра, т.е. приводить к грубым ошибкам. По этой причине при
небольшом объеме выборки следует пользоваться интервальными оценками.
Интервальные оценки параметров
Под интервальной оценкой понимают
интервал , который называют доверительным. Границы доверительного интервала
зависят от выборочных значений случайной величины . С заданной вероятностью доверительный интервал содержит истинное
значение оцениваемого параметра,
Число g является доверительной
вероятностью и характеризует надежность полученной оценки: чем ближе g к единице, тем надежнее оценка (обычно выбирают g = 0.9, 0.95 или 0.99).
Величины и являются
доверительными границами. Они представляют собой функции выборочных значений , , и,
следовательно, являются случайными величинами.
Интервал со случайными границами , ,
которые при любом допустимом значении паpаметpа удовлетворяют
соотношению(*), считают доверительным интервалом для неизвестного
параметра .
Примеры доверительных интервалов
. Доверительный интервал для
математического ожидания нормальной случайной величины при известной дисперсии s2 имеет вид
(1.2.12)
Здесь , величину определяют
по заданной доверительной вероятности g с помощью таблиц.
. Доверительный интервал для
математического ожидания нормальной случайной величины при неизвестной дисперсии
s2 имеет вид
(1.2.13)
где оценку дисперсии s вычисляют
по формуле
, (**)
а величину определяют по заданной доверительной вероятности и объему выборки n
с помощью таблиц.
. Доверительный интервал для
дисперсии нормальной случайной величины имеет вид:
, (1.2.14)
где - объем выборки, -
оценка величины s2, определяемая формулой (**).
Значения зависят от объема выборки n и заданной доверительной
вероятности g и определяются
из таблиц. При определении
входами этой таблицы служат число степеней свободы k=n-1, и a=(1+g)/2, при определении , соответственно, - k=n-1, и a=(1-g)/2.
3. Статистическая
проверка статистических гипотез
Статистической называют гипотезу о
виде неизвестного распределения, или о параметрах известных распределений.
Нулевой (основной) называют
выдвинутую гипотезу .
Конкурирующей (альтернативной)
называют гипотезу ,
которая противоречит нулевой.
Простой гипотезой называют гипотезу,
содержащую только одно предположение.
Сложной называют гипотезу, которая
состоит из конечного или бесконечного числа простых гипотез.
Выдвинутая гипотеза может быть
правильной или неправильной, поэтому возникает необходимость ее проверки.
Поскольку проверку проводят статистическими методами, ее называют
статистической.
Случайная величина x, которая
служит для статистической проверки гипотез, является критерием. Иногда термином
«критерий» обозначают не только случайную величину x, но и все правило
проверки гипотезы в целом. При этом x называют статистикой критерия.
Проверка гипотезы состоит в том, что
если наблюдаемое значение критерия принадлежит некоторому определенному
множеству S, т.е. наступает событие , то основная гипотеза отвергается.
Множество S, такое, что при
наступлении события ,
основная гипотеза отвергается,
называют критическим (для гипотезы ).
Событие , состоящее в том, что основная гипотеза отвергается, когда она
является истинной, считают ошибкой первого рода. Событие , состоящее в том, что основная гипотеза не отвергается, когда
верна одна из альтернативных гипотез, считают ошибкой второго рода.
Вероятности и ошибок
первого и второго рода вычисляются в предположениях о справедливости различных
гипотез - основной и
альтернативной соответственно:
(1.3.1)
Вероятность ошибки второго рода, а
также вероятность
(1.3.2)
противоположного события связаны с
конкретной альтернативной гипотезой , то есть могут зависеть от некоторого параметра t.
Функция параметра t, равная
вероятности отвергнуть гипотезу , если
верна гипотеза ,
является функцией мощности критерия.
. Задаются малым числом a > 0, которое называется
уровнем значимости критерия; обычно a=0.05, 0.01 или 0.001. Это число
характеризует вероятность ошибки первого рода. Чем более опасными признаются
ошибки первого рода, тем меньшее значение должно быть выбрано.
. Определяют критическое множество S
из условия выполнения неравенства
(1.3.3)
. Так как условием (***) критическое
множество определяется неоднозначно, то выбирают ту из возможностей, которая
обеспечивает минимум вероятности ошибки второго рода, или, что то же самое,
максимум мощности критерия.
. Производят опыт и получают
наблюдаемое значение критерия. Если при этом наступает событие , то основная гипотеза отвергается. В противном случае считают, что не противоречит опытным данным. Результат проверки гипотезы
выражают словами: гипотеза отвергается (не отвергается) на уровне значимости a.
Сравнение средних
В исследовательской работе большое
значение имеет воспроизводимость результатов. Серии экспериментов неоднократно
повторяют. Иногда оказывается, что средний результат в одной серии
экспериментов заметно отличается от среднего результата в другой серии. При
этом возникает вопрос, можно ли объяснить обнаруженное расхождение средних
случайными ошибками эксперимента или оно вызвано какими-либо незамеченными или
даже неизвестными закономерностями.
В промышленности задача сравнения
средних часто возникает при выборочном контроле качества изделий, изготовленных
на разных установках или при разных технологических режимах.
В простейшем варианте задача
ставится так. Произведено две серии независимых измерений, которые дали
результаты соответственно и со средними значениями и , . Предполагается, что в каждой серии производится измерение вполне
определенной величины, т. Е. что
(1.3.4)
(1.3.5).
Кроме того предполагается, что
ошибки измерений следуют нормальным законам с параметрами соответственно и .
Ставится вопрос о том, можно ли считать, что истинные значения измеряемых
величин и совпадают,
несмотря на расхождение их эмпирических оценок и . Для
решения этого вопроса пользуются правилами статистической проверки гипотез,
описанными выше.
Сравнение средних при известной
точности измерений
Известны значения средних
квадратических отклонений и для обеих серий измерений. Здесь можно воспользоваться тем, что
при нулевой гипотезе средние и имеют нормальное распределение с параметрами соответственно и . Так
как эти средние независимы, то их разность тоже имеет нормальное распределение
с параметрами и . Поэтому нормированная разность, т.е. величина
(1.3.6)
имеет простейшее нормальное
распределение .
Критическая область строится в зависимости от вида конкурирующей гипотезы.
Правило 1.
Для того чтобы при заданном уровне
значимости проверить
нулевую гипотезу о
равенстве математических ожиданий двух нормальных генеральных совокупностей с
известными дисперсиями при конкурирующей гипотезе , необходимо вычислить наблюдаемое значение критерия и по таблице Лапласа найти критическую точку по равенству .
Если - нет оснований отвергнуть нулевую гипотезу.
Если - нулевую гипотезу отвергают.
Правило 2.
Для того чтобы при заданном уровне
значимости проверить
нулевую гипотезу о
равенстве математических ожиданий двух нормальных генеральных совокупностей с
известными дисперсиями при конкурирующей гипотезе , необходимо вычислить наблюдаемое значение критерия и по таблице Лапласа найти критическу точку по равенству .
Если - нет оснований отвергнуть нулевую гипотезу.
Если -нулевую гипотезу отвергают.
Правило 3.
Для того чтобы при заданном уровне
значимости проверить
нулевую гипотезу о
равенстве математических ожиданий двух нормальных генеральных совокупностей с
известными дисперсиями при конкурирующей гипотезе , необходимо вычислить наблюдаемое значение критерия и по таблице Лапласа найти критическую точку по равенству .
Если - нет оснований отвергнуть нулевую гипотезу.
Если -нулевую гипотезу отвергают.
Сравнение средних при неизвестной
точности измерений.
В общем случае имеется лишь два ряда
результатов измерений и . По этим результатам находятся средние значения и ,
которые служат оценками для и . По ним же оценивается точность измерений, которая заранее
неизвестна. Предполагается, что точность измерений в обеих сериях одинакова.
Тогда для оценки дисперсии в
обеих сериях измерений можно использовать эмпирические дисперсии.
,
(1.3.7)
(1.3.8)
или, (1.3.9)
Как и для предыдущего случая при
нулевой гипотезе о равенстве разность
распределена нормально с параметрами 0 и . Но теперь для построения критической области нельзя
воспользоваться интегралом вероятностей, так как неизвестно точное значение . Необходимо воспользоваться распределением Стьюдента.
Нормированная разность имеет
простейшее нормальное распределение, а независимая от нее величина
(1.3.10)
имеет -распределение с степенями
свободы. Поэтому отношение
(1.3.11)
будет иметь распределение Стьдента с
числом степеней свободы . Как и
предыдущем случае строится симметричная критическая область так, чтобы вероятность попадания отношения (?) в эту область была
равна .
Критические значения , для которых и, значит, ,
находятся с помощью таблиц по заданной надежности и числу степеней свободы . Если абсолютная величина отношения (?) превосходит критическое
значение , то с надежностью вывода можно считать расхождение средних значимым (неслучайным).
Критерий χ2
Критерии, которые служат для
проверки гипотезы о законе распределения случайной величины, считают критериями
согласия. Пусть основная гипотеза состоит в том, что функция распределения случайной величины есть вполне определенная функция .
Разобьем числовую ось на r
промежутков (разрядов):
,
(1.3.12)
где . При справедливой гипотезе i-му разряду соответствует вероятность
pi = F(ai)
- F(ai-1), i=1,2,…, r (1.3.13)
Из n выборочных значений случайной величины в i-й разряд (ai-1, ai)
попадает случайное число значений
(1.3.14)
Тогда отношение mi /n
представляет собой частоту выборочных значений в i - й разряд. Близость
частот mi /n к вероятностям pi свидетельствует
в пользу основной гипотезы .
Заметные различия отвергают гипотезу .Случайная величина
(1.3.15)
характеризует согласованность
гипотезы с опытными данными. Критерий применяется в соответствии с общим правилом статистической
проверки гипотез. При этом наблюдаемое значение критерия вычисляют по формуле
(*-*), а критическое множество выбирают в виде полубесконечного интервала где величину
находят с помощью таблиц. Входами таблицы служат: количество степеней свободы l=r-1
(r - количество неизвестных параметров теоретической функции распределения)
и уровень значимости
Если выполняется соотношение >, то говорят, что гипотеза отвергается на уровне значимости a. В противном случае она не противоречит опытным данным.
Замечания
Замечание 1. Число выборочных
значений , i=1., r в каждом разряде должно быть не менее 5-10.
Если это условие не выполняется, рекомендуется объединять разряды.
Замечание 2. Критерий согласия применим не только в случае, когда гипотетическая функция
распределения случайной
величины x
полностью определена. Если она зависит от k неизвестных
параметров, т.е. имеет вид F (x,a1,…,ak), и параметры a1,…,ak оцениваются по выборке
методом максимального правдоподобия, то критерий согласия остается в силе,
только входом в таблиц. служит величина l= k- r -1, где r - число
неизвестных параметров теоретической функции распределения. Для нормального
распределения r=2.
Замечание 1. Число выборочных
значений , i=1,… r в каждом разряде должно быть не менее 5-10. Если
это условие не выполняется, рекомендуется объединять разряды.
Замечание 2. Критерий согласия применим не только в случае, когда гипотетическая функция
распределения случайной
величины полностью определена. Если она зависит от k неизвестных
параметров, т.е. имеет вид , и
параметры оцениваются
по выборке методом максимального правдоподобия, то критерий согласия остается в
силе, только входом в таблицу служит величина l=r-k-1.
4. Сравнение средних
Постановка задачи
В исследовательской работе большое
значение имеет воспроизводимость результатов. Серии экспериментов неоднократно
повторяют. Иногда оказывается, что средний результат в одной серии
экспериментов заметно отличается от среднего результата в другой серии. При
этом возникает вопрос, можно ли объяснить обнаруженное расхождение средних
случайными ошибками эксперимента или оно вызвано какими-либо незамеченными или
даже неизвестными закономерностями.
В промышленности задача сравнения
средних часто возникает при выборочном контроле качества изделий, изготовленных
на разных установках или при различных технологичных режимах. Например,
приходиться сравнивать средние для решения вопроса о преимуществе нового
технологического режима перед старым.
В простейшем варианте задача
ставиться так. Произведено две серии независимых измерений, которые дали
результаты соответственно и со средними значениями и ¢, .Предполагается,
что в каждой серии производиться измерение вполне определенной величины, т.е.
что
(i=1,2,…,
n)
(j=1,2,…,
n¢)
Кроме того, предполагается, что
ошибки измерений следуют нормальным законам с параметрами соответственно (0;s) и (0;s¢).
Ставится вопрос о том, можно ли считать, что истинные значения измеряемых
величин и совпадают,
несмотря на расхождение их эмпирических оценок и ¢. Для решения этого вопроса выдвигается гипотеза о том, что =
(нуль-гипотеза). При этой гипотезе находят распределение разности -¢, сравниваемых средних (или какой-либо подходящей функции от нее).
Далее задаются желаемой надежностью вывода R и строят «критическую область», попадание в которую имеет
пренебрежимо малую вероятность 1-R.
Если обнаруженное в эксперименте
значение разности -¢ попадет в критическую область, то следует считать, что это не
может быть объяснено случайными причинами. При этом «нуль-гипотезу» о равенстве
и следует опровергнуть (с надежностью вывода). В противном случае обнаруженное
значение разности может быть объяснено случайными причинами и потому нет
оснований отвергать «нуль-гипотезу». Заметим, что это ни в какой мере не может
служить доказательством равенства = (и
если у исследователя остались сомнения в справедливости этого равенства, то
следует произвести новые эксперименты, улучшив их точность или увеличив число).
Сравнение средних при известной
точности измерений
Начнем с более простого случая,
когда точно известны значения средних квадратических ошибок s и s¢ для
обеих серий измерений. Здесь можно воспользоваться тем, что при «нуль-гипотезе»
средние и ¢ имеют нормальные распределения с параметрами соответственно и . Так
как эти средние независимы, то их разность тоже имеет нормальное распределение
параметрами -=0 и _.
Поэтому Нормированная разность, т.е. величина
(1.38)
имеет простейшее нормальное
распределение N (0; 1). Это позволяет рассчитать критическую область с
помощью интеграла вероятностей. А именно, исходя из соотношения
(1.39)
можно установить границы критической
области для величины t в виде , где , т.е. : значение _
определяется таблицей значений функции Лапласса. Таким образом при надежности Р
критической областью для нормированной разности служит .
(1.40)
Сравнение средних при неизвестной
точности измерений
В общем случае мы имеем лишь два
ряда результатов измерений: и . По этим результатам мы находим средние значения и ,
которые служат оценками для и . По ним же мы оцениваем точность измерений, которая заранее
неизвестна. Мы будем предполагать, что точность измерений в обеих сериях
одинакова. Тогда для оценки дисперсии в обеих сериях мы можем использовать несмещенные точечные оценки:
или еще лучше,
(1.41)
Как и в п. 1.6.2, при нуль-гипотезе
о равенстве = разность -¢ распределена нормально с параметрами 0 и . Но теперь для построения нельзя воспользоваться интегралом
вероятностей, так как неизвестно точное значение s. Воспользуемся распределением Стьюдента. Нормированная разность имеет простейшее нормальное распределение, а независимая от нее
величина
имеет -распределение с k=n+n¢-2 степенями свободы.
Поэтому отношение
(1.42)
будет иметь распределение Стьюдента
с k=n+n¢-2
степенями свободы. Как и в п. 1.6.2 строим симметрическую
критическую область так,
чтобы вероятность попадания отношения 1.42 в эту область была равна 1-Р.
Критические значения , для которых и,
значит, , находятся с помощью таблицы по заданной надежности Р и
числу степеней свободы k=n+n¢-2. Если абсолютная
отношения превосходит критическое значение , то с надежностью вывода Р можно считать расхождение
средних значимым (неслучайным).
Практическая часть
Точечные и интервальные оценки
Наша выборка X={15.1105, 13.4361,
13.3126, 11.702, 8.10118, 13.1882, 11.3535, 13.4894, 13.2346, 11.8471, 15.8944,
11.8704, 14.1202, 12.2736, 13.6305, 16.6751, 12.8739, 13.4145, 12.8545,
14.2895, 15.7449, 11.4513, 13.9131, 13.7525, 17.8657, 12.4564, 14.3367,
11.6086, 16.6522, 11.7017, 12.8177, 13.5415, 12.6892, 10.0954, 8.67393,
10.9508, 7.25058, 14.5305, 11.8574, 12.6288, 10.522, 15.7281, 14.4069, 14.0923,
13.6519, 12.9329, 11.1661, 13.9729, 15.2256, 16.4336, 11.6738, 12.3098,
15.4431, 12.4387, 16.9786, 14.8162, 14.1465, 11.4639, 13.5517, 13.6961,
16.2227, 14.0447, 11.0347, 13.8711, 11.5386, 12.0848, 12.6642, 9.52355,
12.9093, 13.608, 11.5763, 16.767, 11.0056, 13.3937, 15.0797, 13.6933, 16.1657,
12.4156, 8.92121, 13.0559, 13.218, 9.12137, 13.0409, 12.3411, 13.8375, 14.2002,
15.5778, 16.0673, 14.734, 9.44301, 11.4128, 15.9887, 10.3523, 10.9879, 11.8377,
12.4681, 11.1203, 13.2968, 9.26849, 14.3356, 12.4038, 11.7793, 11.9005,
11.2376, 13.7543, 13.2509, 12.5349, 10.7658, 16.0395, 11.02, 9.3723, 11.4503,
13.7352, 13.5623, 11.9096, 10.2511, 12.1815, 12.1872, 13.6293, 14.8497, 13.558,
13.0332, 13.4698, 12.915, 14.3692, 12.6489, 12.6641, 14.8861, 14.9831, 12.9327,
12.0399, 14.0173, 10.1216, 10.3908, 10.9528, 15.7998, 11.8799, 12.1425,
14.7458, 12.9409, 12.9485, 11.3751, 11.2069, 12.6039, 14.4051, 14.7419, 12.472,
14.6028, 14.1276, 15.6626, 11.9713, 11.0306, 10.9289, 14.3648, 12.8964,
12.6677, 12.6787, 12.0857, 18.5735, 13.7794, 14.7302, 12.6859, 13.0289, 11.92,
14.8129, 11.6591, 12.016, 12.3111, 13.6481, 16.5496, 13.654, 14.851, 10.8445,
11.3532, 14.6646, 15.0441, 14.7581, 13.2142, 13.5274, 15.3121, 15.736, 16.1264,
13.6641, 14.2272, 11.0696, 9.37289, 11.3226, 12.0224, 12.9846, 12.1836, 11.585,
10.396, 10.2171, 9.70973, 11.6309, 10.1961, 13.4366, 16.8073, 10.8924, 10.6696,
13.4248, 15.3548, 11.6518, 9.01196, 13.8488, 13.9105, 14.9363, 10.8981,
16.7737, 10.3786, 11.1761, 13.3015, 12.652, 15.5676, 12.1643, 10.1794, 9.94395,
10.4524, 9.3532, 14.0838, 12.3047, 10.9587, 16.0633, 10.7984, 13.2476, 8.1035,
14.2903, 14.7179, 12.9343, 9.96246, 15.1142, 10.3205, 10.2485, 14.0969,
8.59498, 10.5089, 12.7159, 15.577, 9.41497, 14.2478, 13.5616, 12.2889, 12.0198,
13.0983, 15.6144, 14.3519, 10.5803, 11.9615, 15.2567, 10.4589, 11.052, 12.1397,
10.7556, 11.8277, 13.78, 10.8717, 13.296, 13.5247, 14.7389, 11.5188, 14.5981,
16.2615, 14.0538, 12.2079, 12.0479, 13.7225, 10.4334, 11.0768, 11.9277,
9.82713, 9.31008, 13.5464, 11.8189, 12.1112, 10.6735, 14.3165, 14.8302,
14.0871, 13.0703, 11.1847, 15.586, 16.1095, 9.54145, 13.2944, 12.9052, 11.187,
14.3097, 11.7921, 11.3915, 12.3628, 16.023, 14.3809, 13.28, 15.0442, 13.2592,
15.9537, 13.8795, 11.4151, 15.1926, 14.1151, 9.90679, 12.3633, 12.5135,
13.0972, 12.9826, 16.2152, 9.12162, 13.7289, 9.64117, 12.217, 11.8154, 13.6724,
15.2279, 11.1635, 11.0449, 16.4759, 13.8044, 14.1514, 11.6879, 13.2919,
14.3903, 13.6346, 11.1971, 10.975, 12.3589, 19.0986, 15.4591, 13.4982, 14.704,
15.5731, 12.5719, 17.1227, 13.6838, 13.4326, 10.6672, 12.3674, 14.2801,
12.4484, 12.7016, 12.1759, 13.7144, 12.0067, 10.5512, 12.0848, 10.8365, 15.2703,
18.5342, 10.6573, 14.8688, 13.989, 9.74058, 12.7361, 11.0589, 13.6839, 17.8403,
9.81788, 11.3732, 12.146, 11.5367, 15.7223, 8.44819, 14.0904, 13.5866, 15.8518,
10.5599, 17.0607, 10.5385, 12.2089, 13.5708, 13.3052, 13.9909, 15.1224,
11.9269, 14.0447, 10.545, 14.4608, 13.9337, 14.6322, 11.2523, 12.524, 13.5227,
12.7773, 9.97519, 11.9064, 13.8362, 14.1235, 12.1743, 13.2476, 13.123, 12.7086,
10.3882, 16.9732, 14.2406, 12.7842, 12.9675, 9.6559, 11.5248, 13.137, 13.7182,
16.5372, 14.0024, 11.6516, 14.9841, 10.8952, 12.0472, 14.3576, 16.438, 11.004,
12.6786, 13.084, 12.328, 13.1651, 14.8505, 9.95625, 12.1012, 16.7986, 11.9864,
16.1325, 12.3989, 11.4464, 12.116, 13.0887, 16.8171, 15.7835, 14.8423, 9.56763,
11.4018, 8.50631, 15.0497, 11.5999, 10.885, 18.2232, 16.172, 14.3922, 15.1867,
13.5686, 14.9484, 11.5597, 13.837, 14.4225, 13.8703, 12.548, 15.0079, 13.0294,
16.5992, 10.9599, 15.8985, 12.5592, 12.983, 12.1463, 15.0624, 12.5177, 15.111,
14.5668, 14.5896, 14.7038, 15.3287, 8.81298, 14.7946, 14.1529, 11.8515, 11.8022,
9.45978, 14.1744, 13.063, 14.382, 13.5806, 13.8687, 13.354, 11.7983, 15.8245,
12.1493, 12.2488, 13.6751, 12.8886, 13.5261, 15.8345, 12.1639, 13.5666,
11.3566, 10.5335, 14.5997, 9.15714, 14.1994, 13.3351, 16.4245, 9.46404,
15.3872, 11.7544, 12.5253, 13.0121, 13.554, 14.1712, 12.6049, 12.7286, 13.9574,
15.4003, 14.8738, 10.0325, 14.3044}
Соответствующие точечные несмещенные
оценки считаем по формулам 1.19 и 1.22 из теоретической части
Дальше везде будем использовать
уровень доверия =0.05.
Доверительные интервалы для
математического ожидания
При известной дисперсии интервальные
оценки считаются за формулой 1.25 из теоретической части:
где t квантиль простейшего
нормального распределения и равна при нашем уровне доверия a 1.95996.
Итак, мы имеем
При неизвестной дисперсии
где s - несмещенная оценка дисперсии, а t
- квантиль распределения Стьюдента с n-1 степенями свободы, где n
объем выборки, и уровнем доверия a. t=1.96473.
Итак, мы имеем
Доверительные интервалы для
дисперсии
Доверительный интервал для дисперсии
нормальной случайной величины имеет вид
где - квантильи распределения Хи-квадрат с n-1 степенями
свободы и уровнями доверия a/2, 1-a/2 соответственно. , . Имеем.
Сравнение средних
Наша вторая выборка X2={18.4841,
13.8801, 16.6171, 15.3487, 18.3253, 16.6705, 16.0122, 20.2528, 16.0871,
18.0075, 17.1654, 15.0251, 19.1677, 17.2417, 15.2727, 16.1137, 15.7447,
12.5086, 13.3346, 15.9126, 18.1961, 17.3272, 15.646, 18.8549, 14.1453, 18.9964,
15.0162, 15.2183, 19.276, 14.7063, 11.1617, 18.496, 14.6173, 18.8906, 19.4089,
17.1446, 16.0372, 18.558, 18.5992, 14.7145, 20.0074, 17.8624, 12.4767, 19.4354,
18.7668, 20.3248, 18.0764, 19.3568, 17.0854, 17.7232, 18.6477, 16.676, 19.6292,
16.6858, 12.0644, 17.6887, 14.6637, 17.285, 16.3673, 16.1255, 14.0755, 15.2539,
10.0661, 18.9728, 15.1412, 19.3182, 16.6347, 17.3759, 17.5463, 14.0545,
12.5761, 14.5461, 16.6579, 16.7936, 15.9432, 17.4637, 16.6092, 18.4843,
20.5341, 16.6908, 16.9978, 15.2233, 14.6123, 19.5779, 15.4697, 19.3708,
13.7997, 18.7059, 12.2848, 16.9678, 11.4802, 20.2336, 13.7249, 12.9676,
16.9598, 15.6598, 14.6629, 14.7023, 16.472, 13.4417, 15.8726, 13.9706, 16.0435,
12.617, 13.71, 19.8861, 14.1716, 16.2122, 16.9824, 14.8045, 14.2297, 18.9164,
17.3752, 13.6713, 14.7597, 16.4523, 19.495, 17.1064, 14.6517, 15.883, 15.7633,
19.6197, 18.3084, 17.6165, 17.2962, 15.4876, 13.324, 17.2412, 11.8758, 17.3929,
18.2485, 16.6315, 17.0724, 17.5126, 16.4013, 21.4996, 19.6541, 15.426, 15.2889,
15.3069, 17.235, 13.5464, 16.5392, 13.0821, 17.2075, 14.2847, 17.0106, 14.1693,
17.5812, 16.4071, 15.5361, 13.1514, 16.3374, 17.3291, 18.5168, 14.1872,
17.9999, 18.9041, 17.6814, 16.2183, 18.5062, 15.017, 17.7716, 18.53, 14.1201,
18.0728, 15.4289, 11.9553, 14.8208, 14.575, 14.6264, 13.636, 13.3054, 17.2674,
12.7864, 18.4781, 18.0806, 17.5774, 15.128, 14.2272, 15.6896, 17.7805, 19.9022,
12.5715, 15.0043, 15.0346, 17.5961, 18.4823, 19.802, 18.8305, 13.1681, 14.9899,
16.7808, 13.8836, 16.0992, 17.3327, 16.9615, 17.0025, 17.2848, 15.8942, 15.939,
14.6705, 16.7, 17.2799, 17.274, 13.3606, 16.4218, 14.2482, 18.3485, 13.1831,
17.9488, 16.1034, 14.0688, 16.8254, 16.3397, 19.2983, 17.5466, 15.5356,
14.8191, 17.5461, 13.0704, 14.5362, 15.2843, 19.9108, 19.1495, 17.125, 15.9142,
16.8174, 13.3418, 15.4905, 18.0502, 13.9924, 13.2198, 15.8423, 17.6874,
17.1372, 17.6443, 18.5108, 14.627, 16.7212, 18.8673, 16.5372, 17.1223, 14.2409,
15.3148, 16.019, 19.4363, 18.8106, 17.1839, 17.0994, 12.3592, 13.4588, 14.9765,
18.0426, 14.834, 14.9939, 14.4274, 15.9758, 16.3072, 16.9545, 15.864, 17.1065,
16.6335, 15.6076, 16.6447, 13.6761, 14.3689, 18.0512, 19.6789, 15.395, 17.5619,
11.6551, 15.4647, 12.6249, 17.0275, 16.6058, 14.8859, 16.2772, 20.095, 15.6245,
16.6791, 14.541, 18.0828, 17.8566, 13.9212, 15.0434, 16.3021, 16.8827, 17.797,
13.4567, 19.2693, 14.8951, 19.0234, 17.0603, 17.303, 15.2303, 13.8254, 18.8332,
14.4423, 18.5803, 15.9113, 14.6084, 14.8989, 17.7108, 15.1145, 17.1872,
14.9192, 15.1145, 19.4313, 13.848, 16.0032, 15.68, 16.4317, 17.5266, 13.312,
16.7246, 17.651, 20.0043, 15.1647, 13.1056, 16.2351, 17.2234, 15.2573, 15.4131,
15.6497, 16.1855, 16.4206, 17.9337, 16.4637, 18.5612, 15.2519, 12.6024,
14.3342, 13.7856, 16.4009, 17.1675, 13.5805, 21.3915, 14.5717, 18.4119,
16.5502, 16.9018, 16.582, 15.4481, 17.8183, 15.5953, 17.6724, 15.332, 16.419,
15.3531, 17.3174, 15.5197, 13.5655, 17.2505, 17.738, 10.0235, 16.2913, 16.9026,
18.7152, 15.8788, 14.0904, 15.8956, 17.1737, 19.1625, 17.7876, 17.2575,
15.6554, 14.9085, 15.8792, 16.2812, 15.0989, 12.7978, 18.4586, 17.5484,
18.0499, 19.1746, 17.2792, 14.839, 14.3487, 17.9523, 19.4002, 16.334, 13.6437,
15.6316, 15.2879, 19.703, 15.6022, 20.4994, 15.8404, 15.019, 15.3496, 13.8247,
14.6556, 18.4491, 19.3008, 15.845, 13.5431, 15.2344, 16.6239, 15.0377, 17.4887,
20.6674, 16.0903, 16.1893, 16.7251, 14.6165, 16.1787, 16.4978, 16.8266,
16.0446, 17.4686, 15.9482, 20.0099, 16.1609, 17.8377, 15.09, 16.488, 19.3539,
14.8523, 15.7623, 17.7746, 17.1619, 17.2304, 16.0315, 17.7597, 12.6447,
17.0458, 18.4135, 17.5565, 20.8714, 17.4764, 16.7475, 16.156, 16.3822, 16.0135,
14.1168, 14.043, 17.9777, 14.4143, 15.7517, 14.2126, 13.8027, 14.126, 17.5901,
16.1275, 19.1365, 17.3943, 15.3526, 14.0667, 17.7619, 17.1956, 20.0557,
15.6903, 11.0679, 17.3293, 13.4062, 13.8396, 13.1222, 15.1023, 16.077, 19.5054,
18.5469, 19.0121, 17.7021, 16.5541, 13.6299, 19.8634, 16.6109, 14.7181,
14.7189, 17.5396, 15.1814, 15.8216, 16.6516, 14.563, 19.0091, 18.1088, 11.3591,
16.4887, 14.2826, 13.1627, 16.5748, 14.3471, 12.7295, 18.8873, 15.9221,
15.3578, 16.7349, 14.325, 16.9268, 15.2661, 11.1863, 16.6728, 15.552, 12.481,
16.8641, 14.9446, 16.8495, 16.2382, 15.8546}
Количество элементов выборки n=500.
Выдвигаем гипотезу Н0 о том что
средние значения выборок Х1 и Х2 совпадают. Н1 конкурирующая гипотеза
Несмещенные оценки для этой выбоки:
Величина равна S=2.01254.
Критерий равен -571.892. Он попадает в критическую область которую задает
нам квантиль распределения Стьюдента со n+-2 степенями свободы и уровнем
доверия , которая равна 1.64638. Таким образом гипотеза Н0
опровергается.
Критерий Хи-квадрат для проверки
гипотезы о виде распределения
Рассмотрим нашу выборку Х1.
Гипотеза Н0:
Предположим, что это реализация
случайной величины, имеющей нормальное распределение с параметрами
Гипотеза Н1: опровергаем это.
Случайная величина характеризует согласованность гипотезы Н0 с опытными данными.
Здесь m - количество интервалов, на которые разбивается числовая ось, mi
- количество значений из реализации попавшей в і-тый интервал (для
100<=n <=500 10<=m<=30, в нашем случае m=30). А рi - значение гипотетической
вероятности на заданных интервалах.
Частоты попадания в интервалы
Гипотетические вероятности на этих
интервалах
{0.001702, 0.00288073, 0.00469005,
0.00734487, 0.0110642, 0.0160321, 0.0223455, 0.0299586, 0.0386354, 0.0479271,
0.0571884, 0.0656396, 0.0724697, 0.0769624, 0.0786199, 0.0772536, 0.0730191,
0.0663874, 0.0580586, 0.0488405, 0.0395207, 0.030761, 0.0230308, 0.0165863,
0.01149, 0.00765635, 0.00490745, 0.00302566, 0.00179439, 0.00102363}
Значение
А квантиль распределения Хи-квадрат m-2-1
степенями свободы и уровнем доверия a, которая задает критическую область, равна 40.1133.
Следовательно, наша гипотеза о виде распределения случайной величины
подтвердилась.
Выводы
На протяжении работы над данной
темой были углублены знания в области теории вероятностей и математической
статистики, которые позволили приобрести навыки в решении практических задач.
Работая над этой темой убедились в необходимости и важности изучения теории
вероятности и математической статистики.
Полученные знания позволят более
уверено ориентироваться в заданной области науки, что может быть полезно в
дальнейшем, как в изучение других наук, так и в углубление своих знаний в
данной отрасли.