Статистика измерений

  • Вид работы:
    Дипломная (ВКР)
  • Предмет:
    Математика
  • Язык:
    Русский
    ,
    Формат файла:
    MS Word
    1,08 Mb
  • Опубликовано:
    2012-02-11
Вы можете узнать стоимость помощи в написании студенческой работы.
Помощь в написании работы, которую точно примут!

Статистика измерений

Содержание

вероятность измерение математическая статистика

Исходные данные

Введение

.        Определение закона распределения вероятностей результатов измерения

.        Проверка соответствия эмпирического распределения теоретическому

.        Определение доверительного интервала, в котором лежит значение измеряемой величины

Заключение

Список использованной литературы

Исходные данные

Данные по выборке - вариант 30 - для расчета

1,08

0,55

0,62

0,04

0,54

0,14

0,03

0,02

0,63

0,18

0,88

0,17

0,54

0,01

0,18

0,45

0,34

0,07

0,14

0,16

0,27

0,30

0,17

0,01

0,31

0,56

0,18

0,15

1,00

0,44

0,03

0,10

0,31

0,03

0,31

0,34

0,09

0,10

0,53

0,12

0,33

0,73

0,53

0,14

0,12

0,84

1,19

0,38

0,64

0,89

0,10

0,12

0,24

0,77

0,25

1,00

0,10

0,12

0,32

0,99

0,59

0,38

0,51

0,24

0,27

0,16

0,30

0,05

0,15

0,97

0,04

0,39

0,31

1,20

1,15

0,05

0,30

0,16

0,04

0,17

0,07

0,17

0,18

0,13

0,35

1,52

0,08

0,04

0,10

0,03

0,20

0,08

0,54

0,07

0,05

0,15

0,16

0,46

0,07

0,11

0,83

0,05

0,39

0,24

0,55

0,00

0,14

0,58

0,43

0,05

0,33

0,48

0,48

0,00

0,62

1,25

1,56

0,14

0,29

0,80

0,11

0,43

0,20

0,97

0,44

0,04

0,81

0,11

0,04

0,40

0,14

0,06

0,04

0,03

0,27

0,34

0,28

0,08

2,34

0,12

0,62

0,14

1,00

1,32

0,02

0,28

0,47

0,14

0,65

1,25

0,19

0,25

0,40

0,35

0,16

0,00

0,63

0,11

0,08

0,15

0,12

0,18

0,20

0,46

0,23

0,13

0,15

0,07

0,00

0,15

0,17

0,22

0,26

0,02

0,45

0,10

0,15

0,14

0,19

0,26

0,00

0,16

0,58

0,36

0,14

0,28

0,12

0,23

0,07

0,32

1,79

0,06

0,03

0,14

0,10

0,01

0,33

0,03

0,26

0,04

0,02

1,08

0,60

0,71

0,71

0,18

0,13

0,07

0,10

0,00

0,52

0,31

0,18

0,01

0,32

0,70

0,09

1,02

2,10

0,28

0,25

0,09

0,19

0,02

0,05

0,23

0,09

0,45

0,07

0,19

0,21

0,11

0,10

0,02

0,07

0,30

0,98

0,09

2,34

0,62

0,13

0,35

0,07

0,00

0,40

0,04

0,76

0,64

0,39

0,18


Введение

Математическая статистика - раздел математики, который занимается разработкой методов получения научно обоснованных выводов о массовых явлениях и процессах по данным наблюдений или экспериментов. Например, по имеющейся информации о числе бракованных изделий в партии готовой продукции надо сделать вывод о качестве используемого технологического процесса.

Математическая статистика предполагает вероятностную природу данных наблюдений, поэтому она основана на понятиях и методах теории вероятностей.

Задачи математической статистики в известной мере являются обратными к задачам теории вероятностей. Если в теории вероятностей вероятностную модель случайного явления считают заданной и делают расчет вероятностей интересующих событий, то в математической статистике исходят из того, что вероятностная модель не задана (или задана не полностью), а в результате эксперимента стали известны реализации каких-либо случайных событий. На основе статистических данных математическая статистика подбирает подходящую вероятностную модель для получения вывода о рассматриваемом явлении или процессе.

В настоящее время математическая статистика является обширным разделом математики.

Общая характеристика работы

Цель работы: закрепить пройденный материал по математической статистике

Задачи, поставленные перед автором работы:

. Составить статистическое распределение выборки значений данной случайной величины. Построить сгруппированный ряд.

. Построить полигон относительных частот, эмпирическую функцию распределения, кумулянту и гистограмму, выдвинуть гипотезу о виде распределения для простого и сгруппированного ряда распределения.

. Найти точечные оценки неизвестных числовых характеристик: .

. Найти интервальные оценки параметров M(X), s (X), в предположении, что X » N ( a ,s ) с надёжностью 0,95.

. Проверить гипотезы:при различных конкурирующих гипотезах с уровнем значимости: 0,05.

. Проверить гипотезу о нормальном распределении исследуемого

распределения с уровнем значимости 0,05: .

. Полученные результаты проанализировать и сделать общие выводы.

Актуальность работы:

В начале 30-х годов на стыке экономической практики и математической статистики зародилась новая самостоятельная дисциплина, получившая название "Эконометрика1". Математическая статистика является универсальным аппаратом, используемым в различных эконометрических исследованиях.

Работа исследователя обязательно содержит этап математической обработки результатов проведенных экспериментов. Современная научно-исследовательская аппаратура имеет встроенные процессоры и сопряжение с персональными компьютерами, что позволяет автоматизировать определенные этапы математической обработки получаемой информации. Этот процесс облегчает технику вычислений, но требует от исследователя принципиального знания используемых методов, их достоинств, недостатков и границ их применимости.

Современная математическая статистика разрабатывает способы определения числа необходимых испытаний до начала исследования (планирования эксперимента), в ходе исследования (последовательный анализ). Её можно определить как науку о принятии решений в условии неопределённости.

Данная работа выполнялась на персональном компьютере с использованием Excel и профессионального пакета программ версии Statistic 9.5.8.

Анализ распределений направлен на выявление закономерности изменения частот в зависимости от значений варьирующего признака и анализ различных характеристик изучаемого распределения. Прежде, чем приступить к вычислению специальных статистических показателей, необходимо из исходной совокупности исключить единицы, не подчиняющиеся общей закономерности распределения, так называемые выбросы. Выбросы - это значения признака, резко отличающиеся как в большую, так и в меньшую сторону, от значений признака основной части единиц совокупности .

Для локализации и устранения выбросов необходимо, прежде всего, ранжировать исходные данные. Затем, в ППП Statistic 9.5.8. строится график Box plot на основании ранжированной совокупности. Единицы совокупности, обозначенные на графике звёздочками (*), являются выбросами, которые необходимо исключить из изучаемой совокупности (данная процедура использовалась только для контроля получаемых результатов).

Вариационным называется ряд распределения, построенный по количественному признаку. Он может быть представлен в виде таблицы и графически. Табличное представление позволяет не только выявить ту или иную закономерность распределения, но и подробно охарактеризовать структуру изучаемой совокупности.

Таблицы вариационных рядов строятся по принципам группировки. Известные проблемы возникают при определении числа групп, поскольку формула Стерджеса, рекомендуемая для этих целей, дает приемлемые результаты только в условиях больших статистических совокупностей. Процесс определения числа выделяемых групп, в значительной степени, носит творческий характер и требует от исследователя применения не только теоретических знаний, но и практического опыта и интуиции.

Формула Стерджеса:

,

где k - число групп; N - объем совокупности.

Использование ППП значительно упрощает задачу табличного представления вариационного ряда, поскольку позволяет с малыми временными затратами просмотреть несколько таблиц с разным числом групп и размером группировочного интервала. Конечный вариант таблицы должен отвечать следующим требованиям: в таблице не должно быть малонаполненных и нулевых групп; нужно стремиться к получению мономодального распределения (т.е. по обе стороны от максимальной частоты должно наблюдаться закономерное убывание частот). Если не удается избавиться от многовершинности в распределении, это, как правило, означает, что изучаемая статистическая совокупность неоднородна и требует более детального изучения. В этих условиях следует либо работать с выбросами, либо, если единицы совокупности не подчиняются единой закономерности распределения, разбить совокупность на объективно существующие группы, и анализировать их раздельно.

Ряд распределения - это распределение единиц совокупности по значению того или иного признака. Комплексный анализ ряда распределения включает:

-       Табличное и графическое представление ряда распределения;

-       Расчёт и анализ показателей центра и структуры распределения;

-       Расчёт и анализ показателей вариации;

-       Характеристику формы распределения;

-       Выбор теоретического распределения, которому соответствует изучаемое эмпирическое [1].

Ряды распределения могут быть:

)        Вариационными;

)        Атрибутивными.

Одна из важнейших целей изучения рядов распределения состоит в том, чтобы выявить закономерность распределения и определить ее характер. Закономерности распределения наиболее отчетливо проявляются только при большом количестве наблюдений (т.н. закон больших чисел).

.       
Определение закона распределения вероятностей результатов измерений

Весь массив экспериментальных данных характеризует результат измерения Х. Он может быть также описан с помощью функции распределения вероятности. Но необходимо проверить, не было ли допущено ошибок при получении отдельных значений результата измерений.

Все результаты заданной группировки результатов измерений, ранжируем в порядке возрастания. Они представляют собой вариационный ряд.

Сведем в таблицу 1 все данные и вычислим основные «оценочные» характеристики.

Таблица 1. Обработка результатов измерений.

х

m

mx

x -



1

0.00

7

0,00

-0,34

0,1156

0,8092

2

0.01

4

0,04

-0,33

0,1089

0,4356

3

0.02

6

0,12

-0,32

0,1024

0,6144

4

0.03

7

0,21

-0,31

0,0961

0,6727

5

0.04

9

0,36

-0,30

0,0900

0,8100

6

0,05

6

0,30

-0,29

0,5046

7

0,06

2

0,12

-0,28

0,0784

0,1568

8

0,07

10

0,70

-0,27

0,0729

0,7290

9

0,08

4

0,32

-0,26

0,0676

0,2704

10

0,09

5

0,45

-0,25

0,0625

0,3125

11

0,10

9

0,90

-0,24

0,0576

0,5184

12

0,11

5

0,55

-0,23

0,0529

0,2645

13

0,12

7

0,84

-0,22

0,0484

0,3388

14

0,13

4

0,52

-0,21

0,0441

0,1764

15

0,14

11

1,54

-0,20

0,0400

0,4400

16

0,15

7

1,05

-0,19

0,0361

0,2527

17

0,16

6

0,96

-0,18

0,0324

0,1944

18

0,17

5

0,85

-0,17

0,0289

0,1445

19

0,18

8

1,44

-0,16

0,0256

0,2048

20

0,19

4

0,76

-0,15

0,0225

0,0900

21

0,20

3

0,60

-0,14

0,0196

0,0588

22

0,21

1

0,21

-0,13

0,0169

0,0169

23

0,22

1

0,22

-0,12

0,0144

0,0144

24

0,23

3

0,69

-0,11

0,0121

0,0363

25

0,24

3

0,72

-0,10

0,0100

0,0300

26

0,25

3

0,75

-0,09

0,0081

0,0243

27

0,26

3

0,78

-0,08

0,0064

0,0192

28

0,27

3

0,81

-0,07

0,0049

0,0147

29

0,28

4

1,12

-0,06

0,0036

0,0144

30

0,29

1

0,29

-0,05

0,0025

0,0025

31

0,30

4

1,20

-0,04

0,0016

0,0064

32

0,31

5

1,55

-0,03

0,0009

0,0045

33

0,32

3

0,96

-0,02

0,0004

0,0012

34

0,33

3

0,99

-0,01

0,0001

0,0003

35

0,34

3

1,02

0,00

0,0000

0,0000

36

0,35

3

1,05

0,01

0,0001

0,0003

37

0,36

1

0,36

0,02

0,0004

0,0004

38

0,38

2

0,76

0,04

0,0016

0,0032

39

0,39

3

1,17

0,05

0,0025

0,0075

40

0,40

3

1,20

0,06

0,0036

0,0108

41

0,43

2

0,86

0,09

0,0081

0,0162

42

0,44

2

0,88

0,10

0,0100

0,0200

43

0,45

3

1,35

0,11

0,0121

0,0363

44

0,46

2

0,92

0,12

0,0144

0,0288

45

0,47

1

0,47

0,13

0,0169

0,0169

46

0,48

2

0,96

0,14

0,0196

0,0392

47

0,51

1

0,51

0,17

0,0289

0,0289

48

0,52

1

0,52

0,18

0,0324

0,0324

49

0,53

2

1,06

0,19

0,0361

0,0722

50

0,54

3

1,62

0,20

0,0400

0,1200

51

0,55

2

1,10

0,21

0,0441

0,0882

52

0,56

1

0,56

0,22

0,0484

0,0484

53

0,58

2

1,16

0,24

0,0576

0,1152

54

0,59

1

0,59

0,25

0,0625

0,0625

55

0,60

1

0,60

0,26

0,0676

0,0676

56

0,62

4

2,48

0,28

0,0784

57

0,63

2

1,26

0,29

0,0841

0,1682

58

0,64

2

1,28

0,30

0,0900

0,1800

59

0,65

1

0,65

0,31

0,0961

0,0961

60

0,70

1

0,70

0,36

0,1296

0,1296

61

0,71

2

1,42

0,37

0,1369

0,2738

62

0,73

1

0,73

0,39

0,1521

0,1521

63

0,76

1

0,76

0,42

0,1764

0,1764

64

0,77

1

0,77

0,43

0,1849

0,1849

65

0,80

1

0,80

0,46

0,2116

0,2116

66

0,81

1

0,81

0,47

0,2209

0,2209

67

0,83

1

0,83

0,49

0,2401

0,2401

68

0,84

1

0,84

0,50

0,2500

0,2500

69

0,88

1

0,88

0,54

0,2916

0,2916

70

0,89

1

0,89

0,55

0,3025

0,3025

71

0,97

2

1,94

0,63

0,3969

0,7938

72

0,98

1

0,98

0,64

0,4096

0,4096

73

0,99

1

0,99

0,65

0,4225

0,4225

74

1,00

3

3,00

0,66

0,4356

1,3068

75

1,02

1

1,02

0,68

0,4624

0,4624

76

1,08

2

2,16

0,74

0,5476

1,0952

77

1,15

1

1,15

0,81

0,6561

0,6561

78

1,19

1

1,19

0,85

0,7225

0,7225

79

1,20

1

1,20

0,86

0,7396

0,7396

80

1,25

2

2,50

0,91

0,8281

1,6562

81

1,32

1

1,32

0,98

0,9604

0,9604

82

1,52

1

1,52

1,18

1,3924

1,3924

83

1,56

1

1,56

1,22

1,4884

1,4884

84

1,79

1

1,79

1,45

2,1025

2,1025

85

2,10

1

2,10

1,76

3,0976

3,0976

86

2,34

2

4,68

2,00

4,0000

8,0000









Сумма

250

85,84



37,496


. Определим среднюю арифметическую значений заданной выборки:

 =  

=  = 0.34336  0.34.

Для того, чтобы использовать данную формулу в Excel, вводим исходные данные в таблицу, устанавливаем курсор в свободную ячейку и вызываем Мастер функций. В открывшимся диалоговом окне выбираем категорию Статистические. В нашем случае - взвешенная средняя арифметическая. Для ее вычисления используем комбинацию функций СУММПРОИЗВ и СУММ.

В качестве диапазона значений указываем ячейки, содержащие наши числовые данные. Клик по ОК завершит процесс вычисления. Среднее арифметическое отображается в выделенной ячейке.

Для характеристики величины возможных колебаний наблюдаемых единиц совокупности необходимо вычислить: средний квадрат отклонения (дисперсия) и среднее квадратическое отклонение.

. Определяем несмещенный центр дисперсии результата измерения.

 = ;

=  = 0.1506.

. Определяем среднее квадратическое отклонение.

S = σ =  .

σ =  = 0,388  0,4.

Формулы в Excel для их вычисления: СРОТКЛ и КВАДРОТКЛ.

. Для исключения из выборки ошибок определим: 3σ = 3*0,388 = 1,164.

И исключим значения хi , отличающиеся от среднего значения больше чем на 3σ:

/х - /  3σ.

Это будут значения под номерами: №№ 82 - 86.

Будем работать с членами вариационного ряда под номерами 1 - 81 (таблица 2). И вычислим для этого диапазона те же характеристики.

Таблица 2.Вариационный ряд с исключенными промахами 82 - 86.

х

m

mx

x -



1

0.00

7

0,00

-0,34

0,1156

0,8092

2

0.01

4

0,04

-0,33

0,1089

0,4356

3

0.02

6

0,12

-0,32

0,1024

0,6144

4

0.03

7

0,21

-0,31

0,0961

0,6727

5

0.04

9

0,36

-0,30

0,0900

0,8100

6

0,05

6

0,30

-0,29

0,0841

0,5046

7

0,06

2

0,12

-0,28

0,0784

0,1568

8

0,07

10

0,70

-0,27

0,0729

0,7290

9

0,08

4

0,32

-0,26

0,0676

0,2704

10

0,09

5

0,45

-0,25

0,0625

0,3125

11

0,10

9

0,90

-0,24

0,0576

0,5184

12

0,11

5

0,55

-0,23

0,0529

0,2645

13

0,12

7

0,84

-0,22

0,0484

0,3388

14

0,13

4

0,52

-0,21

0,0441

0,1764

15

0,14

11

1,54

-0,20

0,0400

0,4400

16

0,15

7

1,05

-0,19

0,0361

0,2527

0,16

6

0,96

-0,18

0,0324

0,1944

18

0,17

5

0,85

-0,17

0,0289

0,1445

19

0,18

8

1,44

-0,16

0,0256

0,2048

20

0,19

4

0,76

-0,15

0,0225

0,0900

21

0,20

3

0,60

-0,14

0,0196

0,0588

22

0,21

1

0,21

-0,13

0,0169

0,0169

23

0,22

1

0,22

-0,12

0,0144

0,0144

24

0,23

3

0,69

-0,11

0,0121

0,0363

25

0,24

3

0,72

-0,10

0,0100

0,0300

26

0,25

3

0,75

-0,09

0,0081

0,0243

27

0,26

3

0,78

-0,08

0,0064

0,0192

28

0,27

3

0,81

-0,07

0,0049

0,0147

29

0,28

4

1,12

-0,06

0,0036

0,0144

30

0,29

1

0,29

-0,05

0,0025

0,0025

31

0,30

4

1,20

-0,04

0,0016

0,0064

32

0,31

5

1,55

-0,03

0,0009

0,0045

33

0,32

3

0,96

-0,02

0,0004

0,0012

34

0,33

3

0,99

-0,01

0,0001

0,0003

35

0,34

3

1,02

0,00

0,0000

0,0000

36

0,35

3

1,05

0,01

0,0001

0,0003

37

0,36

1

0,36

0,02

0,0004

0,0004

38

0,38

2

0,76

0,04

0,0016

0,0032

39

0,39

3

1,17

0,05

0,0025

0,0075

40

0,40

3

1,20

0,06

0,0036

0,0108

41

0,43

2

0,86

0,09

0,0081

0,0162

42

0,44

2

0,88

0,10

0,0100

0,0200

43

0,45

3

1,35

0,11

0,0121

0,0363

44

0,46

2

0,92

0,12

0,0144

0,0288

45

0,47

1

0,47

0,13

0,0169

0,0169

46

0,48

2

0,96

0,14

0,0196

0,0392

47

0,51

1

0,51

0,17

0,0289

0,0289

48

0,52

1

0,52

0,18

0,0324

0,0324

49

0,53

2

1,06

0,19

0,0361

0,0722

50

0,54

3

1,62

0,20

0,0400

0,1200

51

0,55

2

1,10

0,21

0,0441

0,0882

52

0,56

1

0,56

0,22

0,0484

0,0484

53

0,58

2

1,16

0,24

0,0576

0,1152

54

0,59

1

0,59

0,25

0,0625

0,0625

55

0,60

1

0,60

0,26

0,0676

0,0676

56

0,62

4

2,48

0,28

0,0784

0,3136

57

0,63

2

1,26

0,29

0,0841

0,1682

58

0,64

2

1,28

0,30

0,0900

0,1800

59

0,65

1

0,65

0,31

0,0961

0,0961

60

0,70

1

0,70

0,36

0,1296

0,1296

61

0,71

2

1,42

0,37

0,1369

0,2738

62

0,73

1

0,73

0,39

0,1521

0,1521

63

0,76

1

0,76

0,42

0,1764

0,1764

64

0,77

1

0,77

0,43

0,1849

0,1849

65

0,80

1

0,80

0,46

0,2116

0,2116

66

0,81

1

0,81

0,47

0,2209

0,2209

67

1

0,83

0,49

0,2401

0,2401

68

0,84

1

0,84

0,50

0,2500

0,2500

69

0,88

1

0,88

0,54

0,2916

0,2916

70

0,89

1

0,89

0,55

0,3025

0,3025

71

0,97

2

1,94

0,63

0,3969

0,7938

72

0,98

1

0,98

0,64

0,4096

0,4096

73

0,99

1

0,99

0,65

0,4225

0,4225

74

1,00

3

3,00

0,66

0,4356

1,3068

75

1,02

1

1,02

0,68

0,4624

0,4624

76

1,08

2

2,16

0,74

0,5476

1,0952

77

1,15

1

1,15

0,81

0,6561

0,6561

78

1,19

1

1,19

0,85

0,7225

0,7225

79

1,20

1

1,20

0,86

0,7396

0,7396

80

1,25

2

2,50

0,91

0,8281

1,6562

81

1,32

1

1,32

0,98

0,9604

0,9604


Сумма

244

74,19



21,4151


а.Средняя арифметическая значений заданной выборки:

 =  

=  = 0,304.

б.Несмещенный центр дисперсии результата измерения.

 = ;

=  = 0,088.

σ =  = 0,297.

σ = 3*0,297 = 0,891.

Вновь отбрасываем «ошибочные» значения №№ 80, 81.

Таблица 3.Вариационный ряд с исключенными промахами 81 и 82.

№хmmxx -







1

0.00

7

0,00

-0,34

0,1156

0,8092

2

0.01

4

0,04

-0,33

0,1089

0,4356

3

0.02

6

0,12

-0,32

0,1024

0,6144

4

0.03

7

0,21

-0,31

0,0961

0,6727

5

0.04

9

0,36

-0,30

0,0900

0,8100

6

0,05

6

0,30

-0,29

0,0841

0,5046

7

0,06

2

0,12

-0,28

0,0784

0,1568

8

0,07

10

0,70

-0,27

0,0729

0,7290

9

0,08

4

0,32

-0,26

0,0676

0,2704

10

0,09

5

0,45

-0,25

0,0625

0,3125

11

0,10

9

0,90

-0,24

0,0576

0,5184

12

0,11

5

0,55

-0,23

0,0529

0,2645

13

0,12

7

0,84

-0,22

0,0484

0,3388

14

0,13

4

0,52

-0,21

0,0441

0,1764

15

0,14

11

1,54

-0,20

0,0400

0,4400

16

0,15

7

1,05

-0,19

0,0361

0,2527

17

0,16

6

0,96

-0,18

0,0324

0,1944

18

0,17

5

0,85

-0,17

0,0289

0,1445

19

0,18

8

1,44

-0,16

0,0256

0,2048

20

0,19

4

0,76

-0,15

0,0225

0,0900

21

0,20

3

0,60

-0,14

0,0196

0,0588

22

0,21

1

0,21

-0,13

0,0169

0,0169

23

0,22

1

0,22

-0,12

0,0144

0,0144

24

0,23

3

0,69

-0,11

0,0121

0,0363

25

0,24

3

0,72

-0,10

0,0100

0,0300

26

0,25

3

0,75

-0,09

0,0081

0,0243

27

0,26

3

0,78

-0,08

0,0064

0,0192

28

0,27

3

0,81

-0,07

0,0049

0,0147

29

0,28

4

1,12

-0,06

0,0036

0,0144

30

0,29

1

0,29

-0,05

0,0025

0,0025

31

0,30

4

1,20

-0,04

0,0016

0,0064

32

0,31

5

1,55

-0,03

0,0009

0,0045

33

0,32

3

0,96

-0,02

0,0004

0,0012

34

3

0,99

-0,01

0,0001

0,0003

35

0,34

3

1,02

0,00

0,0000

0,0000

36

0,35

3

1,05

0,01

0,0001

0,0003

37

0,36

1

0,36

0,02

0,0004

0,0004

38

0,38

2

0,76

0,04

0,0016

0,0032

39

0,39

3

1,17

0,05

0,0025

0,0075

40

0,40

3

1,20

0,06

0,0036

0,0108

41

0,43

2

0,86

0,09

0,0081

0,0162

42

0,44

2

0,88

0,10

0,0100

0,0200

43

0,45

3

1,35

0,11

0,0121

0,0363

44

0,46

2

0,92

0,12

0,0144

0,0288

45

0,47

1

0,47

0,13

0,0169

0,0169

46

0,48

2

0,96

0,14

0,0196

0,0392

47

0,51

1

0,51

0,17

0,0289

0,0289

48

0,52

1

0,52

0,18

0,0324

0,0324

49

0,53

2

1,06

0,19

0,0361

0,0722

50

0,54

3

1,62

0,20

0,0400

0,1200

51

0,55

2

1,10

0,21

0,0441

0,0882

52

0,56

1

0,56

0,22

0,0484

0,0484

53

0,58

2

1,16

0,24

0,0576

0,1152

54

0,59

1

0,59

0,25

0,0625

0,0625

55

0,60

1

0,60

0,26

0,0676

0,0676

56

0,62

4

2,48

0,28

0,0784

0,3136

57

0,63

2

1,26

0,29

0,0841

0,1682

58

0,64

2

1,28

0,30

0,0900

0,1800

59

0,65

1

0,65

0,31

0,0961

0,0961

60

0,70

1

0,70

0,36

0,1296

0,1296

61

0,71

2

1,42

0,37

0,1369

0,2738

62

0,73

1

0,73

0,39

0,1521

0,1521

63

0,76

1

0,76

0,42

0,1764

0,1764

64

0,77

1

0,77

0,43

0,1849

0,1849

65

0,80

1

0,80

0,46

0,2116

0,2116

66

0,81

1

0,81

0,47

0,2209

0,2209

67

0,83

1

0,83

0,49

0,2401

0,2401

68

0,84

1

0,84

0,50

0,2500

0,2500

69

0,88

1

0,88

0,54

0,2916

0,2916

70

0,89

1

0,89

0,55

0,3025

0,3025

71

0,97

2

1,94

0,63

0,3969

0,7938

72

0,98

1

0,98

0,64

0,4096

0,4096

73

0,99

1

0,99

0,65

0,4225

0,4225

74

1,00

3

3,00

0,66

0,4356

1,3068

75

1,02

1

1,02

0,68

0,4624

0,4624

76

1,08

2

2,16

0,74

0,5476

1,0952

77

1,15

1

1,15

0,81

0,6561

0,6561

78

1,19

1

1,19

0,85

0,7225

0,7225

79

1,20

1

1,20

0,86

0,7396

0,7396


Сумма

241

70,37



18,7985


а.Средняя арифметическая значений заданной выборки:

 =  

=  = 0,29.

б.Несмещенный центр дисперсии результата измерения.

 = ;

=  = 0,078327.

σ =  = 0,28.

σ = 3*0,28 = 0,84.

Вновь отбрасываем «ошибочные» значения №№ 78, 79.

Таблица 4.Вариационный ряд с исключенными промахами 78 и 79.

№хmmxx -







1

0.00

7

0,00

-0,34

0,1156

0,8092

2

0.01

4

0,04

-0,33

0,1089

0,4356

3

6

0,12

-0,32

0,1024

0,6144

4

0.03

7

0,21

-0,31

0,0961

0,6727

5

0.04

9

0,36

-0,30

0,0900

0,8100

6

0,05

6

0,30

-0,29

0,0841

0,5046

7

0,06

2

0,12

-0,28

0,0784

0,1568

8

0,07

10

0,70

-0,27

0,0729

0,7290

9

0,08

4

0,32

-0,26

0,0676

0,2704

10

0,09

5

0,45

-0,25

0,0625

0,3125

11

0,10

9

0,90

-0,24

0,0576

0,5184

12

0,11

5

0,55

-0,23

0,0529

0,2645

13

0,12

7

0,84

-0,22

0,0484

0,3388

14

0,13

4

0,52

-0,21

0,0441

0,1764

15

0,14

11

1,54

-0,20

0,0400

0,4400

16

0,15

7

1,05

-0,19

0,0361

0,2527

17

0,16

6

0,96

-0,18

0,0324

0,1944

18

0,17

5

0,85

-0,17

0,0289

0,1445

19

0,18

8

1,44

-0,16

0,0256

0,2048

20

0,19

4

0,76

-0,15

0,0225

0,0900

21

0,20

3

0,60

-0,14

0,0196

0,0588

22

0,21

1

0,21

-0,13

0,0169

0,0169

23

0,22

1

0,22

-0,12

0,0144

0,0144

24

0,23

3

0,69

-0,11

0,0121

0,0363

25

0,24

3

0,72

-0,10

0,0100

0,0300

26

0,25

3

0,75

-0,09

0,0081

0,0243

27

0,26

3

0,78

-0,08

0,0064

0,0192

28

0,27

3

0,81

-0,07

0,0049

0,0147

29

0,28

4

1,12

-0,06

0,0036

0,0144

30

0,29

1

0,29

-0,05

0,0025

0,0025

31

0,30

4

1,20

-0,04

0,0016

0,0064

32

0,31

5

1,55

-0,03

0,0009

0,0045

33

0,32

3

0,96

-0,02

0,0004

0,0012

34

0,33

3

0,99

-0,01

0,0001

0,0003

35

0,34

3

1,02

0,00

0,0000

0,0000

36

0,35

3

1,05

0,01

0,0001

0,0003

37

0,36

1

0,36

0,02

0,0004

0,0004

38

0,38

2

0,76

0,04

0,0016

0,0032

39

0,39

3

1,17

0,05

0,0025

0,0075

40

0,40

3

1,20

0,06

0,0036

0,0108

41

0,43

2

0,86

0,09

0,0081

0,0162

42

0,44

2

0,88

0,10

0,0100

0,0200

43

0,45

3

1,35

0,11

0,0121

0,0363

44

0,46

2

0,92

0,12

0,0144

0,0288

45

0,47

1

0,47

0,13

0,0169

0,0169

46

0,48

2

0,96

0,14

0,0196

0,0392

47

0,51

1

0,51

0,17

0,0289

0,0289

48

0,52

1

0,52

0,18

0,0324

0,0324

49

0,53

2

1,06

0,19

0,0361

0,0722

50

0,54

3

1,62

0,20

0,0400

0,1200

51

0,55

2

1,10

0,21

0,0441

0,0882

52

0,56

1

0,56

0,22

0,0484

0,0484

53

0,58

1,16

0,24

0,0576

0,1152

54

0,59

1

0,59

0,25

0,0625

0,0625

55

0,60

1

0,60

0,26

0,0676

0,0676

56

0,62

4

2,48

0,28

0,0784

0,3136

57

0,63

2

1,26

0,29

0,0841

0,1682

58

0,64

2

1,28

0,30

0,0900

0,1800

59

0,65

1

0,65

0,31

0,0961

0,0961

60

0,70

1

0,70

0,36

0,1296

0,1296

61

0,71

2

1,42

0,37

0,1369

0,2738

62

0,73

1

0,73

0,39

0,1521

0,1521

63

0,76

1

0,76

0,42

0,1764

0,1764

64

0,77

1

0,77

0,43

0,1849

0,1849

65

0,80

1

0,80

0,46

0,2116

0,2116

66

0,81

1

0,81

0,47

0,2209

0,2209

67

0,83

1

0,83

0,49

0,2401

0,2401

68

0,84

1

0,84

0,50

0,2500

0,2500

69

0,88

1

0,88

0,54

0,2916

0,2916

70

0,89

1

0,89

0,55

0,3025

0,3025

71

0,97

2

1,94

0,63

0,3969

0,7938

72

0,98

1

0,98

0,64

0,4096

0,4096

73

0,99

1

0,99

0,65

0,4225

0,4225

74

1,00

3

3,00

0,66

0,4356

1,3068

75

1,02

1

1,02

0,68

0,4624

0,4624

76

1,08

2

2,16

0,74

0,5476

1,0952

77

1,15

1

1,15

0,81

0,6561

0,6561


Сумма

239

67,98



17,3364


а.Средняя арифметическая значений заданной выборки:

 =  

=  = 0,2844.

б.Несмещенный центр дисперсии результата измерения.

 = ;

=  = 0,072842.

σ =  = 0,27.

3σ = 3*0,27 = 0,81.

И теперь ни одно из оставшихся значений х не отличается от среднего арифметического больше чем на 3σ. Можно, следовательно, считать, что среди них нет ошибочных.

. Рассчитаем следующие дополнительные числовые характеристики полученного статистического ряда:

Размах варьирования.

Размах варьирования вычисляется по формуле:

 

где R - размах варьирования;max - максимальный элемент вариационного ряда;min - минимальный элемент вариационного ряда;max= 1,15min = 0,00= 1,15 - 0,00 = 1,15

Определение моды

Модой называют варианту с наибольшей частотой повторений.

Из исходной таблицы находим, что наибольшую частоту n =11 имеют варианты x = 0.14.

Определение медианы

Если количество вариант число четное, то медиана вычисляется по формуле:

МВ=(xk+xk+1)/2

где xk - cто двадцать пятый член вариационного ряда;

xk+1 сто двадцать шестой член вариационного ряда;

n - Количество вариант и n=2*k

МВ=(xk+xk+1)/2=(0,44+0,04)/2= 0,24.

Расчет коэффициента вариации

Расчет коэффициента вариации проведем по формуле:

 


Коэффициент вариации более 33%, следовательно, ряд варьируется слабо!

Вывод:

Размах варьирования является простейшей характеристикой рассеяния вариационного ряда.

Для того чтобы охарактеризовать рассеяние значений количественного признака X генеральной совокупности вокруг своего среднего значения, вводят сводные характеристики - генеральную дисперсию и средним квадратическим отклонением.

Коэффициент вариации служит для сравнения величин рассеяния по отношению к выборочной средней двух вариационных рядов: тот из рядов имеет большее рассеяние, у которого коэффициент больше (эта величина безразмерная поэтому он пригоден для сравнения вариационных рядов, варианты которых имеют различную размерность.

В целом числовые характеристики служат для сравнения рассеяния вариационных рядов в сравнении с аналогичными числовыми характеристиками других вариационных рядов.

4.      Определение центральных моментов. Для этого нам понадобятся аналогичные таблицы, содержащие элементы

5.      и

Таблица 5.

х

m

x -



1

0.00

7

-0,34

0.01336336

0,0935435

2

0.01

4

-0,33

0,01186

0,047437

3

0.02

6

-0,32

0,0104858

0,062915

4

0.03

7

-0,31

0,009235

0,0646465

5

0.04

9

-0,30

0,0081

0,0729

6

0,05

6

-0,29

0,0070728

0,042437

7

0,06

2

-0,28

0,0061466

0,012293

8

0,07

10

-0,27

0,0053144

0,053144

9

0,08

4

-0,26

0,0045698

0,018279

10

0,09

5

-0,25

0,0039

0,01953

11

0,10

9

-0,24

0,0033178

0,02986

12

0,11

5

-0,23

0.0027984

0,0133992

13

0,12

7

-0,22

0,00234256

0,0163979

14

0,13

4

-0,21

0,0019448

0,00777924

15

0,14

11

-0,20

0,0016

0,0176

16

0,15

7

-0,19

0,0013

0,0013

17

0,16

6

-0,18

0,0010

0,006

18

0,17

5

-0,17

0,0008

0,004

19

0,18

8

-0,16

0,00065

0,00262

20

0,19

4

-0,15

0,0005

0,002025

21

0,20

3

-0,14

0,0004

0,00115248

22

0,21

1

-0,13

0,0003

0,0169

23

1

-0,12

0,0002

0,0144

24

0,23

3

-0,11

0,00015

0,00045

25

0,24

3

-0,10

0,0001

0,0003

26

0,25

3

-0,09

0,00006561

0,0002

27

0,26

3

-0,08

0,00004

0,000123

28

0,27

3

-0,07

0,000024

0,000072

29

0,28

4

-0,06

0,000013

0,000052

30

0,29

1

-0,05

0,00000625

0,0000625

31

0,30

4

-0,04

0,00000256

0,00001

32

0,31

5

-0,03

0,0000008

0,00000405

33

0,32

3

-0,02

0,00000016

0,00000048

34

0,33

3

-0,01

0,000000010

0,00000003

35

0,34

3

0,00

0,0000

0,0000

36

0,35

3

0,01

0,00000001

0,00000003

37

0,36

1

0,02

0,000000016

0,000000016

38

0,38

2

0,04

0,00000256

0,00000512

39

0,39

3

0,05

0,00000625

0,00001875

40

0,40

3

0,06

0,00001296

0,00003888

41

0,43

2

0,09

0,00006561

0,00013122

42

0,44

2

0,10

0,0001

0,0002

43

0,45

3

0,11

0,0001464

0,00043923

44

0,46

2

0,12

0,0002074

0,00041472

45

0,47

1

0,13

0,0002856

0,0002856

46

0,48

2

0,14

0,0003842

0,00076832

47

0,51

1

0,17

0,0008352

0,0008352

48

0,52

1

0,18

0,0010498

0,0010498

49

0,53

2

0,19

0,0013032

0,0026064

50

0,54

3

0,20

0,0016

0,0048

51

0,55

2

0,21

0,0019448

0,00388962

52

0,56

1

0,22

0,0023426

0,0023426

53

0,58

2

0,24

0,0033178

0,00663552

54

0,59

1

0,25

0,0039063

0,0039063

55

0,60

1

0,26

0,00456976

0,00456976

56

0,62

4

0,28

0,00614656

0,02458624

57

0,63

2

0,29

0,0070728

0,01414562

58

0,64

2

0,30

0,0081

0,0162

59

0,65

1

0,31

0,0092352

0,0092352

60

0,70

1

0,36

0,01679616

0,01679616

61

0,71

2

0,37

0,0187416

0,03748322

62

0,73

1

0,39

0,0231344

0,0231344

63

0,76

1

0,42

0,03111696

0,03111696

64

0,77

1

0,43

0,034188

0,034188

65

0,80

1

0,46

0,04477456

0,04477456

66

0,81

1

0,47

0,0487968

0,0487968

67

0,83

1

0,49

0,05768

0,05768

68

0,84

1

0,50

0,0625

0,0625

69

0,88

1

0,54

0,085

0,085

70

0,89

1

0,55

0,0915

0,0915

71

0,97

2

0,63

0,1575296

0,315059

72

0,98

1

0,64

0,16777216

0,16777216

73

0,99

1

0,65

0,17851

0,17851

74

1,00

3

0,66

0,189747

0,5692421

75

1,02

1

0,68

0,213814

0,213814

76

1,08

2

0,74

0,299866

0,59973152

77

1,15

1

0,81

0,43047

0,43047


Сумма

239



3,7277913


Определяем четвёртый центральный момент:

μ4 =  .

μ4 =  = 0,0156.

. Определяем контрэксцесс χ:

χ =  .

χ =  = 0,5837.

Таким образом, χ лежит в пределах (0,0045; 0,67), следовательно, рассматриваемую выборку можно отнести к классу распределений, близких к нормальному, нормальному, показательному, биноминальному.

нормальное распределение;

f(x) = px(1 - p)n - x - биноминальное распределение;

f(x) = λ exp{-λx}, где λ = 1/ - показательное.

Оценка центра распределения

Произведем оценку центра распределения. Для распределений, близких к нормальному эффективными оценками являются простые оценки Диксона или усечённые средние:

(а) = , где k = na.

Отбросим два крайних члена совокупности, тогда

(а) =  = 0,282

Таким образом, получаем вполне удовлетворительный результат с погрешностью всего

 100% = 0,85%.

Выяснение общего характера распределения предполагает не только оценку степени его однородности (определение , σ2 и σ), но и исследование формы распределения, т. е. оценку симметричности и эксцесса).

Рассчитаем на основе центрального момента 3-го порядка коэффициент ассиметрии


Определим третий центральный момент.

Таблица 6.

х

m

x -



1

0.00

7

-0,34

0,039304

0,275128

2

0.01

4

-0,33

0,35937

0,143748

3

0.02

6

-0,32

0,032768

0,196608

4

0.03

7

-0,31

0,029791

0,208537

5

0.04

9

-0,30

0,027

0,243

6

0,05

6

-0,29

0,024389

0,146334

7

0,06

2

-0,28

0,021952

0,043904

8

0,07

10

-0,27

0,019683

0,19683

9

0,08

4

-0,26

0,017576

0,070304

10

0,09

5

-0,25

0,015625

0,078125

11

0,10

9

-0,24

0,013824

0,124416

12

0,11

5

-0,23

0,012167

0,060835

13

0,12

7

-0,22

0,010648

0,074536

14

0,13

4

-0,21

0,009261

0,037044

15

0,14

11

-0,20

0,008

0,088

16

0,15

7

-0,19

0,006859

0,048013

17

0,16

6

-0,18

0,005832

0,034992

18

0,17

5

-0,17

0,004913

0,024565

19

0,18

8

-0,16

0,004096

0,032768

20

0,19

4

-0,15

0,003375

0,0135

21

0,20

3

-0,14

0,002744

 0,008232

22

0,21

1

-0,13

0,002197

0,002197

23

0,22

1

-0,12

0,001728

0,001728

24

0,23

3

-0,11

0,001331

0,003993

25

0,24

3

-0,10

0,001

0,003

26

0,25

3

-0,09

0,000729

0,002187

27

0,26

3

-0,08

0,000512

0,001536

28

0,27

3

-0,07

0,000343

0,001029

29

0,28

4

-0,06

0,000216

0,000864

30

0,29

1

-0,05

0,000125

0,000125

31

0,30

4

-0,04

0,000064

0,000256

32

0,31

5

-0,03

0,000027

0,000135

33

0,32

3

-0,02

0,000008

0,000024

34

0,33

3

-0,01

0,000001

0,000003

35

0,34

3

0,00

0,0000

0,0000

36

0,35

3

0,01

0,000001

0,000003

37

0,36

1

0,02

0,000008

0,000008

38

0,38

2

0,04

0,000064

0,000128

39

0,39

3

0,05

0,000125

0,000375

40

0,40

3

0,06

0,000216

0,000648

41

0,43

2

0,09

0,000729

0,001458

42

0,44

2

0,10

0,001

0,002

43

0,45

3

0,11

0,001331

0,003993

44

0,46

2

0,12

0,001728

0,003456

45

0,47

1

0,13

0,002197

0,002197

46

0,48

2

0,14

0,002744

0,005488

47

0,51

1

0,17

0,004913

0,004913

48

0,52

1

0,18

0,005832

0,005832

49

0,53

2

0,19

0,006859

0,013718

50

0,54

3

0,20

0,008

0,024

51

0,55

2

0,21

0,009261

0,018522

52

0,56

1

0,22

0,010648

0,010648

53

0,58

2

0,24

0,013824

0,027648

54

0,59

1

0,25

0,015625

0,015625

55

0,60

1

0,26

0,017576

0,017576

56

0,62

4

0,28

0,021952

0,087808

57

0,63

2

0,29

0,024389

0,048778

58

0,64

0,30

0,027

0,054

59

0,65

1

0,31

0,029791

0,029791

60

0,70

1

0,36

0,046656

0,046656

61

0,71

2

0,37

0,050653

0,101306

62

0,73

1

0,39

0,059319

0,059319

63

0,76

1

0,42

0,074088

0,074088

64

0,77

1

0,43

0,079507

0,079507

65

0,80

1

0,46

0,097336

0,097336

66

0,81

1

0,47

0,103823

0,103823

67

0,83

1

0,49

0,117649

0,117649

68

0,84

1

0,50

0,125

0,125

69

0,88

1

0,54

0,157464

0,157464

70

0,89

1

0,55

0,166375

0,166375

71

0,97

2

0,63

0,250047

0,500094

72

0,98

1

0,64

0,262144

0,262144

73

0,99

1

0,65

0,274625

0,274625

74

1,00

3

0,66

0,287496

0,862488

75

1,02

1

0,68

0,314432

0,314432

76

1,08

2

0,74

0,405224

0,810448

77

1,15

1

0,81

0,531441

0,531441


Сумма

239



7,229304


Определяем третий центральный момент:

μ3 =  .

μ3 =  = 0,03025.

As =  = 1.537

Для оценки существенности рассчитанного коэффициента ассиметрии определяется его средняя квадратическая ошибка (коэффициент ассиметрии):

σAs =  

σAs =  = 0.1568

отношение  =  = 9.8 3, следовательно, ассиметрия является существенной. Очевидно, что в нашем случае это связано со смещением вершины распределения относительно середины распределения.

Мода распределения в нашем случае Мо = 0,14, а = 0,2844, поэтому форму распределения можно представить как


Так как распределение является одновершинным, то необходимо рассчитать еще один показатель оценки его формы - эксцесс. Эксцесс является показателем островершинности распределения. Он рассчитывается как

Ех =  -3

Ех =  - 3 = 2,935-3 = - 0,065.

Так как Ех 0, то распределение является плосковершинным..

Показатель формы для Ех* = 2,935  2 (находится по специализированным таблицам).


Для изучения показателей формы вариации удобно использовать табличный процессор Excel Он имеет набор средств анализа данных (Пакет анализа), предназначенный для решения статистических и инженерных задач. Вызов осуществляется командой Сервис  Анализ данных. Для проведения анализа следует указать входные данные и выбрать параметры. Анализ будет проведен с помощью соответствующей статистической или инженерной функции, а результат будет помещен в выходной диапазон.

Правдоподобно или нет допущение о том, что результат измерения подчиняется нормальному закону распределения вероятности, оценим по виду гистограммы, построенной на основании экспериментальных данных.

Произведём разделение на интервалы рассматриваемую совокупность.

.        Количество интервалов определяем по формуле Старджесса:

r = 1 + 3.33lg m

r = 1 + 3.33*lg 239 = 1 + 3.33*2.378 = 8.92.

выбираем 9 интервалов.

.        Ширина интервала d

d =  

xmax = 1.15

xmin = 0.00, тогда d = 1.15/9 = 0.127777,

выбираем шаг равным 0,13, тогда получаем интервальное распределение и составим сводную расчётную таблицу.

Таблица 7.

х

Середина х

Частота n

n/r

n/P(x)F(x)



1

0.00 - 0.13

0.065

85

9.444

0.356

0.356

0.356

2

0.13 - 0.26

0.195

58

6.444

0.243

0.243

0.599

3

0.26 - 0.39

0.325

35

3.888

0.146

0.146

0.745

4

0.39 - 0.52

0.455

17

1.888

0.071

0.071

0.816

5

0.52 - 0.65

0.585

21

2.333

0.088

0.088

0.904

6

0.65 - 0.78

0.715

6

0.666

0.025

0.025

0.929

7

0.78 - 0.91

0.845

6

0.666

0.025

0.025

0.954

8

0.91 - 1.04

0.975

8

0.888

0.0335

0.0335

0.987

9

1.04 - 1.17

1.105

3

0.333

0.0125

0.0125

1




239


1




Построим гистограмму и полигон для полученного распределения в Excel. Одновременно рассмотрим полученную функцию распределения F(x) и произведём в этом операторе поиск аппроксимирующей функции.

Выбирая окончательный вариант табличного представления вариационного ряда из представленных вариантов, остановимся на первом - n=9.

From To

Count

Commulative Count

Persent

Commulative Persent

0,00<x=0,13

85

85

0,34465

0,34465

0,13<x=0,26

58

143

0,24268

0,58733

0,26<x=0,39

35

178

0,14644

0,74477

0,39<x=0,52

17

195

0,07113

0,8049

0,52<x=0,65

21

216

0,08787

0,89277

0,65<x=0,78

6

222

0,0251

0,91787

0,78<x=0,91

6

228

0,0251

0,94297

0,91<x=1,04

8

236

0,03348

0,97645

1,04<x=1,17

3

239

0,01255

1


В таблицах первая непоименованная графа (From To) содержит интервалы значений признака «Количество» Второй столбец «Count» - абсолютные частоты (fi), т.е. число единиц совокупности, обладающих указанным значением признака.Count - накопленные абсолютные частоты, получаемые последовательным суммированием частот по группам. Сумма накопленных частот по каждой строке означает, какое количество единиц совокупности имеет значение признака, не превышающее значения верхней границы данного интервала. Общая сумма накопленных частот соответствует объему изучаемой совокупности (239).- частости (относительные частоты, wi; выражаются в процентах), рассчитываются:

, или n/r в нашем случае

где: fi - число единиц i-той группы;  - общее число единиц в совокупности; wi - доля каждой группы в общем объеме совокупности.

percent - накопленные частости - это результат последовательного суммирования относительных частот по группам, итоговая сумма, очевидно, равна 100%.

Табличное представление вариационного ряда позволяет получить подробную информацию о составе и структуре изучаемой совокупности, т.е. определить какое количество единиц изучаемой совокупности обладает тем или иным значением признака и какова доля этой группы единиц в общем объеме совокупности, а также выявить закономерность изменения частот.

Из таблицы видно, что наибольшую частоту (85 или 35.6% от всего объема совокупности) имеет интервал 0.00 - 0.13.

Наименьшую частоту (3 или 1.25%) имеет первый интервал - 1.04 - 1.17

Для более наглядного представления вариационного ряда используют статистические графики.

Статистический график представляет собой чертеж, на котором при помощи условных геометрических фигур (линий, точек или других символических знаков) изображаются статистические данные. В результате этого достигается наглядная характеристика изучаемой статистической совокупности.

Правильно построенный график делает статистическую информацию более выразительной, запоминающейся и удобно воспринимаемой.

Традиционно для изображения вариационных рядов распределения в отечественной практике используются графики: гистограмма, полигон, кумулята.

На рис. 1. представлен полигон распределения в абсолютных частотах при количестве интервалов n=9. Он показывает, что наибольшую частоту имеет интервал 0.00 - 0.13 т.е. это модальный интервал.

Одной из часто используемых видов графиков является гистограмма (или столбиковая диаграмма), т.е. график распределения, на котором частоты каждого интервала представлены в виде столбиков (рис. 2).

Рис.1

Рис.2

Рис. 3 Функция распределения.

Рис.5. Отношения частостей.

Рис. 6. Аппроксимация плотности вероятности.

Приблизительная аппроксимирующая функция:

у = 0,476 е-0,39х, с достоверностью 0,919.

2. Проверка соответствия эмпирического распределения теоретическому

Процедура выравнивания, сглаживания анализируемого распределения заключается в замене эмпирических частот теоретическими, определяемыми по формуле теоретического распределения, но с учетом фактических значений переменной. На основе сопоставления эмпирических и теоретических частот рассчитываются критерии согласия, которые используются для проверки гипотезы о соответствии исследуемого распределения тому или иному типу теоретических распределении.

Выбор конкретного типа модельного распределения осуществляется исходя из самых общих соображений, опирающихся на визуальный анализ построенных графиков распределения. В практическом анализе обязательной является проверка соответствия изучаемого распределения нормальному закону распределения. Необходимость этого связана с тем, что условием применения значительного числа статистических характеристик и оценок является наличие нормального распределения.

Проверка гипотезы о нормальном распределении основывается на расчёте критерия

,

где  - эмпирические абсолютные частоты,  - абсолютные частоты теоретического распределения, k - число интервалов.

Формулы, по которым рассчитывается плотность модельного распределения, а также формулы для расчета теоретических частот распределения могут быть легко найдены в общедоступной справочной и учебной литературе. В данной лабораторной работе используются формулы для нормального распределения.

Первая гипотеза Н0 - нормальное распределение.

Функция нормального распределения: , плотность нормального распределения:

,

где  - значение изучаемого признака, - средняя арифметическая величина, - среднее квадратическое отклонение изучаемого признака, e, π - математические константы,  - нормированное отклонение.

Проверку проводим с помощью критерия Пирсона.

В этом задании, с помощью критерии Пирсона проверим гипотезу о нормальном распределении генеральной совокупности, с этой целью будем сравнивать эмпирические и теоретические частоты.

= 0,2844     - Среднее арифметическое значение

n =239        - Количество вариантов

h = 0.13      - Шаг интервалов

σ = 0.073    - Оценка среднеквадратического отклонения.


Вычислим теоретические частоты, учитывая

 =  φ() = 4,333 φ().

Вычислим данные по таблице:

Таблица 8.

i

xi

ui = (xi - )/σφ() = 4,333 φ().



1

0.065

-0.8126

0.2874

33,072

2

0.195

-0.3311

0.3778

43,475

3

0.325

0.1504

0.3945

45,397

4

0.455

0.63185

0.3271

5

0.585

1.11333

0.2155

24,798

6

0.715

1.5948

0.1109

12,762

7

0.845

2.0763

0.0459

5,282

8

0.975

2.55778

0.0153

1,76

9

1.105

3.0207

0.0042

0,483


Сравним эмпирические и теоретические частоты.

А) составим расчетную таблицу и из нее найдём наблюдаемое значение критерия

= / .

Таблица 9.

i

ni


1

85

33.072

51.928

2696.517

8.153

2

58

43.475

14.525

210.975

4.852

3

35

45.397

-10.397.

108.098

2.381

4

17

37.641

-20.641

426.051

11.319

5

21

24.798

-3.798

14.425

0.581

6

6

12.762

-6.762

45.725

3.583

7

6

5.282

0.718

0.516

0.098

8

8

1.76

6.24

38.938

22.124

9

3

0.483

2.517

6.335

13.116





66.207


Б) по таблице критических точек распределения χ2, по уровню значимости α = 0,05 и числу степеней свободы К = 9 - 3 = 6 находим критическую точку правосторонней критической области

χ2(0,05;6)= 12,6.

Так как χ2 - гипотезу о нормальном распределении отвергаем при уровне значимости α = 0,05.

Другими словами, эмпирическое и теоретическое значение частот различимо значительно.

Вторая гипотеза Н1 - показательное распределение

Проверка гипотезы о показательном распределении совокупности.

= 0,2844     - Среднее арифметическое значение

n =239        - Количество вариантов

h = 0.13      - Шаг интервалов

σ = 0.073    - Оценка среднеквадратического отклонения.

.Найдём оценку параметра предполагаемого показательного распределения:

λ = 1/ = 1/0,2844 = 3,516

таким образом, дифференциальная функция предполагаемого показательного распределения имеет вид

f(x) = 3.516e-3.516x

.Находим вероятности попадания х в каждый из интервалов по форме:

Pi =P(xi X xi+1) = exp{-λ} - exp{-λxi+1}

P1(0 x 0.13) = e-3.516*0 - e-3.516*0.13 = 1 - 0.6331 =0.36692(0.13 x 0.26) = e-3.516*0.13 - e-3.516*0.26 = 0.6331 - 0.4009 =0.2322.3(0.26 x 0.39) = e-3.516*0.26 - e-3.516*0.39 = 0.4009 - 0.2538 =0.1471.4(0.39 x 0.52) = e-3.516*0.39 - e-3.516*0.52 = 0.2538 - 0.1607 =0.0931.5(0.52 x 0.65) = e-3.516*0.52 - e-3.516*0.65 = 0.1607 - 0.1017 =0.059.6(0.65 x 0.78) = e-3.516*0.65 - e-3.516*0.78 = 0.1017 - 0.0644 =0.0373.7(0.78 x 0.91) = e-3.516*0.78 - e-3.516*0.91 = 0.0644 - 0.0409 =0.0236.8(0.91 x 1.04) = e-3.516*0.91 - e-3.516*1.04 = 0.0409 - 0.0258 =0.0181.9(1.04 x 1.17) = e-3.516*1.04 - e-3.516*1.17 = 0.0258 - 0.0163 =0.0105.

Контроль: 0,3669 + 0,2322 + 0,1471 + 0,0931 + 0,059 + 0,0373 + 0,0236 + 0,0181 + 0, 105  1.

3.     
Находим теоретические частоты:

 = n*Pi = 239*Pi

4.      Составим расчетную таблицу и определим из неё наблюдаемое значение критерия Пирсона:.

= / .

Таблица 10.

i

ni

ni - (ni - )2(ni - )2/



1

85

87.69

-2.69

7.2361

0.0825

2

58

55.5

2.5

6.25

0.1126

3

35

35.16

-0.16

0.0256

0.0007

4

17

22.25

-5.25

27.5625

1.2387

5

21

14.1

6.9

47.61

3.3766

6

6

8.91

-2.91

8.4681

0.9504

7

6

6.64

-0.64

0.4096

0.0617

8

8

4.82

3.18

10.1124

2.0980

9

3

2.51

0.49

0.2401

0.0956


239




8.0168


по таблице критических точек распределения χ2, по уровню значимости α = 0,05 и числу степеней свободы К = 9 - 3 = 6 находим критическую точку правосторонней критической области

χ2(0,05;6)= 12,6.

Так как χ2 - гипотезу о показательном распределении принимаем!!!.

Исследование показательной функции распределения.       From To Count   0-0,13 85   0,13-0,26 58   0,26-0,39 35    0,39-0,52 17    0,52-0,65 21   0,65-0,78 6   0,78-0,91 6   0,91-1,04 8   1,04-1,17 3  Теоретическое распределение.




From To

Teoretic Count


0-0,13

87,68


0,13-0,26

55,5


0,26-0,39

35,16


0,39-0,52

22,25


0,52-0,65

14,1


0,65-0,78

8,91


0,78-0,91

6,64


0,91-1,04

4,82


1,04-1,17

2,51



Третья гипотеза Н2 - биноминальное распределение

Точечная оценка: Если имеется реализация из n = 239 испытаний в которых событие наблюдалось m = 79 раз (как в нашем случае), то несмещенной точечной оценкой максимальной правдоподобности параметра р является величина рn = m/n = 79/239 = 0.3305.

Плотность вероятности биноминального распределения имеет вид:

f(x) = px(1 - p)n - x

распределение имеет единственный параметр р.

Интервальная оценка: Интервальные оценки параметра р с доверительной вероятностью α являются решениями уравнений Клоппера-Пирсона

 =  (1 - α);

 =  (α);

В скобках приведены вероятности, соответствующие границам рн и рв односторонних доверительных интервалов.

Известно, что биноминальное распределение может быть аппроксимировано с помощью бета- и F-распределений, нормального распределения и распределения Пуассона. Поэтому значения рн и рв для двусторонней интервальной оценки можно выразить через квантили этих распределений.

Ввиду сложности биноминальной зависимости - высокий порядок шестой степени - рассмотрим данную зависимость в ППП Statistica 9.5.8.

From To

 Count

Teoretic Count

 

0,065

85

50,99345

2,267831

0,195

58

69,45199

0,188833

0,325

35

73,29751

2,001022

0,455

17

59,94154

3,07629

0,585

21

37,984

0,759415

0,715

6

18,65124

0,858141

0,845

6

7,096578

0,016945

0,975

8

2,092302

1,668062

1,105

3

0,478007

1,33062

суммы

239

319,9866

12,16716





Midl

0,287469



 Midl Quatro

0,257414

   






Замечание

Получение такого результата в программе Statistic 9.3. объясняется тем, что прежде, чем приступить к вычислению специальных статистических показателей, из исходной совокупности исключаются единицы, не подчиняющиеся общей закономерности распределения, так называемые выбросы. Выбросы - это значения признака, резко отличающиеся как в большую, так и в меньшую сторону, от значений признака основной части единиц совокупности .

Для локализации и устранения выбросов необходимо, прежде всего, ранжировать исходные данные. Затем, в ППП Statistic 9.5.8. строится график Box plot на основании ранжированной совокупности. Единицы совокупности, являющиеся выбросами, исключаются из изучаемой совокупности (данная процедура использовалась только для контроля получаемых результатов).

3.Определение доверительного интервала, в котором лежит значение вероятной величины

Определение доверительного интервала означает оценку для центра распределения. В качестве первичных оценок группирования значений случайных величин могут быть использованы различные предельные неравенства.

Неравенство Чебышева.

Неравенство Чебышева имеет вид:


где μ и σ - соответственно среднее значение и стандартное отклонение.

Из неравенства Чебышева следует, что


Таким образом, при α = 0,95

х -   μ  х +

Х - 0,0693  μ  Х + 0,0693

При х = :

,2844 - 0,0693  μ  0,2844 + 0,0693

,2151  μ 0,3537.

Это и есть искомый доверительный интервал.

Неравенство Кантелли.

Таким образом, при α = 0,95

μ  0,2844 - 0,27 = (х - 0,0619) = 0,2844 - 0,0619 = 0,2225 и

μ  0,2844 + 0,27 = (х + 0,0148) = 0,2844 + 0,0148 = 0,2992.

Доверительный интервал:

Х - 0,0619  μ  Х + 0,0148

При х =

,2225  μ 0,2992.

Неравенство Мейделя

Откуда


Тогда, τ = 0,272 + (0,2844 - 0,14)2 = 0,0520,

х -   μ  х +  0,95*0,052

Х - 0,0329  μ  Х + 0,0329

,2515  μ 0,0,3173.

Вывод:

Последнее неравенство более точно.

Заключение

В курсовой работе были проанализированы данные о распределении проведенных. Для удобства анализа данные были представлены в виде группировочных таблиц с количеством интервалов n=9. Также для удобства анализа вариационного ряда используется графическое представление. В работе были использованы такие виды графиков, как полигон и гистограмма. Полигон, построенный на основе абсолютных частот, показывает форму распределения. Из рисунка видно, что распределение имеет одну вершину, форма его не симметрична, смещена к левому краю и довольно крута.

Также с помощью графика можно определить модальный интервал (0,00 - 0,13). Гистограмма позволяет сделать такие же выводы.

Центральная тенденция распределения характеризуется такими показателями, как среднее арифметическое значение, мода и медиана. Все показатели были определены с помощью программы Statistica по исходному ряду данных и вручную по сгруппированным данным. Среднее арифметическое значение вариационного ряда составило 0,2844 (по исходным данным) и 0,28747 (по группировочной таблице).

Медиана - это величина признака, делящая распределение на две равные части. По исходным данным медиана составила 0,24, а по сгруппированным данным - 0,2409.

Мода - это значение признака с наибольшей частотой. Ее значение составило 0,14. Очевидно, что и среднее арифметическое, и медиана принадлежат одному интервалу, но отличаются по значениям. Мода принадлежит другому интервалу. Это свидетельствует о несимметричности распределения относительно центра.

Вариация - это различие в значениях какого-либо признака у разных единиц данной совокупности в один и тот же период или момент времени. К показателям, характеризующим вариацию распределения, относятся размах вариации, дисперсия и среднее квадратическое отклонение и коэффициент вариации.

Размах вариации показывает амплитуду вариации и определяется как разница между максимальным и минимальным значением распределения и составляет 1,15.

Дисперсия признака представляет собой средний квадрат отклонений вариантов от их средней величины. Дисперсия, рассчитанная по исходным данным, составила 0,0729, а по сгруппированным - 0,0663. Более удобным для анализа показателем является среднее квадратическое отклонение, которое определяется как корень из дисперсии. Среднее квадратическое отклонение, рассчитанное на основании исходного ряда распределения, равно 0,27, а отклонение, определенное по сгруппированным данным, - 0,25741. Оно показывает, что значение признака отклоняется от среднего арифметического значения в среднем на 0,27.

Коэффициент вариации определяется как отношение среднего квадратического отклонения к среднему арифметическому значению. Этот показатель используют для характеристики однородности совокупности. Значение коэффициента вариации для исследуемого ряда данных составило 94,3%. Поскольку рассчитанное значение коэффициента много больше 33%, то данная совокупность не является количественно однородной.

Форма распределения характеризуется асимметрией и эксцессом. Коэффициент асимметрии показывает, как следует из названия, степень асимметричности распределения и определяется как отношение третьего центрального момента к стандартному отклонению в кубе. Коэффициент асимметрии исследуемого распределения равен -0,341 (по сгруппированным данным - -0,168), что свидетельствует о небольшой левосторонней асимметрии.

Эксцесс характеризует «крутизну» распределения и определяется как отношение четвертого центрального момента к стандартному отклонению в четвертой степени. Для нормального распределения величина эксцесса равна трем, поэтому от рассчитанного значения отнимают 3. Значение эксцесса для анализируемого распределения равно -0,065. Это означает, что исследуемое распределение гораздо «круче» нормального.

Одна из важнейших задач анализа вариационных рядов заключается в выявлении закономерности распределения и определении ее характера. Для этого осуществляется процедура выравнивания и проверка гипотезы о соответствии эмпирического ряда данных теоретическому распределению. В данной работе были проверены гипотезы соответствия эмпирического вариационного ряда нормальному, логнормальному и прямоугольному распределениям с помощью критерия Пирсона. Для этого с помощью программы Statistica было осуществлено сглаживание эмпирического ряда данных путем расчета теоретических частот и сравнение полученных значений с эмпирическими частотами. В результате этих расчетов было получено расчетное значение критерия .

Расчетный критерий для нормального распределения составил 66,207 при количестве степеней свободы 6 и расчетном уровне значимости 0,05. Табличное значение критерия равно 12,6. Поскольку расчетное значение больше критического, гипотеза о нормальном распределении противоречит статистическим данным.

Аналогично были рассчитаны критерии Пирсона для показательного (χ2 = 8,0168) и биноминального () распределения. Оба критерия значительно не превышают соответствующие табличные значения, следовательно, гипотезы о показательном и биноминальном распределениях подтвердились.

Список использованной литературы

1.  Боровиков В.П., STATISTICA. Искусство анализа данных на компьютере: для профессионалов / В.П. Боровиков. - 2-е изд. - СПб. : - 2003. - 688 с.

2.      Венецкий И.Г., Основные математико-статистические понятия и формулы в экономическом анализе. Справочник / И.Г. Венецкий, В.И. Венецкая. - 2-е изд., перераб. и доп. - М. : Статистика, 1979. - 477 с.

.        Гмурнан В.Э. Теория вероятностей и математическая статистика: Учеб. пособие. - М.: Высш. шк., 2003. - 479 с.

.        Гусаров В.М. Статистика: Учеб. пособие для вузов. - М.: ЮНИТИ-ДАНА, 2003. - 463 с.

.        Елисеева И.И., Юзбашев М.М. Общая теория статистики: Учебник / Под ред. И.И. Елисеевой. - 5-е изд., перераб. и доп. - М.: Финансы и статистика, 2004. - 656 с.

.        Закс Л., Статистическое оценивание: Пер. с нем / Л. Закс. - М.: Статистика, 1976. - 597 с.

.        Н.В. Куприенко Статистика. Методы анализа распределений. Выборочное наблюдение. 3-е изд.: учеб. пособие. / Н.В. Куприенко, О.А. Пономарева, Д.В. Тихонов. - СПб.: Изд-во Политехн. ун-та, 2009. - 138 с.

.        Лялин В.С., Зверева И.Г., Никифорова Н.Г. Статистика. Теория и практика в Excel. М.: Финансы и статистика. Издательский дом «ИНФРА - М», 2010.

.        Общая теория статистики: Статистическая методология в изучении коммерческой деятельности: Учебник. / Под ред. А.А. Спирина, О.Э. Башиной. - М.: Финансы и статистика, 1996. - 296 с.

.        Общая теория статистики: учеб. / М.Р. Ефимова, Е.В. Петрова, В.Н. Румянцев. - М.: ИНФРА-М, 2002. - 416 с.

.        Орлов А.И. Прикладная статистика. Учебник. / А.И. Орлов. - М.: Издательство «Экзамен», 2004. - 656 с.

.        Сизова Т.М. Статистика: Учебное пособие. - СПб.: СПб ГУИТМО, 2005. - 80 с.

.        Теория статистики.: учеб. /Под ред. Р.А. Шмойловой. - М.: Финансы и статистика, 2005. - 560 с.

.        Теория статистики: учеб. / Под ред. проф. Г.Л. Громыко. - 2-е изд., перераб. и доп. - М.: ИНФРА-М, 2006. - 476 с.

.        Экономическая статистика: Учебник. / Под ред. Ю.Н. Иванова. - М.: ИНФРА-М, 2004. - 480 с.

Похожие работы на - Статистика измерений

 

Не нашли материал для своей работы?
Поможем написать уникальную работу
Без плагиата!