Разряд (x)
|
Число рабочих (f)
|
1
|
7
|
2
|
13
|
3
|
10
|
4
|
5
|
3
|
6
|
1
|
Итого
|
40
|
Средний разряд по цеху №1 находим по средней взвешенной:
(1*7+2*13+3*10+4*6+5*3+6*1)/40= 2,7
Группировку
рабочих Цеха №2 проводили в таблице 2
Определим
коэффициенты вариации рабочих по цехам:
V = σ / x * 100%
где: σ - среднее квадратическое отклонение;
x - средний
разряд.
σ = √ σ2
σц1 = √
1,61 = 1,27;
σц2 = √
1,49 = 1,22;
Для
цеха №1: (1,27/2,7)*100%= 47,04%
Для
цеха №2: (1,22/3,2)*100%= 38%
Коэффициент
вариации является критерием надежности средней. Различие указывает на большую
колеблемость в величине тарифных разрядов у рабочих 1-го цеха. Тарифный разряд
рабочих второго цеха имеет более низкий коэффициент, а следовательно более
высокую степень однородности тарифного разряда рабочих цеха.
Задача 4. С вероятностью 0,954 определить ошибку выборки для
среднего тарифного разряда рабочих завода и для доли рабочих, имеющих четвертый
разряд. Указать пределы возможных значений этих показателей в генеральной
совокупности
Выборочным называется такое наблюдение, при котором характеристика всей
совокупности единиц дается по некоторой ее части, отобранной в случайном
порядке. Выборочное наблюдение - наиболее распространенный вид несплошного
наблюдения. Оно дает возможность, не прибегая к сплошному наблюдению, получить
обобщающие показатели, которые правильно отражают характеристики всей
совокупности в целом.
Вся совокупность единиц называется генеральной совокупностью, а та часть
совокупности единиц, которая подвергается выборочному обследованию, называется
выборочной совокупностью. Задача выборочного наблюдения - получить правильное
представление о показателях генеральной совокупности на основе изучения
выборочной совокупности.
Основными вопросами теории выборочного наблюдения являются:
определение предельной ошибки выборки для различных типов выборочных
характеристик с учетом особенностей отбора;
определение объема выборки, обеспечивающего необходимую
репрезентативность выборочной совокупности с учетом особенностей отбора.
Величина предельной ошибки выборки зависит от вариации признака внутри
совокупности объема выборки. И способа отбора единиц.
Определим ошибку выборки для среднего тарифного разряда рабочих завода:
Средний тарифный разряд рабочих завода является:
Дисперсия
по заводу:
.
Предельная
ошибка выборки определяется по формуле:
,
Где:
- средняя ошибка выборки;
t - коэффициент
доверия, зависящий от вероятности (), с
которой можно утверждать, что предельная ошибка не превысит t -
кратное значение средней ошибки.
При
= 0,954 t = 2,0
= 10% =
0,1 (исх. данные)
Т.е.
объем выборочной совокупности (n) 100 человек, а объем генеральной совокупности (N)
1000 человек. Исходя из условий задания, отбор бесповторный.
- средняя
ошибка для среднего тарифного разряда
Тогда
предельная ошибка для среднего тарифного разряда равна:
= 3
-
Ошибка
выборки по среднему тарифному разряду равна 0,48.
Тогда
средний тарифный разряд рабочих завода колеблется от 2,52 до 3,48.
Определим
ошибку выборки для доли рабочих имеющих 4 разряд.
Рассчитаем
ошибку выборки по альтернативному признаку:
Определим
среднее значение альтернативного показателя: из 100 человек 20 имеют 4 разряд.
Определим
среднюю ошибку для доли рабочих , имеющих 4 разряд.
Ошибка
выборки для рабочих завода имеющих 4 разряд составляет 0,076.
Доля
рабочих, имеющих 4 разряд, колеблется от 0,124 до 0,276.
Задача 5. Определить количественную взаимосвязь между
признаками
.1 С помощью графического метода определить форму связи между тарифным
разрядом и заработной платой рабочих цеха № 2 с № 41 по № 60 включительно (n=20)
Сущность графического метода заключается в построении поля корреляции,
которое представляет собой точечный график, для построения которого в
прямоугольной системе координат по оси абсцисс откладывают значения
факториального признака, а по оси ординат - результативного. По тому как
располагаются точки, судят о наличии и форме связи.
В данном случае тарифный разряд будет факториальным признаком, а
заработная плата - результативным, т.к. она зависит от тарифного разряда.
Осуществим группировку по разряду и заработной плате, т.к. при одинаковом
разряде у разных рабочих разная заработная плата.
Таблица 5.1 Данные для построения графика
( х )
|
Зарплата рабочих
|
( у )
|
1
|
491
|
491
|
2
|
483, 505, 506, 508, 512
|
502,8
|
3
|
514, 521, 524, 526, 534, 552, 555.
|
532,3
|
4
|
527, 547, 552, 559
|
546,25
|
5
|
575, 595, 597
|
589
|
6
|
0
|
0
|
По полученным значениям разряда и заработной платы построим график, где
множество получившихся точек называется - полем корреляции, а их
последовательное соединение - эмпирической линией регрессии.
По
графику можно определить, что связь стохастическая, т.к. каждому значению
факториального признака (х), соответствует некоторое множество значений
результативного признака (у).
Корреляционная
связь между признаками проявляется в том, что при изменении признака (х) на
единицу изменяется средняя величина признака (у). В данном случае связь
линейная прямая, т.к. с возрастанием признака (х) увеличивается признак (у).
.2
Вычислить параметры уравнения регрессии, характеризующего зависимость между
тарифным разрядом и заработной платой рабочих. Построить на графике
теоретическую и эмпирическую линии регрессии. Объяснить смысл полученных
параметров уравнения
При
линейной регрессии уравнение имеет вид:
ух
= а + b * x
где:
ух - среднее значение результативного признака;
х
- среднее значение факториального признака;
a, b -
параметры уравнения связи.
Параметр
a - показывает уровень заработной платы на который
влияют другие факторы, которые в данном случае не рассматриваются.
Параметр
b (коэффициент регрессии) - показывает на сколько в
среднем изменяется результативный признак (у) при увеличении факториального
признака (х) на единицу.
Таблица
5.2
№ п\п
|
Разряд (х)
|
Зарплата (у), у.е.
|
х * у
|
х2
|
у2
|
41
|
2
|
506
|
1012
|
4
|
256036
|
42
|
2
|
512
|
1024
|
4
|
262144
|
43
|
3
|
552
|
1656
|
9
|
304704
|
44
|
4
|
527
|
2108
|
16
|
277729
|
45
|
4
|
547
|
2188
|
16
|
299209
|
46
|
5
|
595
|
2975
|
25
|
354025
|
47
|
3
|
514
|
1542
|
9
|
264196
|
48
|
3
|
555
|
1665
|
9
|
308025
|
49
|
3
|
524
|
1572
|
9
|
274576
|
50
|
2
|
505
|
1010
|
4
|
255025
|
51
|
4
|
559
|
2236
|
16
|
312481
|
52
|
1
|
491
|
491
|
1
|
241081
|
53
|
3
|
534
|
1602
|
9
|
285156
|
54
|
4
|
552
|
2208
|
16
|
304704
|
55
|
3
|
526
|
1578
|
9
|
276676
|
56
|
5
|
597
|
2985
|
25
|
356409
|
57
|
3
|
521
|
1563
|
9
|
271441
|
58
|
2
|
483
|
966
|
4
|
233289
|
59
|
5
|
575
|
2875
|
25
|
330625
|
60
|
2
|
508
|
1016
|
4
|
258064
|
Итого: 20
|
63
|
10683
|
34272
|
223
|
5725595
|
Для определения параметров уравнения прямой на основе методов наименьших
квадратов решается следующая система нормальных уравнений:
∑ у = а * n + b * ∑x,
∑ х * у = а * ∑ х + b * ∑ x2;
10683 = 20 * a + 63 * b,
= 63 * a + 223 * b;
а =
(10683 - 63 * b) / 20,
= 63 * ((10683 - 63 * b) / 20) + 223 * b;
а =
454,53,= 25,28.
ух = 454,53 + 25,28 * х
Параметр а представляет собой теоретическое значение результативного
признака при х = 0 , и показывает влияние других факторов на результативный.
Параметр b - коэффициент
регрессии - показывает, на сколько в среднем изменяется значение признака у при
увеличении значения признака х на единицу. В данном примере при повышении
тарифного разряда на 1 единицу зарплата в среднем повышается на 25,28 у.е.
у1 = 454,53 + 25,28 * 1 = 479,81
у2= 454,53 + 25,28 * 2 = 505,09
у3= 454,53 + 25,28 * 3 = 530,37
у4= 454,53 + 25,28 * 4 = 555,65
у5= 454,53 + 25,28 * 5 = 580,93
По полученным величинам составляем теоретическую линию регрессии,
характеризующую форму корреляционной связи между изучаемыми признаками.
.3 Определить степень тесноты между рассматриваемыми признаками
При наличии линейной зависимости степень тесноты связи можно рассчитать с
помощью коэффициента парной корреляции ( τ ).
Коэффициент корреляции определяется следующим образом:
0,90
Коэффициент корреляции изменяется в пределах от -1 до +1. Знак при
коэффициенте корреляции показывает направление вязи ( прямая или обратная), а
его величина - степень связи (чем ближе к 1, тем связь теснее).
Следовательно, наличие линейной связи установлено правильно и эта связь
довольно тесная, т.к. τ = 0,90.
Оценка существенности коэффициента корреляции определяется на основании
критерия надежности t, который
рассчитывается по формуле:
20,65
В
математической статистике доказано, что если t < 2,56, то
связь между признаками признается несущественной. В этом случае считается, что
факториальный признак не оказывает существенного влияния на результативный
признак. Если t > 2,56, то связь признается существенной, т.е.
факториальный признак оказывает существенное влияние на признак результативный.
Т.к.
t=20,65> 2,56, то связь между признаками считается
существенной. Т.е. квалификация рабочего оказывает большое влияние на
заработную плату.
Список используемой литературы
1. Степанова Н.И., «Статистика» пособие по выполнению
курсовой работы, М.-2011г.
. Степанова Н.И., «Статистика. Конспект лекций. Часть 1»,
М.-2006г.