Анализ данных и инструментальные методы статистики
Ростовский государственный
экономический университет «РИНХ»
Кафедра математической статистики,
эконометрики и актуарных расчетов
Домашнее задание
"Анализ данных и
инструментальные методы статистики"
Задание 1
Имеются данные о распределении коммерческих банков по объявленному
уставному фонду:
РЕГИОН 1
|
РЕГИОН 2
|
Группы банков по уставному фонду
|
Удельный вес банков в общем их числе
|
Группы банков по уставному фонду
|
Удельный вес банков в общем их числе
|
До 100
|
7
|
До 100
|
2
|
100-500
|
9
|
100-300
|
5
|
500-1000
|
18
|
300-500
|
6
|
1000-5000
|
34
|
500-700
|
7
|
5000-20000
|
22
|
700-100
|
12
|
Свыше 20000
|
10
|
1000-3000
|
28
|
|
|
3000-5000
|
18
|
|
|
5000-10000
|
14
|
|
|
Свыше 10000
|
8
|
Итого
|
100
|
Итого
|
100
|
С целью сравнения осуществите вторичную группировку коммерческих банков,
пересчитав данные - региона 1 в соответствии с группировкой региона 2.
Решение:
Регион 1
Группы банков по уставному фонду
|
Удельный вес банков в общем их числе
|
До 100
|
=7
|
100-300
|
9х0,5=4,5
|
300-500
|
9*0,5=4,5
|
500-700
|
18*0,4=7,2
|
700-1000
|
18*0,6=10,8\
|
1000-3000
|
34*0,5=17
|
3000-5000
|
34*0,5=17
|
5000-10000
|
22*0,5=11
|
Свыше 10000
|
22*0,5+10*1=21
|
Итого
|
100
|
Получается:
Группы банков по уставному фонду
|
Удельный вес банков в общем их числе
|
|
РЕГИОН 1
|
РЕГИОН 2
|
До 100
|
7
|
2
|
100-300
|
4,5
|
5
|
300-500
|
4,5
|
6
|
500-700
|
7,2
|
7
|
700-1000
|
10,8
|
12
|
1000-3000
|
17
|
28
|
3000-5000
|
17
|
18
|
5000-10000
|
11
|
14
|
Свыше 10000
|
21
|
8
|
Итого
|
100
|
100
|
Задание 2
Имеются следующие данные о торговле товаром А на субрынках города за
базисный и отчетный периоды:
Субрынки
|
Базисный период
|
Отчетный период
|
|
товарооборот, тыс. руб.
|
средняя цена, руб.
|
количество продаж, тыс. руб.
|
средняя цена, руб.
|
Рынки мелкооптовой торговли
|
1200
|
25
|
45
|
26
|
Центр. часть города
|
324
|
36
|
6
|
39
|
“Спальные” районы
|
400
|
32
|
11
|
34
|
Определите среднюю цену товара в каждом периоде.
Решение:
Когда исходные данные сгруппированы, то расчёт средней производится по
формуле средней арифметической взвешенной:
где fi - частота ряда распределения, с
которой отдельные варианты встречаются в совокупности (или удельный вес
отдельных значений во всей совокупности).
Базисный период = =585,6344
Отчетный период = =17,9596
Задание 3
По результатам маркетингового исследования туристических фирм, организующих
недельные туры в Турцию в различные курортные города, получены следующие данные
о вариации стоимости туров (цены приведены для гостиниц одного класса):
Месторасположение курорта
|
Число туристических фирм
|
Средняя цена недельного тура, у.е.
|
Дисперсия цен тура в группе
|
Анталия
|
7
|
530
|
2720
|
Бодрум
|
6
|
590
|
8855
|
Итого
|
13
|
550
|
5550
|
Найти общую дисперсию, коэффициент детерминации и эмпирическое
корреляционное отношение.
Решение:
Вариация цен в обследованной группе туристических фирм, обусловленная
различием в месторасположении курорта будет характеризоваться величиной
межгрупповой дисперсии.
Средняя цена тура по всем фирмам составила:
Х==557,6923
Тогда межгрупповая будет равна:
=894,6746
Вариация цен под влиянием всех прочих факторов, кроме месторасположения
курорта, будет характеризоваться величиной средней из внутригрупповых
дисперсий:
=5551,5385
Вариация цен на недельные туры в Турцию, обусловленная влиянием всех
факторов, формирующих уровень цен в заданной группе:
,6746+5551,5385=6446,2131
Правило сложения дисперсий имеет большую практическую значимость, т.к.
позволяет выявить зависимость результатов от определяющих факторов соотношением
межгрупповой и общей дисперсии - коэффициент детерминации.
- коэффициент детерминации;
*100=13,879%
Эмпирическое корреляционное отношение измеряет, какую часть общей
колеблемости результативного признака вызывает изучаемый фактор. Это отношение
факторной дисперсии к общей дисперсии:
- эмпирическое корреляционное отношение.
h==0,3725
Отсюда можно сделать вывод, что на 13,879% (13,78%) дисперсия цен на
недельные туры объясняется различиями в месторасположении курорта, а на 86,121%
(86,22%) - влиянием прочих факторов.
Таким образом, преобладающее влияние на вариацию цен недельных туров в Турцию
оказывают прочие факторы.
Задание 4
По данным 10 предприятий с помощью коэффициента ранговой корреляции
Спирмена измерить тесноту зависимости между объемом выпускаемой продукции (у),
млн. руб., и стоимостью основных производственных средств (х), млн. руб.
№
|
1
|
2
|
3
|
4
|
5
|
6
|
7
|
8
|
9
|
10
|
Х
|
1,5
|
1,8
|
2,0
|
2,2
|
2,3
|
2,6
|
3,0
|
3,1
|
3,5
|
3,8
|
Y
|
3,9
|
4,4
|
3,8
|
3,5
|
4,8
|
4,3
|
7,0
|
6,5
|
6,1
|
8,2
|
Присвоим ранги признаку Y и фактору X.
X
|
Y
|
ранг X, dx
|
ранг Y, dy
|
1.5
|
3.9
|
1
|
3
|
1.8
|
4.4
|
2
|
5
|
2
|
3.8
|
3
|
2
|
2.2
|
3.5
|
4
|
1
|
2.3
|
4.8
|
5
|
6
|
2.6
|
4.3
|
6
|
4
|
3
|
7
|
7
|
9
|
3.1
|
6.5
|
8
|
8
|
3.5
|
6.1
|
9
|
7
|
3.8
|
8.2
|
10
|
10
|
Матрица рангов.
ранг X, dx
|
ранг Y, dy
|
(dx - dy)2
|
1
|
3
|
4
|
2
|
5
|
9
|
3
|
2
|
1
|
4
|
1
|
9
|
5
|
6
|
1
|
6
|
4
|
4
|
7
|
9
|
4
|
8
|
8
|
0
|
9
|
7
|
4
|
10
|
10
|
0
|
55
|
55
|
36
|
Проверка правильности составления матрицы на основе исчисления
контрольной суммы:
распределение дисперсия коэффициент динамика
Сумма по столбцам матрицы равны между собой и контрольной суммы, значит,
матрица составлена правильно.
По формуле вычислим коэффициент ранговой корреляции Спирмена.
Связь между признаком Y и фактором X сильная и прямая
Значимость коэффициента ранговой корреляции Спирмена
Для того чтобы при уровне значимости α проверить нулевую гипотезу о
равенстве нулю генерального коэффициента ранговой корреляции Спирмена при
конкурирующей гипотезе Hi. p ≠ 0, надо вычислить критическую
точку:
где n - объем выборки;- выборочный коэффициент ранговой корреляции
Спирмена:
t(α, к) - критическая точка двусторонней
критической области, которую находят по таблице критических точек распределения
Стьюдента, по уровню значимости α и числу степеней свободы k = n-2.
Если |p| < Тkp - нет оснований отвергнуть нулевую гипотезу.
Ранговая корреляционная связь между качественными признаками не значима. Если
|p| > Tkp - нулевую гипотезу отвергают. Между качественными
признаками существует значимая ранговая корреляционная связь.
По таблице Стьюдента находим t(α/2, k) =
(0.1/2;8) = 1.86
Так как Tkp < p, то отклоняем гипотезу о равенстве 0
коэффициента ранговой корреляции Спирмена. Другими словами, коэффициент
ранговой корреляции статистически - значим и ранговая корреляционная связь
между оценками по двум тестам значимая.
Задание 5
Имеются данные о ежегодном выпуске продукции предприятия ( тыс. шт.) 2005-2013 гг.
Годы
|
2005
|
2006
|
2007
|
2008
|
2009
|
2010
|
2011
|
2012
|
2013
|
Объем выпуска ( тыс. шт.)
|
10,9
|
10,9
|
7,3
|
3,2
|
3,1
|
2,9
|
2,4
|
2,6
|
2,8
|
Определить аналитические показатели ряда динамики: абсолютные приросты,
темпы роста, темпы прироста - базисные и цепные, абсолютное содержание 1%
прироста, пункты роста. Полученные данные представьте в таблице; рассчитайте
средний уровень ряда, среднегодовой абсолютный прирост, среднегодовой темп
роста и прироста. Проведите аналитическое выравнивание ряда динамики.
Решение:
Цепные показатели ряда динамики.
Период
|
выпуск продукции
|
Абсолютный прирост
|
Темп прироста, %
|
Темпы роста, %
|
Абсолютное содержание 1% прироста
|
2005
|
10,9
|
-
|
-
|
100
|
0,109
|
2006
|
10,9
|
0
|
0,00
|
100,00
|
0,109
|
2007
|
7,3
|
-3,6
|
-33,03
|
66,97
|
2008
|
3,2
|
-4,1
|
-56,16
|
43,84
|
0,032
|
2009
|
3,1
|
-0,1
|
-3,13
|
96,88
|
0,031
|
2010
|
2,9
|
-0,2
|
-6,45
|
93,55
|
0,029
|
2011
|
2,4
|
-0,5
|
-17,24
|
82,76
|
0,024
|
2012
|
2,6
|
0,2
|
8,33
|
108,33
|
0,026
|
2013
|
2,8
|
0,2
|
7,69
|
107,69
|
0,028
|
В 2009 по сравнению с 2008 выпуск продукции уменьшилось на 0.1 тыс. шт.
Максимальный прирост наблюдается в 2012 и 2013 гг. (0,2)
Минимальный прирост зафиксирован в 2008 (-4.1)
Темп наращения показывает, что тенденция ряда убывающая, что
свидетельствует о замедлении выпуск продукции
Базисные показатели ряда динамики.
Период
|
выпуск продукции
|
Абсолютный прирост
|
Темп прироста, %
|
Темпы роста, %
|
2005
|
10,9
|
-
|
-
|
100
|
2006
|
10,9
|
0
|
0
|
100,00
|
2007
|
7,3
|
-3,6
|
-33,03
|
66,97
|
2008
|
3,2
|
-7,7
|
-70,64
|
29,36
|
2009
|
3,1
|
-7,8
|
-71,56
|
28,44
|
2010
|
2,9
|
-8
|
-73,39
|
26,61
|
2011
|
2,4
|
-8,5
|
-77,98
|
22,02
|
2012
|
2,6
|
-8,3
|
-76,15
|
23,85
|
2013
|
2,8
|
-8,1
|
-74,31
|
25,69
|
В 2013 по сравнению с 2005 выпуск продукции уменьшилось на 8,1 тыс. шт.
или на 74,31%.
Средний уровень ряда y динамики характеризует типическую величину
абсолютных уровней.
Для нахождения среднего уровня моментного ряда используют среднюю
хронологическую:
==3,54
Среднее значение выпуск продукции за анализируемый период составило 3,54
тыс. шт.
Средний темп роста
Тр==0,84
В среднем за весь период рост анализируемого показателя составил 0.84
Средний темп прироста
Тпр=0,84-1=-0,16
В среднем с каждым периодом выпуск продукции сокращался на 16%.
Средний абсолютный прирост представляет собой обобщенную характеристику
индивидуальных абсолютных приростов ряда динамики.
Средний абсолютный прирост
=1.01
С каждым периодом выпуск продукции в среднем уменьшалось на 1.01 тыс. шт.
Другим статистическим критерием является коэффициент множественной
детерминации R2.
yi
|
Δ1t
|
Δ2t
|
Темп роста
|
10,9
|
-
|
-
|
1,00
|
10,9
|
0
|
-
|
1,00
|
7,3
|
-3,6
|
-0,33
|
0,67
|
3,2
|
-4,1
|
-0,56
|
0,44
|
3,1
|
-0,1
|
-0,03
|
0,97
|
2,9
|
-0,2
|
-0,06
|
0,94
|
2,4
|
-0,5
|
-0,17
|
0,83
|
2,6
|
0,2
|
0,08
|
1,08
|
2,8
|
0,2
|
0,08
|
1,08
|
Линейное уравнение тренда имеет вид y = a1t + a0
Находим параметры уравнения методом наименьших квадратов.
Система уравнений МНК:
0n + a1∑t = ∑y
a0∑t + a1∑t2 = ∑y
• t
t
|
y
|
t2
|
y2
|
t y
|
1
|
10,90
|
1,00
|
118,81
|
10,90
|
2
|
10,90
|
4,00
|
118,81
|
21,80
|
3
|
7,30
|
9,00
|
53,29
|
21,90
|
4
|
3,20
|
16,00
|
10,24
|
12,80
|
5
|
3,10
|
25,00
|
9,61
|
15,50
|
6
|
2,90
|
36,00
|
8,41
|
17,40
|
7
|
2,40
|
49,00
|
5,76
|
16,80
|
8
|
2,60
|
64,00
|
6,76
|
20,80
|
9
|
2,80
|
81,00
|
7,84
|
25,20
|
45,00
|
46,10
|
285,00
|
339,53
|
163,10
|
Для наших данных система уравнений имеет вид:
a0 + 45a1 = 46.1
a0 + 285a1 = 163.1
Из первого уравнения выражаем а0 и подставим во второе
уравнение
Получаем a0 = 14.07, a1 = -2.33
Уравнение тренда:
= -2.33 t + 14.07
Эмпирические коэффициенты тренда a и b являются лишь оценками теоретических
коэффициентов βi,
а само уравнение отражает лишь общую тенденцию в поведении рассматриваемых
переменных.
Коэффициент тренда b = -2.33 показывает среднее изменение результативного
показателя (в единицах измерения у) с изменением периода времени t на единицу
его измерения. В данном примере с увеличением t на 1 единицу, y изменится в
среднем на -2.33.
Список использованных источников
1. Ефимова,
М.Р. Практикум по общей теории статистики : учеб. пособие / М. Р. Ефимова,
О.И.Ганченко, Е. В. Петрова. - 2-е изд., перераб. и доп. - М. : Финансы и
статистика, 2007. - 336 с.
. Илышев,
Анатолий Михайлович. Общая теория статистики : учеб. для вузов / А. М. Илышев.
- М. : ЮНИТИ-ДАНА, 2008. - 535 с.
. Ниворожкина
Л. И., Рудяга А. А., Федосова О. Н. Теория статистики. Практикум./ Рост. гос.
эконом. универ. «РИНХ».- Ростов н/Д, 2005.- 185 с.
. Ниворожкина
Л.И. Статистика: Учебник для бакалавров / Л.И. Ниворожкина, [и др.]; под общ.
ред. д.э.н., проф. Л.И. Ниворожкиной - М.: Издательско-торговая корпорация «Дашков
и К», 2010. - 416 с.
. Ниворожкина,
Людмила Ивановна. Теория статистики (с задачами и примерами по региональной
экономике) : учеб. пособие / Л. И. Ниворожкина, Т. В. Чернова. - Ростов н/Д :
Феникс, 2005. - 220 с.
. Статистика
: учеб. / под ред. В. С. Мхитаряна. - М. : Экономистъ, 2005. - 671 с.
. Шмойлова,
Р. А. Теория статистики : [учеб. пособие] / Р. А. Шмойлова, В. Г. Минашкин, Н.
А. Садовникова ; [под ред. В. Г. Минашкина]. - Электрон. изд. - М. : Маркет ДС,
2006. - 200 с.