Парная регрессия
Смысл
регрессионного анализа – построение функциональных зависимостей между двумя
группами переменных величин Х1, Х2, … Хр и Y.
При этом речь идет о влиянии переменных Х (это будут аргументы функций) на
значения переменной Y (значение функции). Переменные Х мы будем называть
факторами, а Y – откликом.
Наиболее
простой случай – установление зависимости одного отклика y от одного фактора х.
Такой случай называется парной (простой) регрессией.
Парная регрессия – уравнение
связи двух переменных у и x:
,
где у – зависимая переменная (результативный признак);
х – независимая, объясняющая
переменная (признак-фактор).
Различают линейные и нелинейные регрессии.
Линейная регрессия:.
Нелинейные регрессии делятся на
два класса: регрессии, нелинейные относительно включенных в анализ объясняющих
переменных, но линейные по оцениваемым параметрам, и регрессии, нелинейные по
оцениваемым параметрам.
Регрессии, нелинейные по объясняющим переменным:
• полиномы разных степеней
•равносторонняя гипербола
Регрессии, нелинейные по оцениваемым параметрам:
•
степенная ;
•
показательная
•
экспоненциальная
Построение уравнения регрессии сводится к оценке ее параметров.
Для оценки параметров регрессий, линейных по параметрам, используют метод
наименьших квадратов (МНК). МНК позволяет получить такие оценки параметров,
при которых сумма квадратов отклонений фактических значений результативного
признака у от теоретических минимальна, т.е.
Для линейных и нелинейных уравнений, приводимых к линейным,
решается следующая система относительно а и b:
Можно воспользоваться готовыми формулами, которые вытекают из этой
системы:
Тесноту связи изучаемых явлений оценивает линейный коэффициент
парной корреляции для линейной регрессии
и индекс корреляции - для нелинейной
регрессии ():
Оценку качества построенной модели даст коэффициент (индекс)
детерминации, а также средняя ошибка аппроксимации.
Средняя ошибка аппроксимации – среднее
отклонение расчетных значений от фактических:
Допустимый предел значений –
не более 8 – 10%.
Средний коэффициент эластичности показывает, на сколько процентов
в среднем по совокупности изменится результат у от своей средней
величины при изменении фактора x на 1% от своего среднего
значения:
Задача дисперсионного анализа состоит в анализе дисперсии
зависимой переменной:
где – общая сумма квадратов отклонений;
– сумма квадратов отклонений,
обусловленная регрессией («объясненная» или «факторная»);
– остаточная сумма квадратов отклонений.
Долю дисперсии, объясняемую регрессией, в общей дисперсии
результативного признака у характеризует коэффициент (индекс)
детерминации R2:
Коэффициент детерминации – квадрат коэффициента или индекса
корреляции.
F-тест – оценивание качества уравнения регрессии – состоит в проверке
гипотезы Но о статистической незначимости уравнения
регрессии и показателя тесноты связи. Для этого выполняется
сравнение фактического Fфакт и критического (табличного)
Fтабл
значений F-критерия Фишера. Fфакт определяется из соотношения значений факторной и остаточной
дисперсий, рассчитанных на одну степень свободы:
п – число единиц совокупности;
т – число параметров при
переменных х.
Fтабл – это максимально возможное значение критерия под влиянием
случайных факторов при данных степенях свободы и уровне значимости а. Уровень
значимости а – вероятность отвергнуть правильную гипотезу при условии, что она
верна. Обычно а принимается равной 0,05 или 0,01.
Если Fтабл < Fфакт, то H0 – гипотеза о случайной
природе оцениваемых характеристик отклоняется и признается их статистическая
значимость и надежность. Если Fтабл > Fфакт, то гипотеза Н0 не отклоняется и признается
статистическая незначимость, ненадежность уравнения регрессии.
Для оценки статистической значимости коэффициентов регрессии и
корреляции рассчитываются t-критерий Стьюдента и доверительные
интервалы каждого из показателей. Выдвигается гипотеза Н0 о
случайной природе показателей, т.е. о незначимом их отличии от нуля. Оценка
значимости коэффициентов регрессии и корреляции с помощью f-критерия Стьюдента проводится путем
сопоставления их значений с величиной случайной ошибки:
Случайные ошибки параметров
линейной регрессии и коэффициента корреляции определяются по формулам:
Сравнивая фактическое и критическое (табличное) значения t-статистики – tтабл и tфакт – принимаем или отвергаем гипотезу Hо.
Связь между F-критерием Фишера и t-статистикой Стьюдента выражается равенством
Если tтабл < tфакт, то Hо отклоняется, т.е. а, b и не случайно отличаются от
нуля и сформировались под влиянием систематически действующего фактора х. Если
tтабл > tфакт, то гипотеза Но
не отклоняется и признается случайная природа формирования a, b или .
Для расчета доверительного интервала определяем предельную
ошибку ∆ для каждого показателя:
Формулы для расчета доверительных интервалов имеют
следующий вид:
Если в границы доверительного интервала попадает ноль, т.е. нижняя
граница отрицательна, а верхняя положительна, то оцениваемый параметр
принимается нулевым, так как он не может одновременно принимать и
положительное, и отрицательное значения.
Прогнозное значение определяется
путем подстановки в уравнение регрессии соответствующего
(прогнозного) значения . Вычисляется средняя стандартная
ошибка прогноза :
где
и строится доверительный интервал прогноза:
где
Задача:
По 22
регионам страны изучается зависимость розничной продажи телевизоров, y от среднедушевых денежных доходов в
месяц, x (табл. 1):
№ региона
|
X
|
Y
|
1,000
|
2,800
|
28,000
|
2,000
|
2,400
|
21,300
|
3,000
|
2,100
|
21,000
|
4,000
|
2,600
|
23,300
|
5,000
|
1,700
|
15,800
|
6,000
|
2,500
|
21,900
|
7,000
|
2,400
|
20,000
|
8,000
|
2,600
|
22,000
|
9,000
|
2,800
|
23,900
|
10,000
|
2,600
|
26,000
|
11,000
|
2,600
|
24,600
|
12,000
|
2,500
|
21,000
|
13,000
|
2,900
|
27,000
|
14,000
|
2,600
|
21,000
|
15,000
|
2,200
|
24,000
|
16,000
|
2,600
|
34,000
|
17,000
|
3,300
|
31,900
|
19,000
|
3,900
|
33,000
|
20,000
|
4,600
|
35,400
|
21,000
|
3,700
|
34,000
|
22,000
|
3,400
|
31,000
|
Задание
1.
Постройте поле корреляции и сформулируйте гипотезу о форме связи.
2.
Рассчитайте параметры уравнений линейной, степенной,
экспоненциальной, полулогарифмической, обратной, гиперболической парной
регрессий.
3.
Оцените тесноту связи с помощью показателей корреляции и
детерминации.
4.
С помощью среднего (общего) коэффициента эластичности дайте
сравнительную оценку силы связи фактора с результатом.
5.
Качество уравнений оцените с помощью средней ошибки аппроксимации.
6.
С помощью F-критерия Фишера определите статистическую надежность результатов
регрессионного моделирования. Выберите лучшее уравнение регрессии и дайте его
обоснование.
7.
Рассчитайте прогнозное значение результата по линейному уравнению регрессии,
если прогнозное значение фактора увеличится на 7% от его среднего уровня.
Определите доверительный интервал прогноза для уровня значимости α=0,05.
8.
Оцените полученные результаты, выводы оформите в аналитической
записке.
1. Поле корреляции для:
·
Линейной регрессии y=a+b*x:
·
Гипотеза о
форме связи: чем больше размер среднедушевого денежного дохода в месяц
(факторный признак), тем больше при прочих равных условиях розничная продажа
телевизоров (результативный признак). В данной модели параметр b называется коэффициентом
регрессии и показывает, насколько в среднем отклоняется величина
результативного признака у при отклонении величины факторного признаках на одну
единицу.
·
Степенной регрессии :
Гипотеза о
форме связи: степенная функция имеет
вид Y=axb.
Параметр b
степенного уравнения называется показателем эластичности и указывает, на
сколько процентов изменится у при возрастании х на 1%. При х = 1 a = Y.
·
Экспоненциальная регрессия :
·
Равносторонняя гипербола :
Гипотеза о
форме связи: В ряде случаев обратная
связь между факторным и результативным признаками может быть выражена
уравнением гиперболы: Y=a+b/x.
·
Обратная гипербола :
·
Полулогарифмическая регрессия :
2. Рассчитайте
параметры уравнений линейной, степенной, экспоненциальной, полулогарифмической,
обратной, гиперболической парной регрессий.
·
Рассчитаем параметры уравнений линейной парной регрессии. Для
расчета параметров a и b линейной регрессии y=a+b*x решаем систему нормальных уравнений относительно a и b:
По исходным
данным рассчитываем ∑y, ∑x, ∑yx, ∑x2, ∑y2 (табл. 2):
№ региона
|
X
|
Y
|
XY
|
X^2
|
Y^2
|
Y^cp
|
Y-Y^cp
|
Ai
|
1
|
2,800
|
28,000
|
78,400
|
7,840
|
784,000
|
25,719
|
2,281
|
0,081
|
2
|
2,400
|
21,300
|
51,120
|
5,760
|
453,690
|
22,870
|
-1,570
|
0,074
|
3
|
2,100
|
21,000
|
44,100
|
4,410
|
441,000
|
20,734
|
0,266
|
0,013
|
4
|
2,600
|
23,300
|
60,580
|
6,760
|
542,890
|
24,295
|
-0,995
|
0,043
|
5
|
1,700
|
15,800
|
26,860
|
2,890
|
249,640
|
17,885
|
-2,085
|
0,132
|
6
|
2,500
|
21,900
|
54,750
|
6,250
|
479,610
|
23,582
|
-1,682
|
0,077
|
7
|
2,400
|
20,000
|
48,000
|
5,760
|
400,000
|
22,870
|
-2,870
|
0,144
|
8
|
2,600
|
22,000
|
57,200
|
6,760
|
484,000
|
24,295
|
-2,295
|
0,104
|
9
|
2,800
|
23,900
|
66,920
|
7,840
|
571,210
|
25,719
|
-1,819
|
0,076
|
10
|
2,600
|
26,000
|
67,600
|
6,760
|
676,000
|
24,295
|
1,705
|
0,066
|
11
|
2,600
|
24,600
|
63,960
|
6,760
|
605,160
|
24,295
|
0,305
|
0,012
|
12
|
2,500
|
21,000
|
52,500
|
6,250
|
441,000
|
23,582
|
-2,582
|
0,123
|
13
|
2,900
|
27,000
|
78,300
|
8,410
|
729,000
|
26,431
|
0,569
|
0,021
|
14
|
2,600
|
21,000
|
54,600
|
6,760
|
441,000
|
24,295
|
-3,295
|
0,157
|
15
|
2,200
|
24,000
|
52,800
|
4,840
|
576,000
|
21,446
|
2,554
|
0,106
|
16
|
2,600
|
34,000
|
88,400
|
6,760
|
1156,000
|
24,295
|
9,705
|
0,285
|
17
|
3,300
|
31,900
|
105,270
|
10,890
|
1017,610
|
29,280
|
2,620
|
0,082
|
19
|
3,900
|
33,000
|
128,700
|
15,210
|
1089,000
|
33,553
|
-0,553
|
0,017
|
20
|
4,600
|
35,400
|
162,840
|
21,160
|
1253,160
|
38,539
|
-3,139
|
0,089
|
21
|
3,700
|
34,000
|
13,690
|
1156,000
|
32,129
|
1,871
|
0,055
|
22
|
3,400
|
31,000
|
105,400
|
11,560
|
961,000
|
29,992
|
1,008
|
0,033
|
Итого
|
58,800
|
540,100
|
1574,100
|
173,320
|
14506,970
|
540,100
|
0,000
|
|
сред значение
|
2,800
|
25,719
|
74,957
|
8,253
|
690,808
|
|
|
0,085
|
станд. откл
|
0,643
|
5,417
|
|
|
|
|
|
|
Система
нормальных уравнений составит:
Ур-ие регрессии: = 5,777+7,122∙x. Данное уравнение показывает, что с
увеличением среднедушевого денежного дохода в месяц
на 1 тыс. руб. доля розничных продаж телевизоров повышается в среднем на 7,12%.
·
Рассчитаем параметры уравнений степенной парной регрессии.
Построению степенной модели предшествует
процедура линеаризации переменных. В примере линеаризация производится путем
логарифмирования обеих частей уравнения:
где
Для расчетов используем данные табл. 3:
№ рег
|
X
|
Y
|
XY
|
X^2
|
Y^2
|
Yp^cp
|
y^cp
|
1
|
1,030
|
3,332
|
3,431
|
1,060
|
11,104
|
3,245
|
25,67072
|
2
|
0,875
|
3,059
|
2,678
|
0,766
|
9,356
|
3,116
|
22,56102
|
3
|
0,742
|
3,045
|
2,259
|
0,550
|
9,269
|
3,004
|
20,17348
|
4
|
0,956
|
3,148
|
3,008
|
0,913
|
9,913
|
3,183
|
24,12559
|
5
|
0,531
|
2,760
|
1,465
|
0,282
|
7,618
|
2,827
|
16,90081
|
6
|
0,916
|
3,086
|
2,828
|
0,840
|
9,526
|
3,150
|
23,34585
|
7
|
0,875
|
2,996
|
2,623
|
0,766
|
8,974
|
3,116
|
22,56102
|
8
|
0,956
|
3,091
|
2,954
|
0,913
|
9,555
|
3,183
|
24,12559
|
9
|
1,030
|
3,174
|
3,268
|
1,060
|
10,074
|
3,245
|
25,67072
|
10
|
0,956
|
3,258
|
3,113
|
0,913
|
10,615
|
3,183
|
24,12559
|
11
|
0,956
|
3,203
|
3,060
|
0,913
|
10,258
|
3,183
|
24,12559
|
12
|
0,916
|
3,045
|
2,790
|
0,840
|
9,269
|
3,150
|
23,34585
|
13
|
1,065
|
3,296
|
3,509
|
1,134
|
10,863
|
3,275
|
26,4365
|
14
|
0,956
|
3,045
|
2,909
|
0,913
|
9,269
|
3,183
|
24,12559
|
15
|
0,788
|
3,178
|
2,506
|
0,622
|
10,100
|
3,043
|
20,97512
|
16
|
0,956
|
3,526
|
3,369
|
0,913
|
12,435
|
3,183
|
24,12559
|
17
|
1,194
|
3,463
|
4,134
|
1,425
|
11,990
|
3,383
|
29,4585
|
19
|
1,361
|
3,497
|
4,759
|
1,852
|
12,226
|
3,523
|
33,88317
|
20
|
1,526
|
3,567
|
5,443
|
2,329
|
12,721
|
3,661
|
38,90802
|
21
|
1,308
|
3,526
|
4,614
|
1,712
|
12,435
|
3,479
|
32,42145
|
22
|
1,224
|
3,434
|
4,202
|
1,498
|
11,792
|
3,408
|
30,20445
|
итого
|
21,115
|
67,727
|
68,921
|
22,214
|
219,361
|
67,727
|
537,270
|
сред зн
|
1,005
|
3,225
|
3,282
|
1,058
|
10,446
|
3,225
|
|
стан откл
|
0,216
|
0,211
|
|
|
|
|
|
Рассчитаем С
и b:
Получим линейное уравнение: .
Выполнив его потенцирование, получим:
Подставляя
в данное уравнение фактические значения х, получаем теоретические
значения результата y.
·
Рассчитаем параметры уравнений экспоненциальной парной регрессии.
Построению экспоненциальной модели предшествует
процедура линеаризации переменных. В примере линеаризация производится путем
логарифмирования обеих частей уравнения:
где
Для расчетов используем данные табл. 4:
№ региона
|
X
|
Y
|
XY
|
X^2
|
Y^2
|
Yp
|
y^cp
|
1
|
2,800
|
3,332
|
9,330
|
7,840
|
11,104
|
3,225
|
25,156
|
2
|
2,400
|
3,059
|
7,341
|
5,760
|
9,356
|
3,116
|
22,552
|
3
|
2,100
|
3,045
|
6,393
|
4,410
|
9,269
|
3,034
|
20,777
|
4
|
2,600
|
3,148
|
8,186
|
6,760
|
9,913
|
3,170
|
23,818
|
5
|
1,700
|
2,760
|
4,692
|
2,890
|
7,618
|
2,925
|
18,625
|
6
|
2,500
|
3,086
|
7,716
|
6,250
|
9,526
|
3,143
|
23,176
|
7
|
2,400
|
2,996
|
7,190
|
5,760
|
8,974
|
3,116
|
22,552
|
8
|
2,600
|
3,091
|
8,037
|
6,760
|
9,555
|
3,170
|
23,818
|
9
|
2,800
|
3,174
|
8,887
|
7,840
|
10,074
|
3,225
|
25,156
|
10
|
2,600
|
3,258
|
8,471
|
6,760
|
10,615
|
3,170
|
23,818
|
11
|
2,600
|
3,203
|
8,327
|
6,760
|
10,258
|
3,170
|
23,818
|
12
|
2,500
|
3,045
|
7,611
|
6,250
|
9,269
|
3,143
|
23,176
|
13
|
2,900
|
3,296
|
9,558
|
10,863
|
3,252
|
25,853
|
14
|
2,600
|
3,045
|
7,916
|
6,760
|
9,269
|
3,170
|
23,818
|
15
|
2,200
|
3,178
|
6,992
|
4,840
|
10,100
|
3,061
|
21,352
|
16
|
2,600
|
3,526
|
9,169
|
6,760
|
12,435
|
3,170
|
23,818
|
17
|
3,300
|
3,463
|
11,427
|
10,890
|
11,990
|
3,362
|
28,839
|
19
|
3,900
|
3,497
|
13,636
|
15,210
|
12,226
|
3,526
|
33,978
|
20
|
4,600
|
3,567
|
16,407
|
21,160
|
12,721
|
3,717
|
41,140
|
21
|
3,700
|
3,526
|
13,048
|
13,690
|
12,435
|
3,471
|
32,170
|
22
|
3,400
|
3,434
|
11,676
|
11,560
|
11,792
|
3,389
|
29,638
|
Итого
|
58,800
|
67,727
|
192,008
|
173,320
|
219,361
|
67,727
|
537,053
|
сред зн
|
2,800
|
3,225
|
9,143
|
8,253
|
10,446
|
|
|
стан откл
|
0,643
|
0,211
|
|
|
|
|
|
Рассчитаем
С и b:
Получим линейное уравнение: .
Выполнив его потенцирование, получим:
Для расчета
теоретических значений y подставим в уравнение значения x.
·
Рассчитаем параметры уравнений полулогарифмической парной
регрессии. Построению полулогарифмической модели предшествует
процедура линеаризации переменных. В примере линеаризация производится путем
замены:
где
Для расчетов используем данные табл. 5:
№ региона
|
X
|
Y
|
XY
|
X^2
|
Y^2
|
y^cp
|
1
|
1,030
|
28,000
|
28,829
|
1,060
|
784,000
|
26,238
|
2
|
0,875
|
21,300
|
18,647
|
0,766
|
453,690
|
22,928
|
3
|
0,742
|
21,000
|
15,581
|
0,550
|
441,000
|
20,062
|
4
|
0,956
|
23,300
|
22,263
|
0,913
|
542,890
|
24,647
|
5
|
0,531
|
15,800
|
8,384
|
0,282
|
249,640
|
15,525
|
6
|
0,916
|
21,900
|
20,067
|
0,840
|
479,610
|
23,805
|
7
|
0,875
|
20,000
|
17,509
|
0,766
|
400,000
|
22,928
|
8
|
0,956
|
22,000
|
21,021
|
0,913
|
484,000
|
24,647
|
9
|
1,030
|
23,900
|
24,608
|
1,060
|
571,210
|
26,238
|
10
|
0,956
|
26,000
|
24,843
|
0,913
|
676,000
|
24,647
|
11
|
0,956
|
24,600
|
23,506
|
0,913
|
605,160
|
24,647
|
12
|
0,916
|
21,000
|
19,242
|
0,840
|
441,000
|
23,805
|
13
|
1,065
|
27,000
|
28,747
|
1,134
|
729,000
|
26,991
|
14
|
0,956
|
21,000
|
20,066
|
0,913
|
441,000
|
24,647
|
15
|
0,788
|
24,000
|
18,923
|
0,622
|
576,000
|
21,060
|
16
|
0,956
|
34,000
|
32,487
|
0,913
|
1156,000
|
24,647
|
17
|
1,194
|
31,900
|
38,086
|
1,425
|
1017,610
|
29,765
|
19
|
1,361
|
33,000
|
44,912
|
1,852
|
1089,000
|
33,351
|
20
|
1,526
|
35,400
|
54,022
|
2,329
|
1253,160
|
36,895
|
21
|
1,308
|
34,000
|
44,483
|
1,712
|
1156,000
|
32,221
|
22
|
1,224
|
31,000
|
37,937
|
1,498
|
961,000
|
30,406
|
Итого
|
21,115
|
540,100
|
564,166
|
22,214
|
14506,970
|
540,100
|
сред зн
|
1,005
|
25,719
|
26,865
|
1,058
|
690,808
|
|
стан откл
|
0,216
|
5,417
|
|
|
|
|
Рассчитаем a и b:
Получим линейное уравнение: .
·
Рассчитаем параметры уравнений обратной парной регрессии. Для
оценки параметров приведем обратную модель к
линейному виду, заменив , тогда
Для расчетов используем данные табл. 6:
№ региона
|
X
|
Y
|
XY
|
X^2
|
Y^2
|
Y^cp
|
1
|
2,800
|
0,036
|
0,100
|
7,840
|
0,001
|
24,605
|
2
|
2,400
|
0,047
|
0,113
|
5,760
|
0,002
|
22,230
|
3
|
2,100
|
0,048
|
0,100
|
4,410
|
0,002
|
20,729
|
4
|
2,600
|
0,043
|
0,112
|
6,760
|
0,002
|
23,357
|
5
|
1,700
|
0,063
|
0,108
|
2,890
|
0,004
|
19,017
|
6
|
2,500
|
0,046
|
0,114
|
6,250
|
0,002
|
22,780
|
7
|
2,400
|
0,050
|
0,120
|
5,760
|
0,003
|
22,230
|
8
|
2,600
|
0,045
|
0,118
|
6,760
|
0,002
|
23,357
|
9
|
2,800
|
0,042
|
0,117
|
7,840
|
0,002
|
24,605
|
10
|
2,600
|
0,038
|
0,100
|
6,760
|
0,001
|
23,357
|
11
|
2,600
|
0,041
|
0,106
|
6,760
|
23,357
|
12
|
2,500
|
0,048
|
0,119
|
6,250
|
0,002
|
22,780
|
13
|
2,900
|
0,037
|
0,107
|
8,410
|
0,001
|
25,280
|
14
|
2,600
|
0,048
|
0,124
|
6,760
|
0,002
|
23,357
|
15
|
2,200
|
0,042
|
0,092
|
4,840
|
0,002
|
21,206
|
16
|
2,600
|
0,029
|
0,076
|
6,760
|
0,001
|
23,357
|
17
|
3,300
|
0,031
|
0,103
|
10,890
|
0,001
|
28,398
|
19
|
3,900
|
0,030
|
0,118
|
15,210
|
0,001
|
34,844
|
20
|
4,600
|
0,028
|
0,130
|
21,160
|
0,001
|
47,393
|
21
|
3,700
|
0,029
|
0,109
|
13,690
|
0,001
|
32,393
|
22
|
3,400
|
0,032
|
0,110
|
11,560
|
0,001
|
29,301
|
Итого
|
58,800
|
0,853
|
2,296
|
173,320
|
0,036
|
537,933
|
сред знач
|
2,800
|
0,041
|
0,109
|
8,253
|
0,002
|
|
стан отклон
|
0,643
|
0,009
|
|
|
|
|
Рассчитаем a и b:
Получим линейное уравнение: .
Выполнив его потенцирование, получим:
Для расчета
теоретических значений y подставим в уравнение значения
x.
·
Рассчитаем параметры уравнений равносторонней гиперболы парной
регрессии. Для оценки параметров приведем модель равносторонней гиперболы к линейному виду, заменив , тогда
Для расчетов используем данные табл. 7:
№ региона
|
X=1/z
|
Y
|
XY
|
X^2
|
Y^2
|
Y^cp
|
1
|
0,357
|
28,000
|
10,000
|
0,128
|
784,000
|
26,715
|
2
|
0,417
|
21,300
|
8,875
|
0,174
|
453,690
|
23,259
|
3
|
0,476
|
21,000
|
10,000
|
0,227
|
441,000
|
19,804
|
4
|
0,385
|
23,300
|
8,962
|
0,148
|
542,890
|
25,120
|
5
|
0,588
|
15,800
|
9,294
|
0,346
|
249,640
|
13,298
|
6
|
0,400
|
21,900
|
8,760
|
0,160
|
479,610
|
24,227
|
7
|
0,417
|
20,000
|
8,333
|
0,174
|
400,000
|
23,259
|
8
|
0,385
|
22,000
|
8,462
|
0,148
|
484,000
|
25,120
|
9
|
0,357
|
23,900
|
8,536
|
0,128
|
571,210
|
26,715
|
10
|
0,385
|
26,000
|
10,000
|
0,148
|
676,000
|
25,120
|
11
|
0,385
|
24,600
|
9,462
|
0,148
|
605,160
|
25,120
|
12
|
0,400
|
21,000
|
8,400
|
0,160
|
441,000
|
24,227
|
13
|
0,345
|
27,000
|
9,310
|
0,119
|
729,000
|
27,430
|
14
|
0,385
|
21,000
|
8,077
|
0,148
|
441,000
|
25,120
|
15
|
0,455
|
24,000
|
10,909
|
0,207
|
576,000
|
21,060
|
16
|
0,385
|
34,000
|
13,077
|
0,148
|
1156,000
|
25,120
|
17
|
0,303
|
31,900
|
9,667
|
0,092
|
1017,610
|
29,857
|
19
|
0,256
|
33,000
|
8,462
|
0,066
|
1089,000
|
32,564
|
20
|
0,217
|
35,400
|
7,696
|
0,047
|
1253,160
|
34,829
|
21
|
0,270
|
34,000
|
9,189
|
0,073
|
1156,000
|
31,759
|
22
|
0,294
|
31,000
|
9,118
|
0,087
|
961,000
|
30,374
|
Итого
|
7,860
|
540,100
|
194,587
|
3,073
|
14506,970
|
540,100
|
сред знач
|
0,374
|
25,719
|
9,266
|
0,146
|
1318,815
|
|
стан отклон
|
0,079
|
25,639
|
|
|
|
|
Рассчитаем a и b:
Получим линейное уравнение: .
Получим уравнение регрессии: .
3. Оценка
тесноты связи с помощью показателей корреляции и детерминации:
·
Линейная модель. Тесноту линейной связи оценит коэффициент
корреляции. Был получен следующий коэффициент корреляции rxy=b=7,122*, что говорит о прямой сильной связи
фактора и результата. Коэффициент детерминации r²xy=(0,845)²=0,715. Это
означает, что 71,5% вариации результативного признака (розничная продажа телевизоров, у) объясняется вариацией
фактора х – среднедушевой денежный доход в месяц.
·
Степенная модель. Тесноту нелинейной связи оценит индекс
корреляции. Был получен следующий индекс корреляции =, что говорит о очень сильной тесной связи, но немного больше чем
в линейной модели. Коэффициент детерминации r²xy=0,7175. Это означает, что 71,75%
вариации результативного признака (розничная
продажа телевизоров, у) объясняется вариацией фактора х – среднедушевой денежный доход в
месяц.
·
Экспоненциальная модель. Был получен следующий индекс корреляции ρxy=0,8124, что говорит о том,
что связь прямая и очень сильная, но немного слабее, чем в линейной и степенной
моделях. Коэффициент детерминации r²xy=0,66. Это означает, что 66% вариации результативного признака (розничная продажа телевизоров, у) объясняется вариацией
фактора х – среднедушевой денежный доход в месяц.
·
Полулогарифмическая модель. Был получен следующий индекс
корреляции ρxy=0,8578, что говорит о том, что связь прямая и очень сильная, но
немного больше чем в предыдущих моделях. Коэффициент детерминации r²xy=0,7358. Это означает, что 73,58%
вариации результативного признака (розничная
продажа телевизоров, у) объясняется вариацией фактора х – среднедушевой денежный доход в
месяц.
·
Гиперболическая модель. Был получен следующий индекс корреляции ρxy=0,8448 и коэффициент
корреляции rxy=-0,1784 что говорит о том, что связь обратная очень сильная.
Коэффициент детерминации r²xy=0,7358. Это означает, что 73,5% вариации результативного признака
(розничная продажа телевизоров, у) объясняется вариацией
фактора х – среднедушевой денежный доход в месяц.
·
Обратная модель. Был получен следующий индекс корреляции ρxy=0,8114 и коэффициент
корреляции rxy=-0,8120, что говорит о том, что связь обратная очень сильная.
Коэффициент детерминации r²xy=0,6584. Это означает, что 65,84% вариации результативного
признака (розничная продажа телевизоров, у) объясняется вариацией
фактора х – среднедушевой денежный доход в месяц.
Вывод: по полулогарифмическому
уравнению получена наибольшая оценка тесноты связи: ρxy=0,8578 (по сравнению с
линейной, степенной, экспоненциальной,
гиперболической, обратной регрессиями).
4. С
помощью среднего (общего) коэффициента эластичности дайте сравнительную оценку
силы связи фактора с результатом.
Рассчитаем
коэффициент эластичности для линейной модели:
·
Для уравнения прямой: y = 5,777+7,122∙x
·
Для уравнения степенной модели :
·
Для уравнения экспоненциальной модели:
Для
уравнения полулогарифмической модели :
·
Для уравнения обратной
гиперболической модели :
·
Для уравнения равносторонней
гиперболической модели :
Сравнивая значения , характеризуем оценку силы связи
фактора с результатом:
·
·
·
·
·
·
Известно, что коэффициент эластичности показывает связь между
фактором и результатом, т.е. на сколько% изменится результат y от своей средней величины
при изменении фактора х на 1% от своего среднего значения. В данном
примере получилось, что самая большая сила связи между фактором и результатом в полулогарифмической модели, слабая сила связи в обратной
гиперболической модели.
5. Оценка
качества уравнений с помощью средней ошибки аппроксимации.
Подставляя в уравнение регрессии фактические значения х, определим
теоретические (расчетные) значения . Найдем
величину средней ошибки аппроксимации :
В среднем расчетные значения отклоняются от фактических на:
·
Линейная регрессия. = *100%= 8,5%, что говорит о повышенной ошибке аппроксимации, но в
допустимых пределах.
Качество построенной модели оценивается как хорошее, так как не превышает
8 -10%.
·
Степенная регрессия. =*100%= 8,2%, что говорит о повышенной ошибке аппроксимации, но в
допустимых пределах.
Качество построенной модели оценивается как хорошее, так как не превышает
8 -10%.
·
Экспоненциальная регрессия. =*100%= 9%, что говорит о повышенной ошибке аппроксимации, но в
допустимых пределах.
Качество построенной модели оценивается как хорошее, так как не превышает
8 -10%.
·
Полулогарифмическая регрессия. =*100%= 7,9 что говорит о повышенной ошибке аппроксимации, но в
допустимых пределах.
Качество построенной модели оценивается как хорошее, так как не превышает
8 -10%.
·
Гиперболическая регрессия. =*100%= 9,3 что говорит о повышенной ошибке аппроксимации, но в
допустимых пределах.
Качество построенной модели оценивается как хорошее, так как не превышает
8 -10%.
·
Обратная регрессия. =*100%= 9,9 3 что говорит о повышенной ошибке аппроксимации, но в
допустимых пределах.
Качество построенной модели оценивается как хорошее, так как не превышает
8 -10%.
6. Рассчитаем F-критерий:
·
Линейная регрессия. = *19= 47,579
где =4,38<
·
Степенная регрессия. =*19= 48,257
где =4,38<
·
Экспоненциальная регрессия. =*19= 36,878
где =4,38<
·
Полулогарифмическая регрессия. =*19= 52,9232
где =4,38<
·
Гиперболическая регрессия. =*19= 47,357
где =4,38<
·
Обратная регрессия. =*19= 36,627
где =4,38<
Для всех регрессий =4,38< , из чего
следует, что уравнения регрессии статистически значимы.
Вывод: остается
на допустимом уровне для всех уравнений регрессий.
|
А
|
R^2
|
Fфакт
|
Линейная модель
|
8,5
|
0,714
|
47,500
|
Степенная модель
|
8,2
|
0,718
|
48,250
|
Полулогарифмическая модель
|
7,9
|
0,736
|
52,920
|
Экспоненциальная модель
|
9,0
|
36,870
|
Равносторонняя гипербола
|
9,3
|
0,714
|
47,350
|
Обратная гипербола
|
9,9
|
0,453
|
15,700
|
Все уравнения регрессии достаточно хорошо описывают исходные
данные. Некоторое предпочтение можно отдать полулогарифмической функции, для
которой значение R^2 наибольшее, а ошибка аппроксимации – наименьшая
7. Рассчитаем прогнозное значение результата по линейному
уравнению регрессии, если прогнозное значение фактора увеличится на 7% от его
среднего уровня. Определим доверительный интервал прогноза для уровня
значимости α=0,05:
Прогнозное значение определяется путем подстановки в уравнение регрессии соответствующего (прогнозного) значения
.
5,777+7,122*2,996=27,114
где = =2,8*1,07=2,996
Средняя стандартная ошибка прогноза :
==3,12
где = =0,697886
Предельная ошибка прогноза:
Доверительный интервал прогноза
где
=27,116,53;
27,11–6,53 = 20,58
27,11+6,53 = 33,64
Выполненный прогноз среднедушевых
денежных доходов в месяц, x оказался надежным (р = 1 – α
= 1 – 0,05 = 0,95), но неточным, так как диапазон верхней и нижней границ
доверительного интервала составляет 2,09 раза:
= = =1,63