Линейное уравнение регрессии
Всероссийский
заочный финансово-экономический институт
Лабораторная
работа
по дисциплине
"Эконометрика"
Брянск 2010
Задание
В таблице 1 представлены
данные о рынке строящегося жилья в Санкт-Петербурге (по состоянию на декабрь
1996г.).
Таблица 1 – Исходные
данные
№ п/п
|
Х1
|
Х2
|
Х3
|
Х4
|
Х5
|
Х6
|
Х7
|
Х8
|
У
|
1
|
1
|
1
|
39
|
20
|
8,2
|
0
|
1
|
0
|
15,9
|
2
|
3
|
1
|
68,4
|
40,5
|
10,7
|
0
|
1
|
0
|
27
|
3
|
1
|
1
|
34,8
|
16
|
10,7
|
0
|
1
|
12
|
13,5
|
4
|
1
|
1
|
39
|
20
|
8,5
|
0
|
1
|
12
|
15,1
|
5
|
2
|
1
|
54,7
|
28
|
10,7
|
0
|
1
|
12
|
21,1
|
6
|
3
|
1
|
74,7
|
46,3
|
10,7
|
0
|
1
|
12
|
28,7
|
7
|
3
|
1
|
71,7
|
45,9
|
10,7
|
0
|
0
|
0
|
27,2
|
8
|
3
|
1
|
74,5
|
47,5
|
10,4
|
0
|
0
|
0
|
28,3
|
9
|
4
|
1
|
137,7
|
87,2
|
14,6
|
0
|
1
|
0
|
52,3
|
10
|
1
|
1
|
40
|
17,7
|
11
|
1
|
1
|
8
|
22
|
11
|
2
|
1
|
53
|
31,1
|
10
|
1
|
1
|
8
|
28
|
12
|
3
|
1
|
86
|
48,7
|
14
|
1
|
1
|
8
|
45
|
13
|
4
|
1
|
98
|
65,8
|
13
|
1
|
1
|
8
|
51
|
14
|
2
|
1
|
62,6
|
21,4
|
11
|
1
|
1
|
0
|
34,4
|
15
|
1
|
1
|
45,3
|
20,6
|
10,4
|
1
|
1
|
8
|
24,7
|
16
|
2
|
1
|
56,4
|
29,7
|
9,4
|
1
|
1
|
8
|
30,8
|
17
|
1
|
1
|
37
|
17,8
|
8,3
|
0
|
1
|
0
|
15,9
|
18
|
3
|
1
|
67,5
|
43,5
|
8,3
|
0
|
1
|
0
|
29
|
19
|
1
|
1
|
37
|
17,8
|
8,3
|
0
|
1
|
3
|
15,4
|
20
|
3
|
1
|
69
|
42,4
|
8,3
|
0
|
1
|
3
|
28,6
|
21
|
1
|
1
|
40
|
20
|
8,3
|
0
|
0
|
0
|
15,6
|
22
|
3
|
1
|
69,1
|
41,3
|
8,3
|
0
|
1
|
0
|
27,7
|
23
|
2
|
1
|
38,1
|
35,4
|
13
|
1
|
1
|
20
|
34,1
|
24
|
2
|
1
|
75,3
|
41,4
|
12,1
|
1
|
1
|
20
|
37,7
|
25
|
3
|
1
|
83,7
|
48,5
|
12,1
|
1
|
1
|
20
|
41,9
|
26
|
1
|
1
|
48,7
|
22,3
|
12,4
|
1
|
1
|
20
|
24,4
|
27
|
1
|
1
|
39,9
|
18
|
8,1
|
1
|
0
|
0
|
21,3
|
28
|
2
|
1
|
68,6
|
35,5
|
17
|
1
|
1
|
12
|
36,7
|
29
|
1
|
1
|
39
|
20
|
9,2
|
1
|
0
|
0
|
21,5
|
30
|
2
|
1
|
48,6
|
31
|
8
|
1
|
0
|
0
|
26,4
|
31
|
3
|
1
|
98
|
56
|
22
|
1
|
0
|
0
|
53,9
|
32
|
2
|
1
|
68,5
|
30,7
|
8,3
|
1
|
1
|
6
|
34,2
|
33
|
2
|
1
|
71,1
|
36,2
|
13,3
|
1
|
1
|
6
|
35,6
|
34
|
3
|
1
|
41
|
8
|
1
|
1
|
12
|
34
|
35
|
1
|
1
|
38
|
19
|
7,4
|
1
|
1
|
12
|
19
|
36
|
2
|
1
|
93,2
|
49,5
|
14
|
1
|
1
|
12
|
46,6
|
37
|
3
|
1
|
117
|
55,2
|
25
|
1
|
1
|
12
|
58,5
|
38
|
1
|
2
|
42
|
21
|
10,2
|
1
|
0
|
12
|
24,2
|
39
|
2
|
2
|
62
|
35
|
11
|
1
|
0
|
12
|
35,7
|
40
|
3
|
2
|
89
|
52,3
|
11,5
|
1
|
1
|
12
|
51,2
|
41
|
4
|
2
|
132
|
89,6
|
11
|
1
|
1
|
12
|
75,9
|
42
|
1
|
2
|
40,8
|
19,2
|
10,1
|
1
|
1
|
6
|
21,2
|
43
|
2
|
2
|
59,2
|
31,9
|
11,2
|
1
|
1
|
6
|
30,8
|
44
|
3
|
2
|
65,4
|
38,9
|
9,3
|
1
|
1
|
6
|
34
|
45
|
2
|
2
|
60,2
|
36,3
|
10,9
|
1
|
1
|
12
|
31,9
|
46
|
3
|
2
|
82,2
|
49,7
|
13,8
|
1
|
1
|
12
|
43,6
|
47
|
3
|
2
|
98,4
|
52,3
|
15,3
|
1
|
1
|
12
|
52,2
|
48
|
3
|
3
|
76,7
|
44,7
|
8
|
1
|
1
|
0
|
43,1
|
49
|
1
|
3
|
38,7
|
20
|
10,2
|
1
|
1
|
6
|
25
|
50
|
2
|
3
|
56,4
|
32,7
|
10,1
|
1
|
1
|
6
|
35,2
|
51
|
3
|
3
|
76,7
|
44,7
|
8
|
1
|
1
|
6
|
40,8
|
52
|
1
|
3
|
38,7
|
20
|
10,2
|
1
|
0
|
0
|
18,2
|
53
|
1
|
3
|
41,5
|
20
|
10,2
|
1
|
1
|
0
|
20,1
|
54
|
2
|
3
|
48,8
|
28,5
|
8
|
1
|
0
|
0
|
22,7
|
55
|
2
|
3
|
57,4
|
33,5
|
10,1
|
1
|
1
|
0
|
27,6
|
56
|
3
|
3
|
76,7
|
44,7
|
8
|
1
|
1
|
0
|
36
|
57
|
1
|
4
|
37
|
17,5
|
8,3
|
0
|
1
|
7
|
17,8
|
58
|
2
|
4
|
54
|
30,5
|
8,3
|
0
|
1
|
7
|
25,9
|
59
|
3
|
4
|
68
|
42,5
|
8,3
|
0
|
1
|
7
|
32,6
|
60
|
1
|
4
|
40,5
|
16
|
11
|
0
|
1
|
3
|
19,8
|
61
|
2
|
4
|
61
|
31
|
11
|
0
|
1
|
3
|
29,9
|
62
|
3
|
4
|
80
|
45,6
|
11
|
0
|
1
|
3
|
39,2
|
63
|
1
|
3
|
52
|
21,2
|
11,2
|
1
|
1
|
18
|
22,4
|
64
|
2
|
3
|
78,1
|
40
|
11,6
|
1
|
1
|
18
|
35,2
|
65
|
3
|
3
|
91,6
|
53,8
|
16
|
1
|
0
|
18
|
41,2
|
66
|
1
|
4
|
39,9
|
19,3
|
8,4
|
0
|
1
|
6
|
17,8
|
67
|
2
|
4
|
56,2
|
31,4
|
11,1
|
0
|
1
|
6
|
25
|
68
|
3
|
4
|
79,1
|
42,4
|
15,5
|
0
|
1
|
6
|
35,2
|
69
|
4
|
4
|
91,6
|
9,4
|
0
|
1
|
6
|
40,8
|
Принятые в таблице
обозначения:
Y – цена квартиры, тыс.долл.;
Х1 – число комнат в
квартире;
Х2 – район города (1 –
Приморский, Шувалово-Озерки, 2 – Гражданка, 3 – Юго-запад, 4 - Красносельский);
Х3 – общая площадь
квартиры (м2);
Х4 – жилая площадь
квартиры (м2);
Х5 – площадь кухни (м2);
Х6 – тип дома (1 –
кирпичный, 0 - другой);
Х7 – наличие балкона (1 –
есть, 0 - нет);
Х8 – число месяцев до
окончания срока строительства.
1) Введите фиктивную
переменную z, отражающую местоположение квартиры
и позволяющую разделить всю совокупность квартир на две группы: квартиры на
севере города (Приморский район, Шувалово-Озерки, Гражданка) и на юге города
(Юго-запад, Красносельский район).
2) Составьте матрицу
парных коэффициентов корреляции исходных переменных. Вместо переменной х2
используйте фиктивную переменную z.
3) Постройте уравнение
регрессии, характеризующее зависимость цены от всех факторов в линейной форме.
Установите, какие факторы мультиколлинеарны.
4) Постройте модель у = f(х3, х6, х7,
х8, z) в линейной
форме. Какие факторы значимо воздействуют на формирование цены квартиры в этой
модели?
5) Существует ли разница
в ценах на квартиры, расположенных в северной и южной частях Санкт-Петербурга?
6) Оцените статистическую
значимость параметров регрессионной модели с помощью t-критерия Стьюдента; нулевую гипотезу о значимости уравнения
регрессии проверьте с помощью F-критерия
Фишера; оцените качество уравнения регрессии с помощью коэффициента
детерминации R2.
Решение
1) Введем фиктивную
переменную Z вместо Х2, отражающую местоположение
квартиры и позволяющую разделить всю совокупность квартир на две группы. Первые
47 квартир относятся к северной части города (Приморский район,
Шувалово-Озерки, Гражданка), а оставшиеся 22 квартиры относятся к южной части
города (Юго-запад, Красносельский район). Составим матрицу парных коэффициентов
корреляции исходных переменных.
Х1
|
Z
|
Х3
|
Х4
|
Х5
|
Х6
|
Х7
|
Х8
|
У
|
1
|
1
|
39
|
20
|
8,2
|
0
|
1
|
0
|
15,9
|
3
|
1
|
68,4
|
40,5
|
10,7
|
0
|
1
|
0
|
27
|
1
|
1
|
34,8
|
16
|
10,7
|
0
|
1
|
12
|
13,5
|
1
|
1
|
39
|
20
|
8,5
|
0
|
1
|
12
|
15,1
|
2
|
1
|
54,7
|
28
|
10,7
|
0
|
1
|
12
|
21,1
|
3
|
1
|
74,7
|
46,3
|
10,7
|
0
|
1
|
12
|
28,7
|
3
|
1
|
71,7
|
45,9
|
10,7
|
0
|
0
|
0
|
27,2
|
3
|
1
|
74,5
|
47,5
|
10,4
|
0
|
0
|
0
|
28,3
|
4
|
1
|
137,7
|
87,2
|
14,6
|
0
|
1
|
0
|
52,3
|
1
|
1
|
40
|
17,7
|
11
|
1
|
1
|
8
|
22
|
2
|
1
|
53
|
31,1
|
10
|
1
|
1
|
8
|
28
|
3
|
1
|
86
|
48,7
|
14
|
1
|
1
|
8
|
45
|
4
|
1
|
98
|
65,8
|
13
|
1
|
1
|
8
|
51
|
2
|
1
|
62,6
|
21,4
|
11
|
1
|
1
|
0
|
34,4
|
1
|
1
|
45,3
|
20,6
|
10,4
|
1
|
1
|
8
|
24,7
|
2
|
1
|
56,4
|
29,7
|
9,4
|
1
|
1
|
8
|
30,8
|
1
|
1
|
37
|
17,8
|
8,3
|
0
|
1
|
0
|
15,9
|
3
|
1
|
67,5
|
43,5
|
8,3
|
0
|
1
|
0
|
29
|
1
|
1
|
37
|
17,8
|
8,3
|
0
|
1
|
3
|
15,4
|
3
|
1
|
69
|
42,4
|
8,3
|
0
|
1
|
3
|
28,6
|
1
|
1
|
40
|
20
|
8,3
|
0
|
0
|
0
|
15,6
|
3
|
1
|
69,1
|
41,3
|
8,3
|
0
|
1
|
0
|
27,7
|
2
|
1
|
38,1
|
35,4
|
13
|
1
|
1
|
20
|
34,1
|
2
|
1
|
75,3
|
41,4
|
12,1
|
1
|
1
|
20
|
37,7
|
3
|
1
|
83,7
|
48,5
|
12,1
|
1
|
1
|
20
|
41,9
|
1
|
1
|
48,7
|
22,3
|
12,4
|
1
|
1
|
20
|
24,4
|
1
|
1
|
39,9
|
18
|
8,1
|
1
|
0
|
0
|
21,3
|
2
|
1
|
68,6
|
35,5
|
17
|
1
|
1
|
12
|
36,7
|
1
|
1
|
39
|
20
|
9,2
|
1
|
0
|
0
|
21,5
|
2
|
1
|
48,6
|
31
|
8
|
1
|
0
|
0
|
26,4
|
3
|
1
|
98
|
56
|
22
|
1
|
0
|
0
|
53,9
|
2
|
1
|
68,5
|
30,7
|
8,3
|
1
|
1
|
6
|
34,2
|
2
|
1
|
71,1
|
36,2
|
13,3
|
1
|
1
|
6
|
35,6
|
3
|
1
|
68
|
41
|
8
|
1
|
1
|
12
|
34
|
1
|
1
|
38
|
19
|
7,4
|
1
|
1
|
12
|
19
|
2
|
1
|
93,2
|
14
|
1
|
1
|
12
|
46,6
|
3
|
1
|
117
|
55,2
|
25
|
1
|
1
|
12
|
58,5
|
1
|
1
|
42
|
21
|
10,2
|
1
|
0
|
12
|
24,2
|
2
|
1
|
62
|
35
|
11
|
1
|
0
|
12
|
35,7
|
3
|
1
|
89
|
52,3
|
11,5
|
1
|
1
|
12
|
51,2
|
4
|
1
|
132
|
89,6
|
11
|
1
|
1
|
12
|
75,9
|
1
|
1
|
40,8
|
19,2
|
10,1
|
1
|
1
|
6
|
21,2
|
2
|
1
|
59,2
|
31,9
|
11,2
|
1
|
1
|
6
|
30,8
|
3
|
1
|
65,4
|
38,9
|
9,3
|
1
|
1
|
6
|
34
|
2
|
1
|
60,2
|
36,3
|
10,9
|
1
|
1
|
12
|
31,9
|
3
|
1
|
82,2
|
49,7
|
13,8
|
1
|
1
|
12
|
43,6
|
3
|
1
|
98,4
|
52,3
|
15,3
|
1
|
1
|
12
|
52,2
|
3
|
0
|
76,7
|
44,7
|
8
|
1
|
1
|
0
|
43,1
|
1
|
0
|
38,7
|
20
|
10,2
|
1
|
1
|
6
|
25
|
2
|
0
|
56,4
|
32,7
|
10,1
|
1
|
1
|
6
|
35,2
|
3
|
0
|
76,7
|
44,7
|
8
|
1
|
1
|
6
|
40,8
|
1
|
0
|
38,7
|
20
|
10,2
|
1
|
0
|
0
|
18,2
|
1
|
0
|
41,5
|
20
|
10,2
|
1
|
1
|
0
|
20,1
|
2
|
0
|
48,8
|
28,5
|
8
|
1
|
0
|
0
|
22,7
|
2
|
0
|
57,4
|
33,5
|
10,1
|
1
|
1
|
0
|
27,6
|
3
|
0
|
76,7
|
44,7
|
8
|
1
|
1
|
0
|
36
|
1
|
0
|
37
|
17,5
|
8,3
|
0
|
1
|
7
|
17,8
|
2
|
0
|
54
|
30,5
|
8,3
|
0
|
1
|
7
|
25,9
|
3
|
0
|
68
|
42,5
|
8,3
|
0
|
1
|
7
|
32,6
|
1
|
0
|
40,5
|
16
|
11
|
0
|
1
|
3
|
19,8
|
2
|
0
|
61
|
31
|
11
|
0
|
1
|
3
|
29,9
|
3
|
0
|
80
|
45,6
|
11
|
0
|
1
|
3
|
39,2
|
1
|
0
|
52
|
21,2
|
11,2
|
1
|
1
|
18
|
22,4
|
2
|
0
|
78,1
|
40
|
11,6
|
1
|
1
|
18
|
35,2
|
3
|
0
|
91,6
|
53,8
|
16
|
1
|
0
|
18
|
41,2
|
1
|
0
|
39,9
|
19,3
|
8,4
|
0
|
1
|
6
|
17,8
|
2
|
0
|
56,2
|
31,4
|
11,1
|
0
|
1
|
6
|
25
|
3
|
0
|
79,1
|
42,4
|
15,5
|
0
|
1
|
6
|
35,2
|
4
|
0
|
91,6
|
55,2
|
9,4
|
0
|
1
|
6
|
40,8
|
2) Проведем
корреляционный анализ на выявление зависимости Y от представленных факторов в среде "СтатЭксперт".
Протокол корреляционного
анализа
Главная цель анализа
данных состоит в выявлении корреляционной связи зависимой переменной Y с независимыми переменными Хi, а также выявление независимых
переменных, имеющих высокий уровень корреляции между собой.
Критическое значение
коэффициента корреляции rкр = 0,2002. Это означает, что все
коэффициенты корреляции, значения которых меньше rкр принимаются равными нулю, а связь между этими параметрами
считается незначимой.
Влияние независимой
переменной Х3, Х4, включенной в исследование, имеет
высокий уровень (r > 0,7),
причем это влияние положительно (rух3 = 0,872, rух4 = 0,917).
Х5 оказывает
умеренное положительное влияние на величину Y (rух5 = 0,303).
Х1, Х2,
Х6, Х7, Х8 не оказывают влияния на величину Y (rух2 = 0,010, rух6
= = -0,104, rух7 = 0,119, rух8 = -0,005).
3) Построим уравнение
регрессии, характеризующее зависимость цены от всех факторов, в линейной форме.
Линейная регрессия
Уравнение будет иметь
вид:
у(х) = -0,505 – 0,966х1
+ 0,824х2 + 0,390х3 + 0,191х4 + 0,091х5
+ 5,835х6 + 1,244х7 – 0,011х8
Линейная или близкая к
ней связь между факторами называется мультиколлинеарностью. Считают явление
мультиколлинеарности в исходных данных установленным, если коэффициент парной
корреляции между двумя переменными больше 0,7.
Рассмотрим матрицу парных
коэффициентов корреляции между факторами Хj, включенными в дальнейшем анализ.
Матрица парных корреляций
Явление сильной
коллинеарности наблюдается между факторами:
Х1 и Х3,
т.к. rх1х3 = 0,872 > 0,7
Х1 и Х4,
т.к. rх1х4 = 0,917 > 0,7
Х3 и Х4,
т.к. rх3х4 = 0,966 > 0,7
4) Построим модель у = f (х3, х6, х7,
х8, z) в линейной
форме.
Результаты регрессионного
анализа
Модель в линейной форме
будет иметь вид:
у(х) = -5,64 + 0,715х2
+ 0,475х3 + 6,786х6 + 1,284х7 – 0,037х8
Х6 (тип дома),
значимо воздействует на формирование цены квартиры в модели.
5) Оценим статистическую
значимость параметров регрессионной модели с помощью t-критерия; нулевую гипотезу о значимости уравнения регрессии
проверим с помощью F-критерия; оценим
качество уравнения регрессии с помощью коэффициента детерминации R2.
Характеристика остатков
линейной регрессии
Характеристика
|
Значение
|
Среднее значение
|
0,000
|
Дисперсия
|
10,579
|
Приведенная дисперсия
|
12,220
|
Средний модуль остатков
|
2,237
|
Относительная ошибка
|
7,144
|
Критерий Дарбина-Уотсона
|
1,154
|
Коэффициент детерминации
|
0,991
|
F - значение ( n1 = 8, n2 = 58)
|
764,697
|
36,993
|
Критерий точности
|
47,492
|
Критерий качества
|
44,867
|
Уравнение значимо с вероятностью 0.95
|
Коэффициент детерминации
показывает долю вариации результативного признака под воздействием изучаемых
факторов. Следовательно, около 99,1% вариации зависимой переменной учтено в
модели и обусловлено влиянием включенных факторов.
Табличное значение F-критерия (Fкрит) при доверительной вероятности 0,95 при n1 = 8 и n2 = 58 составляет 2,10. Проверка
гипотезы о значимости уравнения регрессии проводится на основании:
если Fфакт > Fкрит, то модель статистически значима;
если Fфакт < Fкрит, то модель статистически незначима.
Fфакт > Fкрит, значит модель статистически значима, т.е. пригодна к
использованию.
Оценим с помощью t-критерия Стьюдента статистическую
значимость коэффициентов уравнения регрессии.
Табличное значение t-критерия при 5% уровне значимости и
степени свободы k = 69-8-1 = 60 составляет
2,0003.
Если tрасч > tтабл, то коэффициент статистически значим.
Характеристика модели
|
Коэффициенты
|
Стандартная ошибка
|
t-статистика
|
Y-пересечение
|
-6,10491
|
1,867676003
|
-3,268720937
|
Переменная Х 1
|
-0,16426
|
1,096321271
|
-0,149825399
|
Переменная Х 2
|
0,744173
|
0,335026167
|
2,221237839
|
Переменная Х 3
|
0,36827
|
0,092869614
|
3,965447278
|
Переменная Х 4
|
0,147869
|
0,132602783
|
1,115126788
|
Переменная Х 5
|
0,177213
|
0,195399452
|
0,906925347
|
Переменная Х 6
|
6,93635
|
0,869661345
|
7,975921084
|
Переменная Х 7
|
1,777648
|
1,124095736
|
1,581402513
|
Переменная Х 8
|
-0,04802
|
0,072432334
|
-0,662966567
|
tb0 = 3,2687 > 2,0003 => коэффициент регрессии b0 статистически значим;
tb1 = 0,1498 < 2,0003 => коэффициент регрессии b0 статистически незначим;
tb2 = 2,2212 > 2,0003 => коэффициент регрессии b0 статистически значим;
tb3 = 3,9654 > 2,0003 => коэффициент регрессии b0 статистически значим;
tb4 = 1,1151 < 2,0003 => коэффициент регрессии b0 статистически незначим;
tb5 = 0,9069 < 2,0003 => коэффициент регрессии b0 статистически незначим;
tb6 = 7,9759 > 2,0003 => коэффициент регрессии b0 статистически значим;
tb7 = 1,5814 < 2,0003 => коэффициент регрессии b0 статистически незначим;
tb7 = 0,6630 < 2,0003 => коэффициент регрессии b0 статистически незначим;
6) существует ли разница
в ценах на квартиры, расположенных в северной и южной частях Санкт-Петербурга?
tb2 = 2,2212 > 2,0003, tb3 = 3,9654 > 2,0003 и tb6 = 7,9759 > 2,0003,
значит факторы Х2 (район
города), Х3 (общая площадь квартиры) и Х6 (тип дома) значимо влияют на
формирование цен на квартиры.
Анализ показал, что
разница в ценах на квартиры, расположенные в северной и южной частях
Санкт-Петербурга существенна, т.к. tb2
= 2,2212 > 2,0003.