Классическая модель линейной регрессии

  • Вид работы:
    Практическое задание
  • Предмет:
    Эктеория
  • Язык:
    Русский
    ,
    Формат файла:
    MS Word
    421,87 Кб
  • Опубликовано:
    2015-01-16
Вы можете узнать стоимость помощи в написании студенческой работы.
Помощь в написании работы, которую точно примут!

Классическая модель линейной регрессии

Лабораторная работа № 2


Тема "Классическая модель линейной регрессии"


Задания По данным приложения А:

1)      рассчитайте параметры линейного уравнения множественной регрессии с полным перечнем факторов по данным о деятельности крупнейших компаний США в 2007 г.

2)      дайте сравнительную оценку силы связи факторов с результатом с помощью средних (общих) коэффициентов эластичности.

)        оцените с помощью F-критерия Фишера - Снедекора значимость уравнения линейной регрессии и показателя тесноты связи.

)        оцените статистическую значимость коэффициентов регрессии с помощью t - критерия Стьюдента.

)        оцените качество уравнения через среднюю ошибку аппроксимации.

)        рассчитайте матрицу парных коэффициентов корреляции и отберите информативные факторы в модели. Укажите коллинеарные факторы.

)        постройте модель в естественной форме только с информативными факторами и оцените ее параметры.

)        постройте модель в стандартизованном масштабе и проинтерпретируйте ее параметры.

9)      рассчитайте прогнозное значение результата, если прогнозное значение факторов составляют 80% от их максимальных значений.

10)    рассчитайте ошибки и доверительный интервал прогноза для уровня значимости .

)        по полученным результатам сделайте экономический вывод.

Реализация типовых заданий


1.      Рассчитайте параметры линейного уравнения множественной регрессии с полным перечнем факторов по данным о деятельности крупнейших компаний США в 2007 г.

Имеются данные о деятельности 25 крупнейших компаний США (таблица 8.2.1).

Построим уравнение множественной линейной регрессии следующего вида:

.

Для этого проведем регрессионный анализ данных факторов с помощью табличного редактора МС Excel.

Таблица 8.2.1 - Исходные данные для проведения корреляционного и регрессионного анализа

№ п/п






1

45,9

34

68

12,5

43,3

2,3

2

46,7

16,1

49,3

18,8

42,9

3,9

3

45,7

7,2

66,6

7

41,3

1,7

4

46,7

12,7

17,3

14,6

40,9

2,6

5

47,6

22,7

78,5

30,7

39,7

3,1

6

46,3

17,7

20,9

28

28,9

0,6

7

49,1

139,8

356,4

100,6

39,4

5,1

8

20,6

72,4

24,8

39,2

2,6

9

51,9

168,1

218,2

216,1

38,7

4,5

10

45,4

4,7

5

1,2

37,7

1,9

11

46,3

9,5

28,8

7,8

37,7

3

12

46,9

29,8

68

12,4

37,4

3,6

13

46,9

16,1

47,5

17,9

28,6

3,7

14

46,4

12,5

45,4

61,5

35,5

2,5

15

45,4

22,2

43,9

30,5

35,1

3,1

16

45,8

9,5

11,5

9,7

34,5

0,3

17

46,8

29,7

46,8

41,2

32,9

2,2

18

45,9

24,8

27,8

32,2

3,5

19

46,1

20,4

54

40,6

27,8

4,1

20

46,9

15,4

42,8

17,2

31,7

4,3

21

44,1

24,1

5,8

38

31,6

2,9

22

46,3

16,2

31

20,5

31,6

3,5

23

47

16,1

41,4

19

31,5

4

24

45,6

6,9

6,8

6,7

30,3

2,6

25

45,7

18,2

20,9

23,4

29,6

4


где y - чистый доход, млрд. долл. x1 - оборот капитала, млрд. долл. x2 - использованный капитал, млрд. долл. x3 - численность служащих, тыс. чел. x4 - рыночная капитализация компаний, млрд. долл. x5 - заработная плата служащих, тыс. долл.

Для построения модели можно воспользоваться инструментом анализа данных Регрессия. Порядок действий следующий:

а) в главном меню выберите Сервис/Анализ данных/Регрессия. Щелкните по кнопке ОК;

б) заполните диалоговое окно ввода данных и параметров ввода (рисунок 8.2.1):

классическая модель линейная регрессия

Рисунок 8.2.1 - Диалоговое окно ввода параметров инструмента "Регрессия"

Входной интервал Y - диапазон, содержащий данные результативного признака;

Входной интервал Х - диапазон, содержащий данные всех пяти факторов;

Метки - флажок, который указывает, содержит ли первая строка названия столбцов или нет;

Константа - ноль - флажок, указывающий на наличие или отсутствие свободного члена в уравнении;

Выходной интервал - достаточно указать левую верхнюю ячейку будущего диапазона;

Новый рабочий лист - можно задать произвольное имя нового листа.

Результаты регрессионного анализа представлены на рисунке 8.2.2.

Рисунок 8.2.2 - Результат применения инструмента Регрессия для факторов

Составим уравнение множественной регрессии:


Коэффициенты регрессии показывают среднее изменение результативного признака с изменением на 1 единицу своего измерения данного фактора при условии постоянства всех остальных.

Таким образом, коэффициент регрессии при х1 показывает, что с увеличением оборотного капитала на 1 млрд. долл. чистый доход увеличится в среднем на 0,0136 млрд. долл., при х2 показывает, что с увеличением оборотного капитала на 1 млрд. долл. чистый доход увеличится в среднем на 0,003 млрд. долл., х3 показывает, что с увеличением оборотного капитала на 1 млрд. долл. чистый доход увеличится в среднем на 0,012 тыс. чел., х4 показывает, что с увеличением оборотного капитала на 1 млрд. долл. чистый доход увеличится в среднем на 0,025 млрд. долл., х5 показывает, что с увеличением оборотного капитала на 1 млрд. долл. чистый доход увеличится в среднем на 0,07 тыс. долл., при фиксированном значении остальных факторов.

Параметр экономического смысла не имеет.

2. Дайте сравнительную оценку силы связи факторов с результатом с помощью средних (общих) коэффициентов эластичности.

Средние коэффициенты эластичности  показывают, на сколько процентов от значения своей средней  изменяется результат при изменении фактора  на 1 % от своей средней  и при фиксированном воздействии на y всех прочих факторов, включенных в уравнение регрессии. Для линейной зависимости

,

где  - коэффициент регрессии при  в уравнении множественной регрессии.

Результаты вычисления соответствующих показателей для каждого признака представлены на рисунке 8.2.3.

Рисунок 8.2.3 - Результат применения инструмента "Описательная статистика"

Здесь ,

,

,

,

.

По значениям средних коэффициентов эластичности можно сделать вывод о более сильном влиянии на результат y признаков факторов  и , чем признаков факторов ,  и .

Средний коэффициент эластичности , показывает, что с увеличением оборотного капитала на 1 %, чистый доход увеличивается в среднем на 0,008 %, при условии, что другие факторы остаются постоянными, , показывает, что с увеличением оборотного капитала на 1 %, чистый доход увеличивается в среднем на 0,003 %, при условии, что другие факторы остаются постоянными, , показывает, что с увеличением оборотного капитала на 1 %, чистый доход увеличивается в среднем на 0,009 %, при условии, что другие факторы остаются постоянными, , показывает, что с увеличением оборотного капитала на 1 %, чистый доход увеличивается в среднем на 0,019 %, при условии, что другие факторы остаются постоянными, , показывает, что с увеличением оборотного капитала на 1 %, чистый доход увеличивается в среднем на 0,005 %, при условии, что другие факторы остаются постоянными.

3. Оцените с помощью F-критерия Фишера-Снедекора значимость уравнения линейной регрессии и показателя тесноты связи.

Оценку надежности уравнения регрессии в целом и показателя тесноты связи  дает F-критерий Фишера:

.

Для проверки значимости уравнения выдвигаем две гипотезы:

Н0: уравнение регрессии статистически не значимо;

Н1: уравнение регрессии статистически значимо.

По данным таблиц дисперсионного анализа, представленным на рисунке 8.2.2, =11.52. Вероятность случайно получить такое значение F-критерия составляет 0,00003, что не превышает допустимый уровень значимости 5 %; об этом свидетельствует величина P - значение из этой же таблицы. Следовательно, полученное значение не случайно, оно сформировалось под влиянием существенных факторов, т.е. подтверждается статистическая значимость всего уравнения и показателя тесноты связи . =0,00003.  >  следовательно уравнение регрессии является статистически значимым.

4.      Оцените статистическую значимость коэффициентов регрессии с помощью t - критерия Стьюдента.

Выдвигаем две гипотезы: Н0: коэффициенты регрессии статистически не значим, т.е. равны о; Н1: коэффициенты регрессии статистически значимы, т.е. отличны от нуля. Значения случайных ошибок параметров  с учетом округления равны (рисунок 8.2.2):


Они показывают, какое значение данной характеристики сформировались под влиянием случайных факторов. Эти значения используются для расчета t-критерия Стьюдента (рисунок 8.2.2):

.

Если значения t-критерия меньше 2,09, можно сделать вывод о неслучайной природе данного значения параметра, т. е о том, что он статистически значим и надежен. Tтабл=

5. Оцените качество уравнения через среднюю ошибку аппроксимации.

Рассчитаем среднюю ошибку аппроксимации по формуле средней арифметической простой:


Таблица 8.2.2 - Данные для расчета средней ошибки аппроксимации

№ п/п



1

2

3

4

1

45,9

46,58

1,48

2

46,7

46,46

0,52

3

45,7

46,05

0,77

4

46,7

46,12

1,23

5

47,6

46,64

2,01

6

46,3

45,92

0,81

7

49,1

50,04

1,91

8

46,6

0,26

9

51,9

51,34

1,09

10

45,4

45,69

0,64

11

46,3

46,82

1,13

12

46,9

46,47

0,93

13

46,9

46,07

1,77

14

46,4

46,63

0,49

15

45,4

46,41

2,23

16

45,8

45,68

0,25

17

46,8

46,54

0,57

18

45,9

46,18

0,62

19

46,1

46,43

0,71

20

46,9

46,16

1,58

21

44,1

46,36

5,12

22

46,3

46,11

0,40

23

47

46,16

1,79

24

45,6

45,65

0,12

25

45,7

46,13

0,94


1164,00

29,38



Таким образом, фактические значения результативного признака отличаются от теоретических значений на 117,5 %. Следовательно, построенная модель не является удовлетворительной.

i.       Рассчитайте матрицу парных коэффициентов корреляции и отберите информативные факторы в модели. Укажите коллинеарные факторы.

Значения линейных коэффициентов парной корреляции определяют тесноту попарно связанных переменных, использованных в данном уравнении множественной регрессии.

Парные коэффициенты корреляции рассчитываются по формулам:

; .

Рисунок 8.2.4 - Матрица коэффициентов парной корреляции

Из матрицы можно заметить, что факторы  и ,  и  мультиколлинеарны, т.к. коэффициенты корреляции превышают 0,7. Таким образом, можно сказать, что они дублируют друг друга.

При отборе факторов в модель предпочтение отдается фактору, который при достаточно тесной связи с результатом имеет наименьшую тесноту связи с другими факторами. В нашем примере получаем, информативными факторами являются:  и .

Построим новое уравнение множественной регрессии с информативными факторами.

7. Постройте модель в естественной форме только с информативными факторами и оцените ее параметры.

Построим уравнение множественной линейной регрессии следующего вида:

.

Параметры вычисляем аналогично пункту 1 (рисунок 8.2.7).

Рисунок 8.2.7 - Результат применения инструмента "Регрессия"

Получаем уравнение следующего вида: .

Уравнение в целом, а также его параметры являются статистически значимыми.

8. Постройте модель в стандартизованном масштабе и проинтерпретируйте ее параметры.

Уравнение в стандартизованном масштабе имеет вид:

.

Расчет β - коэффициентов выполним по формулам

; .

Парные коэффициенты корреляции берутся из матрицы (рисунок 8.2.6):


Получим уравнение .

Стандартизованные коэффициенты регрессии показывают, на сколько сигм изменится в среднем результативный признак, если соответствующий фактор изменится на 1 сигму при неизменном среднем уровне других факторов.

В нашем случае, при увеличении использования капитала на 1 сигму чистый доход увеличится на 1,07 сигм, при условии, что численность служащих остаются на прежнем уровне, при увеличении использования капитала на 1 сигму чистый доход уменьшится на 0,46 сигм, при условии, что численность служащих остаются на прежнем уровне.

9. Рассчитайте прогнозное значение результата, если прогнозное значение факторов составляют 80% от их максимальных значений.

Рассчитаем ожидаемое прогнозное значение чистого дохода как точечный прогноз путем подстановки в уравнение регрессии прогнозные значения факторов:

1)      найдем максимальное значение для фактора  (рисунок 8.2.4):

)        найдем максимальное значение для фактора  (рисунок 8.2.4):

)        найдем прогнозные значения факторов:

для фактора :

для фактора :

4)      подставим прогнозные значения факторов в уравнение


В результате получим:


Таким образом, при прогнозных значениях использованного капитала 356 млдр. долл. и численности служащих 216,1 тыс. чел. чистый доход крупнейших компаний США составит 92,21 млрд. долл.

Похожие работы на - Классическая модель линейной регрессии

 

Не нашли материал для своей работы?
Поможем написать уникальную работу
Без плагиата!