Корреляционно-регрессионный анализ экономических показателей с помощью компьютерных технологий

  • Вид работы:
    Контрольная работа
  • Предмет:
    Информационное обеспечение, программирование
  • Язык:
    Русский
    ,
    Формат файла:
    MS Word
    1015,61 Кб
  • Опубликовано:
    2013-11-22
Вы можете узнать стоимость помощи в написании студенческой работы.
Помощь в написании работы, которую точно примут!

Корреляционно-регрессионный анализ экономических показателей с помощью компьютерных технологий

МИНИСТЕРСТВО ОБРАЗОВАНИЯ  РЕСПУБЛИКИ БЕЛАРУСЬ

УО «ВИТЕБСКИЙ ГОСУДАРСТВЕННЫЙ ТЕХНОЛОГИЧЕСКИЙ УНИВЕРСИТЕТ»










КОНТРОЛЬНАЯ РАБОТА № 2

по дисциплине «Компьютерные информационные технологии»












ВИТЕБСК 2011

Задание 1. Используя компьютерные технологии, провести корреляционно-регрессионный анализ исследуемых экономических показателей и построить регрессионную модель

В качестве инструментария исследования использовать:

функции категории «Статистические» ТП MS Excel;

инструменты надстройки Пакет Анализа ТП MS Excel;

встроенные функции библиотеки Stats СКМ Maple.

Вариант 3. Зависимость между показателями Х1, Х2, Х3 реализованной продукции и балансовой прибылью Y предприятий одной из отраслей промышленности характеризуется данными, представленными в таблице ниже.

Х1

1.2

2.8

3.4

4.6

5.2

6.4

7.8

8.3

9.1

9.9

10.5

Х2

1.2

1.8

2.0

2.5

3.0

3.2

3.5

4.9

5.0

6.2

7.3

Х3

2

3

4

3

2

6

5

7

8

12

9

Y

20

50

57

63

22

75

60

81

87

102

95


По выборочным данным исследовать влияние факторов X1, X2 и X3 на результативный признак Y.

Построить корреляционное поле и сделать предположение о наличии и типе связи между исследуемыми факторами.

Оценив тесноту связи между исследуемыми факторами, построить многофакторную (однофакторную) линейную регрессионную модель вида Y=f(X1,X2,X3) или вида Y=f(X).

Оценить:

адекватность уравнения регрессии по значению коэффициента детерминированности R2;

значимость коэффициентов уравнения регрессии по t-критерию Стьюдента при заданном уровне доверительной вероятности p=0,05;

степень случайности связи между каждым фактором X и признаком Y (критерий Фишера).

Решение

Вводим исходные данные (рис. 1.1).

Рис. 1.1. Исходные данные

регрессия план детерминированность

Нанеся пары (X1;Y), (X2;Y), (X3;Y) на координатную плоскость, получаем так называемое корреляционное облако, вид которого позволяет предположить, что линейная зависимость между переменными не лишена оснований (рис. 1.2).

Рис. 1.2. Корреляционное облако

Для проведения корреляционного анализа необходимо выполнить следующие действия:

Меню Сервис, Анализ данных… В появившемся окошке выбираем Корреляция.

В диалоговом окне Корреляция (рис. 1.3) вводим Входной интервал - $A$1:$D$12. Отмечаем флажок Метки в первой строке, т.к. во входной интервал мы включили и заголовки столбцов. Параметры вывода укажем Выходной интервал $A$16.

Рис. 1.3. Диалоговое окно Корреляция

В результате в ячейках $A$16:$E$20 получим матрицу коэффициентов парной корреляции (см. рис. 1.4).

Рис. 1.4. Матрица коэффициентов парной корреляции.

Видно, что зависимая переменная Y имеет тесную прямую связь с переменными X1, X2 и X3.

Построим регрессионную модель. Меню Сервис, Пакет анализа… В появившемся окошке выбираем Регрессия. В диалоговом окне Регрессия (рис. 1.5) вводим: Входной интервал Y - $D$1:$D$12, Входной интервал X - $A$1:$C$12, Выходной интервал - $G$1. Результаты регрессии, оформленные в виде трех таблиц, будут представлены на текущем рабочем листе. Отмечаем флажок Метки и флажок График остатков.

Рис. 1.5. Диалоговое окно Регрессия

Рассмотрим полученные результаты регрессии (рис. 1.6). Первая таблица - Регрессионная статистика - содержит показатели регрессии. Коэффициент детерминации (R-квадрат), ячейка H5, показывает долю вариации результативного признака Y под действием изучаемых факторов X1, Х2, X3. Следовательно, около 85,5% вариации зависимой переменной учтено в модели и обусловлено влиянием изучаемых факторов.

Рис. 1.6. Результаты регрессии

Вторая таблица - Дисперсионный анализ - позволяет осуществить проверку значимости уравнения регрессии. Регрессионная и остаточная суммы квадратов показаны в ячейках I12 и I13 соответственно. Регрессионная сумма квадратов довольно существенно (в 6 раз) превосходит остаточную. Это говорит о том, что большая часть вариации производительности труда Y связана с факторами X1, Х2, X3.

В ячейке K12 показано расчетное значение F-критерия Фишера, а в ячейке H13 число степеней свободы, которое определяется как количество наблюдений (11) за вычетом параметров линейной регрессии (3) и единицы.

Проведем оценку значимости связи, сравнив табличное и расчетное значения F-критерия, который показывает, является ли наблюдаемая взаимосвязь между зависимой и независимой переменными случайной или нет. Для этого можно использовать функцию =FРАСПОБР(0,05;H12;H13).

При уровне значимости 0,05 и числе степеней свободы 3 и 7 табличное значение F-критерия составляет около 4,34683. Расчетное значение 13,7761 больше, что свидетельствует о статистической значимости связи и, значит, уравнение регрессии следует считать адекватным.

Третья таблица - Регрессионная модель - показывает коэффициенты уравнения регрессии - b, m1, ... m3 (ячейки H17:H20 соответственно) и позволяет оценить из значимость. Оценка значимости этих коэффициентов производится с использованием t-критерия Стьюдента (ячейки J17:J20) и уровня значимости p<0,05 (ячейки K17:R20). Табличное значение t-критерия при уровне значимости 5% и степенях свободы n = 7 (функция =СТЬЮДРАСПОБР(0,05;H13)) составляет 2,364623, что меньше фактического значения t-критерия Стьюдента коэффициента при X3 и больше значений t-критерия коэффициентов при X1 и X2, т. е. не все коэффициенты существенны. Следовательно, факторы X1 и X2 из модели можно исключить.

Рассчитанное уравнение регрессии может быть представлено в виде:

Y = 3,358*X1 - 4,102*X2 + 7,115*X3 + 19,282

Рассчитать уравнение регрессии можно и с помощью функции ЛИНЕЙН.

Введем в ячейки A1:D12 данные. В ячейки A15:D19 рабочего листа Excel введем функцию в формате =ЛИНЕЙН(D2:D12;A2:C12;;ИСТИНА) и получим результат (см. рис. 1.6). Следует учесть, что формула вводится как формула массива. При этом способе расчета будет представлена не вся дополнительная статистика по регрессии. Верхняя строка (ячейки A15:D15) - коэффициенты уравнения регрессии m3 … m1 и b, ячейка A17 - коэффициент детерминированности R-квадрат = 0,855157, ячейка A18 - критерий Фишера F = 13,7761. Разделив значения в ячейках A15:D15 на значения стандартной ошибки (ячейки A16:D16) получим t-статистики.

Рис. 1.6. Результат использования функции ЛИНЕЙН

Таблицы с результатами расчетов и формулами в ячейках приведены на стр. 14-15.

Рассчитать уравнение регрессии можно и с помощью функций библиотеки Stats СКМ Maple.

> stats[fit, leastsquare[[x1, x2, x3, y]]]([[1.2, 2.8, 3.4, 4.6, 5.2, 6.4, 7.8, 8.3, 9.1, 9.9, 10.5], [1.2, 1.8, 2, 2.5, 3, 3.2, 3.5, 4.9, 5, 6.2, 7.3], [2, 3, 4, 3, 2, 6, 5, 7, 8, 12, 9], [20, 50, 57, 63, 22, 75, 60, 81, 87, 102, 95]]); = 19.28215417 + 3.358180454 x1 - 4.101593778 x2 + 7.115326625 x3

Все введенные выражения и полученные в рабочем документе СКМ Maple результаты решений приведены на стр. 16.

 

Задание 2. Используя компьютерные технологии, решить задачи линейного программирования

а) Задача оптимального планирования производства.

Условие. Для производства двух видов изделий А и В используется три типа технологического оборудования. На производство единицы изделия А оборудование первого типа используется а1 часов, оборудование второго типа - а2 часов, оборудование третьего типа - а3 часов. На производство единицы изделия В оборудование первого типа используется в1 часов, оборудование второго типа - в2 часов, оборудование третьего типа - в3 часов.

На изготовление всех изделий администрация предприятия может предоставить оборудование первого типа не более чем на t1 часов, оборудование второго типа не более чем на t2 часов, оборудование третьего типа не более чем на t3 часов. Прибыль от реализации единицы готового изделия А составляет α руб., а изделия В - β руб.

Составить план производства изделий А и В, обеспечивающий максимальную прибыль от их реализации.

Вариант

а1

а2

а3

в1

в2

в3

t1

t2

t3

α

β

3

6

4

3

2

3

4

600

520

600

6

3


В качестве инструментария решения использовать:

надстройку Поиск решения ТП MS Excel;

- библиотеки Simpleх и Optimization СКМ Maple.

Решение

Разместим таблицу с исходными данными в ячейках A1:F7 и выполним необходимые предварительные расчеты (рис. 2.1), т.е. в строке 6 будут формулы: =СУММПРОИЗВ(B3:B4;$F$3:$F$4) - в ячейке B6; =СУММПРОИЗВ(С3:С4;$F$3:$F$4) - в ячейке С6; =СУММПРОИЗВ(D3:D4;$F$3:$F$4) - в ячейке D6; =СУММПРОИЗВ(E3:E4;$F$3:$F$4) - в ячейке E6.

Рис. 2.1. Исходные данные

Необходимо отыскать решение задачи, приняв следующие условия:

итоговая прибыль (ячейка E6) - max;

количество изделий (ячейки F3:F4) >= 0, целое значение;

затраты времени по типам оборудования (ячейки B6:D6 <= B7:D7);

изменяемые ячейки - F3:F4 - количество изделий для оптимального производства.

Окончательный вид формулировки задачи представлен на рис. 2.2.

Рис. 2.2. Формулировка задачи

Итоговый результат показан на рис. 2.3.

Рис. 2.3. Результаты Поиска решения

Все без исключения требования задачи выполнены.

Дополнительно можно сформировать отчет по результатам (рис. 2.4).

Рис. 2.4. Отчет по результатам

Таблица с результатами расчетов и формулами в ячейках приведена на стр. 17.

Решим задачу, используя библиотеку СКМ Maple Simplex.

Экономико-математическая модель задачи имеет следующий вид.

Целевая функция:

f := 6*A + 2*B.

Ограничения:

A, B - неотрицательные (> =0);

A, B - целочисленные;

6*А + 2*В <= 600;

4*A + 3*B <= 520;

3*A + 4*B <=600.

Решение в СКМ Maple будет таким:

> restart;

> with(simplex);

[basis, convexhull, cterm, define_zero, display, dual, feasible, maximize, minimize, pivot, pivoteqn, pivotvar, ratio, setup, standardize]

> f := 6*A+3*B;

A + 3 B

> limity := {3*A+4*B <= 600, 4*A+3*B <= 520, 6*A+2*B <= 600};

{3 A + 4 B <= 600, 4 A + 3 B <= 520, 6 A + 2 B <= 600}

> result := maximize(f, limity, NONNEGATIVE);

{A = 76, B = 72}

> TCell := subs(result, f);

672

Все введенные выражения и полученные в рабочем документе СКМ Maple результаты решений приведены на стр. 18.

Решение в системе СКМ Maple с использованием библиотеки Optimization будет таким:

> restart;

> with(Optimization);

[ImportMPS, Interactive, LPSolve, LSSolve, Maximize, Minimize, NLPSolve, QPSolve]

> f := 6*A+3*B;

A + 3 B

> limity := {3*A+4*B <= 600, 4*A+3*B <= 520, 6*A+2*B <= 600};

{3 A + 4 B <= 600, 4 A + 3 B <= 520, 6 A + 2 B <= 600}

> LPSolve(f, limity, assume = {integer, nonnegative}, maximize);

[672, [A = 76, B = 72]]

Все введенные выражения и полученные в рабочем документе СКМ Maple результаты решений приведены на стр. 19.

б) Задача оптимизации плана перевозок (транспортная задача).

Условие. Имеются n пунктов производства и m пунктов распределения продукции. Стоимость перевозки единицы продукции с i-го пункта производства в j-й центр распределения cij приведена в таблице, где под строкой понимается пункт производства, а под столбцом - пункт распределения. Кроме того, в этой таблице в i-й строке указан объем производства в i-м пункте производства, а в j-м столбце указан спрос в j-м центре распределения. Необходимо составить план перевозок по доставке требуемой продукции в пункты распределения, минимизирующий суммарные транспортные расходы.

Вариант 3.


Стоимость перевозки единицы продукции

Объемы производства


6

3

4

5

20


5

2

3

3

70


3

4

2

4

50


5

6

2

7

30

Объемы потребления

40

30

80

20



В качестве инструментария решения использовать (на выбор из перечисленных ниже):

надстройку Поиск решения ТП MS Excel;

библиотеку Simplex СКМ Maple;

библиотеку Optimization СКМ Maple.

Решение

Первым делом отметим, что данная модель сбалансирована, т.е. суммарный объем производства равен суммарному объему потребления.

Разместим исходные данные (рис. 2.5). Ячейки B2:E5 содержат стоимость перевозки единицы продукции. Ячейки B8:E11 отведены под значения неизвестных. Ячейки G8:G11 содержат объемы производства, а ячейки B13:E13 - объемы потребления.

В ячейке B15 находится функция цели =СУММПРОИЗВ(B2:E5;B8:E11). Ячейки F8:F11 содержат формулы для расчета объемов производства: =СУММ(B8:E8); =СУММ(B9:E9); =СУММ(B10:E10); =СУММ(B11:E11). А ячейки B12:E12 содержат формулы для расчета объема потребления: =СУММ(B8:B11); =СУММ(C8:C11); =СУММ(D8:D11); =СУММ(E8:E11).

Рис. 2.5. Исходные данные

В диалоговом окне Поиск решения (рис. 2.6) задаем целевую ячейку, изменяемые ячейки и ограничения.

Рис. 2.6. Диалоговое окно Поиск решения

Оптимальный план, обеспечивающий минимальные затраты на перевозку продукции от производителей к потребителям представлен на рис. 2.7.

Рис. 2.7. Результаты решения.

Таблица с результатами расчетов и формулами в ячейках приведена на стр. 20.

регрессия оптимизация план детерминированность

 

Приложения


Задание 1. Результаты регрессии, полученные с помощью Анализа данных

x1

x2

x3

y

ВЫВОД ИТОГОВ









1,2

1,2

2

20










2,8

1,8

3

50

Регрессионная статистика








3,4

2

4

57

Множественный R

0,92474719








4,6

2,5

3

63

R-квадрат

0,85515737








5,2

3

2

22

Нормированный R-квадрат

0,79308196








6,4

3,2

6

75

Стандартная ошибка

12,2903999








7,8

3,5

5

60

Наблюдения

11








8,3

4,9

7

81










9,1

5

8

87

Дисперсионный анализ









9,9

6,2

12

102

 

df

SS

MS

F

Значимость F




10,5

7,3

9

95

Регрессия

3

6242,804

2080,935

13,7761

0,002536








Остаток

7

1057,378

151,0539










Итого

10

7300,182

 

 

 

















 

x1

x2

x3

 

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Нижние 95,0%

Верхние 95,0%

x1

1



Y-пересечение

19,2821542

8,750639

2,203514

0,063401

-1,4098

39,97411

-1,4098

39,97411

x2

0,954219

1


x1

3,35818045

4,259006

0,788489

0,456279

13,42912

-6,71276

13,42912

x3

0,872999

0,89252

1

x2

-4,10159378

7,367507

-0,55671

0,595065

-21,523

13,31978

-21,523

13,31978

y

0,841096

0,826568

0,917611

x3

7,11532662

2,72296

2,613086

0,034757

0,676555

13,5541

0,676555

13,5541



























Фишер

4,34683












Стьюдент

2,364623



ВЫВОД ОСТАТКА


























Наблюдение

Предсказанное y

Остатки











1

32,6207114

-12,6207











2

42,6481705

7,351829











3

50,9580867

6,041913











4

45,8217797

17,17822











5

38,6705644

-16,6706











6

70,3413687

4,658631











7

66,6970166

-6,69702











8

76,8645288

4,135471











9

86,2562404

0,74376











10

112,482179

-10,4822











11

88,639354

6,360646






















Задание 1. Результаты регрессии, полученные с помощью функции ЛИНЕЙН.

x1

x2

x3

y

1,2

1,2

2

20

2,8

1,8

3

50

3,4

2

4

57

4,6

2,5

3

63

5,2

3

2

22

6,4

3,2

6

75

7,8

3,5

5

60

8,3

4,9

7

81

9,1

5

8

87

9,9

6,2

12

102

10,5

7,3

9

95

7,115327

-4,10159

3,35818

19,28215

2,72296

7,367507

4,259006

8,750639

0,855157

12,2904

#Н/Д

#Н/Д

13,7761

7

#Н/Д

#Н/Д

6242,804

1057,378

#Н/Д

#Н/Д


x1

x2

x3

y

1,2

1,2

2

20

2,8

1,8

3

50

3,4

2

4

57

4,6

2,5

3

63

5,2

3

2

22

6,4

3,2

6

75

7,8

3,5

5

60

8,3

4,9

7

81

9,1

5

8

87

9,9

6,2

12

102

10,5

7,3

9

95

=ЛИНЕЙН(D2:D12;A2:C12;;ИСТИНА)

=ЛИНЕЙН(D2:D12;A2:C12;;ИСТИНА)

=ЛИНЕЙН(D2:D12;A2:C12;;ИСТИНА)

=ЛИНЕЙН(D2:D12;A2:C12;;ИСТИНА)

=ЛИНЕЙН(D2:D12;A2:C12;;ИСТИНА)

=ЛИНЕЙН(D2:D12;A2:C12;;ИСТИНА)

=ЛИНЕЙН(D2:D12;A2:C12;;ИСТИНА)

=ЛИНЕЙН(D2:D12;A2:C12;;ИСТИНА)

=ЛИНЕЙН(D2:D12;A2:C12;;ИСТИНА)

=ЛИНЕЙН(D2:D12;A2:C12;;ИСТИНА)

=ЛИНЕЙН(D2:D12;A2:C12;;ИСТИНА)

=ЛИНЕЙН(D2:D12;A2:C12;;ИСТИНА)

=ЛИНЕЙН(D2:D12;A2:C12;;ИСТИНА)

=ЛИНЕЙН(D2:D12;A2:C12;;ИСТИНА)

=ЛИНЕЙН(D2:D12;A2:C12;;ИСТИНА)

=ЛИНЕЙН(D2:D12;A2:C12;;ИСТИНА)

=ЛИНЕЙН(D2:D12;A2:C12;;ИСТИНА)

=ЛИНЕЙН(D2:D12;A2:C12;;ИСТИНА)

=ЛИНЕЙН(D2:D12;A2:C12;;ИСТИНА)

=ЛИНЕЙН(D2:D12;A2:C12;;ИСТИНА)






Задание 1. Результаты регрессии, полученные в СКМ Maple с помощью функций библиотеки Stats.

>

>

>

Задача оптимального планирования производства. Исходные данные и результаты, полученные с помощью Поиска решения.

Виды изделий

Затраты на производство, ч

Прибыль от единицы, руб

Кол-во


I

II

III



A

6

4

3

6

76

B

2

3

4

3

72

 

 

 

 

 

 

t

600

520

516

672


t max

600

520

600










Виды изделий

Затраты на производство, ч

Прибыль от единицы, руб

Кол-во


I

II

III



A

6

4

3

6

76

B

2

3

4

3

72

 

 

 

 

 

 

t

=СУММПРОИЗВ(B3:B4;$F$3:$F$4)

=СУММПРОИЗВ(C3:C4;$F$3:$F$4)

=СУММПРОИЗВ(D3:D4;$F$3:$F$4)

=СУММПРОИЗВ(E3:E4;$F$3:$F$4)


t max

600

520

600




Microsoft Excel 9.0 Отчет по результатам




Рабочий лист: [kr2.xls]Лист4





Отчет создан: 07.03.2011 14:34:07





Целевая ячейка (Максимум)






Ячейка

Имя

Исходно

Результат




$E$6

t Прибыль от единицы, руб

672

672



Изменяемые ячейки






Ячейка

Имя

Исходно

Результат




$F$3

A Кол-во

76

76




$F$4

B Кол-во

72

72



Ограничения






Ячейка

Имя

Значение

формула

Статус

Разница


$B$6

t I

600

$B$6<=$B$7

связанное

0


$C$6

t II

520

$C$6<=$C$7

связанное

0


$D$6

t III

516

$D$6<=$D$7

не связан.

84


$F$3

A Кол-во

76

$F$3=целое

связанное

0


$F$4

B Кол-во

72

$F$4=целое

связанное

0


$F$3

A Кол-во

76

$F$3>=0

не связан.

76


$F$4

72

$F$4>=0

не связан.

72









Задача оптимального планирования производства. Результаты, полученные в СКМ Maple с помощью библиотеки Simplex.

>

>

>

>

>

>

>

Задача оптимального планирования производства. Результаты, полученные в СКМ Maple с помощью библиотеки Optimization.

>

>

>

>

>

>

Задача оптимизации плана перевозок (транспортная задача). Решение, полученное с помощью Поиска решения.


Стоимость перевозки единицы продукции




6

3

4

5




5

2

3

3




3

4

2

4




5

6

2

7




Неизвестные




Объем производства


0,00

0,00

20,00

0,00

20

20


0,00

30,00

20,00

20,00

70

70


40,00

0,00

10,00

0,00

50

50


0,00

0,00

30,00

0,00

30

30


40

30

80

20



Объем потребления

40

30

80

20



Целевая ячейка

460







Таблица


Стоимость перевозки единицы продукции





6

3

4

5




5

2

3

3




3

4

2

4




5

6

2

7




Неизвестные





Объем производства


-9,99999999917733E-07

-9,99999999917733E-07

20,000002

0

=СУММ(B8:E8)

20


0

30,000001

20

20

=СУММ(B9:E9)

70


40,000002

0

9,999999

0

=СУММ(B10:E10)

50


0

0

30

0

=СУММ(B11:E11)

30


=СУММ(B8:B11)

=СУММ(C8:C11)

=СУММ(D8:D11)

=СУММ(E8:E11)



Объем потребления

40

30

80

20



Целевая ячейка

=СУММПРОИЗВ(B2:E5;B8:E11)






 

Литература


1.       Образовательный математический сайт www.exponenta.ru.

2.      Шарстнев В.Л. Компьютерные информационные технологии: Курс лекций - Витебск: УО «ВГТУ», 2006.

Похожие работы на - Корреляционно-регрессионный анализ экономических показателей с помощью компьютерных технологий

 

Не нашли материал для своей работы?
Поможем написать уникальную работу
Без плагиата!