Описательная статистика. Частоты

  • Вид работы:
    Курсовая работа (т)
  • Предмет:
    Эктеория
  • Язык:
    Русский
    ,
    Формат файла:
    MS Word
    382,58 Кб
  • Опубликовано:
    2014-09-17
Вы можете узнать стоимость помощи в написании студенческой работы.
Помощь в написании работы, которую точно примут!

Описательная статистика. Частоты

Содержание

1. Описательная статистика. Частоты

. Корреляция

. Линейная и нелинейная регрессия

. Дисперсионный анализ

. Дискриминантный анализ

. Кластерный анализ

. Линейное программирование

. Параметрические и непараметрические критерии

1. Описательная статистика. Частоты

Для показателей: уровень рентабельности, прибыль, полная себестоимость, цена реализации, рассчитать среднее значение, max, min, размах, эксцесс, асимметрию, дать интерпретацию каждому параметру.

Таблица 1 - Описательная статистика

 

N

Размах

Minimum

Maximum

Среднее

Среднее отклонение

Дисперсия

Ассимметрия

Эксцесс


Statistic

Statistic

Statistic

Statistic

Statistic

Стат.велич

Стат.велич

Стат.велич

Станд.ош

Стат.велич.

Станд.ош

Уровень рентабельности

91

279

-64,55

214,6

31,45

45,95

2111,70

1,216

0,2

3,9

0,5

Прибыль убыток тыс./руб.

91

10410

-76664

27440

1790

10648

113400

-4,337

0,2

33

0,5

Полная себестоимость за 1 ц/руб.

91

1017

89,79

1107

392,3

157

24850

1,785

0,2

4,9

0,5

Средняя цена реализации за 1 ц/руб.

91

879

164,52

1043

471,1

142,2

20245

1,19

0,2

2,3

0,5


Анализ представлен за 2008-2009 год по 91 предприятию по Верхнеуральскому, Варненскому, Октябрьскому районам. Нами были рассчитаны показатели: рентабельность, средняя цена реализации, прибыль и полная себестоимость. Таким образом:

Ср. значение по уровню рентабельности 31,46; по прибыли 1790,6; по полной себестоимости 392,37; по ср. цене реализации 471,2.

Max по уровню рентабельности 214,0036; по прибыли 27440, по полной себестоимости 1107,3; по ср.цене реализации 1043,7.

Min по уровню рентабельности -64,5; по прибыли -76664; по полной себестоимости 89,8; по ср.цене реализации 164,5.

Размах по уровню рентабельности 279,2; по прибыли 104104; по полной себестоимости 1017,5; по ср. цене реализации 879,1.

Эксцесс по уровню рентабельности 3,91 (полновершинное распределение); по прибыли 33,7 (полновершинное распределение); по полной себестоимости 4,9 (полновершинное распределение); по ср.цене реализации 2,4 (полновершинное распределение).

Асимметрия по уровню рентабельности 1,2 (сдвиг в сторону меньших значений, т.е. предприятия с меньшей рентабельностью); по прибыли -4,33 (сдвиг в сторону больших значений, т.е. предприятия с большей рентабельностью); по полной себестоимости 1,78 (сдвиг в сторону меньших значений, т.е. предприятия с меньшей рентабельностью); по ср. цене реализации 1,19 (сдвиг в сторону меньших значений, т.е. предприятия с меньшей рентабельностью).

) Построить гистограмму распределения уровня рентабельности на предприятии;

) Построить гистограмму прибыли и убытков;

) Сформировать гистограмму средняя цена реализации;

) Построить столбиковую диаграмму полной себестоимости.

Таблица 2 - Средняя цена реализации за 1ц/руб.

Ведомство

Среднее

Кол-во предпр.

Стандарт, отклонение

Медиана

Варненский район

506,939517632340300

28

126,042600783486530

484,088987040895200

Верхнеуральский район

410,536216344213240

29

96,888364694753300

400,347372991749860

Октябрьский район

493,490505325712600

34

171,529677556912000

453,785062517926100

Общее кол-во

471,192680755625800

91

142,287229951379860

436,488970588235250


В таблице 2 представлены средние значения цены реализации 1 тонны пшеницы по предприятиям Варненского района - 506,9 р., Верхнеуральского района - 410,5 р. и Октябрьского района - 493,5 р. за 2008-2009 год.

) На графике представлен уровень рентабельности предприятия, и он приближен к нормальному распределению.

Рисунок 1 - Уровень рентабельности

регрессия корреляция программирование рентабельность

2) На графике представлены прибыли и убытки, анализируемые данные распределены по нормальному распределению.

Рисунок 2 - Прибыли и убытков

3) На графике представлена средняя цена реализации, анализируемые данные распределены по нормальному распределению.

Рисунок 3 - Средняя цена реализации за 1 ц/руб.

) На графике представлена полная себестоимость, анализируемые данные распределены по нормальному распределению.

Рисунок 4 - Полная себестоимость за 1 ц/руб.

Рассматривалась столбиковая гистограмма по полной себестоимости. Шкала от 90 до 1100 рублей. Из полученных данных можно сделать вывод о том, что приблизительно в у 20 предприятий себестоимость за 1ц составила 400 руб. В среднем у 4-х предприятий данный показатель составил 200 руб., у 7-ми - 250 руб., у 10-ти - 350 руб., у 9-ти - 500 руб., у 2-х - 600 руб., у 3-х - 800 руб.

. Корреляция

) Определить существует ли взаимосвязь между рентабельностью и затратами на рекламу;

) Определить существует ли взаимосвязь между затратами на содержание основных средств и урожайностью, рентабельностью;

) Определить существует ли взаимосвязь между затратами на ГСМ и рентабельностью.

Таблица 3 - Связь между рентабельностью и затратами на рекламу


Рентабельность

Затраты на рекламу, руб.

Рентабельность

Корреляция Пирсона

1

0,430**


Sig. (2-tailed)


0,002


Кол-во

48

48

Затраты на рекламу, руб.

Корреляция Пирсона

0,430**

1


Sig. (2-tailed)

0,002



Кол-во

48

48


Между рентабельностью и затратами существует взаимосвязь, но она незначительная, так как отдалена от коэффициента 1, и она составляет 0,43. Между двумя признаками образована прямая связь. Следовательно, при увеличении одного признака, увеличивается и второй признак.

Таблица 4 - Взаимосвязь между затратами на содержание ОС и урожайностью.


Основные средства

Урожайность пшеницы, ц/га

Основные средства

Корреляция Пирсона

1

-0,113


Sig. (2-tailed)


0,372


Кол-во

64

64

Урожайность пшеницы, ц/га

Корреляция Пирсона

-0,113

1


Sig. (2-tailed)

0,372



Кол-во

64

64


Между урожайностью и основными средствами очень слабая взаимосвязь, так как коэффициент равен -0,113. Связь обратная, с увеличением одного фактора происходит уменьшение второго фактора.

Таблица 5 - Взаимосвязь между затратами на содержание ОС и рентабельностью.


Основные средства

Рентабельность

Основные средства

Корреляция Пирсона

1

-0,161


Sig. (2-tailed)


0,204


Кол-во

64

64

Рентабельность

Корреляция Пирсона

-0,161

1


Sig. (2-tailed)

0,204



Кол-во

64

64


Между рентабельностью и основными средствами очень слабая взаимосвязь, так как коэффициент равен - 0,161. Связь обратная, с увеличением значения одного фактора происходит уменьшение значения второго фактора.

Таблица 6 - Связь между затратами на ГСМ и рентабельностью.


Затраты на ГСМ 1цруб

Рентабельность

Затраты на ГСМ 1ц руб.

Корреляция Пирсона

1

-0,181


Sig. (2-tailed)


0,103


Кол-во

82

82

Рентабельность

Корреляция Пирсона

-0,181

1


Sig. (2-tailed)

0,103



Кол-во

82

82


Между рентабельностью и затратами на ГСМ очень слабая взаимосвязь, так как коэффициент равен - 0,181. Связь обратная, поэтому с увеличением значения одного фактора происходит уменьшение значения второго фактора.

. Линейная и нелинейная регрессия

Требуется построить модель зависимости объема прибыли от премиальных выплат с помощью полинома 2-й степени. Исходные данные и результаты расчетов отобразить на графике.

Таблица 7


у

x1

x2

x3

x4

x5

x6

Корреляция Пирсона

у

1,000

0,203

0,725

0,872

0,854

0,021

0,486


x1

0,203

1,000

0,101

0,069

0,100

-0,194

-0,023


x2

0,725

0,101

1,000

0,809

0,891

-0,016

0,222


x3

0,872

0,069

0,809

1,000

0,955

0,084

0,633


x4

0,854

0,100

0,891

0,955

1,000

0,002

0,506


x5

0,021

-0,194

-0,016

0,084

0,002

1,000

0,150


x6

0,486

-0,023

0,222

0,633

0,506

0,150

1,000


Построив матрицу парных коэффициентов корреляции, мы анализируем коллинеарность факторов. Мы видим, что между фактором х1 и у существует слабая взаимосвязь, коэффициент равен 0,203. между фактором х2 и у существует сильная взаимосвязь, коэффициент равен 0,725. Между факторами х2 и х3 существует очень сильная взаимосвязь. Также фактор х3 сильно взаимодействует с факторами х4 и х6, и фактор х2 сильно взаимодействует с х4, поэтому исключим x2 и x4.

Model

R

R Square

1

0,889a

0,791


В результате анализа мы получили коэффициент корреляции, который равен 0,889, а коэффициент детерминации равен 0,791. Коэффициент корреляции говорит нам о том, что между зависимым фактором У и независимыми факторами Х существует очень сильная взаимосвязь. Благодаря коэффициенту детерминации мы можем сказать, что фактор У находится под влиянием практических всех независимых факторов. Модель адекватна и качественна.

Таблица 8

Model

Нестандартизир.коэф-ты

Стандартиз. коэф-ты

Стат-ка коллинеар-ти


B

Std. Error

Beta

Tolerance

VIF

1

(Constant)

-15,320

17,190





x1

14,215

5,930

0,132

0,950

1,053


x2

-7,614

7,033

-0,158

0,135

7,412


x3

1,507

0,409

0,836

0,056

17,917


x4

0,714

0,720

0,249

0,045

22,036


x5

-0,087

0,786

-0,006

0,892

1,122


x6

-2,403

1,657

-0,130

0,355

2,814

У= -15,3+14,2х1-7,6х2+1,5х3+0,7х4-0,087х5-2,4х6

Таблица 9


у

x1

x3

x5

x6

Корреляция Пирсона

у

1,000

0,203

0,872

0,021

0,486


x1

0,203

1,000

0,069

-0,194

-0,023


x3

0,872

0,069

1,000

0,084

0,633


x5

0,021

-0,194

0,084

1,000

0,150


x6

0,486

-0,023

0,633

0,150

1,000


Таблица 10

Model

Нестандартиз.коэф-ты

Стат-ка коллинеарн-ти


B

Std. Error

Tolerance

VIF

1

(Constant)

-23,026

14,680




x1

14,418

5,899

0,951

1,051


x3

1,664

0,125

0,593

1,687


x5

-0,219

0,762

0,941

1,063


x6

-1,715

1,283

0,588

1,701


Модель множественной линейной регрессии :

У= -23,026+14,4х1+1,66х3-0,21х5-1,71х6

На формирование цены квартиры, значимо влияет фактор x3-общая площадь квартиры, также фактором, оказывающим сильное влияние на формирование цены является фактор x6 площадь кухни.

Таблица 11

Parameter Estimates

Parameter

Estimate

Std. Error

95% Confidence Interval




Lower Bound

Upper Bound

a0

-712,105

54,372

-837,486

-586,724

a1

2,391

0,151

2,042

2,740

a2

-0,002

0,000

-0,002

-0,001


Y=-712,105+2,391x1-0,002x^2

Рисунок 5

По мере увеличения премиальных выплат работникам увеличивается прибыль от реализации, достигается максимальный пик увеличения, после чего при увеличении выплат происходит спад прибыли. Максимальная точка (710;155).

Рисунок 6

По мере увеличения премиальных выплат увеличиваются предсказуемые значения. После достижения максимальной точки происходит спад.

4. Дисперсионный анализ

По результатам испытаний требуется выяснить: а) значимы ли различия в средней урожайности различных сортов пшеницы, независимо от типа удобрения. б) значимо ли влияние типа применяемого удобрения на урожайность, независимо от сорта.

Выдвинем две нулевые гипотезы:

) различия в средней урожайности пшеницы, вызванные влиянием типа удобрения (фактор А), выраженные не более, чем различия, обусловленные случайными причинами.

) различия в средней урожайности пшеницы, вызванные влиянием сорта (фактор Б), выраженные не более, чем различия, обусловленные случайными причинами.

Таблица 12

Source

Type III Sum of Squares

df

Mean Square

F

Sig.

Partial Eta Squared

Corrected Model

2474,450a

9

274,939

6,162

0,000

0,735


16008,300

1

16008,300

358,780

0,000

0,947

Удобрения

1875,500

5

375,100

8,407

0,000

0,678

Сорт

598,950

4

149,738

3,356

0,030

0,402

Error

892,375

20

44,619




Total

19375,125

30





Corrected Total

3366,825

29





a. R Squared = ,735 (Adjusted R Squared = ,616)


Таблица оценки эффектов межгрупповых факторов содержит результаты проверки основных гипотез дисперсионного анализа: 1) переменная удобрения оказывает статистическое достоверное влияние на распределение зависимых переменных урожайности, поскольку F=8,4(табл.F-критерия) и при расчетном значении 0,00; 2) переменная сорт оказывает статистически значимое влияние на урожайность, поскольку F-табличное=3,35, расчетная = 0,03. В результате и сорт, и удобрения оказывают достоверное влияние на переменную (урожайность).

Таблица 13 - Многократные сравнения

Зависимая переменная: Урожайность

(I) Удобрения

(J) Удобрения

Mean Difference (I-J)

Std. Error

Sig.

95% Confidence Interval






Lower Bound

Upper Bound

Удобрения А

Удобрения Б

1,1000

4,22463

1,000

-14,4536

16,6536


Удобрения В

-2,2000

4,22463

,998

-17,7536

13,3536


Удобрения Г

-6,0500

4,22463

,836

-21,6036

9,5036


Удобрения Д

-18,1500*

4,22463

,016

-33,7036

-2,5964


Удобрения Е

-17,6000*

4,22463

,020

-33,1536

-2,0464

Удобрения Б

Удобрения А

-1,1000

4,22463

1,000

-16,6536

14,4536


Удобрения В

-3,3000

4,22463

,986

-18,8536

12,2536


Удобрения Г

-7,1500

4,22463

,720

-22,7036

8,4036


Удобрения Д

-19,2500*

4,22463

,009

-34,8036

-3,6964


Удобрения Е

-18,7000*

4,22463

,012

-34,2536

-3,1464

Удобрения В

Удобрения А

2,2000

4,22463

,998

-13,3536

17,7536


Удобрения Б

3,3000

4,22463

,986

-12,2536

18,8536


Удобрения Г

-3,8500

4,22463

,972

-19,4036

11,7036


Удобрения Д

-15,9500*

4,22463

,042

-31,5036

-,3964


Удобрения Е

-15,4000

4,22463

,053

-30,9536

,1536

Удобрения Г

Удобрения А

6,0500

4,22463

,836

-9,5036

21,6036


Удобрения Б

7,1500

4,22463

,720

-8,4036

22,7036


Удобрения В

3,8500

4,22463

,972

-11,7036

19,4036


Удобрения Д

-12,1000

4,22463

,195

-27,6536

3,4536


Удобрения Е

-11,5500

4,22463

,236

-27,1036

4,0036

Удобрения Д

Удобрения А

18,1500*

4,22463

,016

2,5964

33,7036


Удобрения Б

19,2500*

4,22463

,009

3,6964

34,8036


Удобрения В

15,9500*

4,22463

,042

,3964

31,5036


Удобрения Г

12,1000

4,22463

,195

-3,4536

27,6536


Удобрения Е

,5500

4,22463

1,000

-15,0036

16,1036

Удобрения Е

Удобрения А

17,6000*

4,22463

,020

2,0464

33,1536


Удобрения Б

18,7000*

4,22463

,012

3,1464

34,2536


Удобрения В

15,4000

4,22463

,053

-,1536

30,9536


Удобрения Г

11,5500

4,22463

,236

-4,0036

27,1036


Удобрения Д

-,5500

4,22463

1,000

-16,1036


В таблице 14 представлены результаты расчета теста Шеффе. По результатам теста можно увидеть, что удобрения Е и Д наиболее значимы по своему воздействию на урожайность пшеницы. Чем больше значение теста, тем меньше вклад, той или иной комбинации.

Таблица 14 - Урожайность

Удобрения

N

Subset



1

2

3

Удобрения Б

5

14,8500



Удобрения А

5

15,9500



Удобрения В

5

18,1500

18,1500


Удобрения Г

5

22,0000

22,0000

22,0000

Удобрения Е

5


33,5500

33,5500

Удобрения Д

5



34,1000

Sig.


,720

,053

,195


Выделяются три объекта и 3 группы: 1 группа (наименьшее воздействие), 2 группа (среднее воздействие), 3 группа (те удобрения, которые оказывают наибольшее воздействие).

Группа удобрений Г Е и Д оказывают наибольшее влияние на урожайность, а группа Б А В Г оказывают наименьшее влияние на урожайность.

Таблица 15 - Урожайность

Сорт

N

Subset



1

2

Сорт 4

6

16,5000


Сорт 2

6

22,0000

22,0000

Сорт 5

6

22,0000

22,0000

Сорт 1

6

24,7500

24,7500

Сорт 3

6


30,2500

Sig.


,365

,365


Выделяются 2 группы: 1 группа (оказывает наименьшее воздействие), 2 группа (оказывает наибольшее воздействие). Сорт оказывает меньше влияния, чем удобрения(внесение гербицидов). И сорта и удобрения одновременно могут входить в одну или несколько групп.

Рис. 7

Из данного графика видно, что наибольший эффект на среднюю урожайность оказывает влияние удобрения Д и Е, наименьший эффект удобрение А и Б. Если рассмотреть влияние сорта, можно заметить, что наиболее урожайным является сорт 3, наименее сорт 4. Поскольку сорта 2 и 5 имеют одинаковые средние значения, то соответственно две линии слились в одну.

. Дискриминантный анализ

Имеются данные по 2-м группам сельскохозяйственных предприятий отраслей:

x1 - среднегодовая стоимость основных производственных фондов;

x2 - среднесписочная численность персонала;

x3 - балансовая прибыль.

Требуется провести классификацию (дискриминацию) 3-х новых предприятий.

Таблица 16. Групповые статистики

Группы

Среднее

Стд.отклонение

Кол-во валидных (искл. целиком)




Невзвешенные

Взвешенные

1

Стоимость ОПФ

168,90525

36,949497

4

4,000


Персонал

14,04775

2,743931

4

4,000


Прибыль

18,33250

5,709310

4

4,000

2

Стоимость ОПФ

45,79060

13,501905

5

5,000


Персонал

4,77800

,681709

5

5,000


Прибыль

10,75800

2,681023

5

5,000

Итого

Стоимость ОПФ

100,50822

69,379127

9

9,000


Персонал

8,89789

5,188907

9

9,000


Прибыль

14,12444

5,635112

9

9,000


Приводится среднее значение, стандартное отклонение, и количество наблюдений для всех переменных, по средним значениям заметен более высокий уровень переменных в первой группе предприятий, чем во второй.

Таблица 17. Критерий равенства групповых средних


Лямбда Уилкса

F

ст.св1

ст.св2

Знч.

Стоимость ОПФ

,125

48,866

1

7

,000

Персонал

,113

54,677

1

7

,000

Прибыль

,498

7,053

1

7

,033


Результаты теста на значимость между переменными, находящимися в разных группах приведены в таблице, критерии равенства групповых средних, с помощью этих данных выясняется существенность различий (т.е. присутствует ли разделяющие способности) в данном примере получены весьма значимые различия между группами.

Каждый из факторов дискриминирует данную совокупность, так как они меньше 0,5.Все 3 фактора используются, и оказывают влияние на дискриминацию.

Таблица 18. Объединенные внутригрупповые матрицы


Стоимость ОПФ

Персонал

Прибыль

Корреляция

Стоимость ОПФ

1,000

,552

,570


Персонал

,552

1,000

,733


Прибыль

,570

,733

1,000


Данная таблица используется для анализа взаимосвязи между переменными. Так как коэффициент корреляции равен 0,57 то связь существует.

Таблица 19. Лямбда Уилкса

Проверка функции(й)

Лямбда Уилкса

Хи-квадрат

ст.св.

Знч.

1

,069

14,745

3

,002


По критерию проверяется значимость дискриминантной функции, поскольку функция значима на уровне 0,002, то имеет смысл использовать ее для дальнейшей классификации.

Таблица 20. Нормированные коэффициенты канонической дискриминантной функции


Функция


1

Стоимость ОПФ

629

Персонал

1,026

Прибыль

839


Стандартизированные коэффициенты позволяют непосредственно сравнить вклад каждой независимой переменной в различие 2-х групп.

Наибольший вклад вносит персонал, затем стоимость и прибыль.

Таблица 21. Структурная матрица


Функция


1

Персонал

758

Стоимость ОПФ

716

Прибыль

272


Объединенные внутригрупповые корреляции между дискриминантными переменными и нормированными каноническими дискриминантными функциями.

Переменные упорядочены по абсолютной величине корреляций внутри функции.

Главным фактором является персонал, затем ОПФ и прибыль, в подтверждении прошлой таблицы

Таблица 22. Поточечные статистики


Номер наблюдения

Фактическая группа

Наивероятнейшая группа

Вторая вероятнейшая группа

Дискриминантные баллы

Квадрат расстояния Махалонобиса до центра

Группа

P(G=g | D=d)

Квадрат расстояния Махалонобиса до центра

Функция 1





Предсказанная группа

P(D>d | G=g)

P(G=g | D=d)







Исходные

1

1

1

36

1

1,000

4,377

2

0

74,597

5,728


2

1

1

576

1

1,000

,314

2

0

35,819

3,076


3

1

1

415

1

1,000

,663

2

0

32,836

2,821


4

1

1

473

1

1,000

,515

2

0

33,956

2,918


5

2

2

809

1

1,000

,058

1

0

46,052

-3,150


6

2

2

357

1

1,000

,850

1

0

31,619

-1,987


7

2

2

710

1

1,000

,138

1

0

47,840

-3,281


8

2

2

986

1

1,000

,000

1

0

43,070

-2,927


9

2

2

771

1

1,000

,084

1

0

46,724

-3,199


10

несгруппированные

2

014

1

,995

6,074

1

5

16,648

-,444


11

несгруппированные

1

004

1

,926

8,327

2

74

13,389

,750


12

несгруппированные

1

863

1

1,000

2

0

40,599

3,463


В данной таблице мы видим процентную вероятность отношения к той или иной группе. Так из таблицы мы видим, что 10 номер с 99% в 2 группе, 11номер с 92 % в 1групе и 12 номер с 100% в 1группе.

Таблица 23. Коэффициенты канонической дискриминантрой функции


Функция


1

Стоимость ОПФ

24

Персонал

549

Прибыль

197

(Константа)

4,507


D(x)=-4,507+0,024х1+0,549х2-0,197х3

Кредитный отдел коммерческого банка провел выборочное обследование заемщиков. Общий размер выборки составил 30 наблюдений. По каждому заемщику была собрана информация по следующим показаниям: х1-брал ли заемщик кредит в банке ранее,

х2 - среднемесячный доход семьи заемщика,

х3 - срок погашения кредита,

х4 - размер выданного кредита,

х5 - состав семьи заемщика,

х6 - возраст заемщика,

y - вероятность своевременного погашения выданного кредита (Н -низкая, С - средняя, В - высокая).

Таблица 24 - Результаты выборочного обследования заемщиков банка


Брался ли кредит ранее (1-да, 2-нет)

Среднемесячный доход семьи заемщика, тыс. руб.

Период погашения кредита, лет.

Размер кредита, тыс. руб.

Состав семьи заемщика, человек

Возраст заемщика, лет

Вероятность погашения кредита

1

1

25,20

5

180,0

3

43

С2

2

1

35,25

6

270,0

4

51

В3

3

1

31,50

7

150,0

6

42

В3

4

1

24,35

7

170,0

5

56

Н1

5

1

26,35

6

120,0

4

45

В3

6

1

37,50

8

370,0

5

48

В3

7

1

25,10

5

130,0

3

52

С2

8

1

28,50

2

180,0

6

51

С2

9

1

32,00

7

250,0

4

53

В3

10

1

34,05

7

160,0

5

45

С2

11

1

36,70

6

170,0

5

44

В3

12

1

35,90

5

200,0

4

41

В3

13

1

28,15

3

180,0

6

54

С2

14

1

24,65

4

120,0

3

56

В3

15

1

31,00

5

160,0

2

48

В3

16

2

16,05

5

140,0

3

58

Н1

17

2

18,10

3

130,0

2

55

Н1

18

2

21,65

2

150,0

2

37

С2

19

2

25,20

5

220,0

4

33

С2

20

2

22,05

6

360,0

3

42

С2

21

2

19,15

3

160,0

2

45

Н1

22

2

27,50

1

120,0

2

57

С2

23

2

23,05

3

150,0

3

51

Н1

24

2

17,58

10

400,0

5

44

Н1

25

2

18,65

2

90,0

4

54

Н1

26

2

20,90

5

310,0

3

36

С2

27

2

28,50

8

480,0

2

36

В3

28

2

16,70

6

280,0

2

26

Н1

29

2

18,35

3

220,0

3

28

Н1

30

2

20,65

3

250,0

2

42

Н1


Таблица 25 - Групповые статистики

Veroyatnost

Mean

Std. Deviation

Valid N (listwise)




Unweighted

Weighted

1,00

istoria

1,9000

,31623

10

10,000


doxod

19,2530

2,67843

10

10,000


srok

4,5000

2,50555

10

10,000


kredit

199,0000

91,22012

10

10,000


semya

3,1000

1,19722

10

10,000


vozrasn

45,9000

11,34754

10

10,000

2,00

istoria

1,5000

,52705

10

10,000


doxod

25,6300

4,03844

10

10,000


srok

4,1000

1,96921

10

10,000


kredit

199,0000

77,95298

10

10,000


semya

3,7000

1,49443

10

10,000


vozrasn

45,0000

8,24621

10

10,000

3,00

istoria

1,1000

,31623

10

10,000


doxod

31,9350

4,44116

10,000


srok

6,2000

1,31656

10

10,000


kredit

229,0000

117,42137

10

10,000


semya

3,9000

1,28668

10

10,000


vozrasn

46,4000

6,02218

10

10,000

Total

istoria

1,5000

,50855

30

30,000


doxod

25,6060

6,41398

30

30,000


srok

4,9333

2,13240

30

30,000


kredit

209,0000

94,62631

30

30,000


semya

3,5667

1,33089

30

30,000


vozrasn

45,7667

8,52454

30

30,000


В таблице групповые статистики приводятся средние значения, стандартные отклонения и количество наблюдений для всех переменных, по средним значениям заметен более высокий уровень переменных в первой группе предприятий, чем во второй. Результаты теста на значимости различий между переменных находящихся в разных группах приведены в таблице критерия равенства групповых средних. С помощью этих данных выявляется существенность различий. В данном примере весьма значимые различия между группами.

Таблица 26. Критерий равенства групповых средних


Wilks' Lambda

F

df1

df2

Sig.

istoria

,573

10,047

2

27

,001

doxod

,326

27,918

2

27

,000

srok

,811

3,137

2

27

,060

kredit

,977

,319

2

27

,729

semya

,933

,977

2

27

,389

vozrasn

,995

,065

2

27

,937

Наиболее значимыми переменными являются история и доход. Если значение больше 0,005, то данную переменную можно выбраковать и она является не дискриминантной.

Таблица 27. Объединенные внутригрупповые матрицы


istoria

doxod

srok

kredit

semya

vozrasn

Correlation

istoria

1,000

-,474

-,103

,426

-,578

-,426


doxod

-,474

1,000

,069

-,065

,503

,203


srok

-,103

,069

1,000

,616

,321

-,233


kredit

,426

-,065

,616

1,000

-,047

-,465


semya

-,578

,503

,321

-,047

1,000

,213


vozrasn

-,426

,203

-,233

-,465

,213

1,000


Используются для анализа взаимосвязи между отдельными переменными. Существенная связь между сроком и кредитом, так как коэффициент равен 0,616. По критерию Лямбда Уилкса проверяется значимость дискриминантной функции. Он позволяет определить, значимо ли различаются между собой средние значения функции. Дискриминантная функция значима на уровне 0,000, поэтому имеет смысл использовать ее в дальнейшем.

Таблица 28. Лямбда Уилкса

Test of Function(s)

Wilks' Lambda

Chi-square

Df

Sig.

1 through 2

,208

38,460

12

0

2

,830

4,561

5

472


Таблица 29. Нормированные коэффициенты канонической дискриминантной функции


Function


1

2

istoria

559

479

doxod

926

065

srok

172

1,415

kredit

172

745

semya

658

535

vozrasn

150

428


Самый значимый фактор для дискриминантной функции - это семья (вносит самый большой вклад = 0,658), а второй фактор - срок (вносит наибольший фактор = 1,415).

Таблица 30. Canonical Discriminant Function Coefficients


Function


1

2

istoria

1,401

1,199

doxod

-,244

,017

srok

-,086

,711

kredit

-,002

-,008

semya

,494

-,401

vozrasn

,017

,049

(Constant)

2,401

-4,926

Unstandardized coefficients


Данная таблица отражает уравнение дискриминантной функции.  D1 (x) = 2,401 + 1,401х2 - 2,44х2 - 0,086х3 - 0,002х4 +0,494х5 + 0,017х6 D2 (x) = -4,926 + 1,199х2 - 0,017х2 - 0,711х3 - 0,008х4 -0,401х5 + 0,49х6

Дискриминантная функция значима на уровне 0,000, поэтому имеет смысл использовать ее в дальнейшем.

. Кластерный анализ

. Для начала проведем предварительную классификацию, которая позволит определить наиболее целесообразное количество кластеров.

Таблица 31. Agglomeration Schedule (График, список скопления)

Stage

Cluster Combined

Coefficients

Stage Cluster First Appears

Next Stage


Cluster 1

Cluster 2


Cluster 1

Cluster 2


1

9

12

43,430

0

0

10

2

1

4

62,260

0

0

3

3

1

16

87,850

2

0

8

4

5

13

88,850

0

0

6

5

8

11

89,440

0

0

16

6

5

6

132,115

4

0

11

7

3

15

139,910

0

0

9

8

1

14

156,987

3

0

11

9

3

7

168,525

7

0

12

10

9

17

266,345

1

0

13

11

1

5

298,305

8

6

12

12

1

3

386,649

11

9

14

13

9

10

460,167

10

0

15

14

1

2

523,984

12

0

15

15

1

9

1012,915

14

13

16

16

1

8

1265,510

15

5

0


Анализируя таблицу, мы видим скачкообразное изменение данных, начиная с 14 строки. Всего 17 строк. В нашем случае мы выделяем 3 кластера (17-14=3).

Рисунок 8

2. Теперь организуем для каждого наблюдения вывод информации о принадлежности кластеров.

Таблица 32. Cluster Membership (Кол-во в группе)

Case

3 Clusters

1:Белгород

1

 2:Брянская

1

3:Владимир

4:Воронежс

1

5:Ивановск

1

6:Калужска

1

7:Костромс

1

8:Курская

2

9:Липецкая

3

10:Московск

3

11:Орловска

2

12:Рязанска

3

13:Смоленск

1

14:Тамбовск

1

15:Тверская

1

16:Тульская

1

17:Ярославс

3


Анализируя таблицу принадлежность кластеров, можно сделать вывод, что 11 областей относятся к первому кластеру, 2 области относятся ко второму кластеру, 4 области относятся к третьему кластеру.

Пока неясно, что означает полученные три кластера. Разобраться в этом помогут кластерные профили. _1-принадлежность к тому или иному кластеру.

3. Проведем сравнение средних Report (Отчет)

Мы видим, что в первый кластер попали области, имеющие примерно одинаковый уровень цен по всем 5 секторам. Второй кластер отличается высоким индексом цен на реализованную с/х продукцию. Предприятия из 3 кластера характеризуются высоким индексом тарифа на грузовые перевозки.

Таблица 33

Average Linkage (Between Groups)

Область потребительских цен

Индекс цен производителей промышленной продукции

Индекс цен производителей на реализованную с.х. продукцию

Индекс цен производителей в строительстве

Индекс тарифов на грузовые перевозки

область

1

Mean

113,3909

117,5636

114,8364

115,2364

110,0000



N

11

11

11

11

11

11


Std. Deviation

1,76434

6,00871

8,22658

3,50550

6,98570


2

Mean

114,2000

115,5000

146,0000

112,7000

115,0000



N

2

2

2

2

2

2


Std. Deviation

2,82843

,84853

5,65685

1,41421

1,41421


3

Mean

112,9750

118,6000

116,6250

110,7000

136,7000



N

4

4

4

4

4

4


Std. Deviation

1,49081

7,59737

8,46891

3,88244

4,03898


Total

Mean

113,3882

117,5647

118,9235

113,8706

116,8706



N

17

17

17

17

17

17


Std. Deviation

1,72840

5,85096

12,73551

3,82079

12,84040



. Линейное программирование

Задание:

Х1 - затраты на посевной материалы

Х2 - затраты на обработку почвы

Х3 - затраты на применение минер. Удобрений

Х4 - затраты на применение гербицидов

Х5 - фактор сезонности

Х6 - предшественник

Линейное программирование - наука об исследованиях экстремальных значений линейной функции.

) Нахождение целевых функций

Засушливый, вторая пшеница

Урожайность:

У=х1-0,003х2+0,001х3+0,001х4

Рентабельность:

У=-0,017х1-0,037х2-0,01х3-0,04х4

Засушливый, механический пар

Урожайность:

У=-00,1х1-0,007х2-х3+0,003х4

Рентабельность:

У=-0,019х1-0,066х2-0,013х3+0,006х4

Засушливый, первая пшеница

Урожайность:

У=х1-0,002х2+х3+0,001х4

Рентабельность:

У=-0,011х1-0,031х2-0,014х3-0,006х4

Засушливый, химический пар

Урожайность:

У=-0,001х1-0,002х2+0,001х3

Рентабельность:

У=-0,028х1-0,039х2-0,012х3

Обычный, вторая пшеница

Урожайность:

У=-0,02х1+0,006х2+0,001х3+0,004х4

Рентабельность:

У=-0,036х1+0,029х2-0,01х3+0,015х4

Обычный, первая пшеница

Урожайность:

У=х1+0,005х2+0,001х3+0,004х4

Рентабельность:

У=-0,019х1+0,014х2-0,014х3+0,011х4

Обычный, мех пар

Урожайность:

У=0,003х1+0,002х2+0,001х2+0,005х4

Рентабельность:

У=х1-0,006х2-0,006х3+0,020х4

Обычный, пар - химический

Урожайность:

У=-0,006х1+0,002х2+0,003х3

Рентабельность:

У=-0,062х1-0,012х2-0,003х3

Увлажненный, мех пар

Урожайность:

У=-0,005х1+х2+0,003х3+0,006х4

Рентабельность:

У=-0,043х1-0,016х2+0,002х3+0,022х4

Увлажненный, первая пшеница

Урожайность:

У=-0,004х1+х2+0,003х3+0,006х4

Рентабельность:

У=-0,055х1-0,022х2-0,003х3+0,021х4

Увлажненный, вторая пшеница

Урожайность:

У=-0,003х1+х2+0,003х3+0,005х4

Рентабельность:

У=-0,045х1-0,023х2-0,02х3+0,017х4

Увлажненный, хим. пар

Урожайность:

У=-0,010х1-0,006х2+0,003х3

Рентабельность:

У=-0,085х1-0,063х2+0,002х3

Засушливый период


Программа предполагает для того чтобы получить макс рентабельность, необходимо сократить затраты на максимально на фактор х1, однако существует определенная технология поэтому оставляем значения согласно технологоии-250руб. Хотя для максимизации рентабельности, по идеи программа предполагает сократить полностью затраты. Распределение затрат происходит между факторами х2 и х3, и программа распределяет большинство ресурсов на фактор х2=1325 руб. Фактор х4 программа считает незначимым согласно технологии в засушливом периоде, поэтому мы можем отказать от обработки гербицидами.

Обычный период


Программа предлагает израсходовать 300 руб. на фактор х1 согласно технологии. Для максимизации рентабельности программа распределяет затраты между факторами х2, х3 и х4, и большинство ресурсов приходится на фактор х2=786 руб.

Увлажненный период


На фактор х2 программа считает наименее значимым согласно технологии в увлажненном периоде и мы можем сократить затраты на него до 450 руб. Самые значимые затраты на х3.

. Параметрические и непараметрические критерии

) Критерий Манна-Уитни

Таблица 34


пол

N

Mean Rank

Sum of Ranks

отметка2

ЖЕН

61

56,21

3429,00


МУЖ

39

41,56

1621,00


Total

100




Средний ранг для девушек равен 56,21 , для юношей - 41,56. Это означает, что у девушек успеваемость выше, чем у юношей

Таблица 35. Test Statisticsa


отметка2

Mann-Whitney U

841,000

Wilcoxon W

1621,000

Z

-2,469

Asymp. Sig. (2-tailed)

,014

a. Grouping Variable: пол


Две совокупности статистически достоверны, так как коэффициент равен 0,014, который не превышает коэффициент 0,05. Если бы он превышал наш коэффициент, то появились бы сомнения. Сравнение 2х связанных выборок  а) Критерий знаков с помощью этого критерия сравним результаты учащихся по второму тесту и четвертому.

Таблица 36. Frequencies


N

осведомленность - числовые ряды

Negative Differencesa

39


Positive Differencesb

57


Tiesc

4


Total

100

a. осведомленность < числовые ряды

b. осведомленность > числовые ряды

c. осведомленность = числовые ряды


Полученные результаты говорят о том, что в 39 случаях значение переменной тест 2 оказались меньшими, чем значения переменной тест 4, в 57 случаях значения переменной тест 2 превысили значения переменной тест 4 и 4 раза было установлено равенство.

Таблица 37. Test Statisticsa


осведомленность - числовые ряды

Z

-1,735

Asymp. Sig. (2-tailed)

,083

a. Sign Test


Тест является недостоверным, так как значение больше коэффициента 0,05. Скорее всего, этот тест не подойдет для дальнейших исследований.   б) Критерий Уилкоксона Недостатком критерия знаков является то, что он никак не учитывает величину разницы двух значений 

Таблица 38. Ranks


N

Mean Rank

Sum of Ranks

осведомленность - числовые ряды

Negative Ranks

39a

42,26

1648,00


Positive Ranks

57b

52,77

3008,00


Ties

4c




Total

100



a. осведомленность < числовые ряды

b. осведомленность > числовые ряды

c. осведомленность = числовые ряды


Таблица 39. Test Statisticsa


осведомленность - числовые ряды

Z

-2,493b

Asymp. Sig. (2-tailed)

,013

a. Wilcoxon Signed Ranks Test

b. Based on negative ranks.


Тест является недостоверным, так как значение не превышает коэффициента 0,05. Скорее всего, этот тест Уилсона подходит для дальнейших исследований.

Похожие работы на - Описательная статистика. Частоты

 

Не нашли материал для своей работы?
Поможем написать уникальную работу
Без плагиата!