Математические методы статистики

  • Вид работы:
    Дипломная (ВКР)
  • Предмет:
    Математика
  • Язык:
    Русский
    ,
    Формат файла:
    MS Word
    107,20 kb
  • Опубликовано:
    2012-01-11
Вы можете узнать стоимость помощи в написании студенческой работы.
Помощь в написании работы, которую точно примут!

Математические методы статистики

ОГЛАВЛЕНИЕ

Задание к курсовой работе

Введение

построение выборочной совокупности

.1 построение интервального вариационного ряда по величине чистого капитала

.2 построение графика

.3 расчет показателей вариации

.4 определение количественных характеристик распределения (показателей ассиметрии и эксцесса)

.5 нахождение эмпирической функции, построение ее графика

.6 определение теоретических частот по закону нормального распределения. Построение графиков

.7 проверка гипотезы о подчинении изучаемых признаков нормальному закону распределения

.8 оценка параметров генеральной совокупности на основе выборочных данных

.9 построение интервального вариационного ряда по величине прибыли

.10 построение графика

.11 определение количественных характеристик распределения (показателей асимметрии и эксцесса)

.12 нахождение эмпирической функции, построение ее графика

.13 определение теоретических частот по закону нормального распределения. Построение графиков

.14 проверка гипотезы о подчинении изучаемых признаков нормальному закону распределения.

.15 оценка параметров генеральной совокупности на основе выборочных данных

. Построение однофакторной модели взаимосвязи

.1 отбор факторного и результативного признака модели

.2 расчет парного коэффициента корреляции. Анализ зависимости между переменными

.3 построение уравнения однофакторной регрессии с использованием метода наименьших квадратов

.4 проверка значимости коэффициентов регрессии и коэффициента корреляции

Заключение

ЗАДАНИЕ К КУРСОВОЙ РАБОТЕ

. По данным приложения 1 отберите 2-3 экономически связанных между собой показателя деятельности 200 крупнейших в России банков. Определите выборочную совокупность в количестве 30 банков, укажите и опишите способ отбора.

Проведите качественный анализ выборочной совокупности банков по отобранным показателям и исследуйте структуру данных показателей в следующей последовательности:

а) постройте интервальные вариационные ряды по каждому показателю, определив целесообразное количество групп;

б) по данным полученных рядов для каждого показателя постройте графики;

в) вычислите и проанализируйте среднюю арифметическую, моду и медиану, относительные и абсолютные показатели вариации;

г) определите количественные характеристики распределений (показатели асимметрии и эксцесса);

д) найдите эмпирическую функцию распределения и постройте ее график;

е) определите, теоретические частоты по закону нормального распределения и нанесите их на график;

ж) с помощью одного из математических критериев проверьте гипотезу о том, что изучаемые признаки подчиняются нормальному закону распределения;

з) определите границы, в которых с вероятностью 0,95 будет находиться среднее значение выбранных показателей в генеральной совокупности;

и) по каждому пункту сделайте выводы.

2. По данным экономических показателей деятельности коммерческих банков РФ, представленным в приложении 1, постройте однофакторную модель взаимосвязи, определите форму корреляционного уравнения и обоснуйте его выбор. С этой целью:

а) отберите факторный и результативный признаки для включения в регрессионную модель, предварительно оценив важность на основе логики экономического анализа;

б) рассчитайте парный коэффициент корреляции. Проанализируйте характер зависимости между переменными;

в) постройте уравнение однофакторной регрессии; Параметры уравнения определите методом наименьших квадратов;

г) проверьте значимость коэффициентов регрессии (а0, а1,) , а также коэффициента корреляции, на основе (t-критерия Стьюдента).

д) по полученной модели рассчитайте теоретические значения.

е) сформулируйте выводы.

Задача может быть решена с использованием стандартных пакетов прикладных программ, реализованных на ЭВМ.     

ВВЕДЕНИЕ

интервальный вариационный ряд мода

Статистический анализ выборочных данных является очень актуальной темой в наше время. Очень часто невозможно провести анализ по всей совокупности данных (любых данных) по причине их многочисленности. Либо анализ всей совокупности может занимать много времени. Для получения данных проводится анализ выборочных данных по этой совокупности.

В данном случае мы проводим выборочных анализ 30 банков из совокупности общей численностью 200 банков.

Целью данной работы является практическое закрепление теоретических данных статистического анализа вариационных рядов.

1. ПОСТРОЕНИЕ ВЫБОРОЧНОЙ СОВОКУПНОСТИ

По данным приложения 1 мы произвели выборку из 30 банков и выбрали 2 экономически связанных между собой показателя деятельности этих банков - чистые активы и прибыль. Выборка представлена в таблице 1.

Таблица 1

№пп

Название банка

Город

Чистые активы

Прибыль

1

Национальный резервный банк

Москва

9911

645

2

Автобанк

Москва

6728

913

3

Мосбизнесбанк

Москва

8453

481

4

Газпромбанк

Москва

3649

265

5

Ситибанк Т/О

Москва

2728

258

6

Ростэсбанк

Тольятти

1255

243

7

Нижегородпромстрой- банк

Н.Новгород

764

179

8

АКБАРС

Казань

333

161

9

Российский капитал

Москва

949

8

10

Дальрыббанк

Владивосток

633

109

11

Желдорбанк

Москва

871

125

12

Восток-Запад

Москва

729

18

13

Зенит

Москва

1363

208

14

Прио-Внешторг-банк

Рязань

370

11

15

Кузбассоцбанк

Кемерово

704

19

16

Элбим-банк

Москва

439

8

17

Уралвнешторгбанк

Екатеринбург

550

83

18

Нефтяной

Москва

531

7

19

Интехбанк

Казань

232

23

20

Экономбанк

Саратов

443

29

21

АБН АМРО банк

Москва

1320

24

22

Федеральный депозитный банк

Москва

320

3

23

МБРР

Москва

582

9

24

Воронеж

Воронеж

368

29

25

Руссобанк

Москва

461

55

26

Орбита

Москва

185

1

27

Евросиббанк

Москва

275

23

28

Тольяттихимбанк

Тольятти

168

33

29

Сиф

Якутск

384

8

30

Банк Китая (ЭЛОС)

Москва

141

-8


Итого


45839

3970


Среднее значение


1528,0

132,3


При произведении расчетов использовались стандартные пакеты прикладных программ, в частности Excel.

Способ отбора данных был следующий - из 200 банков выбрали каждый 6-ой банк начиная с 3-го по списку. Получился список из 33 банков. Из этого списка исключили каждый 11-ый банк. Получилась выборочная совокупность из 30 банков.

1.1 Построение интервального вариационного ряда по величине чистого капитала

Построим интервальный вариационный ряд распределения по величине чистого капитала

Для определения числа групп можно воспользоваться формулой Стерджесса:

,

где    n - число групп;

N - число единиц в совокупности.

n = 1+3.322 lg30 = 5,90699 ≈ 6

Величина интервала определяется по формуле:

,

где Хmax - максимальное значение признака в ряду;

Xmin - минимальное значение признака в ряду.

Величина интервала для вариационного ряда распределения банков по величине чистых активов

H = (9911 - 141) / 6 = 1628,3 млн.руб.

В таблице 2 приведена группировка банков по величине чистых активов

Таблица 2

№ группы

Величина чистых активов, млн.руб.

Число банков, шт

Средняя величина интервала, млн.руб.

Общая величина чистых активов в группе, млн.руб.

Средняя величина чистых активов в группе, млн.руб.

1

 141 - 1769,3

25

955,15

14370

574,8

2

 1769 - 3397,6

1

2583,15

2583,15

2583,2

3

 3397,6 - 5025,9

1

4211,75

3649

3649,0

4

 5025,9 - 6654,2

0

0

0

-

5

6654,2 -8282,5

1

7468,35

6728

6728,0

6

 8282,5 - 9911

2

9096,65

18364

9182,0

 

Итого

30

 

45694,15

1523,1


1.2 Построение графика

Для наглядного изображения интервального ряда распределения построим гистограмму. Она представлена на рисунке 1.

Гистограмма распределения банков по величине чистого капитала

Рис.1

В таблице 2 рассчитана средняя величина чистых активов по группировке.

Хср = 1 527,97 млн.руб.

Так же среднюю величину для интервального ряда можно рассчитать по формуле средней арифметической взвешенной

, где

где    xi -середина интервала усредняемого показателя;

n - число единиц (объем) совокупности;

fi - частота, которая показывает как часто встречается значение признака в статистической совокупности.

хср = 1877,84 млн.руб.

Однако средняя величина, рассчитанная в первом случае, является более точной и в последующих расчетах мы будем пользоваться ею.

1.3 Расчет показателей вариации

Для характеристики структуры вариации рассчитываем структурные средние: моду и медиану.

Мода - значение признака, которое наиболее часто встречается в ряду распределения. Для интервального ряда мода определяется по наибольшей частоте. Мода находится по формуле:

,

где    x0 - нижняя (начальная) граница модального интервала;

k - величина интервала;

fMo - частота модального интервала;

fMo-1 - частота интервала, предшествующего модальному;

fMo+1 - частота интервала, следующего за модальным.

М0 = 141 + 1628,3*(25 - 0) / ((25 - 0) + (25 - 1)) = 971,77 млн.руб.

Медиана - значение признака, которое делит совокупность на две равные части, т.е. 50% единиц совокупности имеют значение меньше медианы, а остальные - больше медианы.

Для определения медианы рассчитывается ее порядковый номер по формуле:

 = 31 / 2 = 15,5

где    n - число единиц совокупности.

Затем рассчитывается накопленные частоты. После смотрят, какая из накопленных частот впервые превышает номер медианы.  

Медиану рассчитывают по формуле:

,

где    x0 - нижняя граница медианного интервала;

k - величина интервала;

∑f = n - число единиц совокупности;

SMe-1 - накопленная частота (кумулятивная частота) интервала, предшествующего медианному;

fMe - медианная частота.

Ме = 141 + 1628,3 * (15 - 0) / 25 = 1117,98 млн.руб. - данная величина чистых активов находится в середине совокупности.

Степень близости данных отдельных единиц совокупности к средней величине измеряется рядом абсолютных и относительных показателей вариации.

К абсолютным показателям вариации относятся:

размах вариации;

среднее линейное отклонение;

дисперсия;

среднее квадратическое отклонение.

Размах вариации представляет собой разность между максимальным и минимальным значениями признака совокупности, и находится по формуле:

R = 9911 - 141 = 9770 млн.руб.

Среднее линейное отклонение представляет собой среднюю величину из отклонений значений признака от их средней величины, которое рассчитывается по формуле:    

 = 1688,6 млн.руб.

Так же среднее линейное отклонение можно рассчитать по формуле


В таблице 3 представлены дополнительные расчеты для исчисления показателей вариации

Таблица 3

№ группы

Величина чистых активов, млн.руб.

Число банков,шт, fi

Средняя величина интервала, млн.руб.

|х-хср|

|х-хср|*fi

(х-хср)2*fi

1

 141 - 1769,3

25

955,15

568,0

14199,71

8065268,67

2

 1769 - 3397,6

1

2583,15

1060,0

1123624,73

3

 3397,6 - 5025,9

1

4211,75

2688,6

2688,612

7228632,69

4

 5025,9 - 6654,2

0

0

1523,1

0

0,00

5

6654,2 -8282,5

1

7468,35

5945,2

5945,212

35345541,76

6

 8282,5 - 9911

2

9096,65

7573,5

15147,02

114716157,93

 

Итого

30

 

19358,5

39040,6

166479225,79

 

Среднее

 

 

645,3

1301,4

5549307,53

d = 1301,4 млн.руб.

Таким образом, средняя величина отклонений значений величины чистых вложений от их средней составляет 1301,4 млн. руб.

Дисперсия - это средний квадрат отклонений индивидуальных значений признака от их средней величины. Дисперсия находится по формуле:

-простая (невзвешенная) дисперсия

 - дисперсия взвешенная

σ2 = 5 895 974,6 - невзвешенная дисперсия

σ2 = 5 549 307,53 млн.руб.2 - взвешенная дисперсия

Таким образом, средний квадрат отклонений индивидуальных значений величины чистого капитала от их средней величины составляет 5 549 307,53 млн. руб.2

Среднее квадратическое отклонение представляет собой корень квадратный из дисперсии, т.е. корень квадратный из среднего квадрата отклонений индивидуальных значений признака от их средней величины. Среднее квадратическое отклонение находится по формуле:


Найдем среднее квадратическое отклонение по объему кредитных вложений:

 = 2628,16 млн.руб. - невзвешенное значение

 = 2355,7 (млн. руб.) - взвешенное значение

Относительные показатели вариации в общем виде показывают отношение абсолютных показателей вариации к их средней величине.

К относительным показателям вариации относятся:

коэффициент осцилляции;

относительное линейное отклонение;

коэффициент вариации.

Коэффициент осцилляции находится по формуле:


Коэффициент осцилляции для выборки по величине чистых активов равен:

VR = 9770 / 1528 * 100% = 639,4 %

Относительное линейное отклонение рассчитывается по формуле:


Относительное линейное отклонение для выборки величине чистых активов равно:

VD = 1688,6 / 1528 * 100% = 110,5%

VD = 1301,4/ 1528 * 100% = 85,2%

Коэффициент вариации характеризует однородность совокупности. Совокупность считается однородной, если коэффициент вариации меньше либо равен 33%, иначе признается неоднородной. Коэффициент вариации определяется по формуле:


Тогда, коэффициент вариации для выборки по величине чистых активов равен:

Vσ = 2628,16 / 1528 * 100% = 172%

Vσ = 2355,7 / 1528 * 100% = 154,17%

Коэффициент вариации для выборки по величине чистых активов больше, чем 33%, следовательно, совокупность неоднородна, а это означает, что среднее значение признака не является центром распределения.

 

1.4 Определение количественных характеристик распределения (показателей асимметрии и эксцесса)


При анализе данных важно представить не только размер вариации, но и то, как распределены единицы совокупности по всему диапазону значений признака.

Показатели асимметрии и эксцесса используются для количественной оценки симметричности.

Для расчета показателя асимметрии используют формулу:

,

где    M3 - центральный момент третьего порядка;

σ - среднее квадратическое отклонение.

В свою очередь центральный момент третьего порядка рассчитывается по формуле:

М3 = 34 798 998 424,8 - невзвешенный момент третьего порядка

М3 = 36 419 174 665,3 - взвешенный момент третьего порядка

АS = 34 798 998 424,4 / 2628,163 = 2,43

АS = 328 797 195 203 / 2355,73 = 2,79

Для того, чтобы определить, является ли асимметрия существенной или не существенной, рассчитывается отклонение показателя асимметрии к среднеквадратическому отклонению. Для этого используют соотношение:

,

где    As - показатель асимметрии;

 - средняя квадратическая ошибка отклонения асимметрии, которая рассчитывается по формуле:

,

где    n - число единиц в совокупности.

0,412

 = 2,43 / 0,412 = 5,898

 = 2,79 / 0,412 = 6,772

Если данное соотношение меньше 3, то асимметрия признается несущественной, иначе - существенной.

Как видим, данное соотношение значительно больше 3, поэтому в данном случае асимметрия признается существенной.

В симметричных распределениях или распределениях с несущественной асимметрией рассчитывается показатель эксцесса. Поскольку в данном случае имеет место существенная асимметрия, но данный показатель может не рассчитываться.

 

1.5 Нахождение эмпирической функции, построение ее графика


Построим график эмпирического распределения банков в зависимости величины чистого капитала. Для этого по оси абсцисс необходимо откладывать середину интервала значения признака, а по оси ординат, соответствующие ей частоты.

Рис.2

 

1.6 Определение теоретических частот по закону нормального распределения. Построение графиков


Для удобства вычислений вероятностей случайные величины нормируются, а затем по специальным таблицам находится плотность распределения нормируемой случайной величины. Для этого используются следующие формулы:

,

где    t - нормируемое отклонение.


Теоретические частоты находятся по формуле:

,

где    f - эмпирические частоты;

k - величина интервала.

σ - невзвешенное значение среднеквадратичного отклонения

Определим теоретические частоты для выборки банков по объему кредитных вложений.

Таблица 4. Расчет теоретических частот

№ п/п

Величина чистых активов, млн.руб.

Число банков, fi

Середина интервала, xi

t

φ(t)

Теоретические частоты, f'








1

 141 - 1769,3

25

955,15

-0,2359

0,3867

8

2

 1769 - 3397,6

1

2583,15

0,4346

0,36050

7

3

 3397,6 - 5025,9

1

4211,75

1,1053

0,21790

4

4

 5025,9 - 6654,2

0

5840,05

1,7759

0,07900

2

5

6654,2 -8282,5

1

7468,35

2,4465

0,01980

0

6

 8282,5 - 9911

2

9096,65

3,1170

0,00330

0

Итого

-

30

-

-

-

21


По найденным теоретическим частотам построим график теоретического распределения банков по величине чистого капитала.

Рис.3

При совмещении графиков теоретического и эмпирического распределения получится следующее:

Рис.4

 

1.7 Проверка гипотезы о подчинении изучаемых признаков нормальному закону распределения


Так как все предположения о характере распределения лишь гипотезы, а не категорические утверждения, то они должны быть подвергнуты статистической проверке с помощью одного из критериев согласия. Критерии согласия, опираясь на установленный закон распределения, дают возможность установить, когда расхождение между частотами эмпирического и теоретического распределений следует признать несущественными, то есть случайными, а когда существенными (в тех случаях, когда неверно выдвинута гипотеза о законе распределения).

Для проверки гипотезы о подчинении изучаемых признаков нормальному закону распределения воспользуемся критерием Романовского, который рассчитывается по формуле:

,

где    h - число групп;

l - число независимых параметров, которые необходимо знать, чтобы построить кривую теоретического распределения.

В свою очередь  рассчитывается по формуле:

,

где    fi - эмпирические частоты распределения;

fi' - теоретические частоты распределения.

Таблица 5. Расчет значения критерия Пирсона для распределения по величине чистого капитала

№ п/п

Величина чистых активов, млн.руб.

Эмирические частоты, fi

Теоретические частоты, f'

(fi-f')2

(fi-f')2/f'

1

 141 - 1769,3

25

8

297

38,119

2

 1769 - 3397,6

1

7

39

5,390

3

 3397,6 - 5025,9

1

4

11

2,612

4

 5025,9 - 6654,2

0

2

3

1,589

5

6654,2 -8282,5

1

0

0

0,909

6

 8282,5 - 9911

2

0

4

0,000

Итого

-

30

21

 

48,619


Рассчитаем значение критерия Романовского для распределения по объему кредитных вложений:

 = 18,624

Так как критерий Романовского больше 3 (равен 18,624), то гипотеза о распределении банков в зависимости от величины чистых активов по закону нормального распределения отвергается.

 

1.8 Оценка параметров генеральной совокупности на основе выборочных данных


Расхождение между генеральной и выборочной совокупностями измеряется средней ошибкой выборки, которая рассчитывается следующим образом:

,

где    n - число единиц в выборочной совокупности;

N - число единиц в генеральной совокупности.

Среднюю ошибку необходимо знать для того, чтобы определить возможные пределы для средней генеральной совокупности

Суждение о том, что средняя в генеральной совокупности будет лежать в пределах  можно гарантировать не с абсолютной точностью, а с некоторой вероятностью.

Для этого рассчитывают предельную ошибку выборки по формуле:

,

где    t - коэффициент доверия, определяемый в зависимости от вероятности по таблицам.

Таким образом, показатели генеральной совокупности для генеральной средней при заданной вероятности определяются по показателям выборочной совокупности следующим образом:


Рассчитаем среднюю ошибку для выборки по величине чистых активов:

 = 396,52 (млн.руб.)

Найдем предельную ошибку для выборки по кредитным вложениям, принимая вероятность равной 0,95. По таблице находим коэффициент доверия t, равный 1,96.

Δ = 396,52 * 1,96 = 777,18 млн.руб.

Таким образом, границы, в которых с вероятностью 0,95 будет находиться среднее значение показателя величины чистых активов, принимают вид:

- 777,18 < хср < 1528 + 777,18

,82 < хср < 2305,18 млн.руб.

1.9 Построение интервального вариационного ряда по величине прибыли

Построим вариационный ряд распределения по величине прибыли. Число групп определено в предыдущих расчетах и равно 6.

Величина интервала составляет

H = (913 - (-8)) / 6 = 153,5 млн.руб.

В таблице 6 приведена группировка банков по величине чистых активов

Таблица 6

№ группы

Величина прибыли, млн.руб.

Число банков,шт, f

Средняя величина интервала, млн.руб.

Общая величина прибыли в группе, млн.руб.

Средняя величина прибыли в группе, млн.руб.

1

 - 8 - 145,5

21

68,75

617

29,4

2

 145,5 - 299

6

222,25

1314

219,0

3

 299 - 452,5

1

375,75

481

481,0

4

 452,5 - 606

0

529,25

0

-

5

 606 - 759,5

1

682,75

645

645,0

6

 759,5 - 913

1

836,25

913

913,0

 

Итого

30

 

3970

132,3

 

1.10 Построение Графика

Для наглядного изображения интервального ряда распределения построим гистограмму. Она представлена на рисунке 5

Гистограмма распределения банков по величине прибыли

Рис.5

В таблице 6 рассчитана средняя величина прибыли по группировке

Хср = 132,33 млн.руб.

Так же среднюю величину для интервального ряда можно рассчитать по формуле средней арифметической взвешенной. В этом случае ее величина составит

Хср = 155,73 млн.руб.

Как видим две величины, рассчитанные разными способами значительно отличаются друг от друга. В дальнейших расчетах мы будем пользоваться средней величиной прибыли, рассчитанной в таблице 6, поскольку данная величина является более точной.

1.2.в) Расчет показателей вариации

Для характеристики структуры вариации рассчитываем структурные средние: моду и медиану.

Мо = -8 + 153,5*(21-0) / ((21-0) + (21-6)) = 81,54 млн.руб.

Рассчитаем медиану

Ме = -8 + 153,5* (15 - 0) / 21 = 28,55 млн.руб.- данная величина прибыли находится в середине совокупности.

Рассчитаем абсолютные показатели вариации

Размах вариации R = 913 - (- 8) = 921 млн.руб.

В таблице 7 представлены дополнительные расчеты для исчисления показателей вариации

Таблица 7

Величина прибыли, млн.руб.

Число банков,шт, f

Средняя величина интервала, млн.руб.

|х-хср|

|х-хср|*fi

(х-хср)2*fi

 - 8 - 145,5

21

68,75

63,6

1335,25

84899,65

 145,5 - 299

6

222,25

89,9

539,5

48510,04

 299 - 452,5

1

375,75

243,42

59251,67

 452,5 - 606

0

529,25

396,9

0

0,00

 606 - 759,5

1

682,75

550,4

550,42

302958,51

 759,5 - 913

1

836,25

703,9

703,92

495498,67

Итого

30

 

2048,2

3372,5

991118,54

Среднее

 

 

68,3

112,4

33037,28


Среднее линейное отклонение

D = 144,1 млн.руб. - невзвешенная величина среднего линейного отклонения

D = 112,4 млн.руб. - взвешенная величина среднего линейного отклонения

Дисперсия

σ2 = 43 189,42 млн.руб.2 - невзвешенная дисперсия

σ2 = 33 037,282 млн.руб.2 - взвешенная дисперсия

Среднее квадратическое отклонение

σ = 207,82 млн.руб.- невзвешенное среднее квадратическое отклонение

σ = 181,76 млн.руб.- взвешенное среднее квадратическое отклонение

Рассчитаем относительные показатели вариации

Коэффициент осцилляции

VR = 921 / 132,3 * 100 = 696,1%

Относительное линейное отклонение

VD = 144,1 / 132,3 * 100% = 108,9 %

VD = 112,4/ 132,3 * 100% = 84,96 %

Коэффициент вариации

Vσ = 207,82 / 132,3 * 100% = 157,1 %

Vσ = 181,76 / 132,3 * 100% = 137,38 %

Коэффициент вариации для выборки по величине прибыли значительно больше, чем 33%, следовательно, совокупность неоднородна, а это означает, что среднее значение признака не является центром распределения.

1.11 Определение количественных характеристик распределения (показателей асимметрии и эксцесса)

М3 = 20 997 502,5 - невзвешенный момент третьего порядка

М3 = 17 630 989,7 - взвешенный момент третьего порядка

АS = 20 997 502,5 / 207,823 = 2,34

АS = 20 997 502,5 / 181,763 = 2,94

Найдем соотношение

 = 2,34 / 0,412 = 5,67

 = 2,94 / 0,412 = 7,14

Данное соотношение в обоих случаях (как при расчете невзвешенной величины, так и при расчете взвешенной величины) значительно больше 3, поэтому асимметрия признается существенной

В симметричных распределениях или распределениях с несущественной асимметрией рассчитывается показатель эксцесса. Поскольку в данном случае имеет место существенная асимметрия, но данный показатель может не рассчитываться.

1.12 Нахождение эмпирической функции, построение ее графика

Построим график эмпирического распределения банков в зависимости от величины прибыли. Для этого по оси абсцисс необходимо откладывать середину интервала значения признака, а по оси ординат, соответствующие ей частоты.

Рис.6

1.13 Определение теоретических частот по закону нормального распределения. Построение графиков

Таблица 8. Расчет теоретических частот

№ п/п

Величина прибыли, млн.руб.

Число банков, fi

Середина интервала, xi

t

φ(t)

Теоретические частоты, f'

1

 - 8 - 145,5

21

68,75

-0,3498

0,3752

8

2

 145,5 - 299

6

222,25

0,4947

0,3521

8

3

 299 - 452,5

1

375,75

1,3392

0,1604

4

4

 452,5 - 606

0

529,25

2,1837

0,0355

1

5

 606 - 759,5

1

682,75

3,0282

0,0041

0

6

 759,5 - 913

1

836,25

3,8727

0,0003

0


Итого

30




21


По найденным теоретическим частотам построим график теоретического распределения банков по величине прибыли.

Рис.7

При совмещении графиков теоретического и эмпирического распределения получится следующее:

Рис.8

1.14 Проверка гипотезы о подчинении изучаемых признаков нормальному закону распределения

Для проверки гипотезы о подчинении изучаемых признаков нормальному закону распределения воспользуемся критерием Романовского.

Таблица 9. Расчет значения критерия Пирсона для распределения по величине прибыли

№ п/п

Величина прибыли, млн.руб.

Эмирические частоты, fi

Теоретические частоты, f'

(fi-f')2

(fi-f')2/f'

1

 - 8 - 145,5

21

8

161

19,358

2

 145,5 - 299

6

8

3

0,416

3

 299 - 452,5

1

4

7

1,836

4

 452,5 - 606

0

1

1

0,787

5

 606 - 759,5

1

0

1

9,098

6

 759,5 - 913

1

0

1

0,000

Итого

Итого

30

21

 

31,494


Рассчитаем значение критерия Романовского

Р =  = 11,63

Поскольку величина критерия Романовского больше 3 (равна 11,63), то гипотеза о распределении банков в зависимости от величины прибыли по закону нормального распределения отвергается.

1.15 Оценка параметров генеральной совокупности на основе выборочных данных

Рассчитаем среднюю ошибку выборки по величине прибыли

 = 34,98 млн.руб.

Найдем предельную ошибку, принимая вероятность равной 0,95. Коэффициент доверия t = 1,96

Δ = 34,98 * 1,96 = 65,56 млн.руб.

Таким образом, границы, в которых с вероятностью 0,95 будет находится среднее значение показателя величины чистых активов, принимают вид

,3 - 65,56 < хср < 132,3 + 65,56

,74 < хср < 197,86

2. Построение однофакторной модели взаимосвязи

.1 Отбор факторного и результативного признака модели

Примем в качестве факторного признака величину чистых активов, а в качестве результативного - прибыль.

2.2 Расчет парного коэффициента корреляции. Анализ зависимости между переменными

Парный коэффициент корреляции можно вычислить по следующей формуле:

,

Таблица 10 - Данные для расчета парного коэффициента корреляции для выборочной совокупности.

№пп

Чистые активы, млн.руб., хi

Прибыль, млн.руб.,уi

хi2

уi2

хiуi

1

9911

645

98 227 921

416 025

6 392 595

2

6728

913

45 265 984

833 569

6 142 664

3

8453

481

71 453 209

231 361

4 065 893

4

3649

265

13 315 201

70 225

966 985

5

2728

258

7 441 984

66 564

703 824

6

1255

243

1 575 025

59 049

304 965

7

764

179

583 696

32 041

136 756

8

333

161

110 889

25 921

53 613

9

949

8

900 601

64

7 592

10

633

109

400 689

11 881

68 997

11

871

125

758 641

15 625

108 875

12

729

18

531 441

324

13 122

13

1363

208

1 857 769

43 264

283 504

14

370

11

136 900

121

4 070

15

704

19

495 616

361

13 376

16

439

8

192 721

64

3 512

17

550

83

302 500

6 889

45 650

18

531

7

281 961

49

3 717

19

232

23

53 824

529

5 336

20

443

29

196 249

841

12 847

21

1320

24

1 742 400

576

31 680

22

320

3

102 400

9

960

23

582

9

338 724

81

5 238

24

368

29

135 424

841

10 672

25

461

55

212 521

3 025

25 355

185

1

34 225

1

185

27

275

23

75 625

529

6 325

28

168

33

28 224

1 089

5 544

29

384

8

147 456

64

3 072

30

141

-8

19 881

64

-1 128

Итого

 

 

246 919 701

1 821 046

19 425 796

Среднее

 

 

8 230 657

60 702

647 527


R = 0,882

Коэффициент корреляции является величиной положительной, следовательно, связь между факторами прямая. Величина коэффициента корреляции больше 0,5, значит, связь между факторами можно назвать тесной.

 

2.3 Построение уравнения однофакторной регрессии с использованием метода наименьших квадратов


Определим вид зависимости между объемом кредитных вложений и размером прибыли, используя графический метод.

Рис.9

По графику можно предположить, что зависимость прибыли от объема кредитных вложений приближается к уравнению прямой. Следовательно, сумма квадратов отклонений эмпирических точек от теоретических принимает вид:


В этом случае коэффициенты уравнения регрессии рассчитываются по формулам:

Рассчитаем данные коэффициенты:

А = 16,93= 0,0755

Таким образом, уравнение регрессии принимает вид:

У = 16,93 +0,0755х

 

2.4 Проверка значимости коэффициентов регрессии и коэффициента корреляции


Поскольку анализ взаимосвязей между явлениями проводят в выборочной совокупности, а данные необходимо обобщить на всю генеральную совокупность, то необходимо проверить коэффициенты уравнения регрессии на статистическую значимость.

При объеме выборки меньше или равном 30 единицам значимость коэффициентов уравнения регрессии определяют с помощью t-критерия Стьюдента, который находится по формуле (для коэффициента a):

,

где    a - коэффициент уравнения регрессии;

n - число единиц совокупности;

 - остаточное среднее квадратическое отклонение, которое отображает вариацию результативного признака (y) от всех прочих, кроме факторного признака (x), которое находится по формуле:

,

где    yi - эмпирические значения результативного признака;

урасчх - теоретические значения результативного признака, найденные по уравнению регрессии;

n - число единиц в совокупности.

Проверка значимости для коэффициента b осуществляется по формуле:

,

где    b - коэффициент уравнения регрессии;

n - число единиц совокупности;

 - остаточное среднее квадратическое отклонение, которое отображает вариацию результативного признака (y) от всех прочих, кроме факторного признака (x);

 - среднее квадратическое отклонение факторного признака, которое находится по формуле:

,

где    xi - эмпирические значения факторного признака;

хср - среднее значение факторного признака.

Проведем проверку коэффициентов уравнения регрессии (a = 16,93 и b = 0,0755) на статистическую значимость.

Таблица 11. Проверка значимости коэффициентов регрессии

№пп

Чистые активы, млн.руб.,х

Прибыль, млн.руб.,у

(х - хср)2

урасч

у - урасч

(у - урасч)2

1

9911

645

70275247,87

765,51

-120,51

14522,08

2

6728

913

27040346,67

525,09

387,91

150470,92

3

8453

481

47956086,67

655,38

-174,38

30409,85

4

3649

265

4498782,401

292,54

-27,54

758,23

5

2728

258

1440080,001

222,97

35,03

1226,93

6

1255

243

74510,80111

111,72

131,28

17235,48

7

764

179

583645,0678

74,63

104,37

10892,97

8

333

161

1427945,334

42,08

118,92

14142,69

9

949

8

335202,4011

88,60

-80,60

6496,96

10

633

109

800965,3344

64,74

44,26

1959,29

11

871

125

431605,2011

82,71

42,29

1788,25

12

729

18

638347,7344

71,99

-53,99

2914,60

13

1363

208

27214,00111

119,87

88,13

7766,31

14

370

11

1340886,801

44,87

-33,87

1147,28

15

704

19

678921,0678

70,10

-51,10

2611,08

16

439

8

1185848,401

50,08

-42,08

1770,99

17

550

83

956418,8011

58,47

24,53

601,86

18

531

7

993942,5344

57,03

-50,03

2503,20

19

232

23

1679529,601

34,45

-11,45

131,07

20

443

29

1177152,668

50,39

-21,39

457,33

21

1320

24

43250,13444

116,63

-92,63

8579,49

22

320

3

1459183,468

41,10

-38,10

1451,23

23

582

9

894852,9344

60,88

-51,88

2691,95

24

368

29

1345522,668

44,72

-15,72

247,14

25

461

55

1138417,868

51,74

3,26

10,60

26

185

1

1803559,468

30,90

-29,90

893,92

27

275

23

1569925,468

37,70

-14,70

215,98

28

168

33

1849509,334

29,61

3,39

11,46

29

384

8

1308659,734

45,93

-37,93

1438,61

30

141

-8

1923676,534

27,58

-35,58

1265,59

Итого

45 839

3 970

176 879 237

3 970

0

286 613


Рассчитаем остаточное среднее квадратическое отклонение результативного признака:

σε =  = 97,74

Вычислим t-критерий Стьюдента для коэффициента a уравнения регрессии:

 = 0,917

Полученное расчетное значение сравним с табличным:

 (υ=28, α=0,05) = 2,0484 >  = 0,0917 , следовательно, параметр a статистически не значим, и его нельзя распространять на всю совокупность.

Рассчитаем остаточное среднее квадратическое отклонение факторного признака:

2628,16

Вычислим t-критерий Стьюдента для коэффициента b уравнения регрессии:

= 10,74

Полученное расчетное значение сравним с табличным:

 (υ=28, α=0,05) = 2,0484 <  = 10,74 , следовательно, параметр b статистически значим, и его можно распространять на всю совокупность.

При объеме выборочной совокупности менее или равном 30 единицам проверка коэффициента корреляции на статистическую значимость осуществляется при помощи t-критерия Стьюдента, который рассчитывается по формуле:


Рассчитаем t-критерий Стьюдента для выборочной совокупности:

= 9,93

Полученное расчетное значение сравним с табличным:

 (υ=28, α=0,05) = 2,0484 <  = 15.76, следовательно, коэффициент корреляции признается статистически значимым и его можно распространять на всю совокупность.

Построение графика зависимости признаков по теоретическим частотам


Рис.10
ЗАКЛЮЧЕНИЕ

В данной работе мы произвели выборку 30 банков из общей совокупности в 200 банков и произвели анализ данной выборки. Мы рассчитали показатели вариационного ряда по двум показателям - среднюю арифметическую, моду, медиану, относительные и абсолютные показатели вариации, количественные характеристики распределения, а так же нашли эмпирическую и теоретическую функцию распределения ряда и построили их графики.

Почти все характеристики ряда считались в двух вариантах - взвешенное значение и невзвешенное.

Можно сказать, что цель данной работы (практическое закрепление полученных теоретических данных) достигнута.

Хотелось бы только отметить, что в данном случае многие из взвешенных характеристик значительно отличаются по значению от невзвешенных. При данном объеме выборки (30 элементов) и даже при всем объеме выборки можно было бы все характеристики рассчитывать только в одном варианте - взвешенное значение, поскольку данное значение является более точным, а при сегодняшнем уровне автоматизации расчетов и применении электронных таблиц Exsel проведение таких расчетов не является трудоемким.

Похожие работы на - Математические методы статистики

 

Не нашли материал для своей работы?
Поможем написать уникальную работу
Без плагиата!