Коэффициент корреляции. Выбор формы уравнения тренда. Статистические показатели социальной работы и методы их анализа
Федеральное агентство по образованию
Министерства образования и науки
Российской Федерации
Государственное образовательное
учреждение высшего профессионального образования
Филиал Уральского государственного
экономического университета
г. Березники
Кафедра «Математики и
естественнонаучных дисциплин»
КУРСОВАЯ РАБОТА
на тему:
Коэффициент корреляции. Выбор формы
уравнения тренда. Статистические показатели социальной работы и методы их
анализа
специальность: 080103.65
«Национальная экономика»
Выполнила
Студентка гр.
ЭКПЗ - 091 ______________ С.С. Пашихина
Проверил
Профессор,
д.т.н ______________ Б.Н. Щеткин
Березники
г.
Содержание
1 Коэффициент корреляции, его значение и характеристика.
Выбор формы уравнения тренда
.1 Коэффициент корреляции, его значение и характеристика
.2 Выбор формы уравнения тренда
Статистические показатели социальной работы и методы их
анализа
Задачи
Список использованных источников
1.
Коэффициент корреляции, его значение и характеристика. Выбор формы уравнения
тренда
1.1 Коэффициент
корреляции, его значение и характеристика
Один из наиболее общих законов объективного мира - закон всеобщей связи и
зависимости между явлениями. Естественно, что, исследуя явления в самых
различных областях, статистика неизбежно сталкивается с зависимостями как между
количественными, так и между качественными показателями, признаками. Ее задача
- обнаружить (выявить) такие зависимости и дать им количественную
характеристику.
Среди взаимосвязанных признаков (показателей) одни могут рассматриваться
как определенные факторы, влияющие на изменение других (факторные), а вторые
(результативные) - как следствие, результат влияния первых.
Существует 2 вида связи между отдельными признаками: функциональная и
стохастическая (статистическая), частным случаем которой является
корреляционная [1].
Связь
между двумя переменными x и y называется функциональной, если определенному
значению переменной x строго соответствует одно или несколько значений другой
переменной y, и с изменением значения x значение y меняется строго определенно.
Такие связи обычно встречаются в точных науках. Например, известно, что площадь
квадрата равна квадрату его стороны (S = a2). Это соотношение характерно для
каждого единичного случая (квадрата), это так называемая жестко детерминированная
связь. Такие связи можно встретить и в области экономических явлений. Например,
при простой сдельной оплате труда связь между оплатой труда y и количеством
изготовленных изделий x при фиксированной расценке за одну деталь, например 5
руб., легко выразить формулой . Для
изучения функциональных связей применяется индексный метод.
Существуют
и иного рода связи, где взаимно действуют многие факторы, комбинация которых
приводит к вариации значений результативного признака (показателя) при
одинаковом значении факторного признака. Например, при изучении зависимости
величины таможенных платежей, поступающих в федеральный бюджет, от количества
товаров, перемещаемых через таможенную границу государства, (или от
стоимостного товарооборота) последние будут рассматриваться как факторный
признак, а величина таможенных платежей - как результативный.
Между
ними нет жестко детерминированной связи, т.е. при одном и том же количестве
перемещенных через таможенную границу товаров (или стоимости товарооборота)
величина таможенных платежей, перечисленных разными таможнями будет различной,
так как кроме количества товаров, перемещаемых через таможенную границу
государства, (или стоимость товарооборота) на величину таможенных платежей
влияет много других факторов (различная номенклатура товаров, для которых
применяются различные таможенные пошлины, сборы и льготы; различные таможенные
режимы перемещения товаров через таможенную границу и др.), комбинация которых
вызывает вариацию величины таможенных платежей.
Там,
где взаимодействует множество факторов, в том числе и случайных, выявить
зависимости, рассматривая единичный случай, невозможно. Такие связи можно
обнаружить только при массовом наблюдении как статистические закономерности.
Выявленная таким образом связь именуется стохастической.
Корреляционная
связь - понятие более узкое, чем стохастическая связь, это ее частный случай.
Именно корреляционные связи являются предметом изучения статистики.
Корреляционная
связь - это связь, проявляющаяся при большом числе наблюдений в виде
определенной зависимости между средним значением результативного признака и
признаками-факторами. Другими словами, корреляционную связь условно можно
рассматривать как своего рода функциональную связь средней величины одного
признака (результативного) со значением другого (или других). При этом, если
рассматривается связь средней величины результативного показателя y с одним
признаком-фактором x, корреляция называется парной, а если факторных признаков
2 и более (x1, x2, …, xm) - множественной.
По
характеру изменений x и y в парной корреляции различают прямую и обратную
связь. При прямой связи значения обоих признаков изменяются в одном
направлении, т.е. с увеличением (уменьшением) значений x увеличиваются
(уменьшаются) и значения y. При обратной связи значения факторного и
результативного признаков изменяются в разных направлениях.
Изучение
корреляционных связей сводится в основном к решению следующих задач [1]:
1) выявление наличия (отсутствия) корреляционной связи между изучаемыми
признаками;
2) измерение тесноты связи между двумя (и более) признаками с
помощью специальных коэффициентов (эта часть исследования именуется
корреляционным анализом);
) определение уравнения регрессии - математической модели, в
которой среднее значение результативного признака у рассматривается как функция
одной или нескольких переменных - факторных признаков (эта часть исследования
именуется регрессионным анализом).
Для выявления наличия и характера корреляционной связи между двумя
признаками в статистике используется ряд методов [1]:
. Рассмотрение параллельных данных (значений x и y в каждой из n единиц).
Единицы наблюдения необходимо расположить по возрастанию значений факторного
признака х и затем сравнить с ним (визуально) поведение результативного
признака у.
. Графический метод - это графическое изображение корреляционной
зависимости. Для этого, имея n взаимосвязанных пар значений x и y и пользуясь
прямоугольной системой координат, каждую такую пару изображают в виде точки на
плоскости с координатами x и y. Совокупность полученных точек представляет
собой корреляционное поле, а соединяя последовательно нанесенные точки
отрезками, получают ломаную линию, именуемую эмпирической линией регрессии.
3.
Метод аналитических группировок используется при большом числе наблюдений для
выявления корреляционной связи между двумя количественными признаками. Чтобы
выявить наличие корреляционной связи между двумя признаками, проводится
группировка единиц совокупности по факторному признаку х и для каждой выделенной
группы рассчитывается среднее значение результативного признака . Если результативный признак у зависит от факторного
х, то в изменении среднего значения будет
прослеживаться определенная закономерность.
.
Метод корреляционных таблиц предполагает комбинационное распределение единиц
совокупности по двум количественным признакам. Такая таблица строится по типу
«шахматной», т.е. в подлежащем (строках) таблицы выделяются группы по факторному
признаку х, а в сказуемом (столбцах) - по результативному у (или наоборот), а в
клетках таблицы на пересечении х и у показано число случаев совпадения каждого
значения х с соответствующим значением у.
.
Коэффициент корреляции знаков (Фехнера) - простейший показатель тесноты связи,
основанный на сравнении поведения отклонений индивидуальных значений каждого
признака (x и y) от своей средней величины. При этом во внимание принимаются не
величины отклонений () и (), а их
знаки («+» или «-»). Определив знаки отклонений от средней величины в каждом
ряду, рассматривают все пары знаков и подсчитывают число их совпадений (С) и
несовпадений (Н). Тогда коэффициент Фехнера рассчитывается как отношение
разности чисел пар совпадений и несовпадений знаков к их сумме, т.е. к общему
числу наблюдаемых единиц [1]:
(1)
Очевидно, что если знаки всех отклонений по каждому признаку совпадут, то
КФ=1, что характеризует наличие прямой связи. Если все знаки не совпадут, то
КФ=-1 (обратная связь). Если же SС=SН,
то КФ=0. Итак, как и любой показатель тесноты связи, коэффициент Фехнера может
принимать значения от 0 до ±1. Однако, если КФ=1, то это ни в коей мере нельзя воспринимать как
свидетельство функциональной зависимости между х и у.
6.
Линейный коэффициент корреляции - самый популярный измеритель тесноты линейной
связи между двумя количественными признаками x и y. Он основан на
предположении, что при полной независимости признаков x и у отклонения значений
факторного признака от средней () носят
случайный характер и должны случайно сочетаться с различными отклонениями (). При наличии значительного перевеса совпадений или
несовпадений таких отклонений делается предположение о наличии связи между x и
y.
В
отличие от КФ в линейном коэффициенте корреляции учитываются не только знаки
отклонений от средних величин, но и значения самих отклонений, выраженные для
сопоставимости в единицах среднего квадратического отклонения t [1]:
и (2)
Линейный коэффициент корреляции r представляет собой среднюю величину из
произведений нормированных отклонений для x и у [1]:
(3)
или:
(4)
Числитель формулы (4), деленный на n, представляющий собой среднее
произведение отклонений значений двух признаков от их средних значений,
называется коэффициентом ковариации - это мера совместной вариации факторного x
и результативного y признаков [1]:
(5)
Недостатком коэффициента ковариации является то, что он не нормирован, в
отличие от линейного коэффициента корреляции. Очевидно, что линейный
коэффициент корреляции представляет собой частное от деления ковариации между х
и у на произведение их средних квадратических отклонений [1]:
(6)
Путем несложных математических преобразований можно получить и другие
модификации формулы линейного коэффициента корреляции, например [1]:
(7)
(8)
(9)
Линейный коэффициент корреляции может принимать значения от -1 до +1,
причем знак определяется в ходе решения.
Например,
если , то r по формуле (7) будет положительным, что
характеризует прямую зависимость между х и у, в противном случае (r<0) -
обратную связь. Если , то r=0, что означает отсутствие линейной зависимости
между х и у, а при r=1 - функциональная зависимость между х и у. Следовательно,
всякое промежуточное значение r от 0 до 1 характеризует степень приближения
корреляционной связи между х и у к функциональной.
Существует
эмпирическое правило (шкала Чэддока) для оценки тесноты связи, представленное в
таблице 1 [1].
Таблица
1 - Шкала Чэддока
| r |
|
Теснота связи
|
менее 0,1
|
отсутствует линейная связь
|
0,1 ÷ 0,3
|
слабая
|
0,3 ÷ 0,5
|
умеренная
|
0,5 ÷ 0,7
|
заметная
|
более 0,7
|
сильная (тесная)
|
Таким образом, коэффициент корреляции при линейной зависимости служит как
мерой тесноты связи, так и показателем, характеризующим степень приближения
корреляционной зависимости между х и у к линейной. Поэтому близость значения r
к 0 в одних случаях может означать отсутствие связи между х и у, а в других
свидетельствовать о том, что зависимость не линейная.
1.2 Выбор
формы уравнения тренда
Динамика уровней ряда может иметь основную тенденцию (тренд). Это весьма
характерно для экономических показателей. Тренд является результатом
совместного длительного действия множества, как правило, разнонаправленных
факторов на динамику исследуемого показателя. Довольно часто динамика уровней
ряда подвержена циклическим колебаниям, которые зачастую носят сезонный
характер. Иногда не удается выявить тренд и циклическую компоненту. Правда
нередко в этих случаях каждый следующий уровень ряда образуется как сумма
среднего уровня ряда и некоторой случайной компоненты.
В очень многих случаях уровень временного ряда представляется в виде
суммы тренда, циклической и случайной компонент или в виде произведения этих
компонент. В первом случае это аддитивная модель временного ряда, во втором -
мультипликативная модель.
Исследование временного ряда заключается в выявлении и придании
количественного выражения каждой из этих компонент, после чего удается
использовать соответствующие выражения для прогнозирования будущих значений
ряда. Можно также решать задачу построения модели взаимосвязи двух или
нескольких временных рядов.
Для выявления трендовой, циклической компонент можно использовать
коэффициент автокорреляции уровней ряда и автокорреляционную функцию.
Автокорреляционная функция - это последовательность коэффициентов
автокорреляции уровней первого, второго и последующих порядков. Соответственно
график зависимости значений автокорреляционной функции от величины лага
(порядка коэффициента автокорреляции) - коррелограмма. Анализ
автокорреляционной функции и коррелограммы позволяет определить лаг, при
котором автокорреляция наиболее высокая, а следовательно, и лаг, при котором
связь между текущим и предыдущими уровнями ряда наиболее тесная.
Несколько более гибок и опирается на количественные (аналитические)
инструменты анализа метод скользящей средней, или скользящего окна. В нем
последовательно рассчитывается вместо одного полного среднего для всех
наблюдений ряд так называемых частных средних для трех, пяти наблюдений или
более, номера которых постоянно сдвигаются вправо (в сторону увеличения). Таким
образом, получается последовательность частных средних, которая отсеивает
несущественные флуктуации и способна легче обнаружить тренд, чем данные
исходного ряда.
Основным способом моделирования и изучения таким образом основной
тенденции временного ряда (ряда динамики) является аналитическое выравнивание
временного ряда. При этом строится аналитическая функция, характеризующая
зависимость уровней ряда динамики от времени. Эта функция называется также
трендом. Сам такой способ выявления основной тенденции называется аналитическим
выравниванием. Ранее были описаны различные способы определения типа тренда. В
целом построение модели тренда включает следующие основные этапы [1]:
) выравнивание исходного ряда методом скользящей средней;
) расчет сезонной компоненты;
) устранение сезонной компоненты из исходных уровней ряда и получение
выровненных данных в модели;
) аналитическое выравнивание уровней и расчет значений тренда с
использованием полученного уравнения тренда;
) расчет полученных по модели значений, генерируемых трендом и сезонной
компонентой;
) расчет абсолютных и относительных ошибок.
Кроме сезонных и циклических колебаний весьма важную роль играют
единовременные изменения характера тенденции временного ряда. Эти
(относительно) быстрые однократные изменения тренда (его характера) вызываются
структурными изменениями в экономике либо мощными глобальными (внешними)
факторами. Прежде всего выясняется, значимо ли повлияли общие структурные
изменения на характер тренда. При условии значимости такого влияния
(структурных изменений) на характер тренда используется кусочно-линейная модель
регрессии. Кусочно-линейная модель означает представление исходной совокупности
данных ряда в виде двух частей. Одна часть данных моделируется просто линейной
моделью с одним коэффициентом регрессии (углом наклона прямой) и представляет
данные до момента (периода) структурных изменений. Вторая часть данных - это
тоже линейная модель, но уже с иным коэффициентом регрессии (углом наклона).
После построения двух таких моделей (подмоделей) линейной регрессии
получают уравнения двух соответствующих прямых. Если структурные изменения
незначительно повлияли на характер тенденции ряда, то вместо построения точной
кусочно-линейной модели вполне можно использовать единую аппроксимирующую
модель, т.е. одну общую линейную зависимость (одну прямую), тоже вполне
приемлемо представляющую данные в целом. Незначительное ухудшение в отдельных
данных при этом непринципиально.
Если строится кусочно-линейная модель, то снижается остаточная сумма
квадратов по сравнению с единым для всей совокупности уравнением тренда. В то
же время разделение исходной совокупности на две части ведет к потере числа
наблюдений и тем самым к снижению числа степеней свободы в каждом уравнении
кусочно-линейной модели. Единое уравнение для всей совокупности данных
позволяет сохранить число наблюдений исходной совокупности. Остаточная сумма
квадратов по этому уравнению в то же время выше, чем такая же сумма для
кусочно-линейной модели.
Выбор конкретной - кусочно-линейной или просто линейной - модели, т.е.
единого уравнения тренда, зависит от соотношения между снижением остаточной
дисперсии и потерей числа степеней свободы при переходе от единого уравнения
регрессии к кусочно-линейной модели.
2.
Статистические показатели социальной работы и методы их анализа
коэффициент корреляция ряд динамика
Тема «Статистические показатели социальной работы и методы их анализа»
изучается на стыке сразу нескольких взаимосвязанных дисциплин. Для современного
состояния науки характерен переход к глобальному рассмотрению проблем тематики
«Статистические показатели социальной работы и методы их анализа» [2].
Вопросам исследования посвящено множество работ. В основном материал,
изложенный в учебной литературе, носит общий характер, а в многочисленных
монографиях по данной тематике рассмотрены более узкие вопросы проблемы
«Статистические показатели социальной работы и методы их анализа». Однако,
требуется учет современных условий при исследовании проблематики обозначенной
темы.
Высокая значимость и недостаточная практическая разработанность проблемы
«Статистические показатели социальной работы и методы их анализа» определяют
несомненную новизну данного исследования.
Дальнейшее внимание к вопросу о проблеме «Статистические показатели
социальной работы и методы их анализа» необходимо в целях более глубокого и
обоснованного разрешения частных актуальных проблем тематики данного
исследования [2].
Социальное обеспечение - это система учреждений и услуг по оказанию
помощи в случае стихийных бедствий; при ограничении либо потере трудоспособности;
в ситуациях, требующих внешней помощи; а также по оказанию услуг, смягчающих
диспропорции в условиях жизни населения.
Социальная защищенность населения - это совокупность механизмов,
предусмотренных законодательными и нормативными актами для сохранения доходов
(или их части) отдельным лицам или семьям, которые их больше не имеют в связи с
потерей трудоспособности из-за старости или инвалидности, болезни, беременности
(материнства), безработицы, смерти кормильца семьи, а также для материальной поддержки
многодетных и малообеспеченных групп населения, учащейся молодежи и др.
При определении размеров социальной помощи исходят как из потребностей
населения, нуждающегося в поддержке, так и из реальных ресурсов, которыми
располагает государство для этих целей на данном этапе экономического развития
страны. Нормы социального обеспечения служат, как правило, индикаторами
социальной политики государства.
Исходя из задач и направлений деятельности органов и учреждений
социального обеспечения, в задачи статистического наблюдения входит сбор
следующих сведений [3]:
§ размеры социальных выплат и их источники;
§ численность лиц, охватываемых социальным обеспечением по его видам;
§ средние размеры социальных пособий, приходящихся на их получателя.
В связи с разнообразием социальных выплат кратко рассмотрим статистику
социальных услуг и социальную поддержку семьи.
Наряду с выплатой пенсий и пособий важным элементом федеральной системы
социального обеспечения является социальное обслуживание престарелых,
нетрудоспособных и семей с детьми.
В соответствии с Федеральными законами «Об основах социального
обслуживания населения в Российской Федерации» и «О социальном обслуживании
граждан пожилого возраста и инвалидов» предусматривается разработка
государственных стандартов социального обслуживания населения, устанавливающих
основные требования к объектам и качеству социальных услуг, порядку и условиям
их оказания. Это потребует внесения определенных корректив в существующую
информационную базу [3].
Круг оказываемых в настоящее время социальных услуг достаточно широк и
обусловлен потребностями упомянутых контингентов населения в связи с их
болезнью, инвалидностью, старостью, многодетностью. Остановимся в основном на
тех социальных услугах, которые носят массовый характер и отражаются в
статистической или административной (отраслевой) отчетности. Прежде всего это
касается лиц пожилого возраста и инвалидов.
Престарелые и инвалиды, включая детей-инвалидов, получают комплекс
социальных услуг во время их пребывания в домах-интернатах. Эти
медико-социальные учреждения предназначены для постоянного проживания
престарелых и инвалидов, нуждающихся в уходе, бытовом и медицинском
обслуживании. В период пребывания в домах-интернатах им предоставляется жилье,
питание, одежда, медицинская и лекарственная помощь, лечение, социально-бытовое
обслуживание.
Статистическая отчетность о деятельности домов-интернатов для престарелых
и инвалидов (взрослых и детей) позволяет установить их общее число, количество
мест и численность проживающих в них лиц, в том числе находящихся на постоянном
постельном режиме (формы № 2-собес «Отчет дома-интерната для престарелых и
инвалидов» и № 3-собес «Отчет детского дома-интерната для инвалидов»). В
отчетности имеются также сведения о численности лиц, состоящих на очереди для
помещения в дома-интернаты для взрослых и в детские дома-интернаты [3].
Другой существенной услугой, оказываемой населению, является бесплатное
содержание детей-сирот и детей, оставшихся без попечения родителей, в
лечебно-профилактических и учебно-воспитательных учреждениях, а также в детских
домах семейного типа.
Статистика социального обеспечения располагает данными об общем
количестве интернатных учреждений, в том числе по их видам (дома ребенка,
детские дома, школы-интернаты) и численности детей, находящихся в них;
численности детей-сирот и детей, оставшихся без попечения родителей, состоящих
на учете; численности детей и подростков, оставшихся без попечения родителей,
из них - устроенных в отчетном году в дома ребенка, детские дома и школы-интернаты,
находящихся под опекой (попечительством) и усыновленных, направленных в
учебно-воспитательные и учебные заведения на условиях постоянного
государственного обеспечения.
Объектом статистического наблюдения является также оказание такого вида
социальной услуги, как обеспечение инвалидов транспортными средствами (форма №
1-собес «Транспорт для инвалидов») [3].
В настоящее время все большее распространение получает и такой вид
социальных услуг, как социальная помощь на дому. Такая помощь оказывается престарелым
и инвалидам, нуждающимся в посторонней помощи в связи с утратой способности к
самообслуживанию.
К основным социально-бытовым услугам, оказываемым на дому, относятся:
доставка на дом продуктов питания, обедов, товаров первой необходимости,
лекарств; оплата жилищно-коммунальных и других бытовых услуг. Оказание такой
помощи престарелым и инвалидам является функцией отделений социальной помощи на
дому центров социального обслуживания. Эти центры предоставляют информацию о
численности лиц, которым была предоставлена помощь на дому в отчетном периоде.
Общепризнано, что семья является важнейшим социальным институтом, в
котором рождаются и воспитываются новые поколения. В соответствии с Законом о
семье и браке, принятом в Российской Федерации в 1996 г., семейная политика
провозглашена как одно из важных направлений социальной политики государства
[3].
На уровне государства закреплены пути и формы поддержки семьи как
фундаментального общественного института, обеспечение гарантированных форм
материальной поддержки.
Для целей статистического анализа в этой области могут использоваться
данные об основных социальных гарантиях, предоставляемых государством в виде
единовременных пособий при рождении каждого ребенка, ежемесячного пособия на
период отпуска по уходу за ребенком до достижения им возраста 1,5 лет,
ежемесячного пособия на каждого ребенка до 16 лет, ежемесячных пособий на детей
одиноким матерям и т.д. [3]
Сведения об общих фактических размерах пособий, носящих трансфертный
характер, и их доле в доходах семьи содержатся в данных бюджетных обследований
населения.
Задачи
Задание 1
. Произведите аналитическую группировку 20 предприятий по среднегодовой
стоимости основных производственных фондов, образовав не более четырех групп с
равными закрытыми интервалами.
. По каждой группе приведите структуру среднегодовой стоимости основных
производственных фондов, а также определите средние абсолютные и относительные
показатели - фондоотдачу и выработку на 1-го работающего.
. Составьте таблицу с системой абсолютных и относительных показателей и
сделайте выводы.
Исходные данные представлены в таблице 2.
Таблица
2 - Показатели работы предприятий
№ предприятия
|
Валовая продукция (ВП), млрд. руб.
|
Среднегодовая стоимость основных производственных фондов
(ОПФ), млрд. руб.
|
Среднегодовая численность ППП. (СЧППП)
|
Среднегодовой фонд заработной платы ППП. (ФЗПППП), тыс.
руб.
|
21
|
10,734
|
8,132
|
1512
|
28025
|
22
|
9,954
|
6,726
|
1143
|
20968
|
23
|
4,074
|
5,992
|
646
|
11049
|
24
|
24,688
|
10,734
|
2463
|
45893
|
25
|
70,226
|
51,260
|
4973
|
99400
|
26
|
8,125
|
5,381
|
1147
|
20719
|
27
|
11,559
|
8,083
|
1945
|
36813
|
28
|
10,814
|
5,942
|
1896
|
33956
|
29
|
9,684
|
3,696
|
918
|
17016
|
30
|
16,000
|
9,143
|
1748
|
34873
|
31
|
2,643
|
1,716
|
626
|
11237
|
32
|
6,140
|
2,729
|
881
|
17306
|
33
|
19,723
|
18,433
|
1766
|
39250
|
34
|
8,412
|
5,842
|
1034
|
19074
|
35
|
8,316
|
5,940
|
890
|
18452
|
36
|
6,502
|
4,963
|
840
|
17500
|
37
|
43,822
|
39,127
|
3262
|
7888
|
38
|
30,000
|
25,862
|
3116
|
58947
|
39
|
6,658
|
7,566
|
4646
|
94697
|
40
|
8,096
|
12,368
|
1383
|
29626
|
Решение:
Определяем величину равного интервала i:
(10)
где xmax, xmin - максимальное и минимальное значение группировочного
признака в совокупности;- количество интервалов (групп).
Максимальное значение среднегодовой стоимости основных производственных
фондов по данным таблицы 2 составляет 51,26 млрд. руб.
Минимальное значение среднегодовой стоимости основных производственных
фондов по данным таблицы 2 составляет 1,716 млрд. руб.
По условию задачи необходимо образовать не более четырех групп с равными
закрытыми интервалами. Таким образом, примем n = 4.
Величина равного интервала i составит:
млрд.
руб.
Итак,
равные закрытые интервалы составят:
1) 1,716 - 14,104
2) 14,102 - 26,488
) 26,488 - 38,874
) 38,874 - 51,26
Группировка предприятий по рассчитанным интервалам представлена в таблице
3.
Таблица
3 - Группировка предприятий по рассчитанным интервалам
№ группы
|
Интервал, млрд. руб.
|
Номера предприятий
|
Число предприятий
|
1
|
1,716 - 14,104
|
21-24, 26-32, 34-36, 39-40
|
16
|
2
|
14,102 - 26,488
|
33, 38
|
2
|
3
|
26,488 - 38,874
|
-
|
0
|
4
|
38,874 - 51,26
|
25, 37
|
2
|
Итого
|
20
|
Итак, по данным таблицы 3 видно, что имеется пустой интервал - от 26,488
до 38,874 млрд. руб.
Следовательно, необходимо укрупнить интервалы, уменьшив количество групп.
Примем n = 3.
Величина равного интервала i составит:
млрд.
руб.
Итак,
равные закрытые интервалы составят:
1) 1,716 - 18,226
2) 18,226 - 34,736
) 34,736 - 51,26
Группировка предприятий по рассчитанным интервалам представлена в таблице
4.
Таблица
4 - Группировка предприятий по рассчитанным интервалам
№ группы
|
Интервал, млрд. руб.
|
Номера предприятий
|
Число предприятий
|
1
|
1,716 - 18,226
|
21-24, 26-32, 34-36, 39-40
|
16
|
2
|
18,226 - 34,736
|
33, 38
|
2
|
3
|
34,736 - 51,26
|
25, 37
|
2
|
Итого
|
20
|
Итак, пустых интервалов в данной группировке нет, следовательно, можно
продолжить расчеты.
Среднегодовая стоимость основных производственных фондов в среднем на
один завод рассчитывается по формуле:
(11)
где ОПФ - среднегодовая стоимость основных производственных фондов по
группе заводов, n - количество заводов в группе.
Фондоотдача рассчитывается по формуле:
(12)
где В - стоимость валовой продукции.
Для определения выработки на одного работающего количество произведенной
продукции делится на численность всего персонала:
(13)
где Ч - численность всего персонала.
Структура среднегодовой стоимости основных производственных фондов, а
также средние абсолютные и относительные показатели - фондоотдача и выработка
на 1-го работающего, по каждой группе предприятий представлены в таблице 5.
Таблица
5 - Итоговая таблица
№ группы
|
Количество предприятий
|
Среднегодовая стоимость основных производственных фондов,
млрд. руб.
|
Валовая продукция (ВП), млрд. руб.
|
Среднегодовая численность ППП. (СЧППП)
|
Среднегодовой фонд заработной платы ППП. (ФЗПППП), тыс.
руб.
|
Фондоотдача
|
Выработка на 1-го работающего, млн. руб.
|
|
|
Всего по группе
|
На 1 предпр.
|
Всего по группе
|
На 1 предпр.
|
Всего по группе
|
На 1 предпр.
|
Всего по группе
|
На 1 предпр.
|
|
|
1
|
16
|
104,953
|
6,56
|
152,399
|
9,52
|
23718
|
1482
|
457204
|
28575
|
1,45
|
6,43
|
2
|
2
|
44,295
|
22,15
|
49,723
|
24,86
|
4882
|
2441
|
98197
|
49099
|
1,12
|
10,18
|
2
|
90,387
|
45,19
|
114,048
|
57,02
|
8235
|
4118
|
107288
|
53644
|
1,26
|
13,85
|
Итого
|
20
|
239,635
|
-
|
316,17
|
-
|
36835
|
-
|
662689
|
-
|
-
|
-
|
Итак, по данным таблицы 5 можно сделать следующие выводы:
Наибольшая по числу предприятий группа № 1. В данной группе в
совокупности произведено больше всего валовой продукции, однако выпуск валовой
продукции на одно предприятие составляет всего 9,52 млрд. руб., данный
показатель значительно меньше аналогичного показателя по остальным группам.
Наибольший выпуск валовой продукции в расчете на одно предприятие
наблюдается в группе № 3 и составляет 57,02 млрд. руб.
Наибольшая среднегодовая численность персонала в расчете на одно
предприятие соответствует группе № 3, наименьшая - группе № 1.
Наибольший показатель фондоотдачи соответствует группе № 1, наименьший -
группе № 2.
Наибольшая выработка на 1-ого работающего наблюдается в группе № 3,
наименьшая - в группе № 1.
Задание 2
. Постройте секционные диаграммы для двух фирм по дискретным вариационным
рядам.
. Сделайте выводы об эффективности работы этих фирм и акции какой фирмы
вы бы приобрели. Обоснуйте ваш выбор.
. Определите коэффициенты, обратные коэффициентам вариации по каждой
фирме. Сравните ваши выводы с полученными коэффициентами и дайте интерпретацию
этим коэффициентам.
Исходные данные представлены в таблице 6.
Таблица
6 - Годовая норма прибыли (%)
Фирмы
|
Годы
|
|
1
|
2
|
3
|
4
|
5
|
6
|
7
|
8
|
9
|
10
|
1
|
15
|
13
|
-17
|
16
|
18
|
11
|
-7
|
-9
|
5
|
13
|
2
|
-7
|
12
|
-9
|
28
|
35
|
15
|
15
|
15
|
19
|
25
|
Решение:
Определим Q1 для первой фирмы:
Так
как n*q - дробное число, то принимаем n*q =2, тогда:
(14)
где x3 означает, что в ранжируемом
дискретном ряду нижний квартиль по счету от минимального значения дискретного
ранжированного ряда стоит на третьем месте, т. е. Q1 = 11.
Определим Q1 для второй фирмы:
Так
как n*q - дробное число, то принимаем n*q =2, тогда:
где
x3 означает, что в ранжируемом дискретном ряду нижний
квартиль по счету от минимального значения дискретного ранжированного ряда
стоит на третьем месте, т. е. Q1 = 15.
Определим
Q2 для первой фирмы:
Так
как n*q - целое число, то используем формулу:
(15)
т.е. Q2 = 14,5
Определим Q2 для второй фирмы:
Так
как n*q - целое число, то используем формулу (14):
т.е.
Q2 = 25
Определим
Q3 для первой фирмы:
Так
как n*q - дробное число, то принимаем n*q = 7, тогда:
где x8 означает, что в ранжируемом
дискретном ряду верхний квартиль по счету от минимального значения дискретного
ранжированного ряда стоит на восьмом месте, т. е. Q3 = 15.
Определим Q3 для второй фирмы:
Так
как n*q - дробное число, то принимаем n*q = 7, тогда:
где x8 означает, что в ранжируемом дискретном
ряду верхний квартиль по счету от минимального значения дискретного
ранжированного ряда стоит на восьмом месте, т. е. Q3 = 25.
Секционные диаграммы для фирм № 1 и № 2 представлены на рисунках 1-2.
Рисунок 1 - Секционная диаграмма для фирмы № 1
Рисунок 2 - Секционная диаграмма для фирмы № 2
Для
характеристики меры колеблемости в относительных величинах используют
коэффициент вариации, определяемый по формуле ,
где S - стандартное отклонение (среднее квадратическое отклонение); x - среднее
значение признака.
Среднее
значение признака для первой фирмы составляет 5,8, для второй фирмы - 14,8.
Для
первой фирмы стандартное отклонение составляет:
Для
второй фирмы стандартное отклонение составляет:
Таким
образом, коэффициент вариации для первой фирмы составит:
Коэффициент
вариации для второй фирмы составит:
Рассчитанные
коэффициенты вариации говорят о неоднородности информации и необходимости
исключения самых больших и самых маленьких значений.
Задание
3
.
Определите взаимосвязь между среднегодовой стоимостью основных производственных
фондов (факторный признак x) и выработкой на 1-го работающего (результативный
признак y), рассчитав коэффициент детерминации и эмпирическое корреляционное
отношение. Сделайте выводы.
Решение:
Исходные
данные представлены в задаче 1, в итоговой таблице 5.
Перепишем,
полученную в задаче 1 сгруппированную таблицу, по необходимым нам данным
(таблица 7):
Таблица
7 - Исходные данные
№ группы
|
Количество предприятий
|
Среднегодовая стоимость основных производственных фондов,
млрд. руб.
|
Выработка на 1-го работающего, млн. руб.
|
1
|
16
|
104,953
|
6,43
|
2
|
2
|
44,295
|
10,18
|
3
|
2
|
90,387
|
13,85
|
Итого
|
20
|
239,635
|
-
|
Коэффициент детерминации вычисляется по формуле:
(16)
где
- межгрупповая дисперсия,
- общая
дисперсия.
Межгрупповая
дисперсия рассчитывается по формуле:
(17)
где mJ - количество единиц в j группе.
Общая дисперсия рассчитывается по формуле:
(18)
Эмпирическое корреляционное отношение определяется по формуле:
(19)
Определим среднюю выработку на 1-ого работающего:
млрд.
руб.
Строим
расчетную таблицу:
Таблица
8 - Расчетная таблица
№ группы
|
Группировка предприятий по среднегодовой стоимости основных
производственных фондов, млрд. руб.
|
Количество предприятий, n
|
Выработка на 1-го работающего, млн. руб.
|
|
|
|
1
|
1,716 - 18,226
|
16
|
6,43
|
-1,12
|
1,25
|
19,96
|
2
|
18,226 - 34,736
|
2
|
10,18
|
2,63
|
6,93
|
13,87
|
3
|
34,736 - 51,26
|
2
|
13,85
|
6,30
|
39,73
|
79,46
|
Итого
|
|
20
|
-
|
7,82
|
47,91
|
113,28
|
Рассчитаем межгрупповую дисперсию по формуле 17:
Рассчитаем
общую дисперсию по формуле 18:
Тогда
коэффициент детерминации составит:
Коэффициент
детерминации показывает, что среднегодовая стоимость ОПФ на 64% зависит от
выработки на одного работающего и на 36% от неучтенных факторов.
Рассчитаем
эмпирическое корреляционное отношение по формуле 19:
Это
говорит о том, что связь между факторным и результативным признаками очень
тесная, т.е. это свидетельствует о существенном влиянии на среднегодовую
стоимость ОПФ выработки на одного работающего.
Задание
4
.
Произведите 25% механический отбор предприятий (объем генеральной совокупности
N = 20).
.
По отобранным данным рассчитайте среднегодовой фонд заработной платы.
.
С вероятностью 0.954 определите границы среднего фонда заработной платы для
всех 20 предприятий.
Исходные
данные представлены в таблице 9.
Таблица
9 - Показатели работы предприятий
№ предприятия
|
Валовая продукция (ВП), млрд. руб.
|
Среднегодовая стоимость основных производственных фондов
(ОПФ), млрд. руб.
|
Среднегодовая численность ППП. (СЧППП)
|
Среднегодовой фонд заработной платы ППП. (ФЗПППП), тыс.
руб.
|
21
|
10,734
|
8,132
|
1512
|
28025
|
22
|
9,954
|
6,726
|
1143
|
20968
|
23
|
4,074
|
5,992
|
646
|
11049
|
24
|
24,688
|
10,734
|
2463
|
45893
|
25
|
70,226
|
51,260
|
4973
|
99400
|
26
|
8,125
|
5,381
|
1147
|
20719
|
27
|
11,559
|
8,083
|
1945
|
36813
|
28
|
10,814
|
5,942
|
1896
|
33956
|
29
|
9,684
|
3,696
|
918
|
17016
|
30
|
16,000
|
9,143
|
1748
|
34873
|
31
|
2,643
|
1,716
|
626
|
11237
|
32
|
6,140
|
2,729
|
881
|
17306
|
33
|
19,723
|
18,433
|
1766
|
39250
|
34
|
8,412
|
5,842
|
1034
|
19074
|
35
|
8,316
|
5,940
|
890
|
18452
|
36
|
6,502
|
4,963
|
840
|
17500
|
37
|
43,822
|
39,127
|
3262
|
7888
|
38
|
30,000
|
25,862
|
3116
|
58947
|
39
|
6,658
|
7,566
|
4646
|
94697
|
40
|
8,096
|
12,368
|
1383
|
29626
|
Решение:
Расстояние между отбираемыми единицами определяется делением численности
генеральной совокупности (N) на численность выборочной совокупности (n).
Численность выборочной совокупности в данном случае составит:
единиц
В
выборочную совокупность будут отобраны каждая четвертая единица генеральной
совокупности (1:0,25=4).
Таким
образом, можно организовать пять групп (20:4=5) с численностью в каждой группе
по четыре единицы.
Так
как генеральная совокупность упорядочена по нейтральному признаку, то в выборку
может быть взята из группы любая единица, но для соблюдения принципа случайного
отбора во всех последующих группах берутся те же единицы, которые соответствуют
порядковому номеру первой группы.
Итак,
берем каждое второе предприятие в группе, т.е. предприятия № 22, 26, 30, 34,
38. Результаты выборки представлены в таблице 10.
Таблица
10 - Результаты выборки
№ предприятия
|
Валовая продукция (ВП), млрд. руб.
|
Среднегодовая стоимость основных производственных фондов
(ОПФ), млрд. руб.
|
Среднегодовая численность ППП. (СЧППП)
|
Среднегодовой фонд заработной платы ППП. (ФЗПППП), тыс.
руб.
|
22
|
9,954
|
6,726
|
1143
|
20968
|
26
|
8,125
|
5,381
|
1147
|
20719
|
30
|
16,000
|
9,143
|
1748
|
34873
|
34
|
8,412
|
5,842
|
1034
|
19074
|
38
|
30,000
|
25,862
|
3116
|
58947
|
Среднегодовой фонд заработной платы по отобранным предприятиям рассчитаем
по формуле средней арифметической:
Итак, среднегодовой фонд заработной платы по отобранным предприятиям
составит:
тыс.
руб.
Выборка
при n < 30 называются малой выборкой и ее характеристики определяются по
формулам 12-13:
(21)
(22)
Итак, рассчитаем дисперсию для выборочной совокупности:
Тогда,
средняя ошибка выборки составит:
Предельная
ошибка выборки определяется по формуле:
(23)
Так вероятность равна 0,954, то коэффициент доверия t равен 2,776 (по
таблице значений критерия Стьюдента (t-критерия), с вероятностью 0,954 и числом
степеней свободы v=n-1=5-1=4), следовательно, предельная
ошибка выборки составит:
Доверительные
интервалы (пределы) средней рассчитываем, исходя из двойного неравенства:
(24)
Таким образом, доверительные интервалы составят:
Таким
образом, с вероятностью 0,954 можно утверждать, что средний фонд заработной
платы лежит в границах от 10700 тыс. руб. до 51132,4 тыс. руб.
Задание
5
.
Произведите сглаживание скользящей средней и центрирование.
.
Определите индивидуальные индексы сезонности.
.
Очистите исходный ряд динамики от сезонной составляющей и опишите полученный
ряд динамики как функцию времени Tr = f (t).
.
Вычислите ретроспективный и перспективный прогнозы на 4-й год по кварталам и
интервал в котором будет находится прогнозная величина в IV квартале 4-го года.
.
Фактические и расчетные данные изобразите графически.
Исходные
данные представлены в таблице 11.
Таблица
11 - Исходные данные
1 год
|
2 год
|
3 год
|
кварталы
|
кварталы
|
кварталы
|
I
|
II
|
III
|
IV
|
I
|
II
|
III
|
IV
|
I
|
II
|
III
|
IV
|
300
|
230
|
120
|
270
|
310
|
300
|
150
|
290
|
320
|
310
|
160
|
300
|
Решение:
Для выравнивания ряда используем линейную трендовую модель - уравнение
прямой:
(25)
Параметры искомого уравнения прямой определяем из следующей системы
нормальных уравнений:
(26)
(27)
откуда:
Уравнение
прямой будет иметь вид:
Подставляя
в данное уравнение последовательно значения t, равные -6, -5, -4, -3, -2, -1,
1, 2, 3, 4, 5, 6, находим выровненные уровни .
Если
, в нашем примере эти суммы равны между собой и равны
3060, следовательно, значения уровней выровненного ряда найдены верно.
Полученное
уравнение показывает, что, несмотря на значительные колебания в отдельные годы,
наблюдается тенденция увеличения выпуска продукции в среднем на 2,03 млн. руб.
в месяц.
Расчетные
данные представлены в таблице 12.
Таблица
12 - Расчетные значения
Год
|
Квартал
|
Значение
|
Расчетные значения
|
|
|
|
t
|
t2
|
y*t
|
|
1 год
|
I
|
300
|
-6
|
36
|
-1800
|
242,82
|
|
II
|
230
|
-5
|
25
|
-1150
|
244,85
|
|
III
|
120
|
-4
|
16
|
-480
|
246,88
|
|
IV
|
270
|
-3
|
9
|
-810
|
248,91
|
2 год
|
I
|
310
|
-2
|
4
|
-620
|
250,94
|
|
II
|
300
|
-1
|
1
|
-300
|
252,97
|
|
III
|
150
|
1
|
1
|
150
|
257,03
|
|
IV
|
290
|
2
|
4
|
580
|
259,06
|
3 год
|
I
|
320
|
3
|
9
|
960
|
261,09
|
|
II
|
310
|
4
|
16
|
1240
|
263,12
|
|
III
|
160
|
5
|
25
|
800
|
265,15
|
|
IV
|
300
|
6
|
36
|
1800
|
267,18
|
Итого
|
3060
|
0
|
182
|
370
|
3060
|
Индивидуальный индекс сезонности можно рассчитать по формуле:
(28)
Индивидуальные индексы сезонности представлены в таблице 13.
Таблица
13 - Расчет индивидуальных индексов сезонности
Год
|
Квартал
|
Значение
|
Расчетные значения
|
|
|
|
|
t
|
t2
|
y*t
|
|
|
1 год
|
I
|
300
|
-6
|
36
|
-1800
|
242,82
|
123,5
|
|
II
|
230
|
-5
|
25
|
-1150
|
244,85
|
93,9
|
|
III
|
120
|
-4
|
16
|
-480
|
246,88
|
48,6
|
|
IV
|
270
|
-3
|
9
|
-810
|
248,91
|
108,5
|
2 год
|
I
|
310
|
-2
|
4
|
-620
|
250,94
|
123,5
|
|
II
|
300
|
-1
|
1
|
-300
|
252,97
|
118,6
|
|
III
|
150
|
1
|
1
|
150
|
257,03
|
58,4
|
|
IV
|
290
|
2
|
4
|
580
|
259,06
|
111,9
|
3 год
|
I
|
320
|
3
|
9
|
960
|
261,09
|
122,6
|
|
II
|
310
|
4
|
16
|
1240
|
263,12
|
117,8
|
|
III
|
160
|
5
|
25
|
800
|
265,15
|
60,3
|
|
IV
|
300
|
6
|
36
|
1800
|
267,18
|
112,3
|
Итого
|
3060
|
0
|
182
|
370
|
3060
|
|
Для устранения воздействия случайных факторов проведем усреднение
индивидуальных индексов сезонности по кварталам. Используем формулу переменной
средней:
По первому кварталу:
%
По
второму кварталу:
%
По
третьему кварталу:
%
По
четвертому кварталу:
%
Вычисленные
и откорректированные средние индексы сезонности составляют модель сезонности
волны объемов выпуска продукции во внутригодовом цикле. Модель отражает
квартальные колебания уровней.
Наибольшие
объемы выпуска продукции ежегодно приходятся на I, ΙΙ и
ΙΙV
кварталы, снижение объемов - в ΙII квартале.
Определяем
скорректированные индексы сезонности:
По
первому кварталу:
По
второму кварталу:
По
третьему кварталу:
По
четвертому кварталу:
Очищаем
исходный ряд динамики от сезонной составляющей и получаем тренд:
(29)
Результаты расчета теоретического значения тренда представлены в таблице
14.
Таблица
14 - Результаты расчета теоретического значения тренда
Год
|
Квартал
|
Значение
|
Расчетные значения
|
|
|
|
|
|
t
|
t2
|
y*t
|
|
|
|
1 год
|
I
|
300
|
-6
|
36
|
-1800
|
242,82
|
123,5
|
225,56
|
|
II
|
230
|
-5
|
25
|
-1150
|
244,85
|
93,9
|
172,93
|
|
III
|
120
|
-4
|
16
|
-480
|
246,88
|
48,6
|
90,23
|
|
IV
|
270
|
-3
|
9
|
-810
|
248,91
|
108,5
|
203,01
|
2 год
|
I
|
310
|
-2
|
4
|
-620
|
250,94
|
123,5
|
233,08
|
|
II
|
300
|
-1
|
1
|
-300
|
252,97
|
118,6
|
225,56
|
150
|
1
|
1
|
150
|
257,03
|
58,4
|
112,78
|
|
IV
|
290
|
2
|
4
|
580
|
259,06
|
111,9
|
218,05
|
3 год
|
I
|
320
|
3
|
9
|
960
|
261,09
|
122,6
|
240,60
|
|
II
|
310
|
4
|
16
|
1240
|
263,12
|
117,8
|
233,08
|
|
III
|
160
|
5
|
25
|
800
|
265,15
|
60,3
|
120,30
|
|
IV
|
300
|
6
|
36
|
1800
|
267,18
|
112,3
|
225,56
|
Итого
|
3060
|
0
|
182
|
370
|
3060
|
-
|
-
|
Итак, теоретическое значение тренда составляет:
Используя
полученное уравнение методом экстраполяции при t равном 7, определяем ожидаемый
объем продаж на I квартал 4 года:
млн.
руб.
Аналогично
определяем ожидаемые объемы продаж на оставшиеся кварталы 4 года:
млн.
руб.
млн.
руб.
млн.
руб.
Нанесем
на график фактические и выровненные данные.
Рисунок
3 - Фактические и расчетные данные динамики выпуска продукции
Задание
6
.
Общий индекс товарооборота.
.
Общий индекс цен и абсолютное изменение товарооборота за счет изменения цены
.
Общий индекс физического объема и абсолютное изменение товарооборота за счет
изменения физического объема.
.
Сделайте выводы.
Решение:
Исходные
данные представлены в таблице 15.
Таблица
15 - Исходные данные
Товары
|
Объем реализации
|
Цена за единицу
|
Изменение цены / физического объема по сравнению с
базисным, %
|
|
q0p0, млн. руб.
|
q1p1, млн. руб.
|
p0, тыс. руб.
|
p1, тыс. руб.
|
|
А
|
2500
|
3000
|
-
|
-
|
-5 / -
|
Б
|
3500
|
3700
|
-
|
-
|
+10 / -
|
В
|
250
|
290
|
-
|
-
|
без. изм. / -
|
Решение:
Общий индекс товарооборота рассчитывается по формуле:
(30)
Таким образом, общий индекс товарооборота составит:
Следовательно,
товарооборот в отчетном году по сравнению с базисным вырос на 12% (112-100).
Общий
индекс цен рассчитывается по формуле:
(31)
Так как из данной модели нам неизвестен знаменатель, а известно
процентное изменение цены, то следует применить формулу среднегармонического
индекса:
(32)
Индивидуальный индекс цен рассчитывается по формуле:
(33)
Таким образом, рассчитаем индивидуальные индексы цен на товары:
Товар А:
Товар
Б:
Товар
В:
Итак,
рассчитаем общий индекс цен:
Таким
образом, за счет изменения цен, общий товарооборот увеличился на 3%.
Абсолютное
изменение товарооборота за счет изменения цен можно рассчитать по формуле:
(34)
Следовательно, абсолютное изменение товарооборота за счет изменения цен
составило:
тыс.
руб.
Общий
индекс физического объема продукции рассчитывается по формуле:
(35)
Так как в данном случае нам неизвестен числитель формулы, а известно
процентное изменение физического объема, то следует применить формулу
среднеарифметического индекса:
(36)
Индивидуальный индекс физического объема рассчитывается по формуле:
(37)
Таким образом, рассчитаем индивидуальные индексы физического объема на
товары. По условию задачи в отчетном году по сравнению с базисным физический
объем продукции не изменялся, следовательно, индивидуальный индекс физического
объема продукции будет равен 1.
Итак, рассчитаем общий индекс физического объема:
Следовательно,
абсолютное изменение товарооборота, за счет изменения физического объема равно
нулю.
Т.е.
товарооборот изменился только в результате изменения цен.
Задание
7
.
Матрицу парных коэффициентов корреляции независимых переменных x1 и x2 вектор
парных коэффициентов корреляции зависимой y и независимых переменных x1 и x2.
Определите значимость коэффициентов корреляции. Сделайте выводы направлении
взаимосвязи этих показателей с теоретической точки зрения и полученных по
выборке.
.
Коэффициенты линейной регрессионной модели a0,a1,a2 и их значимость.
.
Стандартизованные β
коэффициенты и их интерпретация.
.
Коэффициент детерминации R2 и его интерпретация.
.
Адекватность модели по F - критерию Фишера.
.
Сделайте проверку наличия автокорреляции остатков по критерию Дарби - на -
Уотсона.
.
Частные коэффициенты эластичности и их интерпретация.
.
Стандартную ошибку прогноза и интервал прогноза с уровнем значимости α = 0,05, если значения независимых переменных x1 = 50 и x2
= 5200 .
.
Можно ли делать выводы по полученной вами модели и обоснован ли прогноз.
Исходные
данные представлены в таблице 16.
Таблица
16 - Исходные данные
№ предприятия
|
Валовая продукция (ВП), млрд. руб., y
|
Среднегодовая стоимость основных производственных фондов
(ОПФ), млрд. руб., x1
|
Среднегодовая численность ППП. (СЧППП), x2
|
21
|
10,734
|
8,132
|
1512
|
22
|
9,954
|
6,726
|
1143
|
23
|
4,074
|
5,992
|
646
|
24
|
24,688
|
10,734
|
2463
|
25
|
70,226
|
51,260
|
4973
|
26
|
8,125
|
5,381
|
1147
|
27
|
11,559
|
8,083
|
1945
|
28
|
10,814
|
5,942
|
1896
|
29
|
9,684
|
3,696
|
918
|
30
|
16,000
|
9,143
|
1748
|
31
|
2,643
|
1,716
|
626
|
32
|
6,140
|
2,729
|
881
|
33
|
19,723
|
18,433
|
1766
|
34
|
8,412
|
5,842
|
1034
|
35
|
8,316
|
5,940
|
890
|
36
|
6,502
|
4,963
|
840
|
37
|
43,822
|
39,127
|
3262
|
38
|
30,000
|
25,862
|
3116
|
39
|
6,658
|
7,566
|
4646
|
40
|
8,096
|
12,368
|
1383
|
Решение:
Парный коэффициент корреляции, характеризующий линейную взаимосвязь между
исследуемыми показателями, например между зависимой переменной y и независимой
переменной x1, можно определить используя следующие формулы:
(38)
где:
(39)
(40)
Рассчитаем
:
Рассчитаем
:
Строим
вспомогательную таблицу:
Таблица
17 - Вспомогательная таблица
№ предприятия
|
Валовая продукция (ВП), млрд. руб., y
|
Среднегодовая стоимость основных производственных фондов
(ОПФ), млрд. руб., x1
|
|
|
|
|
А
|
Б
|
В
|
Г
|
Д
|
Е
|
Ж
|
21
|
10,734
|
8,132
|
-5,07
|
25,66
|
-3,85
|
14,81
|
22
|
9,954
|
6,726
|
-5,85
|
34,18
|
-5,25
|
27,60
|
23
|
4,074
|
5,992
|
-11,73
|
137,50
|
-5,99
|
35,86
|
24
|
24,688
|
10,734
|
8,89
|
79,00
|
-1,25
|
1,55
|
25
|
70,226
|
51,260
|
54,43
|
2962,19
|
39,28
|
1542,92
|
26
|
8,125
|
5,381
|
-7,68
|
58,91
|
-6,60
|
43,55
|
27
|
11,559
|
8,083
|
-4,24
|
17,99
|
-3,90
|
15,19
|
28
|
10,814
|
5,942
|
-4,99
|
24,86
|
-6,04
|
36,46
|
29
|
9,684
|
3,696
|
-6,12
|
37,41
|
-8,28
|
68,62
|
А
|
Б
|
В
|
Г
|
Д
|
Е
|
Ж
|
30
|
16,000
|
9,143
|
0,20
|
0,04
|
-2,84
|
8,05
|
31
|
2,643
|
1,716
|
-13,16
|
173,11
|
-10,26
|
105,35
|
32
|
6,140
|
2,729
|
-9,66
|
93,32
|
-9,25
|
85,58
|
33
|
19,723
|
3,92
|
15,39
|
6,45
|
41,64
|
34
|
8,412
|
5,842
|
-7,39
|
54,58
|
-6,14
|
37,68
|
35
|
8,316
|
5,940
|
-7,48
|
56,01
|
-6,04
|
36,48
|
36
|
6,502
|
4,963
|
-9,30
|
86,45
|
-7,02
|
49,24
|
37
|
43,822
|
39,127
|
28,02
|
785,23
|
27,15
|
736,96
|
38
|
30,000
|
25,862
|
14,20
|
201,64
|
13,88
|
192,71
|
39
|
6,658
|
7,566
|
-9,14
|
83,58
|
-4,41
|
19,48
|
40
|
8,096
|
12,368
|
-7,70
|
59,35
|
0,39
|
0,15
|
Итого
|
316,17
|
239,635
|
0,17
|
4986,38
|
0,035
|
3099,87
|
Таким образом:
Тогда,
парный коэффициент корреляции, характеризующий линейную взаимосвязь между
зависимой переменной y и независимой переменной x1 составит:
Достоверность
значения парного коэффициента корреляции проверяется сравнением расчетного
значения критерия Стьюдента (tрас) с критическим (tкр), определяемым по таблице
Стьюдента с выбранным уровнем значимости α и степенью свободы ν = n - 2:
(41)
где Sr - ошибка коэффициента корреляции:
(42)
Итак, ошибка коэффициента корреляции составит:
Тогда,
расчетное значение критерия Стьюдента
составит:
Критическое
значение Стьюдента, с уровнем значимости α = 0,05 и степенью свободы равной 18, составляет 1,73.
Таким
образом, следовательно, парный коэффициент корреляции не
значим.
Аналогично
рассчитаем парный коэффициент корреляции, характеризующий линейную взаимосвязь
между зависимой переменной y и независимой переменной x2.
Рассчитаем
:
Строим
вспомогательную таблицу:
Таблица
18 - Вспомогательная таблица
№ предприятия
|
Валовая продукция (ВП), млрд. руб., y
|
Среднегодовая численность ППП. (СЧППП), x2
|
|
|
|
|
А
|
Б
|
В
|
Г
|
Д
|
Е
|
Ж
|
21
|
10,734
|
1512
|
-5,07
|
25,66
|
-329,75
|
108735,06
|
22
|
9,954
|
1143
|
-5,85
|
34,18
|
-698,75
|
488251,56
|
23
|
4,074
|
646
|
-11,73
|
137,50
|
-1195,8
|
1429818,06
|
24
|
24,688
|
2463
|
8,89
|
79,00
|
621,25
|
385951,56
|
25
|
70,226
|
4973
|
54,43
|
2962,19
|
3131,25
|
9804726,56
|
26
|
8,125
|
1147
|
-7,68
|
58,91
|
-694,75
|
482677,56
|
27
|
11,559
|
1945
|
-4,24
|
17,99
|
103,25
|
10660,56
|
28
|
10,814
|
1896
|
-4,99
|
24,86
|
54,25
|
2943,06
|
29
|
9,684
|
918
|
-6,12
|
37,41
|
-923,75
|
853314,06
|
30
|
16,000
|
1748
|
0,20
|
0,04
|
-93,75
|
8789,06
|
А
|
Б
|
В
|
Г
|
Д
|
Е
|
Ж
|
31
|
2,643
|
626
|
-13,16
|
173,11
|
-1215,8
|
1478048,06
|
32
|
6,140
|
881
|
-9,66
|
93,32
|
-960,75
|
923040,56
|
33
|
19,723
|
1766
|
3,92
|
15,39
|
-75,75
|
5738,06
|
34
|
8,412
|
1034
|
-7,39
|
54,58
|
-807,75
|
652460,06
|
35
|
8,316
|
890
|
-7,48
|
56,01
|
-951,75
|
905828,06
|
36
|
6,502
|
840
|
-9,30
|
86,45
|
-1001,8
|
1003503,06
|
37
|
43,822
|
3262
|
28,02
|
785,23
|
1420,25
|
2017110,06
|
38
|
30,000
|
3116
|
14,20
|
201,64
|
1274,25
|
1623713,06
|
39
|
6,658
|
4646
|
-9,14
|
83,58
|
2804,25
|
7863818,06
|
40
|
8,096
|
1383
|
-7,70
|
59,35
|
-458,75
|
210451,56
|
Итого
|
316,17
|
36835
|
0,17
|
4986,38
|
0
|
30259577,75
|
Таким образом:
Тогда,
парный коэффициент корреляции, характеризующий линейную взаимосвязь между
зависимой переменной y и независимой переменной x2 составит:
Достоверность
значения парного коэффициента корреляции проверяется сравнением расчетного
значения критерия Стьюдента (tрас) с критическим (tкр), определяемым по таблице
Стьюдента с выбранным уровнем значимости α и степенью свободы ν = n - 2:
где Sr - ошибка коэффициента корреляции:
Итак, ошибка коэффициента корреляции составит:
Тогда,
расчетное значение критерия Стьюдента
составит:
Критическое
значение Стьюдента, с уровнем значимости α = 0,05 и степенью свободы равной 18, составляет 1,73.
Таким
образом, следовательно, парный коэффициент корреляции не
значим.
Для
определения коэффициентов линейной регрессионной модели воспользуемся МНК в
матричной форме:
(43)
где:
где
XT - транспонированная матрица X независимых переменных;- матрица исходных
данных независимых переменных;
(XTX)−1
- матрица обратная к XTX;- вектор исходных данных зависимой переменной;- вектор
оценок коэффициентов регрессии.
Список
использованных источников
1. Едронова
В.Н., Малафеева М.В. Общая теория статистики: Учебник для вузов Изд. 2-е,
перераб., доп. Издательство: Магистр, 2007.
2. Ефимова
М.Р., Аброскин А.С., Бычкова С.Г.: Социально-экономическая статистика.
Издательство: Высшее образование, 2011.
. Социально-экономическая
статистика. Учебник. Под редакцией профессора Б. И. Башкатова. Издательство:
Юнити-Дана, 2002.