Общая теория статистики
Общая теория статистики
Лекция 1.
Предмет, метод и история возникновения статистики
Статистика включает в себя четыре раздела:
. Общая теория статистики;
. Социально-экономическая статистика (СЭС);
. Статистика финансов;
. Система национальных счетов (СНС).
Термин “статистика” возник во 2-ой половине 18 века в связи с познанием
государств, описанием их особенностей, достопримечательностей. К этому же
времени относится начало преподавания предмета статистики в университетах
Германии.
История развития человечества показала, что без статистических данных
невозможно управление государством, развитие отдельных отраслей и секторов
экономики.
Необходимость сбора и обобщения множества данных о населении страны,
предприятиях, банках и прочих учреждениях приводит к образованию специальных
статистических служб - учреждений государственной статистики.
Слово “статистика” используется в нескольких значениях:
. прежде всего, как синоним слова “данные”. Именно в этом смысле можно
сказать статистика смертности, рождаемости;
. статистикой называется отрасль знаний, объединяющая принципы и методы
работы с числовыми данными, характеризующими массовые явления;
. статистикой называется также отрасль практической деятельности,
направленной на сбор, обработку, анализ числовых данных.
Слово “статистика” произошло от латинского слова “status” − состояние, положение вещей.
В научный обиход слово “статистика” вошло в 18 веке и первоначально
употреблялось в значении государствоведение.
В настоящее время статистика может быть определена как собирание,
представление, анализ и интерпретация числовых данных.
Греческий философ Аристотель (384-322 до н.э.) одним из первых составил
описание 157 городов и государств своего времени.
С середины 19 века благодаря усилиям великого бельгийца −
математика, астронома, статиста Адольфа Кетле были выработаны правила переписи
населения.
В 1885 г. был основан Международный Статистический Институт, действующий
сегодня.
Статистика как наука исследует не отдельные факты, а массовые
социально-экономические явления и процессы.
Предметом статистического изучения выступают совокупности множества
однокачественных варьирующих явлений. В это определение входят три основные
черты совокупности любых явлений:
− во-первых, это множество явлений;
− во-вторых, это множество явлений, объединённых общим качеством;
− в-третьих, это множество варьирующих явлений, отличающихся по
своим характеристикам.
Можно дать более простое определение предмета статистики - это
количественная сторона массовых общественных явлений и процессов.
Объект статистики называют статистической совокупностью.
Статистическая совокупность - множество единиц, обладающих массовостью,
однородностью, определённой целостностью, взаимозависимостью состояний
отдельных единиц и наличием вариаций. Каждый отдельно взятый элемент этого
множества называется единицей статистической совокупности, которая
характеризуется свойствами, именуемыми в статистике признаками. Но существует и
вариация признаков, т.е. единицы совокупности обладают индивидуальными особенностями
и различиями, отличающих их друг от друга. Именно наличие вариации
предопределяет необходимость статистики.
Итак, статистика как наука изучает, прежде всего, количественную сторону
общественных явлений и процессов в конкретных условиях места и времени, т.е.
предметом статистики выступают размеры и количественные соотношения
социально-экономических явлений, закономерности их связи и развития.
Количественную характеристику статистика выражает через числа, которые
называются статистическими показателями. Статистический показатель отражает
результат измерения у единицы совокупности и совокупности в целом.
Различают следующие показатели как измерители:
− натуральные;
− условно натуральные;
− стоимостные (денежные);
− трудовые.
Важной категорией статистики является статистическая закономерность -
форма проявления причинной связи, выражающаяся в последовательности,
регулярности, повторяемости событий с достаточно высокой степенью вероятности.
Приёмы и способы, с помощью которых статистика изучает свой предмет,
образуют статистическую методологию, под которой понимается система приёмов,
способов и методов, направленных на изучение количественных закономерностей,
проявляющихся в структуре, динамике и взаимосвязях социально-экономических
явлений.
Важно уяснить, что статистическое исследование состоит из следующих
стадий:
. статистическое наблюдение;
. сводка и группировка результатов наблюдения;
. анализ полученных обобщённых показателей.
Методы, используемые в статистике
− массовые статистические наблюдения;
− статистические показатели (система статистических показателей);
− сводка и группировка;
− статистические таблицы;
− графики статистики;
− абсолютные и относительные величины;
− средние величины;
− вариация;
− индексы;
− корреляционно-регрессионный анализ;
− ряды динамики;
− выборочное наблюдение.
Таблица №1: “Основная классификация признаков статистики”
по характеру их
выражения
|
по способу
измерения
|
по отношению к
характеризуемому объекту
|
по характеру
вариации
|
по отношению ко
времени
|
1.описательные
2.количественные
|
1.первичные
(учитываемые) 2.вторичные (расчётные)
|
1.прямые
(непосредственные) 2.косвенные
|
1.альтернативные
2.дискретные 3.непрерывные
|
1.моментные
2.интервальные
|
Лекция 2.
Статистическое наблюдение
Статистическое наблюдение - научно организованный массовый сбор данных о
явлениях и процессах общественной жизни, может проводиться любыми способами.
Схема №1: “Составляющие статистического наблюдения”
Таблица №2: ”Классификация статистического наблюдения”
формы
|
виды
|
способы
|
1.периодическая отчётность
2.специально Организованное наблюдение
|
1.по охвату: 1.1.сплошное
1.2.несплошное 1.2.1.выборочное 1.2.2.основного массива 1.2.3.монографическое
2.по времени: 2.1.текущее (непрерывное) 2.2.периодическое 2.3.единовременное
|
1.непосредственный
2.документальный 3.опрос 3.1.анкеиный 3.2.экспедиционный 3.3.саморегистрации
3.4.корреспондентский 4.эксперимент
|
1) Периодическая отчётность - специально разработанные и утверждённые
Министерством труда… формы, которые подлежат заполнению и представлению в
органы государственной статистики всеми без исключения предприятиями,
организациями, учреждениями. Сроки представления статистической отчётности не
позднее 15-го числа каждого месяца, следующего за отчётным периодом (месяцем).
Исключение составляют малые предприятия, которые сдают отчётность
ежеквартально. Количество и содержание статистических форм зависит от вида
деятельности предприятия, организации, учреждения.
) В специально организованном наблюдении различают:
− программно-методологическую часть: цель, объект, программа
наблюдения;
Программа - перечень вопросов, на которые необходимо получить ответы.
− организационную часть: выбор формы, вид, способа, времени
проведения наблюдения, подбор персонала, его обучение.
Различают:
− объективное время - это период, за который проводится наблюдение;
− субъективное время - это период, в течение которого проводится
наблюдение;
− если процесс быстрый, то объективное время конкретизируется в
критический момент времени (конкретное время - 0ч.00мин).
Таблица №3: “Ошибки статистического наблюдения”
ошибки
регистрации
|
ошибки
репрезентативности
|
случайные
|
систематические
|
средние
|
предельные
|
|
преднамеренные
|
непреднамеренные
|
при повторном и
бесповторном отборе
|
|
|
|
|
|
) Ошибки регистрации присущи сплошному наблюдению. Они подразделяются на:
. Случайные;
2. Систематические.
Случайными могут быть ошибки: описка, арифметическая ошибка.
Систематические ошибки подразделяются на:
преднамеренные (умышленные);
непреднамеренные (на основании неточных сведений, приблизительных
расчётов, т.е. допущенных несознательно).
) Ошибки репрезентативности присущи только выборочному наблюдению. Они
возникают, когда в выборку не попадают те единицы совокупности, которые могут
значительно повлиять на результат наблюдения.
Лекция 3.
Статистические показателя
Схема №2: “Атрибуты статистического показателя”
качественная сторона:
объект и его свойства
|
количественная сторона:
число и единицы измерения
|
территориальные, отраслевые
и иные границы объекта
|
Интервал или момент времени
|
Таблица №4: “Классификация видов статистических показателей”
по качественной
стороне показателя
|
по
количественной стороне показателя
|
по отношению к
характеризуемому свойству
|
1.показатели свойств
конкретных объектов 2.показатели статистических свойств любых массовых
явлений и процессов
|
1.абсолютные
2.относительные
|
1.прямые
2.косвенные
|
Абсолютные показатели характеризуют те явления, процессы и объекты, за
которыми мы наблюдаем, можем их увидеть и подсчитать.
Относительные показатели мы можем получить в виде характеристики
наблюдаемого нами объекта расчётным путём из абсолютных показателей.
Схема №3: “Система статистических показателей промышленности”
|
В
|
Т
|
Ф
|
Р
|
М
|
В
|
В
|
|
|
|
|
Т
|
Т
|
|
|
|
|
Ф
|
Ф
|
|
|
|
|
Р
|
Р
|
|
|
|
|
М
|
|
|
|
|
М
|
абсолютные показатели:
В - выпуск продукции
Т - численность рабочих
Ф - основные производственные фонды (ОПФ)
Р - фонд оплаты труда
М - материальные затраты
относительные показатели:
- производительность труда - зарплатаотдача
-
фондоотдача - материалоотдача
-
трудоёмкость - число рабочих, приходящихся на 1 единицу ОПФ
-
фондоёмкость- фондовооружённость
- зарплатаёмкость - средняя зарплата
-
материалоёмкость
-
материальные затраты, приходящиеся на 1-ого работника
-
стоимость материальных затрат, приходящихся на 1 единицу ОПФ
М+Р=С
- себестоимость - затраты на 1 руб. выпускаемой продукции
В-С=П - прибыль -
прибыль, приходящаяся на 1-ого работника
Лекция 4.
Сводка и группировка
Простейшей группировкой являются ряды распределения.
Схема №4: “Ряды распределения”
Величина х называется вариантой. Количество раз, которое
повторяется каждая варианта, называется её частотой.
Интервалы и интервальные ряды бывают открытыми (до 100, …, свыше 180) и
закрытыми (80-100,…, 180-200), возрастающими и убывающими, равными и неравными.
Чтобы работать с открытым интервальным рядом, его необходимо условно закрыть,
используя интервальный шаг в равных интервальных рядах. В неравных интервальных
рядах - последующий шаг для нижней границы и предыдущий шаг для верхней
границы.
Величина
равного интервала определяется по формуле:
Число
групп при группировке можно определить не только по существенным обоснованным
признакам, но и математическим путём с использованием формулы Стерджесса: n=1+3,322
lgN, где n-количество
групп, N-число единиц совокупности.
По
виду группового признака различают следующие группировки:
.
Типологическая: распределение единиц разнородной совокупности на качественно
однородные группы, в основе которых лежит атрибут, или качественный признак
(распределение общества по классам);
.
Структурная: расчленение однородной совокупности по количественному признаку
(распределение рабочих по квалификации, студентов по курсам);
.
Аналитическая: распределение единиц однородной совокупности на группы и подгруппы
по двум или нескольким взаимосвязанным признакам. При этом независимый признак
называется факторным (х), а зависимый - результативным (y).
В статистике она имеют наибольшее значение (зависимость между продажами путёвок
работниками и их стажем работы).
Пример:
стаж работы в годах (х)
|
объём продаж путёвок
работниками (y)
|
до 5 5-10 10-15
свыше 15
|
380000 410000
450000 430000
|
Статистические таблицы
Одной из разновидностей сводки и группировки являются статистические
таблицы. Каждая таблица должна иметь заголовок, т.е.свое название (если таблица
простая, можно над таблицей в правом верхнем углу написать единицы измерения).
В каждой таблице различают подлежащее (то, что изучается) и сказуемое
(показатели, характеризующие подлежащее). Подлежащее расположено в таблице в
виде строк, в ее левой части. Оно является предметом изучения каких-либо
показателей, наблюдений (оценочная ведомость). Сказуемое расположено в виде
столбцов таблицы, в ее верхней части, которые характеризуют наше наблюдение за
показателями, т.е. подлежащим.
Заголовок ед.измерения
|
сказуемое
|
итого
|
подлежащее
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
итого
|
|
|
|
|
|
|
Каждая таблица (особенно расчётная) может иметь итоговые строку и
столбец, которые могут выполнять функцию контроля.
Тблица № 5: “Классификация таблиц”
по подлежащему
|
по сказуемому
|
1.простые 1.1.перечневые
1.2.территориальные 1.3.хронологические 2.групповые 3.комбинированные (сложные)
|
1.простые
2.комбинированные (сложные)
|
(Правило построения таблиц).
Лекция 5.
Абсолютные и относительные величины
В результате исследования статистической совокупности получают
показатели, которые могут быть абсолютными или относительными.
Абсолютные величины - показатели, которые выражают разряды, уровни,
объёмы и т.д. изучаемых явлений и процессов. Они всегда выражаются именованными
числами (кг, м, шт, л). В этом их коренное отличие от относительных величин. Их
единицы измерения называют натуральными.
Относительные величины - показатели, характеризующие количественные
соотношения двух сопоставленных абсолютных и относительных величин.
Относительные величины могут выражаться в коэффициентах (если за базу
принимается единица), в процентах (если за базу принимается 100%), в промилле
(если за базу принимается1000‰), а также через относительные натуральные сложные
показатели (км/ч, руб/чел, чел/дней).
Правило действия с относительными величинами
№ фирмы
|
А.фактическое оказание
услуг за 2004 г.
|
2005 г.
|
относительные
величины
|
|
|
плановое
значение
|
фактическое
значение
|
плановой
динамики
|
выполнения плана
|
Динамики
|
|
а
|
b
|
c
|
d/a
|
c/b
|
c/a
|
1 2 3 4
|
10 20 30 21,05
|
11 18 31,5 20
|
12 21 32,4 22
|
110% 90% 105%
95%
|
109% 117% 103%
110%
|
120% 105% 108%
104,5%
|
Все действия с относительными числами необходимо проводить, выразив их в
виде коэффициентов, а не процентов. В расчётах пользоваться не темпами
прироста, а темпами роста.
Виды относительных величин
Относительное изменение во времени называется динамикой.
. Относительная величина плановой динамики (планового задания) -
отношение планового уровня текущего года к фактическому значению в предыдущем
периоде.
. Относительная величина выполнения плана - отношение фактического
значения к плановому за один и тот же период.
. Относительная величина динамики - отношение двух фактических значений
текущего года к базисному.
Пример: Найти недостающие абсолютные и относительные величины
Вспомогательные формулы: b=a*b/a; c=a*c/a; c=b*c/b; a=b:b/a; c/a=c/b*b/a; b/a=c/a*c/b
4. Относительная величина структуры - отношение каждого элемента ряда к
итогу.
Пример:
№
|
выпуск продукции
|
относительная
величина структуры
|
1 2 3 4 итог:
|
20 30 120 30 200
|
20:200=10%
30:200=15% 120:200=60% 30:200=15% 100%
|
. Относительная величина координации - отношение каждого элемента ряда к
элементу, принятому за базу сравнения.
Пример:
№
|
выпуск продукции
|
относительная
величина координации
|
1 2 3 4
|
20 30 120 70
|
20:120=16,7%
30:120=25% 120:120=100% 70:120=58,3%
|
. Относительная величина сравнения - сопоставление двух объектов за один
и тот же период.
. Относительная величина интенсивности - в отличие от всех прочих имеет
единицу измерения и представляет собой отношение двух разноимённых показателей.
Лекция 6.
Средние величины
Среди показателей, характеризующих статистические совокупности, важное
место занимают средние величины.
Средняя величина - показатель, который даёт обобщённую (усреднённую)
характеристику единиц изучаемой совокупности. В средней величине отражается то
общее, что имеется в каждой единице совокупности.
Сущность статистической обработки методом средней величины заключается в
замене индивидуальных значений признака их средним показателем. При этом общий
объём совокупности остаётся неизменным.
Пример: есть данные о выработке 5 рабочих: 135, 141, 153,
159, 162. Определить среднюю выработку. .
Средние величины, которые необходимо знать наизусть:
-
средняя арифметическая;
средняя
гармоническая;
средняя
хронологическая;
средняя
квадратическая, кубическая;
средняя
геометрическая;
структурные
средние: мода, медиана.
.
Средняя арифметическая: чаще всего в статистике и социально-экономических
исследованиях применяется арифметическая величина.
Средняя
арифметическая простая рассматривается в случаях, когда значение признака
повторяется один или одинаковое число раз в ряде распределения:
, где n-количество
единиц совокупности.
Средняя
арифметическая взвешенная применяется в случаях, когда каждое значение признака
повторяется неодинаковое число раз, или частота ряда распределения превышает
единицу хотя бы для одного признака:
, где f-вес.(сколько
раз повторяется каждая еденица совокупности)
.
Средняя гармоническая: в ряде случаев бывают известны варианты (x)
и произведения варианты на частоту (x∙f),
в то время как сами частоты (f) неизвестны, тогда применяется средняя гармоническая,
которая бывает простой и взвешенной.
Произведение
x∙f выражается
через сложный экономический показатель M
(M= x∙f).
Для расчёта средней величины, когда x∙f
=M=1, применяется средняя гармоническая простая: .
Если
x∙f =M≠
1, то для расчёта применяется средняя
гармоническая взвешенная: .
Средняя
гармоническая - величина, обратная средней арифметической, из обратных значений
признака.
Свойства средних величин
1. Если от каждой варианты отнять или прибавить одно и то же число, то
средняя увеличится или уменьшится на то же число.
. Если каждую варианту увеличить или уменьшить в a раз, то средняя увеличится или
уменьшится в столько же раз.
. Если все частоты увеличить или уменьшить в a раз, то средняя не изменится.
. Если все частоты увеличить или уменьшить на a, то средняя изменится непредсказуемо.
. Средняя арифметическая суммы нескольких величин равна суме средних
арифметических этих величин.
. Алгебраическая сумма отклонений значений признака от средней
арифметической всегда равна нулю.
Пример: Найти среднюю урожайность в 2003 и 2004 гг.
№ колхоза
|
2003 г.
|
2004 г.
|
|
урожайность
(ц/га)
|
площадь (га)
|
урожайность
(ц/га)
|
Валовой сбор(ц)
|
1 2 3
|
40 50 60
|
1000 2000 3000
|
38 49 65
|
40000 100000
150000
|
Решение:
, где f-вес
(ц/га)
.
(ц/га)
.
Средняя хронологическая: применяется для расчёта средней величины, если
исходные данные представлены на определённые даты, моменты времени:
Пример: Найти среднюю стоимость ОПФ
дата
|
1.01
|
1.02
|
1.03
|
1.04
|
1.05
|
1.06
|
стоимость ОПФ
|
100
|
120
|
110
|
120
|
140
|
140
|
Решение:
, ,
,
, .
Приведем
все расчеты к одному знаменателю: Х=ýýý
.
Средняя квадратическая: применяется для измерения вариации признака в
совокупности:
,
.
Средняя кубическая: .
6.
Средняя геометрическая: применяется чаще всего для определения средних темпов
роста в единицу времени: , ,
Пример:
Рассчитайте среднегодовые темпы роста
показатели
|
год
|
|
1995
|
1996
|
1997
|
1998
|
1999
|
выпуск продукции
|
20
|
22
|
26
|
50,1
|
100,2
|
|
х1
|
х2
|
х3
|
х4
|
х5
|
коэффициент
роста выпуска продукции
|
−
|
1,1
|
1,2
|
1,9
|
2
|
|
|
k1
|
k2
|
k3
|
k4
|
Решение:
.
Средняя
геометрическая, чаще всего, применяется в экономических расчетах, но учитывает
только начало и конец ряда и недостаточно точно отражает динамику изменения,
т.е. она не учитывает сумму ряда.
.
Средняя кумулятивная:
.
Формула
кумулятивной средней более чётко отражает динамику изменений и помогает увидеть
сумму ранжированного ряда.
Все
рассмотренные средние величины (кроме средней хронологической) являются
степенными средними и выводятся из следующей формулы: , где получается при
k=-1 − средняя гармоническая;
k=0 − средняя геометрическая;
k=1 − средняя арифметическая;
k=2 − средняя квадратическая;
k=3 − средняя кубическая.
Все
эти показатели рассчитываются для варьирующего признака для простых средних.
Если все значения признака в ряде распределения одинаковы, то все значения
средних равны. Между указанными средними величинами имеет место зависимость
(для одного ряда распределения):
−
это неравенство называется правилом мажорантности средних величин.
.
Структурные средние:
)
Структурное среднее мода (Mо) -
наиболее часто встречающееся значение ряда, другими словами, мода - это
варианта, имеющая наибольшую частоту. В дискретных рядах мода определяется
визуально, в интервальных рядах визуально определяется модальный интервал, а
мода (точечная) определяется по формуле: , где
x0 −
нижняя граница модального интервала;
i
− шаг интервального
ряда;
fMо −
частота модального интервала;
fMо-1
− частота интервала,
предшествующего модальному;
fMо+1
− частота
интервала, следующего за модальным.
Пример: Найти Мо в дискретном и интервальном рядах.
.
2)
Структурное среднее медиана (Mе) -
значение, которое делит ранжированный ряд пополам.
В
нечётных, чётных и дискретных рядах медиана определяется визуально, но в
дискретных рядах она определяется с помощью накопленных частот. В интервальном
ряду медианный интервал находится визуально, с помощью накопленных частот, а
сама медиана (точечно) по формуле:
, где
x0 − нижняя
граница медианного интервала;
i
−шаг интервального ряда;
∑f − сумма
накопленных частот;
SMe-1 − сумма частот, накопленных до медианного
интервала;
fMe −
частота медианного интервала.
Пример:
Найти Ме в нечетных, четных, дискретных,
интервальных рядах.
интервальный ряд:
.
Если
х сред. равно Мо = Ме - это симметричное распределение, если х сред не равно
Мо, не равно Ме - распределение ассиметричное.
Лекция 7.
Вариация
Для каждой единицы изучаемой совокупности интересующий нас признак
принимает различные значения, т.е. варьирует.
Вариация - это колебания признака в ряде распределения.
Показатели вариации
1.
Размах вариации (R) - разность между максимальным и минимальным
значениями совокупности: .
2.
Среднее линейное отклонение (d) - средняя арифметическая абсолютная величина
отклонений значений признака от его средней величины: ; .
.
Дисперсия () - среднее арифметическое квадратов отклонений
значений признака от его средней величины..
Дисперсия
− единственный из показателей вариации, не имеющий единицы измерения:
; ;
; ; , где
; − начальный момент первого порядка,
; − начальный момент второго порядка.
i - величина
интервала;
A
- варианта с наибольшей частотой.
.
Среднее квадратическое отклонение () -
арифметическое значение корня квадратного из дисперсии: ; .
Отметим,
что отношение (для прогноза).
.
Коэффициент вариации (V) - отношение среднего квадратического отклонения к
средней арифметической, выраженное в процентах: .
Этот
коэффициент показывает долю колебания признака от средней арифметической.
Применяется для сравнения вариаций признака в различных совокупностях и для характеристики
колебаний различных признаков в одной совокупности. Также он характеризует
степень однородности совокупности и качества средних величин.
Если
V от 0% до 20%, то совокупность однородная, и среднюю
можно использовать смело.
Если
V от
20% до 50%, то совокупность средней однородности, и среднюю необходимо
использовать осторожно.
Если
V более 50%, то совокупность неоднородная, и средней
пользоваться нельзя для прогнозирования перспективных показателей признака.
Целесообразно
расчёт каждой средней величины дополнять расчётом коэффициента вариации для
характеристики степени однородности совокупности и оценки качества средней
величины.
Свойства дисперсии
1.
Если каждую варианту увеличить или уменьшить в k раз, то
дисперсия увеличится или уменьшится в k2 раз.
.
Если каждую варианту увеличить или уменьшить на одну и ту же величину, то
дисперсия не изменится.
.
Если все частоты увеличить или уменьшить в несколько раз, то дисперсия не
изменится.
.
Дисперсия равна средней арифметической квадратов вариант без квадрата средней
арифметической.
Дисперсия альтернативного признака
Если
в совокупности исследуется доля единиц, обладающих тем или иным альтернативным
признаком, то дисперсия этой доли определяется по формуле: , где .
p - доля
единиц совокупности, обладающих данным признаком, ;
m - число
единиц совокупности, обладающих данным признаком;
n
- число наблюдений.
Пример: выпущена продукция, в объёме которой доля пригодных
изделий составляет 0,8, оставшиеся - бракованные изделия. Определить дисперсию
альтернативного признака.
= 0,8 ∙
0,2 = 0,16.
Межгрупповая и внутригрупповая дисперсии
На
вариацию признака влияют различные факторы: систематические и случайные. В
статистике определяется количественное воздействие случайных факторов при
помощи различных видов дисперсий.
Предположим,
совокупность S разбита на непересекающиеся группы по возрастанию
признака (S1 ,S2 ,…,Sn).
Дисперсия
всей совокупности называется общей дисперсией. Она характеризует влияние
колебания признака от воздействия всех факторов: случайных и систематических.
Дисперсия
каждой группы, на которые разбита совокупность, называется внутригрупповой и
рассчитывается по формуле дисперсии:
,
где
− дисперсия i-ой группы;
−
значение ряда.
Среднее
арифметическое из внутригрупповых дисперсий рассчитывается по формуле: и называется средней внутригрупповой дисперсией. Она
характеризует влияние случайных факторов на величину общей вариации, т.е. всех
факторов, за исключением того, который положен в основу группировки.
Межгрупповой
дисперсией называется среднее арифметическое квадратов отклонений
внутригрупповых средних от общей средней., рассчитывается по формуле. . Она характеризует влияние систематических факторов,
положенных в основу группировки, на величину общей вариации.
Правило сложения дисперсий
Если
совокупность разбита на непересекающиеся группы S1 ,S2 ,…,Sn, то общая дисперсия равна сумме межгрупповой
дисперсии и средней внутригрупповой дисперсии: (четвёртый
способ нахождения дисперсии)
Отношение
межгрупповой дисперсии к общей, выраженное в процентах, называется
коэффициентом детерминации: .
Корень
квадратный из него характеризует долю общей вариации, обусловленную влиянием
признака, положенного в основу группировки, в общей совокупности всех факторов
и называется эмпирическим корреляционным отношением: . (этта)
Пример: имеются данные о производительности труда 10
работников в зависимости от стажа работы. Определить зависимость выработки
работника от стажа работы:
этапы работы
|
количество
деталей в смену
|
количество работников
|
менее 5 лет
|
11, 8, 9, 12,
11, 9
|
6
|
5 лет и выше
|
9, 12, 10, 13
|
4
|
(ед.), (ед.),
(деталей);
;
,
,
, ;
, .
Таким
образом, производительность труда рабочих зависит от стажа работы на 31%, а от
всех остальных, случайных, факторов - на 69%.
Лекция 8.
Индексы
Индексом называется относительная величина, которая характеризует
изменение явления во времени или пространстве, а также степень выполнения
плана.
Индексы получают в результате сравнения двух величин. При этом если
сравнивается какая-то часть явления, то получаем индивидуальный индекс (i), если явление в целом, и при этом
сопоставляются сложные показатели, то получаем общий (агрегатный) индекс (I):
; .
Агрегатные и средневзвешенные индексы
Для
построения общих индексов несопоставимые показатели необходимо сделать
сопоставимыми. Это достигается путём приведения к стоимости, затратам и
некоторым другим сопоставимым показателям.
Между
индексами всегда имеет место та же зависимость, что и между показателями,
которые они выражают: pq = p ∙ q,
следовательно, Ipq = Ip ∙ Iq.
Разница
между числителем и знаменателем индекса - есть абсолютное изменение явления в
целом или его части, которую этот индекс выражает:
Взаимосвязь
: pq = p +q =pqp + pqq.
Правило построения индекса
По
методике, принятой в отечественной статистике, при индексировании качественных
показателей (цены, себестоимости, производительности труда) количественные
берутся в отчётном периоде в числителе и знаменателе индекса, а при
индексировании количественных показателей (объёма, трудозатрат) качественные
берутся в базисном периоде: ; , .
Такие
общие индексы, как правило, называются индексами Пааше. В зарубежной статистике
используются индексы Ласпейреса, где показатели фиксируются наоборот.
Если
нам известны некоторые данные о стоимости товара отчётного и базисного
периодов, об изменении цен этих товаров в отчётном году по сравнению с
базисным, изменение объёма в отчётном периоде по сравнению с базисным:
Пример.
Даны следующие данные ; ; . Найти: ,
Решение:
, ; , ;
; .
Агрегатный
индекс переходит в форму средневзвешенного, если в нем используется
индивидуальный индекс.
Средневзвешенный
индекс, в котором индивидуальный индекс используется как делитель, носит
название средневзвешенного гармонического.
Средневзвешенный
индекс, в котором индивидуальный индекс используется в качестве сомножителя,
называется средневзвешенным арифметическим.
Цепные и базисные индексы
Цепные
индексы - отношение любого явления текущего периода к предыдущему: .(; ; )
Базисные
индексы - отношение любого явления текущего периода к базисному:
. (; ; )
Индексы постоянного, переменного состава и структурных
сдвигов
Индексом постоянного состава называется индекс, рассчитанный с весами,
зафиксированными на уровне одного какого-либо периода, и показывающий изменение
только индексируемой величины, причём среднее изменение (изменение всреднем)
индексируемой величины (т.е. рассматриваемой части явления):
−
общий индекс (цены), индекс постоянного состава или агрегатный индекс (цены),
индекс (общий) цены.
Индексом
переменного состава называется индекс, характеризующий соотношение средних
уровней изучаемого явления в разные периоды времени и показывающий изменение
среднего уровня явления (изменений средней цены):
−
средней цены; − среднего объёма.
Индекс
структурных сдвигов - индекс, характеризующий влияние изменения структуры
изучаемого явления на динамику среднего уровня этого явления: .
Между
данными индексами существует взаимосвязь: ;
Замечание.
Эти
индексы рассчитываются только для одноимённых показателей, если они даны для
двух и более объектов за два периода времени, или они могут рассчитываться для
нескольких видов товаров на одном предприятии.
Индексы динамики и выполнения плана
−
индекс динамики; − индекс выполнения плана.
Классификация индексов по названию
; − индексы товарооборота;
; − индексы затрат на производство;
; − индексы себестоимости;
; − индексы трудоёмкости;
; − индексы физического объёма;
; − индексы цены;
; − индексы производительности труда в трудовой
форме;
; − в стоимостной форме, где
i -
индивидуальный индекс;
I - общий
индекс;
p - цена;
q -
физический объём;
t
- трудоёмкость;
T -
суммарные затраты времени;
w -
производительность труда;
z -
себестоимость единицы продукции;
zq - затраты
на производство;
pq - объём
произведённой продукции, товарооборот;
q0 - физический объём в базисном периоде;
q1 - физический объём в отчётном периоде.
Индексы сложных экономических явлений
Система
взаимосвязанных индексов даёт возможность провести факторный анализ, т.е.
определить влияние ряда факторов на изменение результативного показателя (в
абсолютном или относительном выражении).
Обозначим
через Y объём продукции, произведённой предприятием за год;
через
a - среднесписочную численность работников;
через
b - среднее число дней, отработанных одним работником
за год;
через
c - среднюю продолжительность рабочего дня в часах;
через
d - среднечасовую выработку одного работника в рублях.
По
имеющимся данным составим модель сложного экономического явления, результат
которого зависит от нескольких факторов: Y = a ∙ b ∙ c ∙ d.
- этот
индекс показывает изменение результативного показателя за счет всех факторов в
относительном выражении.
-
разница между числителем и знаменателем данного индекса показывает изменение
результативного показателя в абсолютном выражении (за счет всех факторов).
Метод
цепных подстановок показывает как происходит изменение за счет всех факторов и
за счет каждого отдельного фактора.
Относительные изменения:
Абсолютные изменения:
Этот метод применяется в экономическом анализе.
Лекция 9.
Ряды динамики
Динамика - изменение явления во времени.
Для
выражения абсолютной скорости роста (снижения) уровня ряда динамики
рассчитывают статистический показатель - абсолютный прирост (). Его величина определяется как разность двух
сравниваемых уровней. Она вычисляется по формулам:
1.
; 2. , где
yi
- уровень i-ого года, y0 - уровень
базисного года.
Интенсивность изменения уровней ряда динамики оценивается отношением
текущего уровня к предыдущему или базисному, которое всегда представляет собой
положительное число. Этот показатель принято называть темпом роста (Тр).
Он выражается в процентах и рассчитывается по формулам:
3.
; 4. .
Для выражения изменения величины абсолютного прироста уровня ряда
динамики в относительных величинах определяется темп прироста (Тпр),
который рассчитывается как отношение абсолютного прироста к предыдущему или
базисному и определяется по формулам:
5.
; 6. .
Темп
прироста может быть вычислен также путём вычитания из темпов роста 100%:
Тпр
= Тр -100%.
Показатель
абсолютного значения одного процента прироста (I%I)
определяется как результат деления абсолютного прироста на соответствующий темп
прироста, выраженный в процентах:
.
или .
Расчёт
этого показателя имеет экономический смысл только на цепной основе.
Расчёт
среднего уровня динамики (с равноотстоящими уровнями во времени) производится
по формуле средней арифметической простой:
.
.
Средний
абсолютный прирост определяется по цепным абсолютным приростам по формуле:
.
или .
Среднегодовой
темп роста вычисляется по формуле средней геометрической:
.
или , где m=n-1 - число коэффициентов роста.
Среднегодовой
темп прироста получаем при вычитании из среднего темпа роста 100%:
.
.
Пример:
показатели
|
1992
|
1993
|
1994
|
1995
|
1996
|
производство
станков, тыс. шт.
|
200
|
205
|
208
|
215
|
220
|
1. абсолютный прирост,
цепной, тыс. шт.
|
-
|
5
|
3
|
7
|
5
|
2. абсолютный прирост,
базисный, тыс. шт.
|
-
|
5
|
8
|
15
|
20
|
3. темпы роста,
цепные, %
|
-
|
102,5%
|
101,4%
|
103,3%
|
102,3%
|
4. темпы роста,
базисные, %
|
-
|
102,5%
|
104%
|
107,5%
|
110%
|
5. темпы
прироста, цепные, %
|
-
|
2,5%
|
1,4%
|
3,3%
|
2,3%
|
6. темпы
прироста, базисные, %
|
-
|
2,5%
|
4%
|
7,5%
|
10%
|
7. абсолют.
содержание 1% прироста, шт.
|
-
|
2000
|
2140
|
2120
|
2170
|
8. средний уровень ряда,
тыс. шт.
|
(200+205+208+215+220)
= 209,6
|
9. средний абсолютный
прирост, тыс. шт.
|
(220-200):4 = 5;
(5+3+7+5):4 = 5
|
10.
среднегодовой темп роста, %
|
|
11.
среднегодовой темп прироста, %
|
102,4%-100% =
2,4%
|
Приёмы обработки и анализа рядов динамики
Схема №5: “Разновидности рядов динамики”
ряды динамики
↓
|
↓
|
↓
|
периодические:
|
моментные:
|
средних величин:
|
1. с равными интервалами (с
помощью среднеарифметичес- кой простой); 2. с неравными интервалами (с
помощью среднеарифметичес-кой взвешенной).
|
1. с равными интервалами (с
помощью среднехронологичес- кой простой); 2. с неравными интервалами (с
помощью среднехронологичес-кой взвешенной).
|
1. с равными интервалами (с
помощью средней геометричес- кой простой); 2. с неравными интервалами (с
помощью средней геометричес-кой взвешенной).
|
Схема №6: “Выявление основной тенденции ряда динамики”
приёмы и методы выявления
основной тенденции развития ряда динамики
|
метод укрупнения
интервалов
|
метод скользящей
средней
|
аналитическое
выравнивание
|
основан на укрупнении
периодов времени, к которым относятся уровни ряда
|
основан на замене
абсолютных данных средним арифметическим за определённые периоды
|
уровни ряда выражаются в
виде функции времени: = f(t)
|
Лекция 10. Корреляционно-регрессионный анализ
Зависимости бывают функциональными или корреляционными.
Переменные X и Y связаны корреляционной зависимостью,
если каждому значению одной из них соответствует ряд распределения другой. При
этом связь между факторными и результативными признаками проявляется через
изменение средних величин.
Пример: Аналитическая группировка.
группы заводов по стоимости
ОПФ
|
количество
заводов
|
фонды (млн.
руб.)
|
Товарная
продукция (млн. шт.)
|
|
|
всего (∑)
|
всего (∑)
|
|
|
0,8-3,8
|
4
|
8,7
|
2,2
|
12,9
|
3,2
|
3,8-6,8
|
13
|
62,4
|
4,8
|
94
|
7,2
|
6,8-9,8
|
9
|
70,5
|
7,8
|
101,7
|
11,3
|
9,8-12,8
|
4
|
48,1
|
12
|
76,4
|
19,1
|
итого:
|
30
|
189,7
|
-
|
285
|
-
|
Важной особенностью корреляционных связей является то, что они
обнаруживаются не в единичных случаях, а в массе, что требует для исследования
наличия значительного количества данных (не менее 15-20).
Задачи корреляционного анализа
1. Определение формы связи между факторными и результативными признаками
(выбор математического уравнения, например, y = a+bx);
2. Определение параметров математического уравнения (a, b, c,…- коэффициенты регрессии).
. Оценка тесноты связи между факторными и результативными признаками;
. Оценка качества полученного уравнения (модели).
Способы выбора формы связи между факторными и результативными
признаками
1. Путём теоретического анализа взаимосвязи между изучаемыми признаками.
. При помощи аналитической группировки.
. Графическое изображение показателей (графический анализ).
. Графическое изображение корреляционной таблицы.
Схема №7: “Классификация корреляционной зависимости”
↓
|
↓
|
парная - корреляционная
зависимость между двумя признаками: 1. прямолинейная (линейная) отображается
уравнением: y = a+bx 2. криволинейная: 2.1. параболическая: y =
a+bx+cx2 2.2. гиперболическая: y = a+b ∙ 1/x
2.3. степенная: y = axb
|
многофакторная -
корреляционная зависимость между несколькими признаками, отображается
следующими уравнениями: y =
a+bx1+cx2+dx3 y = ax1b ∙ x2c ∙ x3d…
|
Для
составления парной корреляционно-регрессионной модели (= a+bx)
нам необходимо определить коэффициенты регрессии (a, b,
c,…). Для
этого составим систему уравнений, выразив один коэффициент через другой, и
решим её.
Правило составления алгоритма системы уравнений
1.
Составим квадратичную матрицу из коэффициентов регрессии.
.
Перемножим неизвестные слева и сверху на коэффициенты регрессии. Первый элемент первой строки умножим на n -
количество наблюдений.
Показатели корреляции
Для того, чтобы убедиться в статистической значимости уравнения
регрессии, необходимо оценить тесноту связи, т.е. разброс фактических данных в
поле корреляции или отклонение фактических данных от теоретической линии
регрессии.
1.
При прямолинейной парной зависимости теснота связи оценивается по парному
коэффициенту корреляции: или .
Коэффициент
корреляции имеет пределы: .
Если
, то существует Если r=0, то связь
отсутствует.
функциональная
зависимость.
r=1 r=-1 r=0
Если r > 0, то связь прямая; если r < 0, то связь обратная.
Коэффициент корреляции характеризует корреляционную зависимость.
Оценка тесноты связи
Если: r < 0,1 - связь отсутствует;
,1 ≤ r ≤ 0,3 - связь слабая;
,3 ≤ r ≤ 0,5 - связь заметная;
,5 ≤ r ≤ 0,7 - связь умеренная;
,7 ≤ r ≤ 0,9 - связь высокая;
,9 ≤ r ≤ 0,99 - связь весьма высокая.
. При криволинейной зависимости теснота связи оценивается индексом корреляции:
.
.
Чтобы учесть колеблемость отдельных факторов и привести их в единую систему
измерения (освободиться от различной размерности), рассчитываются β коэффициенты: .
Они
показывают, на сколько сигм (средних квадратических отклонений) изменится
результатирующий показатель при изменении x
на 1 сигму (СКО).
.
Коэффициент эластичности показывает, на сколько процентов изменится
результатирующий показатель, при изменении x на 1%: .
.
Коэффициент детерминации: ,
.
- эмпирическое корреляционное отношение.
Лекция 11.
Выборочное наблюдение
Выборочное наблюдение - способ несплошного наблюдения, при котором
обсуждается не вся совокупность, а лишь часть её, отобранная по определённым
правилам выборки и обеспечивающая получение данных, характеризующих всю
совокупность.
Таблица №6: “Выборочное наблюдение”
|
генеральная
совокупность
|
выборка
|
средняя величина
|
|
|
относительная
величина
|
π
|
P
|
дисперсия
|
S2
|
|
коэффициент
корреляции
|
R
|
|
|
N
|
K(n)
|
Ошибки выборочного наблюдения называются ошибками репрезентативности.
Размер ошибки выборки т методы её определения зависят от вида и схемы отбора.
статистика вариация дисперсия корреляция регрессия
Таблица №7: “Ошибки выборочного наблюдения”
способы отбора
|
ошибки
|
для
многозначного признака
|
для
альтернативного признака
|
повторный отбор
|
средняя
|
|
|
|
предельная
|
|
|
бесповторный
отбор
|
средняя
|
|
|
|
предельная
|
|
|
Различают четыре вида отбора совокупности единиц наблюдения:
. Случайный - жеребьёвки (тиражи выигрышей).
. Механический - вся совокупность разбивается на равные по объёму группы
по случайному признаку, затем из каждой группы берётся одна единица.
. Типический - совокупность разбивается по существенному типическому
признаку на качественно однородные группы, затем из каждой группы выделяется
количество единиц пропорционально удельному весу группы. Типический отбор даёт
более точные результаты, чем случайный и механический.
. Серийный (гнездовой) - отбору подлежат не отдельные единицы
совокупности, а целые группы (серии, гнёзда), отобранные случайным и
механическим способами. В каждой группе проводится сплошное наблюдение, а
результаты переносятся на всю совокупность.
Точность выборки зависит и от схемы отбора. Выборка может быть проведена
по схеме повторного и бесповторного отбора.
Повторный отбор - каждая отобранная единица и серия возвращается во всю
совокупность и может вновь попасть в выборку, что представляет собой схему
“возвращённого шара”.
Бесповторный отбор - каждая обследованная единица изымается и не
возвращается в совокупность, что даёт более точные результаты по сравнению с
повторным отбором, т.к. при одном и том же объёме выборки охватывается большее
количество единиц обследуемой совокупности.
Количество отобранных единиц обычно определяется, исходя из принятой доли
выборки.
Доля выборки - отношение числа единиц выборочной совокупности к числу
единиц генеральной совокупности.
Применяя выборочный метод в статистике, обычно используют два основных
вида обобщающих показателей:
. Среднюю величину количественного признака;
. Относительную величину альтернативного признака (долю или удельный вес
единиц, которые отличаются от всех других единиц данной совокупности только
наличием изучаемого признака).
Выборочная
доля (ω''омега’’ −
частость) определяется отношением числа единиц, обладающих изучаемым признаком
(m) к общему числу единиц выборочной совокупности (n):
.
Ошибка
выборки (E) представляет собой разность соответствующих
выборочных и генеральных характеристик.
Для
средних количественного признака: .
Для
доли альтернативного признака: .
Конечной
целью выборочного наблюдения является характеристика генеральной совокупности
на основе полученных результатов.
Выборочные
средние и относительные величины распространяются на генеральные совокупности с
учётом предела их возможной ошибки.
Фактические
расхождения, т.е. разница между выборочной средней и генеральной средней, могут
рассматриваться как некая предельная ошибка, связанная со средней ошибкой и
гарантированная с определённой вероятностью P.
P = Ф(t), где t - коэффициент доверия.
t
|
1,0
|
1,96
|
2,0
|
2,58
|
3
|
P = Ф(t)
|
0,683
|
…
|
0,954
|
…
|
0,997
|
Для стабильного процесса t=2, для нестабильного процесса t=3.
Предельная ошибка выборки позволяет определить предельные значения
характеристик выборки и их доверительные интервалы:
;
,
.