Общая теория статистики

Лекция 1. Предмет, метод и история возникновения статистики

Лекция 2. Статистическое наблюдение

Лекция 3. Статистические показателя

Лекция 4. Сводка и группировка

Лекция 5. Абсолютные и относительные величины

Лекция 6. Средние величины

Лекция 7. Вариация

Лекция 8. Индексы

Лекция 9. Ряды динамики

Лекция 11. Выборочное наблюдение

Общая теория статистики

Общая теория статистики

Лекция 1. Предмет, метод и история возникновения статистики

Лекция 2. Статистическое наблюдение

Лекция 3. Статистические показателя

Лекция 4. Сводка и группировка

Лекция 5. Абсолютные и относительные величины

Лекция 6. Средние величины

Лекция 7. Вариация

Лекция 8. Индексы

Лекция 9. Ряды динамики

Лекция 11. Выборочное наблюдение

Общая теория статистики

Общая теория статистики

Похожие работы на - Общая теория статистики

Вид работы:

Книга / Учебник
Предмет:

Математика
Язык:

Русский
,
Формат файла:
MS Word

204,71 kb
Опубликовано:

2011-07-14

Все книги / учебники по математике

Скачать книгу / учебник Читать текст online Посмотреть все книги / учебники

Вы можете узнать стоимость помощи в написании студенческой работы.

Статистика включает в себя четыре раздела:

. Общая теория статистики;

. Социально-экономическая статистика (СЭС);

. Статистика финансов;

. Система национальных счетов (СНС).

Термин “статистика” возник во 2-ой половине 18 века в связи с познанием государств, описанием их особенностей, достопримечательностей. К этому же времени относится начало преподавания предмета статистики в университетах Германии.

История развития человечества показала, что без статистических данных невозможно управление государством, развитие отдельных отраслей и секторов экономики.

Необходимость сбора и обобщения множества данных о населении страны, предприятиях, банках и прочих учреждениях приводит к образованию специальных статистических служб - учреждений государственной статистики.

Слово “статистика” используется в нескольких значениях:

. прежде всего, как синоним слова “данные”. Именно в этом смысле можно сказать статистика смертности, рождаемости;

. статистикой называется отрасль знаний, объединяющая принципы и методы работы с числовыми данными, характеризующими массовые явления;

. статистикой называется также отрасль практической деятельности, направленной на сбор, обработку, анализ числовых данных.

Слово “статистика” произошло от латинского слова “status” − состояние, положение вещей.

В научный обиход слово “статистика” вошло в 18 веке и первоначально употреблялось в значении государствоведение.

В настоящее время статистика может быть определена как собирание, представление, анализ и интерпретация числовых данных.

Греческий философ Аристотель (384-322 до н.э.) одним из первых составил описание 157 городов и государств своего времени.

С середины 19 века благодаря усилиям великого бельгийца − математика, астронома, статиста Адольфа Кетле были выработаны правила переписи населения.

В 1885 г. был основан Международный Статистический Институт, действующий сегодня.

Статистика как наука исследует не отдельные факты, а массовые социально-экономические явления и процессы.

Предметом статистического изучения выступают совокупности множества однокачественных варьирующих явлений. В это определение входят три основные черты совокупности любых явлений:

− во-первых, это множество явлений;

− во-вторых, это множество явлений, объединённых общим качеством;

− в-третьих, это множество варьирующих явлений, отличающихся по своим характеристикам.

Можно дать более простое определение предмета статистики - это количественная сторона массовых общественных явлений и процессов.

Объект статистики называют статистической совокупностью.

Статистическая совокупность - множество единиц, обладающих массовостью, однородностью, определённой целостностью, взаимозависимостью состояний отдельных единиц и наличием вариаций. Каждый отдельно взятый элемент этого множества называется единицей статистической совокупности, которая характеризуется свойствами, именуемыми в статистике признаками. Но существует и вариация признаков, т.е. единицы совокупности обладают индивидуальными особенностями и различиями, отличающих их друг от друга. Именно наличие вариации предопределяет необходимость статистики.

Итак, статистика как наука изучает, прежде всего, количественную сторону общественных явлений и процессов в конкретных условиях места и времени, т.е. предметом статистики выступают размеры и количественные соотношения социально-экономических явлений, закономерности их связи и развития.

Количественную характеристику статистика выражает через числа, которые называются статистическими показателями. Статистический показатель отражает результат измерения у единицы совокупности и совокупности в целом.

Различают следующие показатели как измерители:

− натуральные;

− условно натуральные;

− стоимостные (денежные);

− трудовые.

Важной категорией статистики является статистическая закономерность - форма проявления причинной связи, выражающаяся в последовательности, регулярности, повторяемости событий с достаточно высокой степенью вероятности.

Приёмы и способы, с помощью которых статистика изучает свой предмет, образуют статистическую методологию, под которой понимается система приёмов, способов и методов, направленных на изучение количественных закономерностей, проявляющихся в структуре, динамике и взаимосвязях социально-экономических явлений.

Важно уяснить, что статистическое исследование состоит из следующих стадий:

. статистическое наблюдение;

. сводка и группировка результатов наблюдения;

. анализ полученных обобщённых показателей.

Методы, используемые в статистике

− массовые статистические наблюдения;

− статистические показатели (система статистических показателей);

− сводка и группировка;

− статистические таблицы;

− графики статистики;

− абсолютные и относительные величины;

− средние величины;

− вариация;

− индексы;

− корреляционно-регрессионный анализ;

− ряды динамики;

− выборочное наблюдение.

Таблица №1: “Основная классификация признаков статистики”

по характеру их выражения	по способу измерения	по отношению к характеризуемому объекту	по характеру вариации	по отношению ко времени
1.описательные 2.количественные	1.первичные (учитываемые) 2.вторичные (расчётные)	1.прямые (непосредственные) 2.косвенные	1.альтернативные 2.дискретные 3.непрерывные	1.моментные 2.интервальные

Статистическое наблюдение - научно организованный массовый сбор данных о явлениях и процессах общественной жизни, может проводиться любыми способами.

Схема №1: “Составляющие статистического наблюдения”

Таблица №2: ”Классификация статистического наблюдения”

формы	виды	способы
1.периодическая отчётность 2.специально Организованное наблюдение	1.по охвату: 1.1.сплошное 1.2.несплошное 1.2.1.выборочное 1.2.2.основного массива 1.2.3.монографическое 2.по времени: 2.1.текущее (непрерывное) 2.2.периодическое 2.3.единовременное	1.непосредственный 2.документальный 3.опрос 3.1.анкеиный 3.2.экспедиционный 3.3.саморегистрации 3.4.корреспондентский 4.эксперимент

1) Периодическая отчётность - специально разработанные и утверждённые Министерством труда… формы, которые подлежат заполнению и представлению в органы государственной статистики всеми без исключения предприятиями, организациями, учреждениями. Сроки представления статистической отчётности не позднее 15-го числа каждого месяца, следующего за отчётным периодом (месяцем).

Исключение составляют малые предприятия, которые сдают отчётность ежеквартально. Количество и содержание статистических форм зависит от вида деятельности предприятия, организации, учреждения.

) В специально организованном наблюдении различают:

− программно-методологическую часть: цель, объект, программа наблюдения;

Программа - перечень вопросов, на которые необходимо получить ответы.

− организационную часть: выбор формы, вид, способа, времени проведения наблюдения, подбор персонала, его обучение.

Различают:

− объективное время - это период, за который проводится наблюдение;

− субъективное время - это период, в течение которого проводится наблюдение;

− если процесс быстрый, то объективное время конкретизируется в критический момент времени (конкретное время - 0ч.00мин).

Таблица №3: “Ошибки статистического наблюдения”

ошибки регистрации			ошибки репрезентативности
случайные	систематические		средние	предельные
	преднамеренные	непреднамеренные	при повторном и бесповторном отборе

) Ошибки регистрации присущи сплошному наблюдению. Они подразделяются на:

. Случайные;

2. Систематические.

Случайными могут быть ошибки: описка, арифметическая ошибка.

Систематические ошибки подразделяются на:

преднамеренные (умышленные);

непреднамеренные (на основании неточных сведений, приблизительных расчётов, т.е. допущенных несознательно).

) Ошибки репрезентативности присущи только выборочному наблюдению. Они возникают, когда в выборку не попадают те единицы совокупности, которые могут значительно повлиять на результат наблюдения.

Схема №2: “Атрибуты статистического показателя”

качественная сторона: объект и его свойства

количественная сторона: число и единицы измерения

территориальные, отраслевые и иные границы объекта

Интервал или момент времени

Таблица №4: “Классификация видов статистических показателей”

по качественной стороне показателя	по количественной стороне показателя	по отношению к характеризуемому свойству
1.показатели свойств конкретных объектов 2.показатели статистических свойств любых массовых явлений и процессов	1.абсолютные 2.относительные	1.прямые 2.косвенные

Абсолютные показатели характеризуют те явления, процессы и объекты, за которыми мы наблюдаем, можем их увидеть и подсчитать.

Относительные показатели мы можем получить в виде характеристики наблюдаемого нами объекта расчётным путём из абсолютных показателей.

Схема №3: “Система статистических показателей промышленности”

	В	Т	Ф	Р	М
В	В
Т	Т
Ф	Ф
Р	Р
М					М

абсолютные показатели:

В - выпуск продукции

Т - численность рабочих

Ф - основные производственные фонды (ОПФ)

Р - фонд оплаты труда

М - материальные затраты

относительные показатели:

- производительность труда - зарплатаотдача

- фондоотдача - материалоотдача

- трудоёмкость - число рабочих, приходящихся на 1 единицу ОПФ

- фондоёмкость- фондовооружённость

- зарплатаёмкость - средняя зарплата

- материалоёмкость

- материальные затраты, приходящиеся на 1-ого работника

- стоимость материальных затрат, приходящихся на 1 единицу ОПФ

М+Р=С - себестоимость - затраты на 1 руб. выпускаемой продукции

В-С=П - прибыль - прибыль, приходящаяся на 1-ого работника

Простейшей группировкой являются ряды распределения.

Схема №4: “Ряды распределения”

Величина х называется вариантой. Количество раз, которое повторяется каждая варианта, называется её частотой.

Интервалы и интервальные ряды бывают открытыми (до 100, …, свыше 180) и закрытыми (80-100,…, 180-200), возрастающими и убывающими, равными и неравными. Чтобы работать с открытым интервальным рядом, его необходимо условно закрыть, используя интервальный шаг в равных интервальных рядах. В неравных интервальных рядах - последующий шаг для нижней границы и предыдущий шаг для верхней границы.

Величина равного интервала определяется по формуле:

Число групп при группировке можно определить не только по существенным обоснованным признакам, но и математическим путём с использованием формулы Стерджесса: n=1+3,322 lgN, где n-количество групп, N-число единиц совокупности.

По виду группового признака различают следующие группировки:

. Типологическая: распределение единиц разнородной совокупности на качественно однородные группы, в основе которых лежит атрибут, или качественный признак (распределение общества по классам);

. Структурная: расчленение однородной совокупности по количественному признаку (распределение рабочих по квалификации, студентов по курсам);

. Аналитическая: распределение единиц однородной совокупности на группы и подгруппы по двум или нескольким взаимосвязанным признакам. При этом независимый признак называется факторным (х), а зависимый - результативным (y). В статистике она имеют наибольшее значение (зависимость между продажами путёвок работниками и их стажем работы).

Пример:

стаж работы в годах (х)	объём продаж путёвок работниками (y)
до 5 5-10 10-15 свыше 15	380000 410000 450000 430000

Статистические таблицы

Одной из разновидностей сводки и группировки являются статистические таблицы. Каждая таблица должна иметь заголовок, т.е.свое название (если таблица простая, можно над таблицей в правом верхнем углу написать единицы измерения). В каждой таблице различают подлежащее (то, что изучается) и сказуемое (показатели, характеризующие подлежащее). Подлежащее расположено в таблице в виде строк, в ее левой части. Оно является предметом изучения каких-либо показателей, наблюдений (оценочная ведомость). Сказуемое расположено в виде столбцов таблицы, в ее верхней части, которые характеризуют наше наблюдение за показателями, т.е. подлежащим.

Заголовок ед.измерения

Каждая таблица (особенно расчётная) может иметь итоговые строку и столбец, которые могут выполнять функцию контроля.

Тблица № 5: “Классификация таблиц”

по подлежащему	по сказуемому
1.простые 1.1.перечневые 1.2.территориальные 1.3.хронологические 2.групповые 3.комбинированные (сложные)	1.простые 2.комбинированные (сложные)

(Правило построения таблиц).

В результате исследования статистической совокупности получают показатели, которые могут быть абсолютными или относительными.

Абсолютные величины - показатели, которые выражают разряды, уровни, объёмы и т.д. изучаемых явлений и процессов. Они всегда выражаются именованными числами (кг, м, шт, л). В этом их коренное отличие от относительных величин. Их единицы измерения называют натуральными.

Относительные величины - показатели, характеризующие количественные соотношения двух сопоставленных абсолютных и относительных величин. Относительные величины могут выражаться в коэффициентах (если за базу принимается единица), в процентах (если за базу принимается 100%), в промилле (если за базу принимается1000‰), а также через относительные натуральные сложные показатели (км/ч, руб/чел, чел/дней).

Правило действия с относительными величинами

№ фирмы	А.фактическое оказание услуг за 2004 г.	2005 г.		относительные величины
		плановое значение	фактическое значение	плановой динамики	выполнения плана	Динамики
	а	b	c	d/a	c/b	c/a
1 2 3 4	10 20 30 21,05	11 18 31,5 20	12 21 32,4 22	110% 90% 105% 95%	109% 117% 103% 110%	120% 105% 108% 104,5%

Все действия с относительными числами необходимо проводить, выразив их в виде коэффициентов, а не процентов. В расчётах пользоваться не темпами прироста, а темпами роста.

Виды относительных величин

Относительное изменение во времени называется динамикой.

. Относительная величина плановой динамики (планового задания) - отношение планового уровня текущего года к фактическому значению в предыдущем периоде.

. Относительная величина выполнения плана - отношение фактического значения к плановому за один и тот же период.

. Относительная величина динамики - отношение двух фактических значений текущего года к базисному.

Пример: Найти недостающие абсолютные и относительные величины

Вспомогательные формулы: b=a*b/a; c=a*c/a; c=b*c/b; a=b:b/a; c/a=c/b*b/a; b/a=c/a*c/b

4. Относительная величина структуры - отношение каждого элемента ряда к итогу.

Пример:

№	выпуск продукции	относительная величина структуры
1 2 3 4 итог:	20 30 120 30 200	20:200=10% 30:200=15% 120:200=60% 30:200=15% 100%

. Относительная величина координации - отношение каждого элемента ряда к элементу, принятому за базу сравнения.

Пример:

№	выпуск продукции	относительная величина координации
1 2 3 4	20 30 120 70	20:120=16,7% 30:120=25% 120:120=100% 70:120=58,3%

. Относительная величина сравнения - сопоставление двух объектов за один и тот же период.

. Относительная величина интенсивности - в отличие от всех прочих имеет единицу измерения и представляет собой отношение двух разноимённых показателей.

Среди показателей, характеризующих статистические совокупности, важное место занимают средние величины.

Средняя величина - показатель, который даёт обобщённую (усреднённую) характеристику единиц изучаемой совокупности. В средней величине отражается то общее, что имеется в каждой единице совокупности.

Сущность статистической обработки методом средней величины заключается в замене индивидуальных значений признака их средним показателем. При этом общий объём совокупности остаётся неизменным.

Пример: есть данные о выработке 5 рабочих: 135, 141, 153, 159, 162. Определить среднюю выработку. .

Средние величины, которые необходимо знать наизусть:

- средняя арифметическая;

средняя гармоническая;

средняя хронологическая;

средняя квадратическая, кубическая;

средняя геометрическая;

структурные средние: мода, медиана.

. Средняя арифметическая: чаще всего в статистике и социально-экономических исследованиях применяется арифметическая величина.

Средняя арифметическая простая рассматривается в случаях, когда значение признака повторяется один или одинаковое число раз в ряде распределения:

, где n-количество единиц совокупности.

Средняя арифметическая взвешенная применяется в случаях, когда каждое значение признака повторяется неодинаковое число раз, или частота ряда распределения превышает единицу хотя бы для одного признака:

, где f-вес.(сколько раз повторяется каждая еденица совокупности)

. Средняя гармоническая: в ряде случаев бывают известны варианты (x) и произведения варианты на частоту (x∙f), в то время как сами частоты (f) неизвестны, тогда применяется средняя гармоническая, которая бывает простой и взвешенной.

Произведение x∙f выражается через сложный экономический показатель M (M= x∙f). Для расчёта средней величины, когда x∙f =M=1, применяется средняя гармоническая простая: .

Если x∙f =M≠ 1, то для расчёта применяется средняя гармоническая взвешенная: .

Средняя гармоническая - величина, обратная средней арифметической, из обратных значений признака.

Свойства средних величин

1. Если от каждой варианты отнять или прибавить одно и то же число, то средняя увеличится или уменьшится на то же число.

. Если каждую варианту увеличить или уменьшить в a раз, то средняя увеличится или уменьшится в столько же раз.

. Если все частоты увеличить или уменьшить в a раз, то средняя не изменится.

. Если все частоты увеличить или уменьшить на a, то средняя изменится непредсказуемо.

. Средняя арифметическая суммы нескольких величин равна суме средних арифметических этих величин.

. Алгебраическая сумма отклонений значений признака от средней арифметической всегда равна нулю.

Пример: Найти среднюю урожайность в 2003 и 2004 гг.

№ колхоза	2003 г.		2004 г.
	урожайность (ц/га)	площадь (га)	урожайность (ц/га)	Валовой сбор(ц)
1 2 3	40 50 60	1000 2000 3000	38 49 65	40000 100000 150000

Решение:

, где f-вес

(ц/га)

. Средняя хронологическая: применяется для расчёта средней величины, если исходные данные представлены на определённые даты, моменты времени:

Пример: Найти среднюю стоимость ОПФ

дата	1.01	1.02	1.03	1.04	1.05	1.06
стоимость ОПФ	100	120	110	120	140	140

Решение:

, ,

, .

Приведем все расчеты к одному знаменателю: Х=ýýý

. Средняя квадратическая: применяется для измерения вариации признака в совокупности:

. Средняя кубическая: .

6. Средняя геометрическая: применяется чаще всего для определения средних темпов роста в единицу времени: , ,

Пример: Рассчитайте среднегодовые темпы роста

показатели	год
	1995	1996	1997	1998	1999
выпуск продукции	20	22	26	50,1	100,2
	х1	х2	х3	х4	х5
коэффициент роста выпуска продукции	−	1,1	1,2	1,9	2
		k1	k2	k3	k4

Решение:

Средняя геометрическая, чаще всего, применяется в экономических расчетах, но учитывает только начало и конец ряда и недостаточно точно отражает динамику изменения, т.е. она не учитывает сумму ряда.

. Средняя кумулятивная:

Формула кумулятивной средней более чётко отражает динамику изменений и помогает увидеть сумму ранжированного ряда.

Все рассмотренные средние величины (кроме средней хронологической) являются степенными средними и выводятся из следующей формулы: , где получается при

k=-1 − средняя гармоническая;

k=0 − средняя геометрическая;

k=1 − средняя арифметическая;

k=2 − средняя квадратическая;

k=3 − средняя кубическая.

Все эти показатели рассчитываются для варьирующего признака для простых средних. Если все значения признака в ряде распределения одинаковы, то все значения средних равны. Между указанными средними величинами имеет место зависимость (для одного ряда распределения):

− это неравенство называется правилом мажорантности средних величин.

. Структурные средние:

) Структурное среднее мода (Mо) - наиболее часто встречающееся значение ряда, другими словами, мода - это варианта, имеющая наибольшую частоту. В дискретных рядах мода определяется визуально, в интервальных рядах визуально определяется модальный интервал, а мода (точечная) определяется по формуле: , где

x₀ − нижняя граница модального интервала;

i − шаг интервального ряда;

f_M_о− частота модального интервала;

f_M_о-1 − частота интервала, предшествующего модальному;

f_M_о+1 −частота интервала, следующего за модальным.

Пример: Найти Мо в дискретном и интервальном рядах.

2) Структурное среднее медиана (Mе) - значение, которое делит ранжированный ряд пополам.

В нечётных, чётных и дискретных рядах медиана определяется визуально, но в дискретных рядах она определяется с помощью накопленных частот. В интервальном ряду медианный интервал находится визуально, с помощью накопленных частот, а сама медиана (точечно) по формуле:

, где

x₀ − нижняя граница медианного интервала;

i −шаг интервального ряда;

∑f − сумма накопленных частот;

S_Me_-1 − сумма частот, накопленных до медианного интервала;

f_Me− частота медианного интервала.

Пример: Найти Ме в нечетных, четных, дискретных, интервальных рядах.

интервальный ряд:

Если х сред. равно Мо = Ме - это симметричное распределение, если х сред не равно Мо, не равно Ме - распределение ассиметричное.

Для каждой единицы изучаемой совокупности интересующий нас признак принимает различные значения, т.е. варьирует.

Вариация - это колебания признака в ряде распределения.

Показатели вариации

1. Размах вариации (R) - разность между максимальным и минимальным значениями совокупности: .

2. Среднее линейное отклонение (d) - средняя арифметическая абсолютная величина отклонений значений признака от его средней величины: ; .

. Дисперсия () - среднее арифметическое квадратов отклонений значений признака от его средней величины..

Дисперсия − единственный из показателей вариации, не имеющий единицы измерения:

; ;

; ; , где

; − начальный момент первого порядка,

; − начальный момент второго порядка.

i - величина интервала;

A - варианта с наибольшей частотой.

. Среднее квадратическое отклонение () - арифметическое значение корня квадратного из дисперсии: ; .

Отметим, что отношение (для прогноза).

. Коэффициент вариации (V) - отношение среднего квадратического отклонения к средней арифметической, выраженное в процентах: .

Этот коэффициент показывает долю колебания признака от средней арифметической. Применяется для сравнения вариаций признака в различных совокупностях и для характеристики колебаний различных признаков в одной совокупности. Также он характеризует степень однородности совокупности и качества средних величин.

Если V от 0% до 20%, то совокупность однородная, и среднюю можно использовать смело.

Если V от 20% до 50%, то совокупность средней однородности, и среднюю необходимо использовать осторожно.

Если V более 50%, то совокупность неоднородная, и средней пользоваться нельзя для прогнозирования перспективных показателей признака.

Целесообразно расчёт каждой средней величины дополнять расчётом коэффициента вариации для характеристики степени однородности совокупности и оценки качества средней величины.

Свойства дисперсии

1. Если каждую варианту увеличить или уменьшить в k раз, то дисперсия увеличится или уменьшится в k² раз.

. Если каждую варианту увеличить или уменьшить на одну и ту же величину, то дисперсия не изменится.

. Если все частоты увеличить или уменьшить в несколько раз, то дисперсия не изменится.

. Дисперсия равна средней арифметической квадратов вариант без квадрата средней арифметической.

Дисперсия альтернативного признака

Если в совокупности исследуется доля единиц, обладающих тем или иным альтернативным признаком, то дисперсия этой доли определяется по формуле: , где .

p - доля единиц совокупности, обладающих данным признаком, ;

m - число единиц совокупности, обладающих данным признаком;

n - число наблюдений.

Пример: выпущена продукция, в объёме которой доля пригодных изделий составляет 0,8, оставшиеся - бракованные изделия. Определить дисперсию альтернативного признака.

= 0,8 ∙ 0,2 = 0,16.

Межгрупповая и внутригрупповая дисперсии

На вариацию признака влияют различные факторы: систематические и случайные. В статистике определяется количественное воздействие случайных факторов при помощи различных видов дисперсий.

Предположим, совокупность S разбита на непересекающиеся группы по возрастанию признака (S₁,S₂,…,S_n).

Дисперсия всей совокупности называется общей дисперсией. Она характеризует влияние колебания признака от воздействия всех факторов: случайных и систематических.

Дисперсия каждой группы, на которые разбита совокупность, называется внутригрупповой и рассчитывается по формуле дисперсии:

где − дисперсия i-ой группы;

− значение ряда.

Среднее арифметическое из внутригрупповых дисперсий рассчитывается по формуле: и называется средней внутригрупповой дисперсией. Она характеризует влияние случайных факторов на величину общей вариации, т.е. всех факторов, за исключением того, который положен в основу группировки.

Межгрупповой дисперсией называется среднее арифметическое квадратов отклонений внутригрупповых средних от общей средней., рассчитывается по формуле. . Она характеризует влияние систематических факторов, положенных в основу группировки, на величину общей вариации.

Правило сложения дисперсий

Если совокупность разбита на непересекающиеся группы S₁,S₂,…,S_n, то общая дисперсия равна сумме межгрупповой дисперсии и средней внутригрупповой дисперсии: (четвёртый способ нахождения дисперсии)

Отношение межгрупповой дисперсии к общей, выраженное в процентах, называется коэффициентом детерминации: .

Корень квадратный из него характеризует долю общей вариации, обусловленную влиянием признака, положенного в основу группировки, в общей совокупности всех факторов и называется эмпирическим корреляционным отношением: . (этта)

Пример: имеются данные о производительности труда 10 работников в зависимости от стажа работы. Определить зависимость выработки работника от стажа работы:

этапы работы	количество деталей в смену	количество работников
менее 5 лет	11, 8, 9, 12, 11, 9	6
5 лет и выше	9, 12, 10, 13	4

(ед.), (ед.),

(деталей);

;

, ;

, .

Таким образом, производительность труда рабочих зависит от стажа работы на 31%, а от всех остальных, случайных, факторов - на 69%.

Индексом называется относительная величина, которая характеризует изменение явления во времени или пространстве, а также степень выполнения плана.

Индексы получают в результате сравнения двух величин. При этом если сравнивается какая-то часть явления, то получаем индивидуальный индекс (i), если явление в целом, и при этом сопоставляются сложные показатели, то получаем общий (агрегатный) индекс (I):

; .

Агрегатные и средневзвешенные индексы

Для построения общих индексов несопоставимые показатели необходимо сделать сопоставимыми. Это достигается путём приведения к стоимости, затратам и некоторым другим сопоставимым показателям.

Между индексами всегда имеет место та же зависимость, что и между показателями, которые они выражают: pq = p ∙ q, следовательно, I_pq = I_p ∙ I_q.

Разница между числителем и знаменателем индекса - есть абсолютное изменение явления в целом или его части, которую этот индекс выражает:

Взаимосвязь : pq = p +q =pq_p + pq_q.

Правило построения индекса

По методике, принятой в отечественной статистике, при индексировании качественных показателей (цены, себестоимости, производительности труда) количественные берутся в отчётном периоде в числителе и знаменателе индекса, а при индексировании количественных показателей (объёма, трудозатрат) качественные берутся в базисном периоде: ; , .

Такие общие индексы, как правило, называются индексами Пааше. В зарубежной статистике используются индексы Ласпейреса, где показатели фиксируются наоборот.

Если нам известны некоторые данные о стоимости товара отчётного и базисного периодов, об изменении цен этих товаров в отчётном году по сравнению с базисным, изменение объёма в отчётном периоде по сравнению с базисным:

Пример. Даны следующие данные ; ; . Найти: ,

Решение:

, ; , ;

; .

Агрегатный индекс переходит в форму средневзвешенного, если в нем используется индивидуальный индекс.

Средневзвешенный индекс, в котором индивидуальный индекс используется как делитель, носит название средневзвешенного гармонического.

Средневзвешенный индекс, в котором индивидуальный индекс используется в качестве сомножителя, называется средневзвешенным арифметическим.

Цепные и базисные индексы

Цепные индексы - отношение любого явления текущего периода к предыдущему: .(; ; )

Базисные индексы - отношение любого явления текущего периода к базисному:

. (; ; )

Индексы постоянного, переменного состава и структурных сдвигов

Индексом постоянного состава называется индекс, рассчитанный с весами, зафиксированными на уровне одного какого-либо периода, и показывающий изменение только индексируемой величины, причём среднее изменение (изменение всреднем) индексируемой величины (т.е. рассматриваемой части явления):

− общий индекс (цены), индекс постоянного состава или агрегатный индекс (цены), индекс (общий) цены.

Индексом переменного состава называется индекс, характеризующий соотношение средних уровней изучаемого явления в разные периоды времени и показывающий изменение среднего уровня явления (изменений средней цены):

− средней цены; − среднего объёма.

Индекс структурных сдвигов - индекс, характеризующий влияние изменения структуры изучаемого явления на динамику среднего уровня этого явления: .

Между данными индексами существует взаимосвязь: ;

Замечание.

Эти индексы рассчитываются только для одноимённых показателей, если они даны для двух и более объектов за два периода времени, или они могут рассчитываться для нескольких видов товаров на одном предприятии.

Индексы динамики и выполнения плана

− индекс динамики; − индекс выполнения плана.

Классификация индексов по названию

; − индексы товарооборота;

; − индексы затрат на производство;

; − индексы себестоимости;

; − индексы трудоёмкости;

; − индексы физического объёма;

; − индексы цены;

; − индексы производительности труда в трудовой форме;

; − в стоимостной форме, где

i - индивидуальный индекс;

I - общий индекс;

p - цена;

q - физический объём;

t - трудоёмкость;

T - суммарные затраты времени;

w - производительность труда;

z - себестоимость единицы продукции;

zq - затраты на производство;

pq - объём произведённой продукции, товарооборот;

q₀ - физический объём в базисном периоде;

q₁ - физический объём в отчётном периоде.

Индексы сложных экономических явлений

Система взаимосвязанных индексов даёт возможность провести факторный анализ, т.е. определить влияние ряда факторов на изменение результативного показателя (в абсолютном или относительном выражении).

Обозначим через Y объём продукции, произведённой предприятием за год;

через a - среднесписочную численность работников;

через b - среднее число дней, отработанных одним работником за год;

через c - среднюю продолжительность рабочего дня в часах;

через d - среднечасовую выработку одного работника в рублях.

По имеющимся данным составим модель сложного экономического явления, результат которого зависит от нескольких факторов: Y = a ∙ b ∙ c ∙ d.

- этот индекс показывает изменение результативного показателя за счет всех факторов в относительном выражении.

- разница между числителем и знаменателем данного индекса показывает изменение результативного показателя в абсолютном выражении (за счет всех факторов).

Метод цепных подстановок показывает как происходит изменение за счет всех факторов и за счет каждого отдельного фактора.

Относительные изменения:

Абсолютные изменения:

Этот метод применяется в экономическом анализе.

Динамика - изменение явления во времени.

Для выражения абсолютной скорости роста (снижения) уровня ряда динамики рассчитывают статистический показатель - абсолютный прирост (). Его величина определяется как разность двух сравниваемых уровней. Она вычисляется по формулам:

1. ; 2. , где

y_i - уровень i-ого года, y₀ - уровень базисного года.

Интенсивность изменения уровней ряда динамики оценивается отношением текущего уровня к предыдущему или базисному, которое всегда представляет собой положительное число. Этот показатель принято называть темпом роста (Т_р). Он выражается в процентах и рассчитывается по формулам:

3. ; 4. .

Для выражения изменения величины абсолютного прироста уровня ряда динамики в относительных величинах определяется темп прироста (Т_пр), который рассчитывается как отношение абсолютного прироста к предыдущему или базисному и определяется по формулам:

5. ; 6. .

Темп прироста может быть вычислен также путём вычитания из темпов роста 100%:

Т_пр= Т_р -100%.

Показатель абсолютного значения одного процента прироста (I%I) определяется как результат деления абсолютного прироста на соответствующий темп прироста, выраженный в процентах:

. или .

Расчёт этого показателя имеет экономический смысл только на цепной основе.

Расчёт среднего уровня динамики (с равноотстоящими уровнями во времени) производится по формуле средней арифметической простой:

. .

Средний абсолютный прирост определяется по цепным абсолютным приростам по формуле:

. или .

Среднегодовой темп роста вычисляется по формуле средней геометрической:

. или , где m=n-1 - число коэффициентов роста.

Среднегодовой темп прироста получаем при вычитании из среднего темпа роста 100%:

. .

Пример:

показатели	1992	1993	1994	1995	1996
производство станков, тыс. шт.	200	205	208	215	220
1. абсолютный прирост, цепной, тыс. шт.	-	5	3	7	5
2. абсолютный прирост, базисный, тыс. шт.	-	5	8	15	20
3. темпы роста, цепные, %	-	102,5%	101,4%	103,3%	102,3%
4. темпы роста, базисные, %	-	102,5%	104%	107,5%	110%
5. темпы прироста, цепные, %	-	2,5%	1,4%	3,3%	2,3%
6. темпы прироста, базисные, %	-	2,5%	4%	7,5%	10%
7. абсолют. содержание 1% прироста, шт.	-	2000	2140	2120	2170
8. средний уровень ряда, тыс. шт.	(200+205+208+215+220) = 209,6
9. средний абсолютный прирост, тыс. шт.	(220-200):4 = 5; (5+3+7+5):4 = 5
10. среднегодовой темп роста, %
11. среднегодовой темп прироста, %	102,4%-100% = 2,4%

Приёмы обработки и анализа рядов динамики

Схема №5: “Разновидности рядов динамики”

ряды динамики

↓	↓	↓
периодические:	моментные:	средних величин:
1. с равными интервалами (с помощью среднеарифметичес- кой простой); 2. с неравными интервалами (с помощью среднеарифметичес-кой взвешенной).	1. с равными интервалами (с помощью среднехронологичес- кой простой); 2. с неравными интервалами (с помощью среднехронологичес-кой взвешенной).	1. с равными интервалами (с помощью средней геометричес- кой простой); 2. с неравными интервалами (с помощью средней геометричес-кой взвешенной).

Схема №6: “Выявление основной тенденции ряда динамики”

приёмы и методы выявления основной тенденции развития ряда динамики
метод укрупнения интервалов	метод скользящей средней	аналитическое выравнивание
основан на укрупнении периодов времени, к которым относятся уровни ряда	основан на замене абсолютных данных средним арифметическим за определённые периоды	уровни ряда выражаются в виде функции времени: = f(t)

Лекция 10. Корреляционно-регрессионный анализ

Зависимости бывают функциональными или корреляционными.

Переменные X и Y связаны корреляционной зависимостью, если каждому значению одной из них соответствует ряд распределения другой. При этом связь между факторными и результативными признаками проявляется через изменение средних величин.

Пример: Аналитическая группировка.

группы заводов по стоимости ОПФ	количество заводов	фонды (млн. руб.)		Товарная продукция (млн. шт.)
		всего (∑)	всего (∑)
0,8-3,8	4	8,7	2,2	12,9	3,2
3,8-6,8	13	62,4	4,8	94	7,2
6,8-9,8	9	70,5	7,8	101,7	11,3
9,8-12,8	4	48,1	12	76,4	19,1
итого:	30	189,7	-	285	-

Важной особенностью корреляционных связей является то, что они обнаруживаются не в единичных случаях, а в массе, что требует для исследования наличия значительного количества данных (не менее 15-20).

Задачи корреляционного анализа

1. Определение формы связи между факторными и результативными признаками (выбор математического уравнения, например, y = a+bx);

2. Определение параметров математического уравнения (a, b, c,…- коэффициенты регрессии).

. Оценка тесноты связи между факторными и результативными признаками;

. Оценка качества полученного уравнения (модели).

Способы выбора формы связи между факторными и результативными признаками

1. Путём теоретического анализа взаимосвязи между изучаемыми признаками.

. При помощи аналитической группировки.

. Графическое изображение показателей (графический анализ).

. Графическое изображение корреляционной таблицы.

Схема №7: “Классификация корреляционной зависимости”

↓	↓
парная - корреляционная зависимость между двумя признаками: 1. прямолинейная (линейная) отображается уравнением: y = a+bx 2. криволинейная: 2.1. параболическая: y = a+bx+cx2 2.2. гиперболическая: y = a+b ∙ 1/x 2.3. степенная: y = axb	многофакторная - корреляционная зависимость между несколькими признаками, отображается следующими уравнениями: y = a+bx1+cx2+dx3 y = ax1b ∙ x2c ∙ x3d…

Для составления парной корреляционно-регрессионной модели (= a+bx) нам необходимо определить коэффициенты регрессии (a, b, c,…). Для этого составим систему уравнений, выразив один коэффициент через другой, и решим её.

Правило составления алгоритма системы уравнений

1. Составим квадратичную матрицу из коэффициентов регрессии.

. Перемножим неизвестные слева и сверху на коэффициенты регрессии. Первый элемент первой строки умножим на n - количество наблюдений.

Показатели корреляции

Для того, чтобы убедиться в статистической значимости уравнения регрессии, необходимо оценить тесноту связи, т.е. разброс фактических данных в поле корреляции или отклонение фактических данных от теоретической линии регрессии.

1. При прямолинейной парной зависимости теснота связи оценивается по парному коэффициенту корреляции: или .

Коэффициент корреляции имеет пределы: .

Если , то существует Если r=0, то связь отсутствует.

функциональная зависимость.

r=1 r=-1 r=0

Если r > 0, то связь прямая; если r < 0, то связь обратная.

Коэффициент корреляции характеризует корреляционную зависимость.

Оценка тесноты связи

Если: r < 0,1 - связь отсутствует;

,1 ≤ r ≤ 0,3 - связь слабая;

,3 ≤ r ≤ 0,5 - связь заметная;

,5 ≤ r ≤ 0,7 - связь умеренная;

,7 ≤ r ≤ 0,9 - связь высокая;

,9 ≤ r ≤ 0,99 - связь весьма высокая.

. При криволинейной зависимости теснота связи оценивается индексом корреляции:

. Чтобы учесть колеблемость отдельных факторов и привести их в единую систему измерения (освободиться от различной размерности), рассчитываются β коэффициенты: .

Они показывают, на сколько сигм (средних квадратических отклонений) изменится результатирующий показатель при изменении x на 1 сигму (СКО).

. Коэффициент эластичности показывает, на сколько процентов изменится результатирующий показатель, при изменении x на 1%: .

. Коэффициент детерминации: ,

. - эмпирическое корреляционное отношение.

Выборочное наблюдение - способ несплошного наблюдения, при котором обсуждается не вся совокупность, а лишь часть её, отобранная по определённым правилам выборки и обеспечивающая получение данных, характеризующих всю совокупность.

Таблица №6: “Выборочное наблюдение”

	генеральная совокупность	выборка
средняя величина
относительная величина	π	P
дисперсия	S2
коэффициент корреляции	R
	N	K(n)

Ошибки выборочного наблюдения называются ошибками репрезентативности. Размер ошибки выборки т методы её определения зависят от вида и схемы отбора.

статистика вариация дисперсия корреляция регрессия

Таблица №7: “Ошибки выборочного наблюдения”

способы отбора	ошибки	для многозначного признака	для альтернативного признака
повторный отбор	средняя
	предельная
бесповторный отбор	средняя
	предельная

Различают четыре вида отбора совокупности единиц наблюдения:

. Случайный - жеребьёвки (тиражи выигрышей).

. Механический - вся совокупность разбивается на равные по объёму группы по случайному признаку, затем из каждой группы берётся одна единица.

. Типический - совокупность разбивается по существенному типическому признаку на качественно однородные группы, затем из каждой группы выделяется количество единиц пропорционально удельному весу группы. Типический отбор даёт более точные результаты, чем случайный и механический.

. Серийный (гнездовой) - отбору подлежат не отдельные единицы совокупности, а целые группы (серии, гнёзда), отобранные случайным и механическим способами. В каждой группе проводится сплошное наблюдение, а результаты переносятся на всю совокупность.

Точность выборки зависит и от схемы отбора. Выборка может быть проведена по схеме повторного и бесповторного отбора.

Повторный отбор - каждая отобранная единица и серия возвращается во всю совокупность и может вновь попасть в выборку, что представляет собой схему “возвращённого шара”.

Бесповторный отбор - каждая обследованная единица изымается и не возвращается в совокупность, что даёт более точные результаты по сравнению с повторным отбором, т.к. при одном и том же объёме выборки охватывается большее количество единиц обследуемой совокупности.

Количество отобранных единиц обычно определяется, исходя из принятой доли выборки.

Доля выборки - отношение числа единиц выборочной совокупности к числу единиц генеральной совокупности.

Применяя выборочный метод в статистике, обычно используют два основных вида обобщающих показателей:

. Среднюю величину количественного признака;

. Относительную величину альтернативного признака (долю или удельный вес единиц, которые отличаются от всех других единиц данной совокупности только наличием изучаемого признака).

Выборочная доля (ω''омега’’ − частость) определяется отношением числа единиц, обладающих изучаемым признаком (m) к общему числу единиц выборочной совокупности (n): .

Ошибка выборки (E) представляет собой разность соответствующих выборочных и генеральных характеристик.

Для средних количественного признака: .

Для доли альтернативного признака: .

Конечной целью выборочного наблюдения является характеристика генеральной совокупности на основе полученных результатов.

Выборочные средние и относительные величины распространяются на генеральные совокупности с учётом предела их возможной ошибки.

Фактические расхождения, т.е. разница между выборочной средней и генеральной средней, могут рассматриваться как некая предельная ошибка, связанная со средней ошибкой и гарантированная с определённой вероятностью P.

P = Ф(t), где t - коэффициент доверия.

t	1,0	1,96	2,0	2,58	3
P = Ф(t)	0,683	…	0,954	…	0,997

Для стабильного процесса t=2, для нестабильного процесса t=3.

Предельная ошибка выборки позволяет определить предельные значения характеристик выборки и их доверительные интервалы:

;

, .

подлежащее