Проверка адекватности выбранных моделей
Проверка адекватности
выбранных моделей
Проверка адекватности выбранных
моделей реальному процессу ( в частности, адекватности полученной кривой роста)
строится на анализе случайной компоненты. Случайная остаточная компонента
получается после выделения из исследуемого ряда систематической составляющей
(тренда и периодической составляющей, если она присутствует во временном ряду).
Предположим, что исходный временной ряд описывает процесс, не подверженный
сезонным колебаниям, т.е. примем гипотезу об аддитивной модели ряда вида:
(1)
Тогда ряд остатков будет получен как
отклонения фактических уровней временного ряда (yt) от выравненных, расчетных (ŷt):
(2)
При использовании кривых роста ŷt вычисляют, подставляя в уравнения
выбранных кривых соответствующие последовательные значения времени.
Принято считать, что модель адекватна
описываемому процессу, если значения остаточной компоненты удовлетворяют
свойствам случайности, независимости, а также случайная компонента подчиняется
нормальному закону распределения.
При правильном выборе вида тренда
отклонения от него будут носить случайный характер. Это означает, что изменение
остаточной случайной величины не связано с изменением времени. Таким образом,
по выборке, полученной для всех моментов времени на изучаемом интервале,
проверяется гипотеза о зависимости последовательности значений et от времени, или, что то же самое, о
наличии тенденции в ее изменении. Поэтому для проверки данного свойства может
быть использован один из критериев, рассматриваемых в разделе 1, например,
критерий серий.
Если вид функции, описывающей
систематическую составляющую, выбран неудачно, то последовательные значения
ряда остатков могут не обладать свойствами независимости, т.к. они могут
коррелировать между собой. В этом случае говорят, что имеет место
автокорреляция ошибок.
В условиях автокорреляции оценки
параметров модели, полученные по методу наименьших квадратов, будут обладать
свойствами несмещенности и состоятельности (с этими свойствами знакомятся в
курсе математической статистики). В то же время эффективность этих оценок будет
снижаться, а, следовательно, доверительные интервалы будут иметь мало смысла в
силу своей ненадежности.
Существует несколько приемов
обнаружения авто корреляции. Наиболее распространенным является метод,
предложенный Дарбиным и Уотсоном. Критерий Дарбина-Уотсона связан с гипотезой о
существовании автокорреляции первого порядка, Т.е. автокорреляции между
соседними остаточными членами ряда. Значение этого критерия определяется по
формуле:
d = (3)
Можно показать, что величина d
приближенно равна:
d≈ 2(1-r1)
где r1- коэффициент автокорреляции первого порядка (т.е. парный коэффициент
корреляции между двумя рядами е1, е2, ... ,еn-1 и е2, е3,…,en).
Из последней формулы видно, что если
в значениях et имеется
сильная положительная авто корреляция ( r1≈1), то величина d=0, в случае сильной отрицательной
автокорреляции (r1≈-1) d=4. При отсутствии
автокорреляции (r≈0) d=2.
Для этого критерия найдены
критические границы, позволяющие принять или отвергнуть гипотезу об отсутствии
автокорреляции. Авторами критерия границы определены для 1; 2,5; и 5% уровней
значимости. Значения критерия Дарбина- Уотсона при 5% уровне значимости
приведены в таблице. В этой таблице d1 и d2 – соответственно нижняя и верхняя
доверительные границы критерия Дарбина- Уотсона; k1 – число переменных в модели; n- длина ряда.
Таблица.
Значение критерия Дарбина- Уотсона d1 и d2 при 5% уровне значимости
n
|
K1=1
|
K1=2
|
K1=2
|
|
d1
|
d2
|
d1
|
d2
|
d1
|
d2
|
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
|
1.08
1.1
1.13
1.16
1.18
1.2
1.22
1.24
1.26
1.27
1.29
1.3
1.32
1.33
1.34
1.35
1.36
1.37
1.38
1.49
1.4
1.41
|
1.36
1.37
1.38
1.39
1.4
1.41
1.42
1.43
1.44
1.45
1.45
1.46
1.47
1.48
1.48
1.49
1.5
1.5
1.51
1.51
1.52
1.52
|
0.95
0.98
1.02
1.05
1.08
1.1
1.13
1.15
1.17
1.19
1.21
1.22
1.24
1.26
1.27
1.28
1.3
1.31
1.32
1.33
1.34
1.35
|
1.54
1.54
1.54
1.53
1.53
1.54
1.54
1.54
1.54
1.55
1.55
1.55
1.56
1.56
1.56
1.57
1.57
1.57
1.58
1.58
1.58
1.59
|
0.82
0.86
0.9
093
0.97
1
1.03
1.05
1.08
1.1
1.12
1.14
1.16
1.18
1.2
1.21
1.23
1.24
1.26
1.27
1.28
1.29
|
1.75
1.73
1.71
1.69
1.68
1.68
1.67
1.66
1.66
1.66
1.66
1.65
1.65
1.65
1.65
1.65
1.65
1.65
1.65
1.65
1.65
1.65
|
Применение на практике критерия
Дарбина- Уотсона основано на сравнении величины d, рассчитанной по формуле (3), с теоретическими значениями d1 и d2 , взятыми из таблицы. Отметим, что большинство программных
пакетов статистической обработки данных осуществляет расчет этого критерия
(например, ППП "Олимп", "Мезозавр", "Statistica" и др.).
При сравнеии величины d с d1 и d2 возможны следующие варианты:
1)
Если d<d1, то гипотеза о независимости случайных отклонений (отсутствие
автокорреляции) отвергается;
2)
Если d>d2 , то гипотеза о независимости случайных отклонений не
отвергается;
3)
Если d1≤d≤d2, то нет достаточных оснований для принятия решений,
т.е. величина попадает в область "неопределенности" .
Рассмотренные варианты относятся к
случаю, когда в остатках имеется положительная автокорреляция.
Когда же расчетное значение d
превышает 2, то можно говорить о том, что в et существует отрицательная автокорреляция.
Для проверки отрицательной автокорреляции
с критическими значениями dj и d2 сравнивается не сам
коэффициент d, а 4-d.
Для определения доверительных
интервалов модели свойство
нормальности распределения остатков
имеет важное значение. Поскольку временные ряды экономических показателей, как
правило, невелики (<50), то проверка распределения на нормальность может
быть произведена лишь приближенно, например, на основе исследования показателей
асимметрии и эксцесса.
При нормальном распределении
показатели асимметрии (А) и эксцесса (Э) равны нулю. Так как мы предполагаем,
что отклонения от тренда представляют собой выборку из некоторой генеральной
совокупности, то можно определить выборочные характеристики асимметрии и
эксцесса, а также их среднеквадратические ошибки.
А= (4)
Э= (5)
σa= (7)
где А- выборочная характеристика
асимметрии;
Э- выборочная характеристика экцесса;
σА-
среднеквадратическая ошибка выборочной характеристики асимметрии;
σЭ-
среднеквадратическая ошибка выборочной характеристики экцесса.
Если одновременно выполняются
следующие неравенства:
|А|<1,5σА; | |<1,5σЭ (8)
то гипотеза о нормальном характере
распределения случайной компоненты не отвергается.
Если выполняется хотя бы одно из
неравенств
|А|≥2σА; |Э+| ≥2σ (9)
то гипотеза о нормальном характере
распределения отвергается.
Другие случаи требуют дополнительной
проверки с помощью более мощных критериев.
Классификация прогнозов. Требования,
предъявляемые к временным рядам, их компонентный состав
1. Изменения курса акций промышленной
компании в течение месяца представлены в таблице:
курс акции (Дол.)
t Yt t Yt t Yt t Yt
1 509 6 515
11 517 16 510
2 507 7 520
12 524 17 516
3 508 8 519
13 526 18 518
4 509 9 512 14 519
19 524
5 518 10 511 15 514
20 521
Проверить утверждение об отсутствии
тенденции в изменении курса акций двумя способами:
а) с помощью метода Фостера -
Стюарта;
б) используя критерий серии,
основанный на медиане выборки. Доверительную вероятность принять равной 0,95.
2. Проверим гипотезу об отсутствии
тенденции в изменении курса акций с помощью критерия серий, основанного на
медиане выборки.
3. Годовые данные об изменении
урожайности зерновых культу; представлены в таблице. С помощью критерия
"восходящих и нисходящих" серий проверить утверждение о том, что в
изменении урожайности имеется тенденция.
Урожайность зерновых культур (ц/га)
t
|
Yt
|
t
|
Yt
|
t
|
Yt
|
t
|
Yt
|
1
|
6,7
|
6
|
8,6
|
11
|
8,4
|
16
|
9,1
|
2
|
7,3
|
7
|
7,8
|
12
|
9,1
|
17
|
9,5
|
3
|
7,6
|
8
|
7,7
|
13
|
8,3
|
18
|
10,4
|
4
|
7,9
|
9
|
7,9
|
14
|
8,7
|
19
|
10,5
|
5
|
7,4
|
10
|
8,2
|
15
|
8,9
|
20
|
10,2
|
|
|
|
|
|
|
21
|
9,3
|
Доверительную вероятность принять
равной 0,95.
Решение
1. Вспомогательные вычисления по
методу Фостера- Стюарта представлены в таблице 1.
1) Если уровень yt больше всех предшествующих уровней,
то в графе mt ставим 1, если yt меньше всех предшествующих уровней,
то ставим 1 в графе lt;
2) Определяем dt=mt-1t для t=2ч20;
3) D = =3;
4) Значение σd для n=20 берем из таблицы 1.2.
σd =2,279.
Значение tкp берем из
таблицы t- распределения Стьюдента:
tкp (а=О,05; К=19)=2,093; tH ==1,316.
TH< Tkр нет оснований отвергнуть гипотезу об отсутствии тренда.
С вероятностью 0,95 тренд во временном
ряду отсутствует.
Вспомогательные вычисления
представлены в таблице 1.4.
Таблица 1
Вспомогательные вычисления по методу
Фостера- Стюарта
t
|
Yt
|
Mt
|
Et
|
Dt
|
t
|
Yt
|
Mt
|
Et
|
Dt
|
1
2
3
4
5
6
7
8
9
10
|
509
507
508
509
518
515
520
519
512
511
|
-
0
0
0
1
0
1
0
0
0
|
-
1
0
0
0
0
0
0
0
0
|
-
-1
0
0
1
0
1
0
0
0
|
11
13
14
15
16
17
18
19
20
|
517
524
526
519
514
510
516
518
524
521
|
0
1
1
0
0
0
0
0
0
0
|
0
0
0
0
0
0
0
0
0
0
|
0
1
1
0
0
0
0
0
0
0
|
Вспомогательные
вычисления представлены в таблице 2
t
|
Yt
|
Y't
|
|
t
|
Yt
|
Y't
|
|
t
|
Yt
|
Y't
|
|
1
2
3
4
5
6
|
509
507
508
509
518
515
|
507
508
509
509
510
511
|
-
-
-
-
+
-
|
7
8
9
10
11
12
13
14
|
520
519
512
511
517
524
526
519
|
512
514
515
516
517
518
518
519
|
+
+
-
-
+
+
+
+
|
15
16
17
18
19
20
|
519
520
521
524
524
526
|
519
520
521
524
524
526
|
-
-
-
+
+
+
|
1) от исходного ряда yt переходим к ранжированному yt', расположив значения исходного ряда в порядке
возрастания;
2) Т.к. n=20 (четное)
Медиана
Ме = =516,5;
3) Значение каждого
уровня исходного ряда yt сравнивается со значением медианы. Если yt >Ме, то δi принимает значение «+», если меньше,
то «-»;
4) v (20)=8- число серий;
max (20)=4- протяженность самой большой
серии.
В соответствии делаем
проверку:
max (20)<[3,3(lg20+1)]
v(20)>[(20+1-1.96)]
4<7
8>6
Оба неравенства
выполняются. С вероятностью 0,95 тренд во временном ряду отсутствует, что
согласуется с выводом, сделанным с помощью метода Фостера-Стюарта.
Таблица 3
t
|
Yt
|
|
t
|
Yt
|
|
t
|
Yt
|
|
1
2
3
4
5
6
|
6,7
7,3
7,6
7,9
7,4
8,6
|
+
+
+
-
+
|
7
8
9
10
11
12
|
7,8
7,7
7,9
8,2
8,4
9,1
|
-
-
+
+
+
+
|
13
14
15
16
17
18
19
20
21
|
8,3
8,7
8,9
9,1
9,5
10,4
10,5
10,2
9,3
|
-
+
+
+
+
+
+
-
-
|
Вспомогательные
вычисления в задании
В графе δ ставим
«+», если последующее значение уровня временного ряда больше предыдущего, «-» -
если меньше. Определим v
(21)=8 – число серий.
max (21)=6 – протяженность самой большой
серии. Табличное значение
0
(21)=5. В соответствии делаем проверку:
V(21)>[ ]
max (21)≤ 0(21)
8>10
6≤5
Т.к. оба неравенства не
выполняются, то делаем выводы: во временном ряду урожайности имеется тенденции.