Правила построения АРПСС-моделей

По материалам сайта
http://www.duke.edu/~rnau/411home.htm
Robert F. Nau
[email protected]
С любезного разрешения автора
Подготовил П.Н. Дубнер
[email protected]

Те, кто по какой-либо причине не могут или не любят читать тексты в "он-лайн", могут скачать этот же текст в HTML-формате или в формате PDF.

1. Несезонные модели

1.1 Выбор порядка дифференцирования

Самый первый и самый важный шаг при построении АРПСС-модели - определение порядка дифференцирования, необходимого для того, чтобы превратить ряд в стационарный. Как правило, дифференцировать нужно до тех пор, пока мы не получим ряд, благонравно флуктуирующий вокруг явного среднего, автокорреляционная функция (АКФ) которого быстро убывает, стремясь к нулю сверху или снизу. Если у ряда наблюдается медленный тренд или другие отклонения, либо если его АКФ положительна при достаточно больших значениях аргумента (число 10 уже достаточно велико), ряд, видимо, нужно продифференцировать еще раз. Мы назовем это первым правилом выбора АРПСС-модели:

Правило 1: Если автокорреляционная функция ряда положительна при значении аргумента, равном k, этот ряд, по-видимому, понадобится продифференцировать не менее k раз.

Дифференцирование уменьшает коррелированность: если корреляции исходного ряда строго положительны, то (несезонное дискретное) дифференцирование уменьшает их или даже делает отрицательными. Повторное дифференцирование еще уменьшает автокорреляции.

Если значение АКФ в точке k значимо отрицательно (отрицательные значения АКФ не меньше 0.5 по абсолютной величине!), это вполне может означать, что ряд передифференцирован. На первый взгляд такой ряд может выглядеть вполне случайным. Приглядитесь внимательнее к графику: у передифференцированного ряда последовательные значения слишком часто меняют знак: плюс-минус-плюс-минус... - такое поведение не случайно!

Правило 2: Если автокорреляционная функция отрицательна или равна нулю при значении аргумента, равном k-1, ряд не нуждается в дифференцировании порядка, превосходящего k. Если значения автокорреляционной функции меньше или равны -0.5, ряд, по-видимому, передифференцирован.

Еще один признак возможной передифференцированности - увеличение стандартного отклонения с ростом порядка дифференцирования. Это и станет нашим третьим правилом:

Правило 3: Оптимальный порядок дискретной производной - тот, при котором минимально стандартное отклонение.

Первые два правила не всегда позволяют сколько-нибудь точно определить нужный порядок дифференцирования. Ниже мы увидим, что "умеренную недодифференцированность" можно скомпенсировать добавлением АР-членов, а "умеренную передифференцированность" - добавлением СС-членов. Иногда можно построить две модели, которые соответствуют данным примерно одинаково: модель, в которой порядок дифференцирования равен 0 или 1 и имеются АР-члены, и модель с большим порядком дифференцирования и СС-членами. Выбор между двумя такими моделями может основываться на ваших личных предпочтениях о виде нестационарности исходного ряда - другими словами, что вы предпочитаете: отсутствие фиксированного среднего или постоянный средний тренд.

Правило 4: Модель без дифференцирования предполагает, что исходный ряд стационарен. В модели с первой производной предполагается, что у исходного ряда имеется константный тренд (примером является случайное блуждание). В модели с второй производной предполагается, что тренд ряда не постоянен во времени (пример - случайный тренд).

При выборе порядка дифференцирования следует принимать во внимание роль константы в модели, если, конечно, она включена. Константа представляет среднее ряда в моделях без дифференцирования, линейный тренд в моделях с производными первого порядка, нелинейный полиномиальный тренд в моделях с производными более высокого порядка. Как правило, предполагается, что производные второго и более высокого порядка элиминируют тренд, так что в подобные модели константу не включают. В модели без дифференцирования или с производной первого порядка константу часто включают. Таким образом, мы получаем:

Правило 5: В модели без дифференцирования константу, как правило, включают - в них она соответствует среднему ряда. В модели с производными второго и более высокого порядка константу, как правило, не включают. В модели с производной первого порядка константу следует включить в случае, если у производной имеется тренд.

Пример

На рис. 1(а) представлен график ряда, впервые рассмотренного (ряд М) в основополагающей книжке Бокса и Дженкинса. Автокорреляционная функция этого ряда, представленная на рис. 1(б) убывает медленно и линейно, что характерно для нестационарных рядов.

(а)

(б)

Рис. 1. Ряд M из книжки Бокса и Дженкинса - уровни продаж (а) и его АКФ (б).

Ясно, что ряд нужно продифференцировать по крайней мере один раз. Первая производная ряда представлена на рис.2.

(а)
(б)

Рис. 2. Производная ряда М (а) и АКФ производной (б)

Обратите внимание на то, что продифференцированный ряд уже похож на стационарный - в нем не виден тренд, он демонстрирует явственную тенденцию возвращаться к своему среднему, быть может, чуть-чуть слишком лениво. У АКФ на рис. 2(б) достаточно мало положительных значений, хотя, конечно, хотелось бы, чтобы их было еще меньше. Из нижеследующих дескриптивных статистик мы видим, что и стандартное отклонение среднего сильно уменьшилось - с 21.48 до 1.44.

Дескриптивные статистики

M

N

150

Минимум

198,60

Максимум

263,30

Среднее

229,9780

Стд. отклонение

21,4797

DIFF(M,1)

N

149

Минимум

-2,70

Максимум

4,80

Среднее

,4201

Стд. отклонение

1,4440

N валидных

N

149

Дескриптивные статистики
M	N	150
	Минимум	198,60
	Максимум	263,30
	Среднее	229,9780
	Стд. отклонение	21,4797
DIFF(M,1)	N	149
	Минимум	-2,70
	Максимум	4,80
	Среднее	,4201
	Стд. отклонение	1,4440
N валидных	N	149

Поскольку тренд у ряда DIFF(M,1) отсутствует, а количество положительных автокорреляций достаточно мало, можно считать его стационарным. На всякий случай посмотрим, что получится, если мы возьмем еще одну производную:

Посмотрите: мы видим упоминавшиеся выше признаки передифференцированности: значения ряда слишком часто меняют знак, а на графике АКФ мы видим одно большое отрицательное значение, близкое к -0.5, при лаге, равном 1. Кроме того, и стандартное отклонение возросло от 1.444 до 1.698:

Дескриптивные статистики

M

N

150

Минимум

198,60

Максимум

263,30

Среднее

229,9780

Стд. отклонение

21,4797

DIFF(M,2)

N

148

Минимум

-4,70

Максимум

3,40

Среднее

7,432E-03

Стд. отклонение

1,6977

N валидных

N

148

Дескриптивные статистики
M	N	150
	Минимум	198,60
	Максимум	263,30
	Среднее	229,9780
	Стд. отклонение	21,4797
DIFF(M,2)	N	148
	Минимум	-4,70
	Максимум	3,40
	Среднее	7,432E-03
	Стд. отклонение	1,6977
N валидных	N	148

Итак, нам следует начать с ряда, продифференцированного один раз. Конечно, исследование на этом не заканчивается: вполне может оказаться, что при добавлении АР- или СС-членов нам понадобится другой порядок производной ряда. Или может оказаться, что для долговременного прогноза свойства модели с другим порядком производной окажутся более согласующимися с интуитивными представлениями (мы еще поговорим об этом). Однако, в качестве первого приближения мы пока можем считать подходящей производную первого порядка.

1.2. Выбор количества АР- и СС-членов

После того, как ряд "стационаризован" дифференцированием, нам нужно установить, какие члены нужны для аппроксимации оставшихся автокорреляций - АР или СС. Конечно, можно попросту испытать несколько моделей и посмотреть, какая из них работает лучше. Есть, однако, путь, менее экономящий затраты умственной энергии. Рассматривая графики АКФ и ЧАКФ ряда мы можем ориентировочно оценить нужное количество АР- и/или СС-членов. Как вы, конечно, помните, автокорреляционная функция (АКФ) состоит из обычных корреляций между рядом и им же, сдвинутым на одну, две и т.д. позиции, лаги. Аналогично, частная автокорреляционная функция (ЧАКФ) состоит из частных корреляций между рядом и им же, сдвинутым на один, два и т.д. лага.

Как известно, частная корреляция между двумя переменными - это та часть корреляции между ними, которую не удается объяснить их корреляциями с выбранным множеством других переменных. Например, если мы исследуем регрессию переменной Y на X1, X2 и X3, то частная корреляция между Y и X3 равняется корреляции между ними, оставшейся после того, как исключена их корреляция с X1 и X2.

Частная корреляция вычисляется как корреляция между остатками регрессии Y на X1, X2 и регрессии X3 на X1, X2. Она равна также корню квадратному из уменьшения дисперсии, которое возникает в результате добавления X3 к регрессии Y на X1, X2.

Автокорреляционная функция, АКФ, вычисляется как последовательность корреляций между рядом и им же, сдвинутым на 1, 2, ... временных точек, лагов. Автокорреляция при лаге 1 есть коэффициент корреляции между Y_t и Y_t-1, который равняется - ведь ряд стационарен! - коэффициенту корреляции между Y_t-1 и Y_t-2. (Собственно, это свойство и позволяет говорить об автокорреляционной функции и вычислять ее значения описанным образом.) Однако, если коррелированны Y_t и Y_t-1, а также Y_t-1 и Y_t-2, то естественно думать, что Y_t и Y_t-2 также коррелированны. (На самом-то деле, автокорреляция при лаге 2 равняется квадрату корреляции при лаге 1.) Таким образом, корреляция при лаге 1 "вызывает" корреляцию при лаге 2, а, соответственно, и при больших лагах. Потому-то и оказывается полезной частная автокорреляционная функция, ЧАКФ. Ее значение при лаге 1 совпадает с обычной автокорреляцией, отличия начинаются с лага 2. Значение ЧАКФ при лаге 2 равняется корреляции рядов Y_t и Y_t-2, причем считается исключенной их корреляция с рядом Y_t-1. Аналогично, ЧАКФ при лаге 3 равняется корреляции рядов Y_t и Y_t-3, причем считается исключенной их корреляция с рядами Y_t-1 и Y_t-2.

Вернемся к ряду М. Вот как выглядят АКФ и ЧАКФ этого ряда:

(a)
(b)

Автокорреляции значимы при больших значений аргумента. Но, быть может, автокорреляции при лагах, больших 2, велики только из-за «распространения» автокорреляции при лаге 1? Это предположение подтверждается графиком ЧАКФ (b), из которого мы видим, что значимым является лишь значение ЧАКФ при лаге 1. Это и означает, это и имеют в виду, когда говорят, что автокорреляции при больших лагах полностью объясняются автокорреляцией при лаге 1.

Частные автокорреляции при всех лагах можно вычислить, подгоняя последовательность авторегрессионный моделей с увеличивающимся числом членов. В частности, частная автокорреляция при лаге k равняется k-му коэффициенту AR(k) в авторегрессионной модели с k членами. То же самое по другому: если мы возьмем переменную Y и рассмотрим ее регрессию на переменные LAG(Y,1), LAG(Y,2), ..., LAG(Y,k), то коэффициент при переменной LAG(Y,j), как раз и будет равен j-й частной автокорреляции. Таким образом, вы можете определить нужное количество AR-членов, просто глядя на ЧАКФ ряда: если значения ЧАКФ значимы до лага k, а после него незначимы, следует начинать с авторегрессионной модели порядка k.

Наш ряд демонстрирует в точности описанное поведение: у его ЧАКФ пик при лаге 1 и более нет значимых значений. Это говорит нам, что если ряд не дифференцировать, то следует использовать модель AR(1). Однако, в данном конкретном случае такая модель эквивалентна однократному дифференцированию, поскольку коэффициент при AR(1)-члене (который равняется высоте пика ЧАКФ при лаге 1) почти в точности равняется 1. Действительно, рассмотрим уравнение AR(1) модели:

AR(1):Arima32 .

Если коэффициент phi при AR(1)-члене равен 1, то уравнение говорит нам, что первая (дискретная) производная ряда равна константе, т.е. что уравнение задает, на самом деле, модель случайного блуждания с линейным сносом:

Arima33

ЧАКФ ряда M говорит нам, что если мы не хотим дифференцировать ряд, то нам следует использовать модель AR(1), которая оказывается эквивалентной модели с первой производной. Другими словами, ряд M на самом деле нужно продифференцировать - это "стационаризует" его.

Признаки AR и MA. Если ЧАКФ резко обрывается, а АКФ убывает достаточно медленно (т.е. имеет значимые пики при достаточно больших лагах), мы говорим, что "стационаризованный" ряд демонстрирует AR-признаки, имея в виду, что наблюдаемые свойства автокорреляций ряда легко объясняются добавлением AR-членов, и трудно - добавлением MA-членов. Как правило, AR-признаки вызываются положительной автокорреляцией при лаге 1, т.е. обычно возникают в слегка недодифференцированных рядах. Причиной этого является то, что AR-член ведет себя в уравнении, как "частная производная". Например, в AR(1)-моделях он ведет себя как первая производная, если коэффициент при нем равен 1, и как частная производная, если коэффициент находится между 0 и 1. Таким образом, если ряд слегка недодифференцирован, т.е. если нестационарность, вызванная положительной автокорреляцией, не полностью элиминирована, AR-член "попросит" частную производную проявиться как AR-признак. Итак, мы приходим к следующему эмпирическому правилу:

Правило 6: Если ЧАКФ продифференцированного ряда резко обрывается в точке k и/или значение автокорреляции в точке k-1 положительно, т.е. если ряд выглядит слегка "недодифференцированным", следует попробовать добавить к модели авторегрессионный член. Значение аргумента k, после которого ЧАКФ "обрывается", - первый кандидат на порядок авторегрессионной части модели.

В принципе любую автокорреляционную картину можно смоделировать, добавляя в модель "стационаризованного" ряда достаточное количество авторегрессионных членов; ЧАКФ помогает нам определить их примерное число. Однако, это не всегда приводит к простейшей модели: иногда лучше добавлять СС-члены. Автокорреляционная функция для СС-членов играет ту же роль, которую для АР-членов играет ЧАКФ: значения АКФ говорят нам, сколько примерно СС-членов понадобится. Если значения АКФ значимы до лага k (после они незначимы), в модели, по-видимому, уместно использовать k СС-членов. В таких случаях говорят, что стационаризованный ряд демонстрирует "СС-признаки", имея в виду, что характер автокорреляций легче объясняется добавлением СС-членов, чем добавлением АР-членов.

СС-признаки, как правило, связывают с отрицательными автокорреляциями при лаге 1. Другими словами, они часто возникают в слегка передифференцированных рядах. Это можно объяснить тем, что СС-члены могут частично уравновесить дифференцирование в модели. В самом деле, вспомним, что модель ARIMA(0,1,1) без константы эквивалентна обычному экспоненциальному сглаживанию. Уравнение такой модели:

Arima34 ,

где СС(1)-коэффициент theta соответствует 1- в экспоненциальном сглаживании. Если коэффициент при СС(1)-члене равен 1, в соответствующей модели экспоненциального сглаживания =0, так что эта модель в качестве прогноза предлагает константу, поскольку модельное значение не корректируется. Это означает, что когда СС(1)-коэффициент равен 1, модель на самом деле аннулирует дифференцирование, а это приводит к тому, что прогноз экспоненциально сглаженной модели "приклеивается" к последнему наблюдению. С другой стороны, если СС(1)-коэффициент равен 0, модель сводится к модели случайного блуждания, т.е. оставляет только дифференцирование. Таким образом, если СС(1)-коэффициент больше 0, можно сказать, что мы слегка уменьшили порядок дифференцирования. Если ряд уже передифференцирован, т.е. если наблюдаются отрицательные автокорреляции, он "попросит" слегка уменьшить порядок дифференцирования, продемонстрировав СС-признаки. (Обратите внимание на высокую степень нестрогости всех этих рассуждений!) Итак, мы приходим к следующему эмпирическому правилу:

Правило 7: Если АКФ продифференцированного ряда резко обрывается и/или значение АКФ в точке k-1 отрицательно, т.е. ряд выглядит слегка передифференцированным, следует ввести в модель СС-члены. Значение аргумента k, при котором АКФ обрывается, - первый кандидат на порядок СС-части модели.

Модель ARIMA(2,1,0) для ряда М. Мы уже определили, что ряд М требуется продифференцировать (по крайней мере) один раз. АКФ и ЧАКФ производной выглядят так:

Обратите внимание на то, что (а) корреляция при лаге 1 значима и положительная; (б) у ЧАКФ "обрыв" более крутой, чем у АКФ. В частности, у ЧАКФ ровно два значимых значения, в то время как у АКФ - целых четыре. Таким образом, согласно правилу 7, продифференцированный ряд демонстрирует нам признаки AR(2). Вот как выглядят графики АКФ и ЧАКФ для остатков модели ARIMA(2,1,0):

Автокорреляции в самых важных лагах - лагах 1 и 2 - "ушли", отсутствуют сколько-нибудь выраженные закономерности при больших лагах. На графике остатков мы наблюдаем, тем не менее, не вполне удовлетворяющую нас тенденцию: ряд "блуждает" вокруг среднего,

Однако, из результатов, выдаваемым процедурой ARIMA, мы видим, что модель, тем не менее, ведет себя вполне удовлетворительно. Оба АР-коэффициента значимо отличаются от нуля. Единичный корень не грозит нашей модели, поскольку сумма АР-коэффициентов (.248 + .199=.447) достаточно далека от 1. В целом, довольно хорошая модель!

MODEL: MOD_7 Model Description: Variable: M Regressors: NONE Non-seasonal differencing: 1 No seasonal component in model. Parameters: AR1 ________ < value originating from estimation > AR2 ________ < value originating from estimation > CONSTANT ________ < value originating from estimation > 95,00 percent confidence intervals will be generated. Split group number: 1 Series length: 150 No missing data. Melard's algorithm will be used for estimation. Termination criteria: Parameter epsilon: ,001 Maximum Marquardt constant: 1,00E+09 SSQ Percentage: ,001 Maximum number of iterations: 10 Initial values: AR1 ,24929 AR2 ,20046 CONSTANT ,41376 Marquardt constant = ,001 Adjusted sum of squares = 267,56021 Conclusion of estimation phase. Estimation terminated at iteration number 1 because: Sum of squares decreased by less than ,001 percent. FINAL PARAMETERS: Number of residuals 149 Standard error 1,3529082 Log likelihood -255,04718 AIC 516,09437 SBC 525,10621 Analysis of Variance: DF Adj. Sum of Squares Residual Variance Residuals 146 267,55893 1,8303607 Variables in the Model: B SEB T-RATIO APPROX. PROB. AR1 ,24850814 ,08096306 3,0694015 ,00255794 AR2 ,19880504 ,08101270 2,4539985 ,01530411 CONSTANT ,41382162 ,19898260 2,0796875 ,03930264 The following new variables are being created: Name Label FIT_1 Fit for M from ARIMA, MOD_7 CON ERR_1 Error for M from ARIMA, MOD_7 CON LCL_1 95% LCL for M from ARIMA, MOD_7 CON UCL_1 95% UCL for M from ARIMA, MOD_7 CON SEP_1 SE of fit for M from ARIMA, MOD_7 CON 30 new cases have been added.

Прогноз за пределы обучающего периода демонстрирует линейный тренд.

Тренд в долговременном прогнозе возникает из-за того, что в модель входят (несезонная) производная и константа - модель, таким образом, является случайным блужданием со сносом, аппроксимируемым двумя АР-членами. Итак, уравнение модели выглядит следующим образом:

Arima43 ,

где - константа, равная .41382162, а ₁ и ₂ - коэффициенты при АР-членах, равные соответственно .24850814 и .19880504 (см. приведенные выше результаты работы процедуры ARIMA).

Дескриптивные статистики

	N	Среднее	Стд. отклонение
D1.M	149	.4201	1.4440

Другая модель для ряда М - ARIMA(0,2,1)

Напомню, что когда мы начали анализировать ряд, мы не были вполне уверены в порядке производной. Производная первого порядка дала нам ряд с минимальным стандартным отклонением и умеренной положительной автокорреляцией, зато производная второго порядка выглядит более стационарной, хотя и сильнее автокоррелированной. Вот графики АКФ И ЧАКФ второй производной:

На графике АКФ мы видим единственный отрицательный пик при лаге 1, который, согласно правилу 8, интерпретируем как МА(1)-признак. Таким образом, если мы захотим работать с второй производной, нам понадобится также включить в модель МА(1)-член, что приводит нас к модели ARIMA(0,2,1). Согласно правилу 5 нам лучше исключить из модели постоянный член. Вот как выглядят результаты подгонки модели ARIMA(0,2,1) без константы:



Variable:   M
Regressors: NONE

Non-seasonal differencing: 2
No seasonal component in model.

Parameters:
MA1      ________  < value originating from estimation >

95,00 percent confidence intervals will be generated.

Split group number: 1  Series length: 150
No missing data.
Melard's algorithm will be used for estimation.

Termination criteria:
Parameter epsilon: ,001
Maximum Marquardt constant: 1,00E+09
SSQ Percentage: ,001
Maximum number of iterations: 10

Initial values:

MA1        ,61450

Marquardt constant = ,001
Adjusted sum of squares = 284,01314

Conclusion of estimation phase.
Estimation terminated at iteration number 4 because:
   Sum of squares decreased by less than ,001 percent.

FINAL PARAMETERS:
Number of residuals  148
Standard error       1,370614
Log likelihood       -256,5688
AIC                  515,13759
SBC                  518,13481

            Analysis of Variance:

               DF  Adj. Sum of Squares    Residual Variance

Residuals     147            277,68306            1,8785828

           Variables in the Model:

               B         SEB     T-RATIO   APPROX. PROB.

MA1    ,74759244   ,05523238   13,535401        ,0000000

The following new variables are being created:

  Name        Label

  FIT_2       Fit for M from ARIMA, MOD_14 NOCON
  ERR_2       Error for M from ARIMA, MOD_14 NOCON
  LCL_2       95% LCL for M from ARIMA, MOD_14 NOCON
  UCL_2       95% UCL for M from ARIMA, MOD_14 NOCON
  SEP_2       SE of fit for M from ARIMA, MOD_14 NOCON

30 new cases have been added.

Уравнение для этой модели выглядит следующим образом:

где ₁ - коэффициент при МА(1)-члене. Взгляните на это соотношение внимательнее! Узнаете экспоненциальное сглаживание? Коэффициент ₁ равняется 2*(1-), где alpha - весовой коэффициент из модели экспоненциального сглаживания. Поскольку ₁ = 0.75, экспоненциальное сглаживание с около 0.63 должно примерно так же соответствовать данным. Оказывается, оптимальное значение alpha равно примерно 0.61, что не слишком далеко от 0.63.

--------

Все три модели ведут себя примерно одинаково в обучающем периоде, а в экзаменационном ARIMA(2,1,0) выглядит чуточку лучше. Основываясь только на приведенных статистических результатах, трудно остановиться на какой-либо одной модели. Однако, если мы посмотрим на график, мы увидим, что ARIMA(0,2,1) без константы (которая, как мы видели, во всем существенном совпадает с моделью экспоненциального сглаживания) сильно отличается от ARIMA(2,1,0).

Мы видим, что у прогноза имеется тренд, который несколько меньше, чем тренд предыдущей модели - поскольку тренд у конца ряда слегка меньше среднего тренда ряда. Зато доверительные границы растут намного быстрее. Модель с производной второго порядка предполагает, что тренд ряда изменяется со временем, поэтому ближайшее будущее с "точки зрения" этой модели намного менее определенно, чем с "точки зрения" модели с производной первого порядка.

Какую же модель выбрать?

Это зависит от предположений о характере тренда, которые мы готовы принять. Если мы предполагает, что тренд - константа, то нам подходит модель с производной первого порядка. Такая модель чрезвычайно оптимистично оценивает надежность прогноза на одну точку вперед. Модель с производной второго порядка более подходит, если мы считаем, что характер тренда непостоянен, что тренд меняется со временем. Такая модель близка к линейному экспоненциальному сглаживанию, которое и разработано для случаев с неустойчивым трендом. При прочих равных, нужно, конечно, выбирать модели с наименьшим возможным порядком производной. Как правило, модели случайного блуждания и простое экспоненциальное сглаживание работают лучше, чем линейное экспоненциальное сглаживание.

Смешанные модели

Во многих случаях лучшими оказываются "чистые" модели - либо авторегрессионные, либо модели скользящего среднего. В тех случаях, когда это не так, когда данные лучше аппроксимирует смешанная модель, нужно тщательно подбирать AR- и MA-порядки, поскольку AR- и MA-члены взаимозависимы и взаимозаменяемы. Вполне может оказаться, что два таких члена "гасят" друг друга, хотя оба оказываются значимыми, если основываться на t-статистике для их коэффициентов. Пусть, например, "истинной" является модель ARIMA(0,1,1), а мы оцениваем модель ARIMA(1,1,2). Излишние члены могут оказаться значимыми в модели, но на деле они работают "противоположных направлениях". В процесс оценки параметров окажется неустойчивым и потребует много (скажем, больше 10) итераций. Итак, вот наше

Правило 8: Вполне может случиться, что АР- и СС-члены взаимно "аннигилируют". Поэтому, если вы подгоняете смешанную модель, не поленитесь исследовать модель, в которой на 1 меньше АР-членов, а также модель, в которой на 1 меньше СС-членов. Это особенно важно, когда процесс подгонки исходной модели требует много итераций; 10 итераций - это уже много.

По этой причине при идентификации модели АРПСС не применимо пошаговое исключение. Другими словами, вы не можете включить лишние АР- и СС-члены, а потом исключать по одному те из них, при которых коэффициенты окажутся незначимыми. Вместо этого следует использовать пошаговое включение, добавляя нужные члены в соответствии с поведением АКФ и ЧАКФ.

Единичные корни

Признаком того, что ряд сильно пере- или сильно недодифференцирован, часто является единичный корень в оцененных АР- или СС-коэффициентах модели. Про единичный корень у АР(1)-модели говорят в случае, когда оценка АР(1)-коэффициента примерно равна 1. В подобных случаях АР(1)-член эквивалентен взятию первой производной, так что следует отказаться от АР-члена и честно продифференцировать ряд. (Вы столкнетесь с такой ситуацией, если попытаетесь подогнать модель ARIMA(1,0,0) для ряда M.) При работе с АР-моделями более высокого порядка о единичном корне говорят, когда сумма АР-коэффициентов в точности равна 1. В подобных ситуациях следует уменьшить АР-порядок модели на 1 и увеличить на 1 порядок дифференцирования. Временной ряд с единичным корнем нестационарен и, значит, "хочет", чтобы его продифференцировали.

Правило 9: Если в АР-части модели имеется единичный корень, т.е. если сумма АР-коэффициентов равна 1, следует уменьшить на единицу число АР-членов и увеличить на единицу порядок дифференцирования.

Аналогично, говорят, что у СС(1)-модели имеется единичный корень, когда СС(1)-коэффициент в точности равен 1. В подобной ситуации СС(1)-член точно "отменяет" одно дифференцирование; другими словами, следует уменьшить СС-порядок модели на 1 и на 1 уменьшить порядок дифференцирования. При работе с СС-моделями более высокого порядка о единичном корне говорят, когда сумма СС-коэффициентов в точности равна 1.

Правило 10: Если в СС-части модели имеется единичный корень, т.е. если сумма СС-коэффициентов равна 1, следует уменьшить на 1 число СС-членов и уменьшить на 1 порядок дифференцирования.

Если, например, вы подгоняете модель линейного экспоненциального сглаживания (т.е. ARIMA(0,2,2)), в то время, как достаточным было бы простое экспоненциальное сглаживание (т.е. ARIMA(0,1,1)), то вы вполне можете получить два СС-коэффициента, сумма которых близка к 1. Уменьшив СС-порядок и порядок дифференцирования на 1 каждый, вы и получите более адекватную модель простого экспоненциального сглаживания. Модель прогноза с единичным корнем в оцененных СС-коэффициентах иногда называют необратимой, имея в виду, что остатки такой модели нельзя рассматривать как оценки "истинного" случайного шума, лежащего в основе анализируемого временного ряда.

Другим симптомом единичного корня является неестественный характер прогноза. Если график долговременного прогноза временного ряда выглядит странно, например, его тренд имеет "взрывной" характер, следует проверить коэффициенты модели - нет ли там единичного корня.

Правило 11: Если долговременный прогноз оказывается в каком бы то ни было смысле неустойчивым или странным, следует проверить коэффициенты модели на присутствие единичного корня.

Обратите внимание на то, что ни одна из этих проблем не возникла в рассмотренных здесь моделях. Объяснение совсем простое - мы тщательно подбирали подходящий порядок дифференцирования и количества АР- и СС-членов. Идентификация модели основывалась на графиках АКФ и ЧАКФ.

2. Сезонные модели

Сезонная часть модели АРПСС строится по той же схеме, что и ее несезонная часть: у нее может быть АР- и/или СС-часть, в нее также может быть включена (дискретная сезонная) производная. В сезонной части модели все эти составляющие оперируют с последовательными членами ряда, расположенными на расстоянии s друг от друга, где s - число отсчетов на период.

Сезонная модель АРПСС обозначается так: ARIMA(p,d,q)* (P,D,Q), где P - количество сезонных АР(САР)-членов, D - порядок сезонной производной, Q - количество сезонных СС(ССС)-членов.

При идентификации сезонной модели прежде всего определите, нужна ли в модели сезонная производная? Нельзя ли "обменять" ее на обычную (несезонную) производную? Может быть, стоит использовать сезонную производную вместо обычной? Принять это решение вам помогут графики АКФ и ЧАКФ для всех возможных комбинаций сезонной и несезонной производных нулевого и первого порядков. Предупреждения: никогда не пользуйтесь сезонной производной порядка выше 1; никогда не пользуйтесь моделями, в которых сумма порядков сезонной и несезонной производных больше 2.

Если сезонная зависимость достаточно сильна и устойчива (скажем, значения высоки летом и малы зимой или наоборот), то, по-видимому, следует включить в модель сезонную производную вне зависимости от того, включена ли в модель обычная, несезонная, производная. Если этого не сделать, сезонная компонента будет убывать при долговременном прогнозе. Итак, добавим к нашему списку правил следующее:

Правило 12: Если ряд демонстрируют достаточно явственную и устойчивую сезонную компоненту, следует включить в модель сезонную производную. Не используйте сезонные производные порядка, большего 1; не пользуйтесь моделями, у которых сумма порядков сезонной и несезонной производных больше двух.

Сезонные АР- и СС-проявления схожи с их несезонными аналогами. Различие проявляется только в том, что на графиках АКФ и ЧАКФ они отстоят друг от друга на лаг s.

Например, у чистого процесса ССС(1) мы найдем пики АКФ при лагах s, 2s, 3s и т.д., а ЧАКФ равна нулю после лага s.

У чистого процесса САР(1) мы, напротив, увидим пики ЧАКФ при лагах s, 2s, 3s и т.д., а после лага s равна нулю АКФ.

Признаки САР наблюдаются, как правило, когда автокорреляции в лагах s, 2s, 3s и т.д. положительны, а признаки ССС - когда они отрицательны. Таким образом,

Правило 13: Если автокорреляции в сезонных точках положительны, попробуйте включить в модель САР-члены. Если же эти автокорреляции отрицательны, включайте в модель ССС-члены. Не смешивайте САР- и ССС-члены в модели, избегайте включения более одного из них.

Как правило, достаточно, чтобы модель была либо САР(1), либо ССС(1). Модели с САР(2) или с ССС(2) встречаются редко, еще реже у вас хватит данных, чтобы оценить коэффициенты подобных моделей. В самом деле, чтобы оценить коэффициенты, вам понадобится 4-5 сезонных периода. Таким образом, как правило, рассматриваются модели АРПСС лишь с небольшим числом параметров; таким образом, наиболее популярной сезонной моделью АРПСС оказывается ARIMA(0,1,1)*(0,1,1), т.е. модель АР(1)*ССС(1) с сезонной и несезонной производными. Узнали модель сезонного экспоненциального сглаживания?

На эту страницу можно попасть по одному из следующих адресов:
http://learn.at/infoscope/Statistics/trends/ARIMA/ModellingRules/index.html
http://read.at/infoscope/Statistics/trends/ARIMA/ModellingRules/index.html
http://now.at/infoscope/Statistics/trends/ARIMA/ModellingRules/index.html

Дата последней модификации: 25 октября 2000 г.

Hosted by www.Geocities.ws