9.1 Сущность и причины автокорреляции в остатках
Автокорреляция в остатках обычно встречается при регрессионном анализе временных рядов, и почти не встречается при анализе пространственных выборок. Чаще встречается положительная автокорреляция. Она в большинстве случаев вызывается направленным постоянным воздействием некоторых неучтенных в модели факторов. При положительной автокорреляции остатки изменяются монотонно с течением времени наблюдения, а при отрицательной – следует частое изменение знака остатка.
Среди базовых причин автокорреляции можно выделить следующие:
а) ошибки спецификации – неучет в модели какой-то важной объясняющей переменной или неверный выбор вида функции, что ведет к систематическим отклонениям точек наблюдения от линии регрессии,
б) инерция – запаздывание реакции экономической системы на изменение факторов,
в) сглаживание данных.
Последствия автокорреляции в остатках такие же, как и в случае гетероскедастичности (потеря эффективности, смещение дисперсий оценок параметров, занижение стандартных ошибок и завышение t –статистик параметров), а это может повлечь признание незначимых факторов значимыми. Вследствие перечисленных обстоятельств, прогнозные качества модели ухудшаются.
При анализе временных рядов вместо индекса i часто будем использовать время t , а вместо числа наблюдений n будем писать – продолжительность интервала наблюдения временного ряда.
Мы будем рассматривать автокорреляцию первого порядка, так как в большинстве практических случаев автокорреляционная функция быстро убывает.
Коэффициент автокорреляции 1-го порядка в остатках:
В случае если данный коэффициент корреляции существенно отличен от 0, то можно говорить о наличии автокорреляции.
9.2. Обнаружение автокорреляции в остатках
1. Графический метод – при использовании этого метода строится график: ε t есть функция от ε t – 1 . В случае если в графике прослеживается отчетливая положительная или отрицательная тенденция, то, скорее всего, имеет место соответствующая автокорреляция в остатках.
2. Метод рядов
В моменты времени определяются знаки отклонений, к примеру:
– для 20-ти наблюдений.
Рядом называют непрерывную последовательность одинаковых знаков (ряд ограничен скобками, в примере приведено 5 рядов). Количество знаков называют длиной ряда. В случае если рядов мало по сравнению с числом наблюдений, то вполне вероятна положительная автокорреляция, в случае если рядов много, – то отрицательная.
Для более детального анализа используется следующая процедура:
Пусть - число знаков ʼʼ+ʼʼ,
Число знаков ʼʼ–ʼʼ,
Количество рядов.
При достаточном количестве наблюдений и при отсутствии автокорреляции в остатках случайная величина имеет асимптотически нормальное распределение со следующими параметрами:
Тогда, в случае если k лежит внутри интервала
то гипотеза об отсутствии автокорреляции не отклоняется; если лежит левее данного интервала, то есть положительная автокорреляция, а если правее – то отрицательная автокорреляция. Здесь γ – уровень значимости гипотезы об отсутствии автокорреляции. Стоит сказать, что для небольших и существует таблица Сведа–Эйзенхарта͵ в которой по значениям и находятся и .
В случае если k 1 < k < k 2 , то автокорреляция отсутствует, в случае если k < k 1 – есть положительная автокорреляция, в случае если k > k 2 – есть отрицательная автокорреляция.
3. Тест Дарбина-Уотсона (DW ). Это – самый популярный тест: ─ критерий Дарбина – Уотсона.
Установим связь между этим критерием и коэффициентом корреляции:
учитывая, что и , получим:
Процедура обнаружения автокорреляции по критерию DW такова:
1. Вычисляется критерий DW , для чего должна быть выполнена регрессия y на x и определены остатки. Далее выдвигается гипотезаоб отсутствии автокорреляции в остатках.
2. По таблице критических значений теста Дарбина–Уотсона для назначенного уровня значимости γ , числа наблюдений n и числа факторов p определяются верхняя du и нижняя dl критические точки
3. Строятся области: I–от 0 до dl ; II–от dl до du; III–от du до 4–du ; IV– от 4–ul до 4–dl и V–от 4–dl до 4.
Это поясняется табл. 9.1.
таблица 9.1
При использовании критерия следует учитывать следующие ограничения:
а) он применим лишь для модели с ненулевым свободным членом,
в) временной ряд должен иметь одинаковую периодичность, то есть не должно быть пропусков наблюдений,
где - коэффициент авторегрессии, - количество наблюдений, – дисперсия коэффициента c 1 в уравнении авторегрессии y t = a + bx t + c 1 y t - 1 +…+ ε t , c 1 – коэффициент при в упомянутом уравнении.
Как использовать h – статистику?
Стоит сказать, что для назначенного уровня значимости γ выдвигают гипотезу об отсутствии автокорреляции в остатках, ᴛ.ᴇ. полагают, что в модели AR(1) остатков и статистика h имеет стандартное нормальное распределение: .
По таблице функции Лапласа определяют критическую точку такую, что . В случае если , то отклоняется. В противном случае не отклоняется и автокорреляция не признается.
9.3. Методы устранения автокорреляции
1.Обобщенный МНК (ОМНК)
Рассмотрим исходную модель в моменты времени t
и t
–1:
– есть случайная величина, так как и – случайные величины,
Так как и .
Остаток не коррелирует ни с одним регрессором, следовательно, можно применить классический МНК. Оценка параметра b вычисляется непосредственно, а оценка параметра a вычисляется так: .
ОМНК может применяться для данных, начиная с момента , ᴛ.ᴇ. первое наблюдение теряется; его можно восстановить для и , используя поправку Прайса–Уинстена.
Рассматривая последовательность остатков как временной ряд, можно построить график их зависимости от времени. В соответствии с предпосылками МНК остатки должны быть случайными. Однако при моделировании временных рядов нередко встречается ситуация, когда остатки содержат тенденцию или циклические колебания. Это свидетельствует о том, что каждое следующее значение остатков зависит от предшествующих. В этом случае говорят об автокорреляции остатков.
Автокорреляция в остатках может быть вызвана несколькими причинами, имеющими различную природу.
- 1. Она может быть связана с исходными данными и вызвана наличием ошибок измерения в значениях результативного признака.
- 2. В ряде случаев автокорреляция может быть следствием неправильной спецификации модели. Модель может не включать фактор, который оказывает существенное воздействие на результат и влияние которого отражается в остатках, вследствие чего последние могут оказаться автокоррелированными.
Существуют два наиболее распространенных метода определения автокорреляции остатков:
- 1) построение графика зависимости остатков от времени и визуальное определение наличия или отсутствия автокорреляции.
- 2) использование критерия Дарбина -- Уотсона и расчет величины:
Таким образом, d есть отношение суммы квадратов разностей последовательных значений остатков к остаточной сумме квадратов по модели регрессии.
Алгоритм выявления автокорреляции остатков на основе критерия Дарбина -- Уотсона следующий. Выдвигается гипотеза Н0 об отсутствии автокорреляции остатков. Альтернативные гипотезы Н1 и Н1* состоят, соответственно, в наличии положительной или отрицательной автокорреляции в остатках.
Далее по специальным таблицам определяются критические значения критерия Дарбина -- Уотсона dL и dU для заданного числа наблюдений n, числа независимых переменных модели k и уровня значимости б . По этим значениям числовой промежуток разбивают на пять отрезков. Принятие или отклонение каждой из гипотез с вероятностью осуществляется следующим образом:
есть положительная автокорреляция. Принимается гипотеза H1 с вероятностью (1- б ).
зона неопределенности.
автокорреляция остатков нет.
зона неопределенности.
есть отрицательная автокорреляция. Принимается гипотеза H1* с вероятностью (1-б).
Если фактическое значение критерия Дарбина -- Уотсона попадает в зону неопределенности, то на практике предполагают существование автокорреляции остатков и отклоняют гипотезу Hо.
Есть несколько существенных ограничений на применение критерия Дарбина -- Уотсона:
- 1. Он неприменим к моделям, включающим в качестве независимых переменных лаговые значения результативного признака, т.е. к моделям авторегрессии.
- 2. Методика расчета и использования критерия Дарбина-Уотсона направлена только на выявление автокорреляции остатков первого порядка.
- 3. Критерий Дарбина-Уотсона дает достоверные результаты только для больших выборок.
3 Проверка автокорреляции остатков
При наличии автокорреляции в остатках et оценки коэффициентов регрессии модели, полученные МНК, не будут иметь оптимальные статистические свойства (стандартная ошибка уравнения регрессии и построенные на ее основе доверительные интервалы ненадежны). Автокорреляция в остатках свидетельствует о неудачном подборе модели, о ее несовершенстве. Классические методы математической статистики лишь тогда применимы, когда отдельные члены статистического ряда независимы (некоррелированы). Но и при предпосылке нормального распределения и отсутствия автокорреляции в генеральной совокупности, из которой временной ряд взят, нельзя, к сожалению, разработать точной проверки автокорреляции при малых выборках. Ниже рассмотрены три приема проверки автокорреляции.
1. Один из возможных путей приближенной оценки автокорреляции основывается на использовании первого эмпирического нециклического коэффициента автокорреляции . К сожалению, распределение этого коэффициента для выборок из нормально распределенной, не автокоррелированной генеральной совокупности неизвестно. Поэтому мы пользуемся введенным Р.Л. Андерсоном циклическим коэффициентом автокорреляции, который определяется следующим образом:
(4.14)
Циклическим коэффициентом автокорреляции для сдвига является коэффициент автокорреляции между рядами и . При этом мы предполагаем, что временной ряд повторяется, т.е. что за последним членом xn снова следуют члены x1,x2,... Для циклический коэффициент автокорреляции первого порядка будет коэффициентом корреляции между рядами и x2 ,x3 ,...,xn , x1 . Для больших выборок циклический коэффициент автокорреляции и нециклический коэффициент автокорреляции практически совпадают, для малых выборок их равенство приблизительно. Расчетное значение сравнивается при данной численности наблюдений n с граничными значениями (табл. П.5 Приложения). При положительной автокорреляции оно признается существенным для , если выполняется неравенство > , в противном случае, если , она отсутствует. При отрицательной автокорреляции оно признается существенным, если < , а несущественной - при . Изложенный выше метод может быть использован и для проверки автокорреляции остатков . В последнем случае автокорреляционная функция принимает более простой вид:
(4.15)
2. Для проверки значимости автокорреляции чаще всего используют критерий Дарбина-Уотсона (иногда его обозначают DW). Построенный на основе гипотезы о существовании автокорреляции первого порядка: (4.16)
Где n
- длина временного ряда. Величина d
имеет симметрическое распределение со средней, равный 2. При отсутствии автокорреляции значение , при полной положительной - d=0
, при полной отрицательной - d=4
.
Расчетное значение d
сравнивают с граничными его значениями dL
и dU
, при этом возможны следующие случаи:
Таблица 4.3
Значение d |
Суждение |
0 £ d < dL |
имеется положительная автокорреляция |
неопределенность |
Значения dL и dU табулированы (табл. П.7 Приложения) для значений n в интервале 7-100. В этой таблице v означает число независимых переменных в уравнении регрессии. Для функции вида xt =x (t) , v=1 .
3. Иногда вместо статистики Дарбина-Уотсона используется средняя Неймана Q:
(4.17)
(4.18)
(4.19)
Если вычисленное по формуле (4.17) значение Q
меньше некоторого критического для данного числа наблюдений n
значения (для ), то мы говорим о положительной автокорреляции остатков, если больше значения - то об отрицательной автокорреляции. Эти значения приводятся в табл. П.8 Приложения.
Пример 20.
Проверим наличие автокорреляции остатков, полученных в результате моделирования временного ряда примера 1 (см. пример 18).
Прием 1.
(через циклический коэффициент автокорреляции).
Первый эмпирический нециклический коэффициент автокорреляции рассчитываем по следующим данным:
1 9 |
12,051 8,541 |
В эконометрических исследованиях часто возникают ситуации, когда дисперсия остатков постоянна, но наблюдается статистическая зависимость остатков эконометрической модели между собой. Это явление называют автокорреляцией остатков .
В общем случае автокорреляция (последовательная корреляция) – это взаимосвязь упорядоченных во времени или в пространстве последовательных элементов соответственно временного или пространственного ряда данных.
На рис.5.5 показана зависимость Y от X , а также линия оцененного по этим данным уравнения парной линейной регрессии. Уже по рисунку видно, что оцененная регрессия не очень хороша: зависимость Y от X явно нелинейна. Если использовать проведенную регрессионную прямую, скажем, для прогнозирования дальнейшей динамики Y , результат будет неудовлетворительным.
Рис.5.5. К вопросу об автокорреляции остатков
Как же можно выразить формально неудовлетворительность полученного уравнения регрессии?
Мы видим, например, на рис.5.5, что в этом случае отклонения от линии регрессии не случайно распределены вокруг нее, а обладают определенной закономерностью. Эта закономерность, в частности, выражается в одинаковом, как правило, знаке каждых двух соседних отклонений . Это может являться следствием:
Неверной спецификации модели (ввиду нелинейного характера связи переменных);
Воздействием какого-то фактора, не включенного в модель в качестве объясняющей переменной. Величина такого неучтенного фактора может менять свою динамику в рассматриваемый период, отклоняясь в достаточно длительные промежутки времени в ту или иную сторону от своего среднего значения. Это, очевидно, может служить причиной длительных устойчивых отклонений зависимой переменной от линии регрессии.
Обе указанные причины свидетельствуют о том, что существует возможность улучшить уравнение регрессии путем оценивания какой-то новой нелинейной формулы или включения некоторой новой объясняющей переменной.
Зависимость, показанная на рис.5.5, очевидно, нелинейна. Но это – крайний случай. Далеко не всегда бывает столь же очевидно, что отклонения от регрессионной прямой имеют неслучайный, закономерный характер. Для оценки степени такой неслучайности необходимо ввести количественную меру .
Итак, одним из основных предполагаемых свойств отклонений наблюдаемых значений от регрессионной формулы является их статистическая независимость между собой .
Мы рассмотрим наиболее простую модель, в которой ошибки образуют так называемый авторегрессионный процесс первого порядка , т.е. когда ошибки зависят только от ошибок предыдущего периода. Применение обычного метода наименьших квадратов в этом случае дает несмещенные и состоятельные оценки параметров, однако можно показать, что оценка дисперсии оказывается смещенной вниз , что может отрицательно сказаться при проверке гипотез о значимости оценок параметров. Образно говоря, МНК рисует более оптимистичную картину, чем есть на самом деле.
Следовательно, последствия автокорреляции состоят в том, что:
- оценка дисперсии при использовании МНК является заниженной .
Большинство тестов на наличие автокорреляции в ошибках модели (наиболее широко используется тест Дарбина-Уотсона ) используют следующую идею: если корреляция есть у ошибок , то она присутствует и в остатках , получаемых после применения к модели обычного метода наименьших квадратов.
То есть, поскольку значения ошибок остаются неизвестными ввиду неизвестности истинных значений параметров модели, то проверяется статистическая независимость их аналогов – отклонений . При этом проверяется обычно их некоррелированность (являющаяся необходимым, но недостаточным атрибутом независимости ), причем некоррелированность не любых, а соседних величин .
- соседние во времени значения (в случае временных рядов);
- соседние по возрастанию переменной Х значения (в случае перекрестных выборок).
“Первого порядка ” означает, что остатки зависят только от остатков предыдущего периода.
Практически, однако, используют тесно связанную с статистику Дарбина-Уотсона, обозначаемую как DW-статистика или как d‑статистика , и рассчитываемую по формуле:
. (5.13)
.