Тест чоу как сделать

Добавил пользователь Alex
Обновлено: 05.10.2024

Тест Чоу ( китайский : 鄒檢定 ), предложенный эконометчиком Грегори Чоу в 1960 году, является проверкой того, равны ли истинные коэффициенты в двух линейных регрессиях на разных наборах данных. В эконометрике он чаще всего используется в анализе временных рядов для проверки наличия структурного разрыва в период, который можно считать известным априори (например, крупное историческое событие, такое как война). При оценке программ часто используется тест Чоу, чтобы определить, оказывают ли независимые переменные разное влияние на разные подгруппы населения.

СОДЕРЖАНИЕ

Применение теста Чау

Структурный разрыв (уклоны различаются)	Оценка программы (точки пересечения различаются)

При есть структурный разрыв; отдельные регрессии на подынтервалах и дают лучшую модель, чем комбинированная регрессия (пунктирная линия) на всем интервале. Икс знак равно 1,7 [ 0 , 1,7 ] [ 1,7 , 4 ]	Сравнение двух разных программ (красный, зеленый) в общем наборе данных: отдельные регрессии для обеих программ дают лучшую модель, чем комбинированная регрессия (черный).

Предположим, что мы моделируем наши данные как

Если мы разделим наши данные на две группы, то мы получим

Позвольте быть суммой квадратов остатков из объединенных данных, быть суммой квадратов остатков из первой группы и быть суммой квадратов остатков из второй группы. и - количество наблюдений в каждой группе, и - общее количество параметров (в данном случае 3, т.е. 2 коэффициента независимых переменных + точка пересечения). Тогда статистика критерия Чоу равна S C > S 1 > S 2 > N 1 > N 2 > k

Тот же результат может быть достигнут с помощью фиктивных переменных.

Которая выполняется по i = .

D - фиктивная переменная, принимающая значение 1 для i = < +1, . n>и 0 в противном случае. n 1 >

Если оба набора данных могут быть полностью объяснены, то фиктивная переменная бесполезна, поскольку набор данных полностью объясняется ограниченным уравнением. То есть при условии отсутствия структурных изменений у нас есть нулевая и альтернативная гипотеза: ( β 0 , β 1 , . . . , β k ) ,\beta _. \beta _)>

Нулевая гипотеза о совместной незначимости D может быть запущена как F-тест с n-2 (k + 1) степенями свободы. То есть: . F = ( R S S R − R S S U ) / ( k + 1 ) R S S U / D o F -RSS^)/(k+1)>>>

Если исследователь предполагает, что за время наблюдений произошли резкие структурные изменения в виде связей между зависимой и независимыми переменными, то для проверки этой гипотезы используют тест Чоу. В этом случае строятся три регрессионные модели: первая по наблюдениям, проведенным до изменений, вторая по наблюдениям после происшедших изменений в структуре связей, а третья по всей выборке наблюдений. Нулевая гипотеза состоит в предположении о равенстве истинных соответствующих параметров регрессии для всех моделей. Нулевая гипотеза отвергается при уровне значимости \alpha , если наблюдаемая -статистика

Рассмотрим пример. Пусть временной ряд урожайности зерновых культур в России, график которого представлен на рис. 3.1.

Следует проверить гипотезу об изменении в тенденции поведения ряда, которое произошло после распада СССР, т.е. после 1991 г., вследствие ухудшения снабжения сельскохозяйственного производства горюче-смазочными материалами (ГСМ), удобрениями, сельскохозяйственной техникой.

Таблица 3.13

Таблица 3.14

$\sum^<44> Сумма квадратов остатков при этом равна _ e_^ = 138,2942.$

Получим уравнение для оставшейся части наблюдений за 1991-2001 гг. (табл. 3.15). Имеем .

Таблица 3.15

Сумма квадратов остатков при этом равна

Наблюдаемая -статистика Чоу равна

$\alpha = 0,01$

При

$F_ (\alpha ; p + 1; n - 2p - 2) = F_(0,01; 2; 50) = 5,057.$

Нулевая гипотеза об отсутствии изменения в тенденции поведения ряда урожайности в России после распада СССР уверенно опровергается на 1%-ном уровне значимости.

3.13. Выбор модели оптимальной сложности. Критерии Акайке и Шварца

При построении модели, адекватно описывающей изучаемый процесс в экономике, очень важную роль играет анализ правильности ее спецификации. Отрицательно на объясняющих свойствах модели сказывается как отсутствие значимой переменной, так и избыточное присутствие незначимой объясняющей переменной.

В случае когда в модель не включена существенная переменная (существенной называют переменную, которая должна быть в модели согласно правильной теории), наблюдаются следующие последствия:

исчезает возможность правильной оценки и интерпретации уравнений;
коэффициенты при оставшихся переменных становятся смещенными;
стандартные ошибки коэффициентов и t-статистики некорректны и поэтому не могут быть использованы для суждения о качестве подгонки предлагаемой модели.

Предположим, к примеру, что из модели X_ + \beta _X_ + \varepsilon _" />
исключена переменная " />
. Тогда в новой спецификации фактически рассматривается модель = \alpha + \beta _X_ + u_, где u_ = \beta _X_ + \varepsilon _" />
.

Если объясняющие переменные" />
и" />
коррелированы, то нарушается предпосылка теоремы Гаусса - Маркова о некоррелированности случайного члена и регрессоров, поскольку в этом случае между" />
и существует ненулевая корреляция. Оценки, полученные по методу наименьших квадратов для данной модели, уже не являются эффективными среди линейных оценок.

$\beta _<1> Они даже не являются несмещенными, поскольку для МНК-оценки коэффициента$
в этом случае получаем: .

Наблюдается смещение, равное

Включение несущественной переменной в модель не приводит к смещению оценок коэффициентов, но появляется другой недостаток - растут стандартные ошибки коэффициентов. Оценки становятся статистически незначимыми.

Если точная спецификация модели неизвестна (что практически всегда и бывает), то пользуются критериями, позволяющими выбирать из некоторого множества моделей наилучшую модель.

Наиболее распространенными являются критерий Шварца и критерий Акайке. Они позволяют выбирать наилучшую модель из множества различных спецификаций и численно построены так, чтобы учесть влияние на качество подгонки модели двух противоположных тенденций.

При добавлении переменных в модель качество подгонки в общем случае увеличивается. Заметим, что число регрессоров должно быть разумным, чтобы не вызвать "искусственной подгонки" зависимой переменной. Вместе с тем недостаточное количество переменных, включаемых в модель, дает большую стандартную ошибку, что ведет к снижению качества подгонки.

Рассматриваемые критерии находят по формулам

Значение в этом случае равно числу независимых переменных, включая свободный член. Таким образом, если в модели присутствует два регрессора и свободный член, то число ограничений на степени свободы будет равно трем.

Первое слагаемое представляет собой штраф за большую дисперсию, второе - штраф за использование дополнительных переменных. Критерии рассчитываются для каждой рассматриваемой спецификации. При сравнении двух типов моделей предпочтение отдается спецификации, которая имеет наименьшие значения критериев.

Рассмотрим пример использования информационных критериев при выборе наилучшей спецификации модели.

$Х, Х_<2> В качестве исходных данных возьмем временной ряд длиной 20 наблюдений. Будем подгонять этот ряд линейными регрессиями, в которых регрессоры являются полиномами различных степеней -, \dots , Х_$
. Наша задача - выбрать оптимальную степень наибольшего полинома. Для сравнения моделей с различными степенями полиномов воспользуемся критериями Акайке и Шварца. Модель, показывающую наименьшие значения критериев, будем считать оптимальной.

Для регрессии + a_X + e" />
значения критериев и коэффициенты полинома представлены в табл. 3.16, а график наблюдаемых и предсказанных значений для - на рис. 3.2.

Таблица 3.16

Для регрессии + a_X + а_Х^ + e" />
значения критериев и коэффициенты полинома представлены в табл. 3.17, а график наблюдаемых и предсказанных значений для - на рис. 3.3.

Таблица 3.17

Для регрессии + a_X + а_Х^ + а_Х^ + e" />
значения критериев и коэффициенты полинома представлены в табл. 3.18, а график наблюдаемых и предсказанных значений для - на рис. 3.4.

Таблица 3.18

Для регрессии + a_X + а_Х^ + а_Х^ + а_Х^ + e" />
значения критериев и коэффициенты полинома представлены в табл. 3.19, а график наблюдаемых и предсказанных значений для - на рис. 3.5.

Таблица 3.19

Для регрессии + a_X + а_Х^ + а_Х^ + а_Х^ + а_Х^ + e" />
значения критериев и коэффициенты полинома представлены в табл. 3.20, а график наблюдаемых и предсказанных значений для - на рис. 3.6.

Таблица 3.20

Для регрессии + a_X + а_Х^ + а_Х^ + а_Х^ + а_Х^ + а_Х^ + e" />
значения критериев и коэффициенты полинома представлены в табл. 3.21, а график наблюдаемых и предсказанных значений для - на рис. 3.7.

Таблица 3.21

Для регрессии + a_X + а_Х^ + а_Х^ + а_Х^ + а_Х^ + а_Х^ + а_Х^ + e" />
значения критериев и коэффициенты полинома представлены в табл. 3.22, а график наблюдаемых и предсказанных значений для - на рис. 3.8.

Таблица 3.22

Для регрессии + a_X + а_Х^ + а_Х^ + а_Х^ + а_Х^ + а_Х^ + а_Х^ + + а_Х^ + e" />
значения критериев и коэффициенты полинома представлены в табл. 3.23, а график наблюдаемых и предсказанных значений для - на рис. 3.9.

Таблица 3.23. Наблюдаемые и предсказанные(polinom.sta)

Сравнительный график предсказаний для моделей со степенями полиномов и представлен на рис. 3.10.

Результаты показывают, что минимум значений критериев Акайке и Шварца наблюдается при самой высокой степени полинома, равной семи. Отсюда вывод: при подгонке исследуемого ряда целесообразно использовать спецификацию с наивысшей степенью полинома, равной семи.

, которое является наибольшим из всех рассматриваемых.

Графический анализ качества подгонки полиномами неизвестной функции дает следующий результат: при повышении степени полинома с до улучшение объясняющих свойств модели можно наблюдать визуально. На изображенных графиках (см. рис. 3.2-3.10) предсказанные значения приближаются к реальным данным с увеличением степени полинома. При использовании полинома восьмой степени качество подгонки практически не улучшается. На приведенном сравнительном графике предсказаний для моделей со степенями полинома и (см. рис. 3.10) графики предсказанных значений сливаются, следовательно, использование полинома восьмой степени избыточно и практически не улучшает прогнозных свойств модели. Этот вывод подтверждается и ростом значения критерия Акайке.

Контрольные вопросы

Напишите линейную модель регрессии с -факторами.
Какая матрица называется ковариационной матрицей случайного вектора, а какая - корреляционной? В чем их отличие?
Каково условие однородности (гомоскедастичности) наблюдений?
Как посредством МНК получают систему нормальных уравнений? С какой целью составляется и решается система нормальных уравнений МНК?
Приведите формулу расчета коэффициентов регрессионного уравнения в методе наименьших квадратов.
Докажите несмещенность МНК-оценок коэффициентов модели.
Выведите формулу расчета дисперсий и средних квадратических ошибок МНК-коэффициентов модели. Что собой представляет матрица дисперсий-ковариаций векторов-столбцов матрицы наблюдений?
Как оценивается качество уравнения регрессии с помощью абсолютной и относительной ошибки аппроксимации?
Дайте определение коэффициента детерминации.
Как проводится дисперсионный анализ качества модели в случае многих факторов?
Как проверяется значимость коэффициентов регрессии?
Приведите формулы для расчета доверительного интервала функции регрессии и для индивидуальных значений зависимой переменной.
Почему коэффициент детерминации во многих случаях не может помочь при определении числа включаемых в модель переменных?
Дайте определение частного коэффициента корреляции. Какова его роль в процедуре шаговой регрессии последовательного включения (исключения) переменных?
В чем заключается проблема мультиколлинеарности факторов?
Опишите способы устранения мультиколлинеарности, в частности процедуру гребневой регрессии (ридж-регрессии).
Расскажите о методе главных компонент, эффективной процедуре борьбы с мультиколлинеарностью.
Какие переменные называются фиктивными, манекенными? Чем вызвана необходимость использования фиктивных переменных?
Расскажите о тесте Чоу проверки структурной однородности модели.
Как осуществляется выбор моделей оптимальной сложности на основе критериев Акайке и Шварца?

Тест Чоу (Чжоу, англ. Chow test) — применяемая в эконометрике процедура проверки стабильности параметров регрессионной модели, наличия структурных сдвигов в выборке. Фактически тест проверяет неоднородность выборки в контексте регрессионной модели.

Истинные значения параметров модели могут теоретически различаться для разных выборок, так как выборки могут быть неоднородны. В частности, при анализе временных рядов может иметь место так называемый структурный сдвиг, когда со временем изменились фундаментальные характеристики изучаемой системы. Это означает, что модель до этого сдвига и модель после сдвига вообще говоря разные. Например, экономика в 1998—1999 году и в 2008—2009 годах претерпевала структурные изменения в связи с кризисными явлениями, поэтому параметры макроэкономических моделей могут быть разными, до и после этих моментов.

Тест Чоу на структурное изменение

Пусть рассматривается регрессионная модель y t = x t T b + ε t =x_^b+varepsilon _> , где b — параметры модели (их количество — k ). Предполагается, что подвыборки могут быть неоднородными. Таким образом, для двух подвыборок имеются две модели:

Эти две модели можно представить одной моделью, если использовать индикатор подвыборки d :

Используя эту переменную формулируется следующая модель:

y t = x t T ( d t b 1 + ( 1 − d t ) b 2 ) + ε t = d t x t T b 1 + ( 1 − d t ) x t T b 2 + ε t = z 1 T b 1 + z 2 T b 2 + ε t =x_^(d_b_+(1-d_)b_)+varepsilon _=d_x_^b_+(1-d_)x_^b_+varepsilon _=z_^b_+z_^b_+varepsilon _> —

Тогда процедуру теста можно свести к проверке этого линейного ограничения. При нормально распределённых случайных ошибках применяется стандартный F-тест для проверки k линейных ограничений. Статистика этого теста строится по известному принципу:

F = ( R S S S − R S S L ) / k R S S L / ( n − k L ) = ( R S S − R S S 1 − R S S 2 ) / k ( R S S 1 + R S S 2 ) / ( n − 2 k ) ∼ F ( k , n − 2 k ) -RSS_)/k>>=-RSS_)/k><(RSS_<1>+RSS_)/(n-2k)>>~sim ~F(k,n-2k)>

Соответственно, если значение этой статистики больше критического при данном уровне значимости, то гипотеза об ограничениях отвергается в пользу длинной модели, то есть выборки признаются неоднородными и необходимо строить две разные модели для выборок. В противном случае выборка однородна (параметры модели стабильны) и можно строить общую модель для выборки.

Кроме F-теста можно применять и другие тесты для проверки гипотезы об ограничениях, в частности LR-тест. Особенно это касается более общего случая, когда выделяются не две подвыборки, а несколько. Если количество подвыборок равно m , то соответствующая LR-статистика будет иметь распределение χ 2 ( ( m − 1 ) k ) ((m-1)k)> .

Замечание

В тесте предполагается, что разными в выборках могут быть только параметры линейной модели, но не параметры распределения случайной ошибки. В частности, предполагается одинаковая дисперсия случайной ошибки в обоих подвыборках. В общем случае, однако, это может быть не так. В этом случае применяют тест Вальда со статистикой:

где b ^ 1 , V ^ 1 , b ^ 2 , V ^ 2 >_,>_,>_,>_> — оценки параметров и оценки их ковариационной матрицы в первой и второй подвыборках соответственно.

Тест Чоу на предсказание

Здесь применяется несколько иной подход. Строится модель для одной из подвыборок и на основе построенной модели прогнозируется зависимая переменная для второй подвыборки. Чем больше различия между предсказанными и фактическими значениями объясняемой переменной во второй выборке, тем больше разница между подвыборками. Соответстувующая F-статистика равна:

F = ( R S S − R S S 1 ) / n 2 R S S 1 / ( n 1 − k ) ∼ F ( n 2 , n 1 − k ) )/n_>/(n_-k)>>~sim ~F(n_,n_-k)> .

В данном случае также можно использовать LR-статистику с асимптотическим распределением χ 2 ( n 2 ) (n_)> .

В рассматриваемых примерах предполагалось, что изменение значения качественного фактора влияет лишь на изменение свободного члена. В более сложных моделях может быть отражено влияние качественного фактора на сами параметры при переменных. Например, можно предположить, что до некоторого года в стране обменный курс валют был фиксированным, а затем плавающим. Или налог на ввозимые автомобили был одним, а затем он существенно изменился. Зависимость может быть выражена так:

Тогда ожидаемое значение Y определяется следующим образом:

Фиктивная переменная z1 в уравнении используется как в аддитивном виде (z1), так и в мультипликативном (z1x), что позволяет фактически разбивать рассматриваемую зависимость на две части, связанные с периодом изменения качественного фактора. Имеет ли смысл разбивать выборку на части или в этом нет необходимости можно решить с помощью теста Чоу. Задача может быть и противоположной: можно ли объединить две выборки в одну и рассматривать единую модель (без качественного фактора).

Суть теста Чоу состоит в следующем. Пусть выборка имеет объем n, и есть основание предполагать, что целесообразно разбить её на две объёмами n1 и n2: n1 + n2 = n. Строят уравнение общей регрессии и уравнение регрессий по каждой подвыборке. Обозначим

Очевидно, что возможно лишь при совпадении коэффициентов регрессии для всех трех уравнений. Чем сильнее различие в поведении Y для двух подвыборок, тем больше S0 будет превосходить S1 + S2. Тогда S0 - (S1 + S2) может быть интерпретирована как улучшение качества модели при разбиении. Следовательно, дробь (S0 - (S1 + S2))/(p+1) определяет оценку уменьшения дисперсии регрессии. Проверку проводят с помощью критерия Фишера

(здесь n-2p-2 и р+1 - число степеней свободы необъясненной и объясненной дисперсий).

Если F > Fкр(, р+1, n-2p-2), то разбиение целесообразно. Это означает необходимость введения в уравнение регрессии соответствующей фиктивной переменной.

Если F Fkp, то разбиение целесообразно, т.е. целесообразно использование фиктивной переменной.

Читайте также: