Последствия нарушения допущений классической модели регрессии

Последствия нарушения допущений классической модели линейной регрессии проявляются в:

  • существенной смещенности оценок коэффициентов;

  • бессмысленности коэффициента корреляции.

Дисперсия (разброс) уровней ряда остатков должна быть одинаковой для всех значений , или, иными словами, на всём протяжении наблюдений (свойство гомоскедастичности). Если это условие не соблюдается, имеет место гетероскедастичность. Гетероскедастичность приводит к тому, что коэффициенты регрессии не являются оценками с минимальной дисперсией, следовательно, они больше не являются наиболее эффективными коэффициентами.

Воздействие гетероскедастичности на оценку интервала прогнозирования и проверку гипотезы заключается в том, что хотя коэффициенты и не смещены, дисперсии и, следовательно, стандартные ошибки этих коэффициентов будут смещенными. Если смещение отрицательно, то оценочные стандартные ошибки будут меньше, чем они должны быть, а критерий проверки — больше, чем в реальности. Таким образом, можно прийти к выводу, что коэффициент значим, когда он таковым не является. И наоборот, если смещение положительно, то оценочные ошибки будут больше, чем они должны быть, а критерии проверки — меньше. Значит, возможно ошибочное принятие нулевой гипотезы. Гетероскедастичность подлежит устранению, однако рассмотрение этого вопроса остается за пределами данного пособия.

Для оценки гетероскедастичности при малом объеме выборки можно использовать метод Гольдфельда-Квандта, суть которого заключается в том, что необходимо:

  • расположить значения переменной в порядке возрастания;

  • разделить совокупность упорядоченных наблюдений на 2 группы;

  • по каждой группе наблюдений построить уравнения регрессии;

  • определить остаточные суммы квадратов для первой и второй групп по формулам:

(28)

  • рассчитать (в числителе должна быть большая сумма квадратов).

При выполнении гипотезы о гомоскедастичности критерий Fрасч будет удовлетворять F-критерию со степенями свободы для каждой остаточной суммы квадратов (где m – число оцениваемых параметров в уравнении регрессии).

Чем больше величина Fрасч превышает табличное значение F-критерия, тем больше нарушена предпосылка о равенстве дисперсий остаточных величин.