Алгоритм построения и анализа однофакторной линейной модели

Однофакторная линейная модель является наиболее применимой на практике, поскольку на первый взгляд она проста в построении и легка в трактовке полученных результатов. Парную линейную регрессию сегодня не строит разве что ленивый: она является «палочкой-выручалочкой» не только в студенческих курсовых и дипломных работах, но и в более серьёзных научных трудах, таких как кандидатские диссертации и статьи в ваковские журналы. Вот и видим мы коэффициенты корреляции с недоказанной значимостью, коэффициенты регрессии по распределениям, обладающим неизвестной природой… А в результате — выводы, которым нельзя верить, оценки параметров, которые характеризуют что угодно — но только не оцениваемые параметры… Всё это происходит потому, что далеко не каждый понимает суть используемых методов и лежащих в их основе предпосылок…При построении эконометрической модели важным моментом является выполнение всех проверок, особенно — проверок допущений, на основе которых построена модель. Если допущения нарушены, и этот факт проигнорирован исследователем, то неверными окажутся оценки коэффициентов, стандартных ошибок; реальные формы распределений оценок не будут соответствовать теоретическим — тем, на которых базируются статистические тесты. Иными словами, все результаты моделирования в этом случае потеряют свою легитимность, и их нельзя применить на практике.

Построение и анализ даже простейшей линейной модели требуют множества вычислений и проверок. При этом нет никакой гарантии, что в результате будет получена более-менее качественная и применимая на практике модель. Взаимосвязь между факторным и результативным признаком может быть явной (не «заметной», поскольку это слово характеризует силу связи по шкале Чеддока, но об этом чуть позже), но значимость этой взаимосвязи окажется ничтожной. А если значимость коэффициента корреляции будет достаточно высокой, то незначимыми могут оказаться её параметры, или же окажется, что модель не соответствует исходным предпосылкам, необходимым для самой возможности (осмысленности) выполняемых расчетов.

Итак, каким должен быть ваш алгоритм построения и анализа уравнения парной линейной регрессии:

  1. Проверка исходных данных для построения уравнения парной регрессии:
    Расчет линейного коэффициента корреляции (проверка наличия связи);
    Оценка на основе t-критерия Стьюдента значимости коэффициента корреляции;
    Написание выводов (зависимость есть и значима, либо зависимость незначима, т. е. отсутствует, а следовательно — необходимо перейти к изучению взаимосвязи между другой парой признаков).
  2. Расчет параметров модели (например, методом наименьших квадратов)
  3. Анализ модели (анализ коэффициента a и его значимости; анализ коэффициента b и его значимости; значимость модели в целом; выводы по результатам анализа модели: смысл показателей, их трактовка и соответствие изучаемому явлению).
  4. Проверка адекватности модели. (Критерий поворотных точек; проверка равенства матожидания остаточной последовательности нулю; проверка на гомоскедастичность; проверка наличия автокорреляции; проверка соответствия распределения остаточной последовательности нормальному закону распределения; проверка качества модели — расчет коэффициента множественной корреляции.
  5. Определение меры точности модели: максимальная ошибка, средняя абсолютная ошибка, дисперсия ряда остатков, средняя квадратическая ошибка, средняя относительная ошибка аппроксимации.
  6. Построение прогноза и доверительных интервалов.
  7. Разработка общих выводов и рекомендаций по практическому применению построенной модели.

На практике следует придерживаться указанного алгоритма, поскольку это избавит от излишних вычислений (так, прежде следует оценить связь между признаками и значимость этой связи, и лишь после этого строить само уравнение регрессии), поскольку выполнение каждого шага расчетов является необходимым условием для всех последующих. Если не выполняется то или иное условие, можно сделать соответствующие выводы о качестве модели. На одних шагах алгоритма в этом случае будут сделаны выводы о низком качестве модели (когда моделью можно пользоваться, но значение полученных результатов, например — прогнозов, будет низким), либо о качестве недопустимо низком, когда любое применение модели остается необоснованным.

Моим студентам всегда казалось, что этот алгоритм очень сложный и трудоёмкий, однако, выполнив первые три шага, они начинали понимать, что во-первых ничего сложного в этом нет, а во-вторых, что эконометрика — это очень даже понятный, увлекательный и интересный предмет. Хотите пройти мой фирменный курс эконометрики, на котором вы научитесь строить и анализировать парную и множественную линейную регрессии и временные ряды? Отправьте мне письмо на адрес 573896 (at) mail.ru с темой «Хочу на курс эконометрики!» и я включу Вас в ближайшую группу. Если у Вас появились какие-то другие вопросы и Вы хотите предложить сотрудничество — пишите мне на тот же адрес.

P.S. Отправляя письмо на указанный адрес, Вы соглашаетесь с тем, что во-первых письмо будет доставлено на сервера mail.ru (а соответственно, Вы даёте этой корпорации права обрабатывать и хранить его в соответствии с их политиками), а во-вторых — с тем, что Ваше письмо (и электронный адрес, с которого оно было прислано) будут храниться в моём почтовом ящике до момента приглашения Вас в ближайшую группу, занимающуюся по курсу эконометрики, после чего письмо будет удалено в корзину, а корзина очищена.

Алгоритм построения и анализа однофакторной линейной модели: 1 комментарий

Обсуждение закрыто.