Таинственное уравнение регрессии и его построение

Форма связи может быть выражена как линейной функцией (уравнение прямой), так и нелинейными функциями (полиномы разных порядков, гипербола, степенные функции и др.). Подбор функции для выражения формы связи между признаками проходит несколько этапов: графический, логический, экономический, а также математическую проверку близости эмпирических данных к теоретическим.

Часто для выражения формы корреляционной связи подходит одновременно несколько функций, поэтому желательно дать окончательное обоснование выбора функций для выражения формы связи на альтернативной основе.

При этом важно, чтобы модель не только имела достаточную точность (высокое качество), но и была интерпретируемой, применимой на практике. Так, в уравнении y = a + bx практический смысл могут иметь оба параметра (а и b), чего не скажешь, например, о такой модели:

(12)

В подобных моделях их параметры уже не имеют какого-либо очевидного (физического, экономического или иного) смысла.

Наиболее простой с точки зрения понимания, интерпретации и техники расчетов является линейная форма регрессии.

(13)

Примечание к формуле: общепринятая запись уравнения предполагает обозначение параметров модели как , однако для однофакторной модели допустимым является также обозначение параметров уравнения как a и b.

Параметр а, или свободный коэффициент регрессионного уравнения, имеет экономический смысл: он показывает значение результативного признака y, если факторный x = 0.

b — коэффициент регрессии. Показывает, на какую величину в среднем изменится y при увеличении фактора х на 1 единицу. Знак при коэффициенте регрессии показывает направление связи: при его положительном значении связь прямая, при отрицательном — обратная.

— независимая, нормально распределенная случайная величина, остаток с нулевым математическим ожиданием и постоянной дисперсией. Отражает тот факт, что изменение y будет неточно описываться изменением х, так как присутствуют другие факторы, не учтенные в данной модели.

Оценка параметров модели а0 и а1 может быть выполнена несколькими различными способами, однако чаще всего осуществляется методом наименьших квадратов (МНК). Сущность МНК заключается в том, что отыскиваются такие значения параметров модели (а и b), при которых сумма квадратов отклонений фактических значений результативного признка от вычисленных по уравнению регрессии будет наименьшей из всех возможных:

(14)

Система нормальных уравнений для нахождения параметра линейной регрессии методом наименьших квадратов выглядит следующим образом:

(15)

Параметры а и b можно найти также по следующим формулам:

(16)

(17)

Поскольку уравнение регрессии основано на данных выборочной совокупности, необходимо дать оценку его коэффициентов и значимости модели в целом.