Оцениваем достоверность коэффициента корреляции

Как и любые статистические величины, коэффициенты корреляции подвергаются в анализе оценке на достоверность. Это объясняется тем, что любая совокупность наблюдений представляет собой некоторую выборку, а следовательно — значение любого показателя, вычисленного на её основе, является не истиной, а более или менее точной его оценкой. В связи с этим и возникает необходимость проверки существенности (значимости) показателей.

Для оценки значимости коэффициента корреляции используют t-критерий Стьюдента (t-статистику). При этом выдвигается и проверяется гипотеза о равенстве нулю коэффициента корреляции. Если эта гипотеза отвергается, то коэффициент корреляции признается значимым, а связь между переменными существенной.

(11)

Значение t-критерия сравнивают с расчетным значением при заданном уровне значимости ( ) и числе степеней свободы , где k – количество факторных признаков, включенных в модель (в случае парной регрессии k=1).

Если расчетное значение t-критерия оказывается больше табличного, коэффициент корреляции признается значим, в ином случае — нет.

Если взаимосвязь между переменными доказана, то переходим к построению уравнения парной регрессии, т. е. к регрессионному анализу. Кстати, коэффициент корреляции показывает только наличие связи между переменными, но не её направление, а значит, исследователь сам должен определить исходя из своего опыта, исходных данных и постановки задачи, какая переменная на какую влияет.

Кстати, не раз в учебниках встречал некорректную последовательность анализа: сначала авторы предлагают вам построить модель, и только после этого проверить — а есть ли взаимосвязь между переменными?