Более точная оценка взаимосвязи
Если использовать только информацию о том, превысило или нет данное значение среднее для этой переменной, теряется много информации. Можно использовать более точную меру корреляции, которая учитывает не только знак, но и величины отклонения от средних. Наиболее популярным методом измерения связи двух переменных является коэффициент корреляции.
Этот коэффициент вычисляется при помощи расчета ковариации (совместной вариации) двух переменных. Вот его формула:
где Гух — коэффициент корреляции, а S — стандартные отклонения. Ковариация между Y и Х определяется по следующей формуле:
Таким образом, мы вычисляем среднюю величину произведения отклонений индивидуальных значений этих переменных от их средних значений. Если значение одной переменной из пары значений выше ее среднего, а другой — ниже, то их произведение при подсчете ковариации вычитается из общего итога. Размер выборки обозначен буквой n в знаменателе формулы, а единица вычитается из него для коррекции количества степеней свободы. В нашем примере зависимая переменная Y — это процентное изменение индекса S&P 500 в следующем году, а переменная Х-изменение ставок казначейских векселей в текущем году.
Вот последовательность расчета ковариации двух переменных:
1. Подсчитайте среднее для всех значений переменной Х, а
потом сделайте то же для переменной Y.
2. Вычтите среднее из каждого индивидуального значения.
3. Перемножьте каждую пару отклонений от среднего (вариации) и сосчитайте их среднее значение.
В табл. 8.2 показан этот расчет для процентных ставок и доходности S&P 500 за последние 10 лет.
Таким образом, ковариация между Y и Х равна 14,86, деленным на 10 лет минус 1, или на 9 (девять степеней свободы).
Для того чтобы рассчитать на основе этого значения ковариации коэффициент корреляции, посчитайте стандартные отклонения Y и Х. Для этого нужно возвести в квадрат отклонения от среднего для каждой переменной и затем сложить результаты (табл. 8.3).
Для того чтобы получить стандартные отклонения, нужно извлечь из дисперсий квадратный корень. Квадратный корень из 2,86% равен 16,9%, а квадратный корень из 11,07% равен
33,3%.
Затем следует подставить полученные результаты в исходную формулу:
Точно так же, как и для грубой оценки корреляции, которую мы получили из четырехклеточной таблицы, расчеты числителя и знаменателя приведенной выше формулы были основаны на отклонениях наблюдений от средних значений.
|