Вычисление параметров регрессии на
практике.
Рассмотрим, как на практике найти параметры регрессии.
Предположим, что по нескольким предприятиям имеются два ряда наблюдений: выпуск
продукции и суммы затрат на производство. Зависимость между объемом выпуска и
затратами можно представить в виде парной линейной регрессии.
Номер наблюде-ния |
Затраты на производство у, тыс.руб. |
Объем выпуска х,
тыс.ед. |
У*Х |
Х2 |
Ух |
1 |
68,8 |
45,1 |
3102,88 |
2034,01 |
66,68 |
2 |
61,2 |
41,3 |
2527,56 |
1705,69 |
62,61 |
3 |
59,9 |
38,7 |
2318,13 |
1497,69 |
59,82 |
4 |
56,7 |
36,5 |
2069,55 |
1332,25 |
57,46 |
5 |
55 |
36,2 |
1991 |
1310,44 |
57,13 |
6 |
54,3 |
32,4 |
1759,32 |
1049,76 |
53,06 |
7 |
49,3 |
28,1 |
1385,33 |
789,61 |
48,44 |
Итого |
405,2 |
258,3 |
15153,77 |
9719,45 |
405,20 |
Среднее значение |
57,89 |
36,90 |
2164,82 |
1388,49 |
57,89 |
Уравнение регрессии, описывающей зависимость затрат от объема
выпуска, будет выглядеть следующим образом:
т.е. при увеличении объема выпускаемой продукции на 1 тыс.
ед. затраты на производство возрастут на 1070 руб. По этому уравнению
рассчитаем теоретические значения результата и сравним полученные суммы:
Из табл. следует, что это равенство выполняется.
Эта модель из-за возможности четкой экономической интерпретации
коэффициента регрессии в линейном уравнении наиболее часто применяется в
эконометрических исследованиях. В отличие от коэффициента b
регрессии, параметр а в данном уравнении —
это значение результата у при факторе х = 0.
Если признак-фактор х не имеет или не может иметь
нулевого значения, то такая трактовка свободного члена
а
бессмысленна. У него нет экономического содержания. Попытки рассматривать параметр
с экономической точки зрения могут привести к абсурду, особенно при а < 0. Интерпретировать следует
только знак при нем. Если а > О , то относительное изменение результата происходит
медленнее, чем изменение фактора.
Уравнение регрессии всегда дополняется
показателем тесноты связи. При использовании линейной
регрессии таким показателем является линейный коэффициент корреляции rxy . Существует несколько
видов формулы линейного коэффициента
корреляции, приведем основные из них:
Линейный коэффициент корреляции, как
известно, всегда находится в следующих пределах: -1 < rxy < 1. Знак коэффициента регрессии определяет знак
коэффициента корреляции. Если b
< 0, тогда — 1 < rxy
< 0 , и наоборот, если Ь > 0, тогда 0 < rxy
< 1. Чем ближе значение коэффициента корреляции по модулю | rxy|, к единице, тем теснее
связь между признаками в линейной форме. Однако, если абсолютная величина
коэффициента корреляции близка к нулю, то это означает, что между
рассматриваемыми признаками отсутствует линейная связь. При другом виде
уравнения регрессии связь может оказаться достаточно тесной. В приведенном выше
примере коэффициент корреляции равен 0,97, следовательно, в данном случае имеет
место достаточно тесная связь между результатом и фактором.
Для оценки качества подбора линейного
уравнения регрессии находят также квадрат коэффициента корреляции, называемый коэффициентом
детерминации R = (rxy)2
. Он отражает долю вариации результативного признака, объясненную с помощью
уравнения регрессии, или, иными словами, долю дисперсии результата, объясненную
регрессией, в общей дисперсии у:
Следовательно, величина (1— R2)
характеризует долю вариации, или долю дисперсии результата у, вызванную влиянием
всех остальных, не учтенных в модели факторов. Значения
коэффициента детерминации могут изменяться от нуля до единицы (0
< R2
< 1) • Для рассмотренного примера R2=0,94 это
означает, что уравнением регрессии объясняется 94% дисперсии результативного
признака, а прочими, не учтенными в модели факторами — 6%. Чем ближе
коэффициент детерминации к единице, тем меньше роль других факторов и линейное
уравнение регрессии описывает лучше исходные данные.
Выводы
Одна из наиболее простых математических
моделей — нормальная простая (парная) регрессия. Несмотря на то, что в чистом
виде она встречается довольно редко, ее использование помогает понять суть
процессов и исследовать их.
Уравнение парной регрессии
характеризует связь между двумя переменными, которая проявляется как некоторая
закономерность лишь в среднем по совокупности в целом наблюдаемых данных.
В парной регрессии
выбор вида математической функции может быть осуществлен с помощью
графического, аналитического (т.е. исходя из теории изучаемой взаимосвязи) и
экспериментального методов.
Рис. 1.2. Линия регрессии с минимальной
дисперсией остатков.