Вычисление параметров регрессии на практике.

 

Рассмотрим, как на практике найти параметры регрессии. Предположим, что по нескольким предприятиям имеются два ряда наблюдений: выпуск продукции и суммы затрат на производство. Зависимость между объемом выпуска и затратами можно представить в виде парной линейной регрессии.

Номер наблюде-ния

Затраты на производство у, тысуб.

Объем выпуска

х, тыс.ед.

У*Х

Х2

Ух

1

68,8

45,1

3102,88

2034,01

66,68

2

61,2

41,3

2527,56

1705,69

62,61

3

59,9

38,7

2318,13

1497,69

59,82

4

56,7

36,5

2069,55

1332,25

57,46

5

55

36,2

1991

1310,44

57,13

6

54,3

32,4

1759,32

1049,76

53,06

7

49,3

28,1

1385,33

789,61

48,44

Итого

405,2

258,3

15153,77

9719,45

405,20

Среднее значение

57,89

36,90

2164,82

1388,49

57,89

 


 

Уравнение регрессии, описывающей зависимость затрат от объема выпуска, будет выглядеть следующим образом:

т.е. при увеличении объема выпускаемой продукции на 1 тыс. ед. затраты на производство возрастут на 1070 руб. По этому уравне­нию рассчитаем теоретические значения результата и сравним полученные суммы:

Из табл. следует, что это равенство выполняется.

Эта модель из-за возможности четкой экономической интерпретации коэффициента регрессии в линейном уравнении наиболее часто применяется в эконометрических исследованиях. В отличие от коэффициента b регрессии, параметр а в данном уравнении — это значение результата у при факторе х = 0. Если признак-фактор х не имеет или не может иметь нулевого значения, то такая трактовка свободного члена а бессмысленна. У него нет экономического содержания. Попытки рассматривать параметр с экономической точки зрения могут привести к абсурду, особенно при а < 0. Интерпретировать следует только знак при нем. Если а > О , то относительное изменение результата происходит медленнее, чем изменение фактора.

Уравнение регрессии всегда дополняется показателем тесноты связи. При использовании линейной регрессии таким показателем является линейный коэффициент корреляции rxy . Существует несколько видов формулы линейного коэффициента корреляции, приведем основные из них:

Линейный коэффициент корреляции, как известно, всегда находится в следующих пределах:  -1 < rxy < 1. Знак коэффициента регрессии определяет знак коэффициента корреляции. Если b < 0, тогда — 1 < rxy < 0 , и наоборот, если Ь > 0, тогда 0 < rxy < 1. Чем ближе значение коэффициента корреляции по модулю | rxy|, к единице, тем теснее связь между признаками в линейной форме. Однако, если абсолютная величина коэффициента корреляции близка к нулю, то это означает, что между рассматриваемыми признаками отсутствует линейная связь. При другом виде уравнения регрессии связь может оказаться достаточно тесной. В приведенном выше примере коэффициент корреляции равен 0,97, следовательно, в данном случае имеет место достаточно тесная связь между результатом и фактором.

Для оценки качества подбора линейного уравнения регрессии находят также квадрат коэффициента корреляции, называемый коэффициентом детерминации R = (rxy)2 . Он отражает долю вариации результативного признака, объясненную с помощью уравнения регрессии, или, иными словами, долю дисперсии результата, объясненную регрессией, в общей дисперсии у:

Следовательно, величина (1— R2) характеризует долю вариации, или долю дисперсии результата у, вызванную влиянием всех остальных, не учтенных в модели факторов. Значения коэффициента детерминации могут изменяться от нуля до единицы (0 < R2 < 1) • Для рассмотренного примера R2=0,94 это означает, что уравнением регрессии объясняется 94% дисперсии результативного признака, а прочими, не учтенными в модели факторами — 6%. Чем ближе коэффициент детерминации к единице, тем меньше роль других факторов и линейное уравнение регрессии описывает лучше исходные данные.

Выводы

Одна из наиболее простых математических моделей — нормальная простая (парная) регрессия. Несмотря на то, что в чистом виде она встречается довольно редко, ее использование помогает понять суть процессов и исследовать их.

Уравнение парной регрессии характеризует связь между двумя переменными, которая проявляется как некоторая закономерность лишь в среднем по совокупности в целом наблюдаемых данных.

В парной регрессии выбор вида математической функции может быть осуществлен с помощью графического, аналитического (т.е. исходя из теории изучаемой взаимосвязи) и экспериментального методов.

Рис. 1.2. Линия регрессии с минимальной дисперсией остатков.