Вычисление параметров регрессии на практике

Вычисление параметров регрессии на практике.

Рассмотрим, как на практике найти параметры регрессии. Предположим, что по нескольким предприятиям имеются два ряда наблюдений: выпуск продукции и суммы затрат на производство. Зависимость между объемом выпуска и затратами можно представить в виде парной линейной регрессии.

Номер наблюде-ния	Затраты на производство у, тыс.руб.	Объем выпуска х, тыс.ед.	*УХ**	Х²	У_х
1	68,8	45,1	3102,88	2034,01	66,68
2	61,2	41,3	2527,56	1705,69	62,61
3	59,9	38,7	2318,13	1497,69	59,82
4	56,7	36,5	2069,55	1332,25	57,46
5	55	36,2	1991	1310,44	57,13
6	54,3	32,4	1759,32	1049,76	53,06
7	49,3	28,1	1385,33	789,61	48,44
Итого	405,2	258,3	15153,77	9719,45	405,20
Среднее значение	57,89	36,90	2164,82	1388,49	57,89

Уравнение регрессии, описывающей зависимость затрат от объема выпуска, будет выглядеть следующим образом:

т.е. при увеличении объема выпускаемой продукции на 1 тыс. ед. затраты на производство возрастут на 1070 руб. По этому уравнению рассчитаем теоретические значения результата и сравним полученные суммы:

Из табл. следует, что это равенство выполняется.

Эта модель из-за возможности четкой экономической интерпретации коэффициента регрессии в линейном уравнении наиболее часто применяется в эконометрических исследованиях. В отличие от коэффициента b регрессии, параметр а в данном уравнении — это значение результата у при факторе х = 0. Если признак-фактор х не имеет или не может иметь нулевого значения, то такая трактовка свободного члена а бессмысленна. У него нет экономического содержания. Попытки рассматривать параметр с экономической точки зрения могут привести к абсурду, особенно при а < 0. Интерпретировать следует только знак при нем. Если а > О , то относительное изменение результата происходит медленнее, чем изменение фактора.

Уравнение регрессии всегда дополняется показателем тесноты связи. При использовании линейной регрессии таким показателем является линейный коэффициент корреляции r_xy . Существует несколько видов формулы линейного коэффициента корреляции, приведем основные из них:

Линейный коэффициент корреляции, как известно, всегда находится в следующих пределах: -1 < r_xy < 1. Знак коэффициента регрессии определяет знак коэффициента корреляции. Если b < 0, тогда — 1 < r_xy < 0 , и наоборот, если Ь > 0, тогда 0 < r_xy < 1. Чем ближе значение коэффициента корреляции по модулю | r_xy|, к единице, тем теснее связь между признаками в линейной форме. Однако, если абсолютная величина коэффициента корреляции близка к нулю, то это означает, что между рассматриваемыми признаками отсутствует линейная связь. При другом виде уравнения регрессии связь может оказаться достаточно тесной. В приведенном выше примере коэффициент корреляции равен 0,97, следовательно, в данном случае имеет место достаточно тесная связь между результатом и фактором.

Для оценки качества подбора линейного уравнения регрессии находят также квадрат коэффициента корреляции, называемый коэффициентом детерминации R = (r_xy)² . Он отражает долю вариации результативного признака, объясненную с помощью уравнения регрессии, или, иными словами, долю дисперсии результата, объясненную регрессией, в общей дисперсии у:

Следовательно, величина (1— R²) характеризует долю вариации, или долю дисперсии результата у, вызванную влиянием всех остальных, не учтенных в модели факторов. Значения коэффициента детерминации могут изменяться от нуля до единицы (0 < R² < 1) • Для рассмотренного примера R²=0,94 это означает, что уравнением регрессии объясняется 94% дисперсии результативного признака, а прочими, не учтенными в модели факторами — 6%. Чем ближе коэффициент детерминации к единице, тем меньше роль других факторов и линейное уравнение регрессии описывает лучше исходные данные.

Выводы

Одна из наиболее простых математических моделей — нормальная простая (парная) регрессия. Несмотря на то, что в чистом виде она встречается довольно редко, ее использование помогает понять суть процессов и исследовать их.

Уравнение парной регрессии характеризует связь между двумя переменными, которая проявляется как некоторая закономерность лишь в среднем по совокупности в целом наблюдаемых данных.

В парной регрессии выбор вида математической функции может быть осуществлен с помощью графического, аналитического (т.е. исходя из теории изучаемой взаимосвязи) и экспериментального методов.

Рис. 1.2. Линия регрессии с минимальной дисперсией остатков.