Прогнозирование в линейной регрессии

Прогнозирование в линейной регрессии. Интервалы прогноза.

После построения уравнения регрессии, и проверки его значимости можно применять это уравнение для прогнозирования. Однако при этом существуют свои особенности.

Используя уравнение регрессии, можно получить предсказываемое значение результата (у_р) с помощью точечного прогноза при заданном значении фактора х_р, т.е. надо просто подставить в уравнение у (х) = а + b * х соответствующее значение х. Однако точечный прогноз не дает требуемых представлений, он практически нереален на практике, поэтому дополнительно необходимо осуществлять определение стандартной ошибки прогнозирования т_yx и интервальную опенку прогнозного значения.

Чтобы построить формулу стандартной ошибки прогнозирования, подставим в уравнение линейной регрессии значение параметра а, тогда оно примет следующий вид:

Из этой формулы следует, что стандартная ошибка прогнозирования зависит от ошибки у и ошибки коэффициента регрессии Ь:

Используя в качестве Ϭ² остаточную дисперсию на одну степень свободы S² и подставляя значение ошибки параметра b, получаем следующую формулу:

Отсюда стандартную ошибку прогнозирования можно рассчитать по формуле

Полученная формула стандартной ошибки предсказываемого среднего значения результата при заданном х_p характеризует ошибку положения линии регрессии. Величина , (см. формулу) достигает минимума при х_р = и возрастает по мере удаления от в любом направлении. Чем больше разность между х_р и , тем больше ошибка , с которой предсказывается среднее значение результата для заданного х_p .

Наилучших результатов прогноза можно ожидать, если признак-фактор х находится в центре области всех наблюдений х, а при удалении х_з от хороших результатов прогноза не будет, Если же значение х_p оказывается за пределами наблюдаемых значений х, используемых при построении линейной регрессии, то результаты прогноза ухудшаются в зависимости от того, насколько х_p отклоняется от области наблюдаемый значений факторах.

На рис. 2.4 доверительные границы для у_p представляют собой гиперболы, расположенные по обе стороны от линии регрессии {1,2 — верхняя и нижняя границы доверительным интервалов, 3 — линия уравнения регрессии, 4 — доверительный интервал для х). При удалении х_p от размах доверительного интервала увеличивается.

Однако фактические значения у варьируют около среднего значения . Индивидуальные значения у могут отклоняться от у_х на величину случайной ошибки, дисперсия которой оценивается как остаточная дисперсия на одну степень свободы S². В связи с этим ошибка прогнозируемого индивидуального значения результата должна включать не только стандартную ошибку т_yp, но и случайную ошибку S:

Доверительный интервал для прогнозируемого значения рассчитывается следующим образом:

где

- предельная ошибка прогноза

В рассматриваемом примере для х_р=35

При прогнозировании на основе уравнения регрессии следует помнить, что величина прогноза зависит не только от стандартной ошибки индивидуального значения у, но и от точности прогноза факторах. Его величина может задаваться на основе исследования других моделей в зависимости от конкретной ситуации, а также по результатам анализа динамики данного фактора.

Выводы

Построение регрессионной функции на основе эмпирических данных дает возможность не только аппроксимировать исходные данные с заданной точностью, но и в дальнейшем применять в экономических расчетах полученное уравнение регрессии. В частности, на основе регрессионной модели можно рассчитать прогнозное значение результативного признака при заданном значении факторного признака.

Существуют точечные и интервальные прогнозные оценки