Прогнозирование в
линейной регрессии. Интервалы прогноза.
После построения
уравнения регрессии, и проверки его значимости
можно применять это уравнение для прогнозирования. Однако при этом существуют свои особенности.
Используя
уравнение регрессии, можно получить предсказываемое значение результата (ур)
с помощью точечного прогноза при заданном
значении фактора хр, т.е.
надо просто подставить
в уравнение у (х) = а + b * х соответствующее значение х. Однако точечный прогноз не дает
требуемых представлений, он
практически нереален на практике, поэтому
дополнительно необходимо осуществлять определение стандартной ошибки прогнозирования тyx и интервальную опенку прогнозного
значения.
Чтобы
построить формулу стандартной ошибки прогнозирования, подставим в уравнение
линейной регрессии значение параметра а, тогда оно примет
следующий вид:
Из
этой формулы следует, что стандартная ошибка прогнозирования зависит от ошибки у и
ошибки коэффициента регрессии Ь:
Используя
в качестве Ϭ2 остаточную дисперсию на одну степень свободы S2 и подставляя значение ошибки параметра b, получаем
следующую формулу:
Отсюда
стандартную ошибку прогнозирования можно рассчитать по формуле
Полученная формула стандартной ошибки предсказываемого
среднего значения результата при заданном хp характеризует ошибку положения линии регрессии. Величина , (см. формулу) достигает
минимума при хр = и возрастает по
мере удаления от в любом направлении. Чем больше разность между хр
и ,
тем
больше ошибка , с которой предсказывается среднее значение результата для
заданного хp .
Наилучших
результатов прогноза можно ожидать, если признак-фактор х находится в центре области всех наблюдений х, а
при удалении хз от хороших
результатов прогноза не будет, Если же значение хp
оказывается за пределами наблюдаемых значений х,
используемых при построении линейной регрессии, то результаты
прогноза ухудшаются в зависимости от того, насколько хp
отклоняется от области наблюдаемый значений факторах.
На рис. 2.4 доверительные
границы для уp представляют собой гиперболы, расположенные по обе стороны от
линии регрессии {1,2 — верхняя и нижняя границы доверительным
интервалов, 3 — линия уравнения регрессии, 4 — доверительный
интервал для х). При удалении хp от размах доверительного
интервала увеличивается.
Однако
фактические значения у варьируют около среднего значения . Индивидуальные значения у
могут отклоняться от ух на
величину случайной ошибки, дисперсия которой
оценивается как остаточная дисперсия на одну степень свободы S2. В связи с этим ошибка прогнозируемого индивидуального значения результата должна включать не только стандартную
ошибку тyp,
но и случайную ошибку S:
|
Доверительный
интервал для прогнозируемого значения рассчитывается следующим образом:
где
- предельная ошибка прогноза
В рассматриваемом примере для хр=35
При
прогнозировании на основе уравнения регрессии следует помнить, что
величина прогноза зависит не только от стандартной ошибки индивидуального
значения у, но и от точности
прогноза факторах. Его величина может задаваться на основе исследования
других моделей в зависимости от конкретной
ситуации, а также по результатам анализа динамики данного фактора.
Выводы
Построение
регрессионной функции на основе эмпирических данных дает
возможность не только аппроксимировать исходные данные с заданной точностью, но и в
дальнейшем применять в экономических
расчетах полученное уравнение регрессии. В частности, на основе регрессионной модели можно рассчитать прогнозное значение результативного признака при
заданном значении факторного признака.
Существуют точечные и интервальные прогнозные оценки