Прогнозирование в линейной регрессии. Интервалы прогноза.

 

После построения уравнения регрессии, и проверки его значимости можно применять это уравнение для прогнозирования. Однако при этом существуют свои особенности.

Используя уравнение регрессии, можно получить предсказываемое значение результата (ур) с помощью точечного прогноза при заданном значении фактора хр, т.е. надо просто подставить в уравнение у (х) = а + b * х соответствующее значение х. Однако точечный прогноз не дает требуемых представлений, он практически нереален на практике, поэтому дополнительно необходимо осуществлять определение стандартной ошибки прогнозирования тyx и интервальную опенку прогнозного значения.

Чтобы построить формулу стандартной ошибки прогно­зирования, подставим в уравнение линейной регрессии зна­чение параметра а, тогда оно примет следующий вид:

 

Из этой формулы следует, что стандартная ошибка про­гнозирования зависит от ошибки у и ошибки коэффициен­та регрессии Ь:

 

Используя в качестве Ϭ2 остаточную дисперсию на одну степень свободы S2 и подставляя значение ошибки параметра b, получаем следующую формулу:

Отсюда стандартную ошибку прогнозирования можно рассчитать по формуле

 

Полученная формула стандартной ошибки предсказываемого среднего значения результата при заданном хp характеризует ошибку положения линии регрессии. Величина  , (см. формулу) достигает минимума при хр =  и возрастает по мере удаления от в любом направлении. Чем больше разность между  хр  и , тем больше ошибка , с которой предсказывается среднее значение результата для заданного хp .

Наилучших результатов прогноза можно ожидать, если признак-фактор х находится в центре области всех наблюдений х, а при удалении хз от  хороших результатов прогноза не будет, Если же значение хp оказывается за пределами наблюдаемых значений х, используемых при построении линейной регрессии, то результаты прогноза ухудшаются в зависимости от того, насколько хp отклоняется от области наблюдаемый значений факторах.

На рис. 2.4 доверительные границы для уp представляют собой гиперболы, расположенные по обе стороны от линии регрессии {1,2 — верхняя и нижняя границы доверительным интервалов, 3 — линия уравнения регрессии, 4 — доверительный интервал для х). При удалении хp от  размах доверительного интервала увеличивается.

 

Однако фактические значения у варьируют около среднего значения  . Индивидуальные значения у могут отклоняться от ух на величину случайной ошибки, дисперсия которой оценивается как остаточная дисперсия на одну степень свободы S2. В связи с этим ошибка прогнозируемого индивидуального значения результата должна включать не только стандартную ошибку тyp, но и случайную ошибку S:


Доверительный интервал для прогнозируемого значения рассчитывается следующим образом:

где

 - предельная ошибка прогноза

 

В рассматриваемом примере для хр=35

 

 

При прогнозировании на основе уравнения регрессии сле­дует помнить, что величина прогноза зависит не только от стандартной ошибки индивидуального значения у, но и от точности прогноза факторах. Его величина может задаваться на основе исследования других моделей в зависимости от конкретной ситуации, а также по результатам анализа дина­мики данного фактора.

Выводы

Построение регрессионной функции на основе эмпирических данных дает возможность не только аппроксимировать исходные данные с заданной точностью, но и в дальнейшем применять в экономических расчетах полученное уравнение регрессии. В част­ности, на основе регрессионной модели можно рассчитать про­гнозное значение результативного признака при заданном значе­нии факторного признака.

Существуют точечные и интервальные прогнозные оценки