Понятие стохастической зависимости в некотором смысле является обобщением понятия о зависимости функциональной. Для последней характерно, что каждому значению фактора (аргумента) соответствует совершенно определенное значение отклика. В случае стохастической зависимости при определенном значении фактора может наблюдаться множество значений отклика . В производственных условиях фактор также является случайной величиной, но при проведении регрессионного анализа полагают, что всякое его значение неслучайно.
Учитывая возможные отклонения, модель связи отклика с некоторым комплексом факторов должна быть представлена в виде двух составляющих:
,(1)
где
— систематическая (объясненная) составляющая. Она обусловлена существованием зависимости между откликом и комплексом факторов;
— случайная составляющая. Она обусловлена разнообразными возмущениями и вызывает отклонения от значений, соответствующих реальной зависимости.
1.3.2 Оценка параметров регрессионной модели
Задача определения вида уравнения многофакторной регрессии состоит в нахождении систематической составляющей . Так как используются выборки ограниченного объема, следовательно, найти можно лишь оценки истинных параметров.
Пусть, например, действительная зависимость отклика от комплекса факторов является линейной:
.(2)
Оценкой (моделью, отображением, аппроксимацией) этой связи также может быть линейное выражение:
.(3)
В выражении (3), которое и является уравнением регрессии, параметры регрессии и представляют собой оценки параметров истинной зависимости ( и ).
Для подбора уравнения , которое наилучшим образом отображает стохастическую связь между откликом и рассматриваемыми факторами, используют МНК. Согласно МНК наилучшей оценкой исследуемой зависимости является та, которая дает наименьшую сумму квадратов отклонений наблюдаемых значений отклика от рассчитанных по уравнению регрессии при тех же значениях факторов . Данное условие можно записать так:
.(4)
Из условия (4) следует, что задача определения параметров уравнения регрессии сводится к определению минимума функции нескольких переменных. Значения параметров регрессии в (3) находятся решением системы из линейных уравнений с неизвестными (здесь — число наблюдений).
Параметры уравнения регрессии являются случайными величинами с математическими ожиданиями и дисперсиями, которым соответствуют стандартные отклонения . Значение является статистически значимым, если выполнено следующее условие:
,(5)
где и — расчетное и табличное значения Стьюдента.
При не выполнении условия (5) параметр является статистически не значимым, следовательно, что и влияние фактора на отклик несущественное. Далее следует построить регрессионную модель без учета фактора .