Экономический вывод: из этого следует, что наиболее популярным является индекс качества жизни 5,965-6,455. В 5,965-6,455 вошли следующие страны: Шри-Ланка, Филиппины, Словакия, Уругвай, Польша, Хорватия, Турция, Тринидад и Тобаго, Эквадор, Перу, Колумбия, Сальвадор, Румыния, Венесуэла, Китай, Бахрейн, Литва, Ямайка, Марокко, Латвия, Оман.
Задача 2. Строится модель цены автомобиля на вторичном рынке в зависимости от пробега и объема двигателя. Имеются данные по пятнадцати автомобилям одной и той же модели:
Таблица 6. Исходные данные
№ автомобиля Цена автомобиля (долл. США) Пробег
(тыс. км)
Объем двигателя (л)
1 12500 130 2,3
2 13700 120 1,9
3 9200 300 1,8
4 11400 180 2,1
5 15800 150 2,6
6 12300 80 1,7
7 16300 170 2,4
8 10200 210 1,9
9 11000 250 1,9
10 12700 150 1,7
11 15000 90 2,2
12 10500 230 2,4
13 17200 120 2,3
14 16000 110 2,5
15 17100 120 2,6
Требуется:
Построить модель множественной линейной регрессии.
Оценить параметры уравнения линейной регрессии.
Определить статистическую значимость коэффициентов регрессии.
Определить значимость регрессии в целом по F – критерию Фишера.
Решение
Для определения выборочных коэффициентов уравнения регрессии строим матрицу объясняющих переменных размером (15×3), в которой первый столбец с единичными элементами соответствует умножению коэффициента на единицу:
.
Для построения транспонированной матрицы используем функцию ТРАНСП() из категории Ссылки и массивы.
.
Определяем произведения матриц XTX с помощью стандартной функции МУМНОЖ(XT; X)
.
Убеждаемся, что полученная матрица является симметричной.
Аналогичным образом находим произведение XTY.
.
Рассчитываем обратную матрицу (XTX)-1, используя стандартную математическую функцию МОБР(XTX):
.
С помощью математической функции МУМНОЖ((XTX)-1; XTY) определяем вектор выборочных оценок коэффициентов, предварительно выделив для вывода результата столбец из трех ячеек:
.
В результате была получена следующая модель:
.
Используя выборочное уравнение регрессии, находим значения , .
Вычисляем значения и рассчитываем несмещенную оценку дисперсии ошибок (несмещенную выборочную остаточную дисперсию):
.
где число наблюдений, число регрессоров.
Находим векторы несмещенных оценок дисперсий и стандартных отклонений коэффициентов регрессии:
.
Определяем вектор статистик коэффициентов регрессии:
.
t-критерий Стьюдента — общее название для статистических тестов, в которых статистика критерия имеет распределение Стьюдента.
Для заданной доверительной вероятности =0,95 (уровня значимости =0,05) находим значение с помощью стандартной статистической функции СТЬЮДРАСПОБР(; n-k-1): .
Так как и , (2,44>2,18 и 3,71>2,18, 3,42>2,18), с доверительным уровнем 95% делаем вывод о том, что , и значим.
Доверительные интервалы для значимых коэффициентов:
,
,
.
Из найденной матрицы формируем матрицу межфакторной парной корреляции .
Используя математическую функцию МОПРЕД() с соответствующими массивами и в качестве аргументов, получаем:
.
Величина является одной из наиболее эффективных оценок адекватности регрессионной модели. Она показывает, какая часть вариации объясняемой переменной обусловлена вариацией объясняющей переменной.
Она свидетельствует о том, что изменения зависимой переменной в основном можно объяснить изменениями включенных в модель объясняющих переменных .
Множественный коэффициент корреляции равен:
,
.
Для оценки качества модели используем критерий Фишера.
F-тест или критерий Фишера — статистический критерий, тестовая статистика которого при выполнении нулевой гипотезы имеет распределение Фишера (F-распределение).
По -критерию Фишера модель оказалась значимой на уровне значимости =0,05. Расчетное значение -статистики равно: , табличное (критическое) =FРАСПОБР(0,05;k; n-k-1) = 3,88 (с доверительным уровнем 0,95).