Роздрукувати сторінку
Главная \ Методичні вказівки \ Методичні вказівки \ 251 Методичні вказівки до лабораторної роботи 8 - Висперсійний аналіз, перевірка гіпотез

Методичні вказівки до лабораторної роботи №8 - Дисперсійний аналіз, перевірка гіпотез

« Назад

ЛАБОРАТОРНА РОБОТА № 8.

Тема: Дисперсійний аналіз. Перевірка гіпотез

ЗАВДАННЯ

Проведення дисперсійного аналізу на прикладі регресійної задачі. Регресійна пряма дає наближення до всіх заданих точок  по наступним формулам  Таблиця дисперсійного аналізу видається процесором Excel у наступному вигляді.

Таблиця . Дисперсійний аналіз для простої лінійної регресії

Вид дисперсії

Число степенів свободи (df)

Сума квадратів (SS)

Середній квадрат (MS)

F-відношення (F)

Регресія

 

 

 

 

Залишок

 

 

 

 

Повна

 

 

 

 

Сума квадратів SS1 це дисперсія, пов'язана з регресійною прямою. Ця величина тісно пов'язана з регресійним коефіцієнтом, оскільки , де  це дисперсія змінної Х. Сума квадратів SS2 , як видно з формули (3), просто збігається із сумою квадратів відхилень, а величина  MS2  називається середнім квадратом відхилення від регресії. Сума квадратів SS3 збігається з повною дисперсією  змінної Y. Величина, названа F-відношенням, є статистичним критерієм (статистикою), значення якого безпосередньо використовується для перевірки гіпотези про лінійну залежність і для побудови довірчих інтервалів. З подробицями цієї побудови, що включає велику статистичну теорію, студенти можуть познайомитися по спеціальним курсам математичної статистики. 

ПРИКЛАД РОЗ’ЯЗАННЯ

У нашому прикладі результати дисперсійного аналізу виводяться в діапазоні Е12:I14. Число спостережень у нас (див. комірку Е8), тому число залишкових степенів свободи дорівнює 8. Суми квадратів рівні відповідно 3393,8 , 56,6 і 3450,4. Середній квадрат MS2 = 7,1 , а F-відношення дорівнює 479,5. В комірці I12 показаний рівень значимості F, рівний 2*10 – 8. Ця величина, яка називається також Р-значенням, відіграє основну роль у перевірці статистичної гіпотези.

Якщо Р-значення менше рівня значимості , то гіпотеза про лінійну залежність приймається, у противному випадку її потрібно відкинути.

Це правило можна вважати підсумком дисперсійного аналізу. В даному випадку Р-значенння настільки мізерне, що гіпотеза про лінійну залежність може бути прийнята з надійністю яка перевищує 99%. У діапазоні Е17:L18 виводяться докладні статистичні дані по кожному з регресійних коефіцієнтів і, зокрема, показані довірчі інтервали для кожного з них з рівнем надійності 95%.

З повагою ІЦ "KURSOVIKS"!