Роздрукувати сторінку
Главная \ Методичні вказівки \ Методичні вказівки \ 5219 Лабораторна робота №3, Побудова та аналіз функції множинної лінійної регресії з використанням засобів MS EXCEL

Лабораторна робота №3, Побудова та аналіз функції множинної лінійної регресії з використанням засобів MS EXCEL

« Назад

Мета роботи: набуття навичок побудови моделі множинної лінійної регресії з урахуванням лише неколінеарних факторів, оцінка якості моделі.

На основі рішення зібраних раніше даних побудувати та дослідити рівняння множинної лінійної регресії:

1. На основі статистичних даних показника Y та незалежних факторів знайти оцінки параметрів множинної регресії, використовуючи метод найменших квадратів.

2. Визначити часткові коефіцієнти кореляції та оцінити їх значимість.

3. Визначити множинні коефіцієнти кореляції та детермінації. Порівняти загальний коефіцієнт множинної детермінації зі скоригованим.

4. За допомогою F-критерію Фішера оцінити статистичну значимість зв’язку між факторами.

5. Оцінити статистичну значимість параметрів регресії з використання t-критерію Ст’юдента для рівня значимості α = 0,05.

6. Знайти довірчі інтервали для коефіцієнтів регресії для рівня значимості α = 0,05.

7. Зробити точковий прогноз залежної змінної при значенні пояснюючої змінної Х1, що рівне максимальному спостереженню, збільшеному на 10 %, та значенні змінної Х2, що дорівнює мінімальному значенню, збільшеному на 15 %.

Завдання 2

Проводиться специфікація моделі у вигляді лінійної функції Y = a0 + a1X1 + a2X2 + u. Звідси випливає, що система нормальних рівнянь для моделі буде мати вигляд:

М5219, 1

Таблиця 2.2

Допоміжні розрахунки

№ пор.

Y

X1

X2

Y2

X12

X22

YX1

YX2

X1X2

1

20

32

33

400

1 024

1 089

640

660

1 056

2

24

30

31

576

900

961

720

744

930

3

28

36

41

784

1 296

1 681

1 008

1 148

1 476

4

30

40

39

900

1 600

1 521

1 200

1 170

1 560

5

31

41

46

961

1 681

2 116

1 271

1 426

1 886

6

33

47

43

1 089

2 209

1 849

1 551

1 419

2 021

7

34

56

34

1 156

3 136

1 156

1 904

1 156

1 904

8

37

54

38

1 369

2 916

1 444

1 998

1 406

2 052

9

38

60

42

1 444

3 600

1 764

2 280

1 596

2 520

10

40

55

35

1 600

3 025

1 225

2 200

1 400

1 925

11

41

61

39

1 681

3 721

1 521

2 501

1 599

2 379

12

43

67

44

1 849

4 489

1 936

2 881

1 892

2 948

13

45

69

40

2 025

4 761

1 600

3 105

1 800

2 760

14

48

76

41

2 304

5 776

1 681

3 648

1 968

3 116

Сума

492

724

546

1 8138

40 134

21 544

2 6907

19 384

28 533

Середнє

35,14

51,71

39,00

1 295,6

2 866,7

1 538,9

1 921,9

1 384,6

2 038,07

σ

8,08

14,39

4,39

σ2

65,21

207,14

19,23

Для рішення системи рівнянь використовується метод визначників.

М5219, 2

де М5219, 3 – визначник системи;

М5219, 4 – часткові визначники, що отримані шляхом заміни відповідного стовпця матриці визначника системи даними лівої частини системи.

М5219, 5

Тоді

М5219, 6

Рівняння регресії має вигляд: М5219, 7.

Інший вид рівняння множинної регресії – рівняння регресії в стан­дартизованому масштабі: М5219, 8. Коефіцієнти стандартизованого рівняння регресії можна розрахувати так:

М5219, 9.

Рівняння регресії в стандартизованому вигляді: М5219, 10. Тобто зі збільшенням рівня механізації на одну сигму при незмінному середньому віці робітників продуктивність праці збільшується в середньому на 0,937 сігми. Оскільки 0,937 > 0,086, то вплив рівня механізації на продуктивність праці більший, ніж середній вік робітників.

М5219, 11

Коефіцієнти парної кореляції показують на тісний зв’язок фактора Х1 з результатом, фактор Х2 має помірну силу зв’язку. Міжфакторна залежність є помірною, тобто фактори Х1 та Х2 не є колінеарними.

Часткові коефіцієнти кореляції характеризують тісноту зв’язку між результатом і відповідним фактором при виключенні впливу інших факторів, включених у рівняння регресії:

М5219, 12

Як бачимо, зв’язок рівня механізації з продуктивністю праці при виключенні впливу середнього віку робітників тісний, на відміну від зв’язку останнього з продуктивністю праці.

Коефіцієнт детермінації для даної залежності:

М5219, 13.

Коефіцієнт детермінації показує, що продуктивність праці на 94,5 % описується вибраним набором факторів.

Скоригований коефіцієнт детермінації розраховується за формулою:

М5219, 14.

Скоригований коефіцієнт детермінації визначає тісноту зв’язку з врахуванням ступенів свободи загальної і залишкової дисперсії. Він дає таку оцінку зв’язку, яка не залежить від числа факторів і тому може порівнюватися за різними моделями і різним числом факторів. Обидва коефіцієнти вказують на досить високу (більшу 90 %) детермінованість результату Y в моделі факторами X1 і X2.

Для характеристики тісноти зв’язку в множинній лінійній регресії використовують множинний коефіцієнт кореляції:

М5219, 15.

Розраховане значення коефіцієнта множинної кореляції свідчить про достатньо тісний зв’язок факторів з результатом.

Оцінку надійності рівняння регресії в цілому і показника тісноти зв’язку RYX1X2 показує F-критерій Фішера:

М5219, 16.

Отже, М5219, 17 (при n = 14), тобто ймовірність випадково отримати таке значення F-критерію не перевищує допустимий рівень значимості (5 %).

Для визначення статистичної значимості оцінок параметрів рівняння регресії необхідно скористатися формулою для розрахунку t-критерію Ст’юдента:

М5219, 18,

де аj – параметри рівняння регресії;

сjj – діагональний елемент матриці М5219, 19;

М5219, 20 – залишкова дисперсія.

Для розрахунку за даною формулою виконуються допоміжні розрахунки.

Матриця Х для даної моделі буде такою:

М5219, 21

Одиниця в матриці незалежних змінних Х дописується тоді, коли економетрична модель має вільний член а0.

Тоді ХТ:

М5219, 22

Звідси М5219, 23:

М5219, 24

Табличне значення критерію Ст’юдента при рівні значимості α = 0,05 та числі ступенів свободи (nm – 1) = (14 – 3) = 11 вибрати tтабл = 2,201.

Тоді М5219, 25, тобто статистично значимим параметром рівняння регресії є лише а1.

На основі критеріїв Ст’юдента та стандартної помилки можуть бути визначені довірчі інтервали для параметрів моделі:

М5219, 26

Аналіз верхньої та нижньої межі довірчих інтервалів зумовлює висновок про те, що з ймовірністю p = 1 – α = 0,95 параметри а0 і а2, знаходячись у вказаних межах, приймають нульові значення, тобто є статистично незначимими. Параметр а1 є статистично значимий.

Якщо прогнозоване значення рівня механізації складе X1p = max(X1i) * 1,1 = 76 * 1,1 = 83,6 %, а середній вік робітників X2p = min(X2i) * 1,15 = 31 * 1,15 = 35,65, то прогнозоване значення продуктивності праці становить: Yp = 1,736 + 83,6 * 0,526 + 35,65 * 0,159 = 51,38 т/год.

З повагою ІЦ "KURSOVIKS"!