Роздрукувати сторінку
Главная \ Методичні вказівки \ Методичні вказівки \ 3819 Лабораторна робота 2 на тему Множинна лінійна кореляційна модель, Економетрія, НУХТ

Лабораторна робота 2 на тему Множинна лінійна кореляційна модель, Економетрія, НУХТ

« Назад

 

Лабораторна робота 2 на тему Множинна лінійна кореляційна модель

 

Мета роботи: сформувати у студентів практичні навички дослідження багатофакторної регресійної моделі на конкретному прикладі.

Завдання роботи: згідно з варіантом (додаток 5) побудувати множинну лінійну регресійну модель виду . Вибірка статистичних даних характеризує дослідження обсягу виробленої продукції (Y), тис. т в залежності від вартості основних засобів (Х1), тис. грн. та чисельності працюючих (Х2), чол.

Порядок виконання роботи:

1. Знайти параметри моделі.

2. Проаналізувати достовірність моделі та її параметрів. Для аналізу необхідно розрахувати:

  • коефіцієнт детермінації;

  • скоригований коефіцієнт детермінації;

  • множинний коефіцієнт кореляції R;

  • парні коефіцієнти кореляції;

  • частинні коефіцієнти кореляції;

  • стандартні похибки оцінок параметрів моделі (порівняти з величиною оцінок);

  • перевірити значущість коефіцієнта детермінації, коефіцієнта кореляції та оцінок параметрів моделі множинної регресії;

  • знайти інтервали надійності для оцінок параметрів моделі.

3. Знайти прогнозні значення матриці залежних змінних Yпр, які відповідають очікуваним значенням матриці незалежних змінних Xпр.

4. Відобразити модель на графіку.

5. Зробити економічний висновок.

У моделях множинної регресії розглядають множину даних по кожному зі змінних як вектор-стовпчик, а вільному членові відповідає вектор, що складається лише з одиниць.

– вектор-стовпець залежної змінної. 

b*– вектор параметрів.

Векторну оцінку параметрів теоретичної моделі (b*) знаходять за методом найменших квадратів. Для цього треба виконати обчислення за формулою (6.1), яка в нашому випадку буде мати вигляд.

Приклад виконання завдання

Задача. Згідно з вибіркою статистичних даних за 8 років, які характеризують обсяг виробленої продукції (Y), тис. т в залежності від вартості основних засобів (Х1), тис. грн. та чисельності працюючих (Х2), чол. побудувати лінійну регресійну модель виду:

Y = b0 + b1 X1 + b2 X2.

Знайти векторну оцінку b* за методом найменших квадратів, для цього треба виконати обчислення за формулою (1) 

Оцінити тісноту та значимість зв’язку між змінними моделі; проаналізувати достовірність моделі та її параметрів. Відобразити модель на графіку. Застосувати модель для прогнозування розвитку економічних процесів. Виконати економічний аналіз отриманих результатів.

Вихідні дані для розрахунку в табл..1.

Таблиця 1

Спостереження

обсяг виробленої продукції, тис. т

вартість основних засобів, тис. грн.

чисельність працюючих, чол.

 

Y

Х1

 Х2

1

33

4,2

13

2

36

5,3

18

3

37

6,5

24

4

38,2

5,8

22

5

38,5

6,9

22

6

40,2

5,9

24

7

41,1

7,2

25

8

48,5

14,2

28

Середні значення

39,06

7,0

22

1. Знайти векторну оцінку b* за методом найменших квадратів.

Складемо матрицю X. Перший її стовпчик містить лише одиниці (він відповідає незалежній змінній Х0 – вільному членові); інші стовпчики є відповідно векторами Х1, Х2. 

Матриця Х

 

 

1

4,2

13

 

1

5,3

18

 

1

6,5

24

 Х =

1

5,8

22

 

1

6,9

22

 

1

5,9

24

 

1

7,2

25

 

1

14,2

28

 

Матриця Y

 

33

 

36

 

37

 Y =

38,2

 

38,5

 

40,2

 

41,1

 

48,5

Далі виконуємо операції над матрицями відповідно формули (1).

 =ТРАНСП(C29:E36)

 

 

 

 

 

 

 

 

1

1

1

1

1

1

1

1

Х′ =

4,2

5,3

6,5

5,8

6,9

5,9

7,2

14,2

 

13

18

24

22

22

24

25

28

Транспонування матриці просто реалізувати за допомогою “майстра функцій f” (операція ТРАНСП(.) у категорії “Ссылки и массивы“). Звернення до математичних та статистичних функцій Excel.

=МУМНОЖ(B41:I43;C29:E36)

 

8,0

56,00

176

Х′ × Х =

56,00

457,52

1304,60

 

176

1304,60

4022,00

Функція Microsoft Excel МУМНОЖ(. , .) – знаходить добуток матриць.

Для цього треба:

1) відмітити поле, де буде знаходитись результат добутку матриць;

2) ввійти у "майстер функцій f". У категоріях вибираємо "математичні", а в функціях – МУМНОЖ. Вводимо адреси матриць, добуток яких знаходимо;

3) для того, щоб отримати на екрані значення добутку матриць, натискаємо спершу клавішу F2, а потім Ctrl+Shift+Еnter.

Функція Microsoft Excel МОБР(D46:F48) – знаходить обернену матрицю.

Матриця похибок

 

3,78969

0,12007

–0,20478

(Х' × Х)–1 =

0,12007

0,03291

–0,01593

 

–0,20478

–0,01593

0,01438

Функція Microsoft Excel МОБР(.) – знаходить матрицю, обернену до квадратної матриці. Процедура знаходження оберненої матриці аналогічна процедурі мумнож.

=МУМНОЖ(B41:I43;H29:H36)

 

312,5

Х' × Y =

2278,91

 

7002,7

=МУМНОЖ(D51:F53;D56: D58)

 

23,89

b*=

0,97

 

0,38

Отже, наша регресійна модель має вигляд:

Далі знаходяться відповідні значення Yрозр за формулою Y=Х×b* (за допомогою "майстра функцій f" МУМНОЖ( . ; . ) і заносяться до стовпчика "1" табл. 2.

Таблиця 2

Yрозр

Yфакт – Yрозр

Yфакт – Yсер

Yрозр – Yсер

 

1

2

3

4

 

32,92

0,08

–6,06

–6,146

 

35,89

0,11

–3,06

–3,175

 

39,33

–2,33

–2,06

0,272

 

37,89

0,31

–0,86

–1,169

 

38,97

–0,47

–0,56

–0,097

 

38,75

1,45

1,14

–0,312

 

40,40

0,70

2,04

1,334

 

48,36

0,14

9,44

9,294

 

 

8,399

145,96

138

=СУММКВ(.)

=МУМНОЖ(C29:E36;D61:D63)

Останній рядок таблиці 2 – значення сум квадратів відхилень стовпчиків 2, 3 та 4, які розраховуються за допомогою процедури "майстра функцій f" СУММКВ(.).

2. Проаналізуємо достовірність моделі та її параметрів:

Коефіцієнт детермінації моделі обчислюється за формулою: 

В економічних розрахунках вважається прийнятним такий зв’язок між факторами, при якому r2 > 0,7.

Скоригований коефіцієнт детермінації:

Скоригований коефіцієнт детермінації не перевищує одиниці

Справедлива нерівність:

0,9194 < 0,94246

Множинний коефіцієнт кореляції R розраховується за формулою:,

що свідчить про вельми високий кореляційний зв’язок між вхідними показниками Y та X1 і X2 .

Парні коефіцієнти кореляції розраховують за формулою матриці коефіцієнтів парної регресії між змінними: 

Елементи нормалізованих векторів розраховують за формулами:

Дисперсії змінних мають такі зна­чення:

Тоді знаменники для нормалізації кожної змінної будуть такими:

y* : ;

xk* : ;

xj* : .

Таблиця.3

 

 

 

 

 

 

 

 

 

-6,06

-2,80

-9,00

36,75

7,84

81

-0,5018

-0,3459

-0,7348

-3,06

-1,70

-4,00

9,38

2,89

16

-0,2535

-0,2100

-0,3266

-2,06

-0,50

2,00

4,25

0,25

4

-0,1707

-0,0618

0,1633

-0,86

-1,20

0,00

0,74

1,44

0

-0,0714

-0,1482

0,0000

-0,56

-0,10

0,00

0,32

0,01

0,0

-0,0466

-0,0124

0,0000

1,14

-1,10

2,00

1,29

1,21

4,0

0,0942

-0,1359

0,1633

2,04

0,20

3,00

4,15

0,04

9

0,1686

0,0247

0,2449

9,44

7,20

6,00

89,07

51,84

36

0,7812

0,8895

0,4899

Усього

 

 

145,96

65,52

150

 

 

 

Матриця нормалізованих змінних:

 

-0,5018

-0,3459

-0,7348

 

-0,2535

-0,2100

-0,3266

 

-0,1707

-0,0618

0,1633

X* =

-0,0714

-0,1482

0,0000

 

-0,0466

-0,0124

0,0000

 

0,0942

-0,1359

0,1633

 

0,1686

0,0247

0,2449

 

0,7812

0,8895

0,4899

Матриця, транспонована до X*:

 

-0,5018

-0,2535

-0,1707

-0,0714

-0,0466

0,0942

0,1686

0,7812

X*' =

-0,3459

-0,2100

-0,0618

-0,1482

-0,0124

-0,1359

0,0247

0,8895

 

-0,7348

-0,3266

0,1633

0,0000

0,0000

0,1633

0,2449

0,4899

Запишемо шукану кореляційну матрицю:

 

1

0,9347

0,8630

rxx =

0,9347

1

0,7323

 

0,8630

0,7323

1

Кожний елемент цієї матриці характеризує тісноту зв’язку однієї змінної з іншою.

Оскільки діагональні елемен­ти характеризують тісноту зв’язку кожної змінної з цією самою змінною, то вони дорівнюють одиниці. Решта елементів матриці rхх такі.

Вони є парними коефіцієнтами кореляції між змінними.

Користуючись цими коефіцієнтами, можна зро­бити висновок, що між змінними y та xj – високий зв’язок; між змінними y та xk існує досить високий кореляційний зв’язок

Частинні коефіцієнти кореляції, як і парні, характеризують тісноту зв’язку між двома змінними, але за умови, що решта змінних сталі.

Розрахунок частинних коефіцієнтів кореляції базується на оберненій матриці до матриці rxx(матриця С):

де сkj – елемент матриці С, що міститься в k-му рядку i j-му стовпці;
сkk і сjj – діагональні елементи матриці С.

Розрахуємо матрицю, обернену до матриці rxx :

 

17,379

–11,35

–6,69

C =

–11,345

9,56

2,79

 

–6,69

2,79

4,73

Матриця C – симетрична, і її діагональні елементи завжди мають бути додатними.

Визначимо частинні коефіцієнти кореляції:

r yxk =

0,8801

r yxj =

0,7377

r xk xj =

–0,4145

Частинні коефіцієнти кореляції характеризують рівень тісноти зв’язку між двома змінними за умови, що решта змінних на цей зв’язок не впливає. Частинні коефіцієнти кореляції за модулем нижчі, ніж коефіцієнти парної кореляції, бо на їхній рівень не впливає решта змінних, які мають зв’язок із цими двома.

Коефіцієнт парної кореляції ryxk = 0,88, тому можна зробити висновок, що рівень тісноти зв’язку між двома змінними (y та xk;) високий за умови, що решта змінних на цей зв’язок не впливає.

Коефіцієнт парної кореляції ryxj = 0,7377 – можна зробити висновок, що рівень тісноти зв’язку між двома змінними (y та xj ) високий за умови, що решта змінних на цей зв’язок не впливає.

Перевіримо значимість зв’язку між змінними моделі: 

F0,05табл =

3,97

F0,05табл <

Fрозр

Модель приймаємо – припускаємо присутність лінійного зв’язку для рівня надійності р =(1– a) = 0,95 .

Стандартні похибки оцінок параметрів з урахуванням дисперсії залишків: 

З матриці похибок:

С00=

3,78969

С11=

0,03291

С22=

0,01438

Стандартні помилки параметрів не перевищують абсолютні значення цих параметрів, то це означає, що оцінки параметрів є незміщеними відносно їх істотних значень.

Стійкість оцінок параметрів визначається порівнянням стандартних похибок з абсолютними значеннями оцінок параметрів моделі.

Порівняємо стандартні похибки оцінки з величиною оцінки параметра.

Перевірка значимості коефіцієнта детермінації, коефіцієнта кореляції та оцінок параметрів моделі множинної регресії.

Перевірка значимості коефіцієнта детермінації

Висувається нульова гіпотеза        H0: R2=0,

або                                                   H0 : b1 = b2 = ... = bn = 0.

Альтернативна до неї є                  НА: (bj ≠ 0)

За отриманими в моделі значеннями коефіцієнта детермінації R2 обчислюємо експериментальне значення F-статистики: 

Визначимо табличне значення F-критерію Фішера:

Fтабл =

3,9715

 

 

=FРАСПОБР(0,05;5;7)

 

Порівняємо з табличним значенням розподілу Фішера при ступенях вільності f1=nm–1, f2=n–1 та рівні значущості a= 0,05:

Fексп > Fтабл

Нульова гіпотеза відхиляється.

Відхи­лення нуль-гіпотези свідчить про значимість коефіцієнта детермінації.

Перевірка значимості коефіцієнта кореляції

Коефіцієнт кореляції, як вибіркова характеристика, перевіряється на значущість за допомогою t-критерію Стьюдента при k=nm1 ступенях вільності та рівні значимості a=0,05. 

tтабл =2,57058

 

=СТЬЮДРАСПОБР(0,05;5)

 

Величина експериментального значення t-статистики перевищує табличне:

|tексп| > tтабл

9,049 > 2,57058

Тобто можна зробити висновок, що коефіцієнт кореляції достовірний (зна­чущий), а зв’язок між залежною змінною та всіма незалежними факторами суттєвий.

Перевірка значимості оцінок параметрів моделі множинної регресії

Для оцінки значимості кожного параметра моделі перевіряємо їх за допомогою t-критерію Стьюдента: 

де сjj – діагональний елемент матриці (Х' Х)-1 ;

– стандартна похибка оцінки параметра моделі.

Статистичну значущість кожного параметра моделі можна пере­вірити за допомогою t-критерію. При цьому нульова гіпотеза має вигляд:

Н0 : bj = 0,

альтернативна

НА : bj ≠ 0.

Будемо наслідувати відповідний алгоритм. Задамо рівень значущості a=0,05, визначимо табличне значення t-критерію Стьюдента (tтабл =2,5058) і розрахуємо значення t-критерію для кожного параметра.

Перевірка гіпотези Н0: b0 =0

tспос =

9,4678

Перевірка гіпотези Н0: b1 =0

tспос =

4,1439

Перевірка гіпотези Н0: b2 =0

tспос =

2,4435

 

Якщо | tспос | < tтабл , то приймаємо гіпотезу Н0.

Якщо | tспос | > tтабл , то відхиляємо гіпотезу Н0.

Перевіряємо виконання нерівності | tспос | > tтабл робимо висновки про стійкість впливу відповідного параметру на залежну змінну Y.

Знайдемо інтервали надійності для кожного окремого параметра за формулою: 

= 23,89 – 2,57 * 2,523 < b0 < 23,89 + 2,57 * 2,523

= 0,97 – 2,57 * 0,235 < b1 < 0,97 + 2,57 * 0,235

= 0,38 – 2,57 * 0,155 < b2 < 0,38 + 2,57 * 0,155

P (17,4 < b0 < 30,37) = 0,95

P (0,37 < b1 < 1,579) = 0,95

P (–0,02 < b2 < 0,779) = 0,95

3. Обчислимо прогнозні значення Yпр:

У рівняння Yрозр = 23,89 +0,97X1 +0,38X2 підставимо прогнозні значення фактору Хпр = (1, 15, 35), що лежить за межами базового періоду (точковий прогноз):

Yпр = 23,89 + 0,97 × 15 + 0,38 × 35 = 51,79

Тоді M(Yпр) можна розглядати як оцінку прогнозного значення математичного сподівання та індивідуального значення обсягу виробленої продукції при відомих параметрах вартості основних засобів (Х1) та чисельності працюючих (Х2).

Визначимо дисперсію прогнозу  з урахуванням матриці похибок, яка для прикладу має вигляд:

 (Х' × Х)–1 =

3,78969

0,12007

–0,20478

0,12007

0,03291

–0,01593

–0,20478

–0,01593

0,01438

Елементи дисперсійно-коваріаційної матриці, які розраховуються за формулами і мають значення:

 

6,36573

0,20169

–0,343982

var (В) =

0,20169

0,05529

–0,02676

 

–0,343982

–0,02676

0,02415

 

Хпр =

1

15

35

 

Х'пр =

1

15

35

 

Х'пр * var (В) =

–2,6483

0,0944

0,0999

Знайдемо дисперсію прогнозу: 

Середньоквадратична похибка прогнозу математичного сподівання M(Ynp): 

Довірчий інтервал для математичного сподівання M(Ynp) прогнозного значення розрахуємо за формулою: 

де t – табличне значення t-критерію Стьюдента з ступенем вільності k=nm1 та рівнем значимості a=0,05.

51,79 – 2,57058 × 1,5046 ≤ M(Yпр) ≤ 51,79 + 2,57058 × 1,5046

47,9264

≤ M(Yпр) ≤

55,6617

Знайдемо межі інтервального прогнозу індивідуального значення Yпр.

Для цього обчислимо дисперсію та стандартну похибку прогнозу індивідуального значення Yпр:

51,79 – 2,57058 × 1,9858 ≤ Yпр  ≤ 51,79 + 2,57058 × 1,9858;

46,6893

≤ Yпр ≤

56,8988

4. Графічне зображення моделі ґрунтується на побудові ліній регресії, в прямокутних координатах Y – x1 та Y – x2 (рис. 1).

При цьому масштаб треба обрати таким, щоб мінімальні та максимальні значення x1 та x2 співпадали між собою.

Лінія регресії Y=f(X1) при X2=const відображає вплив першого фактора х1 на продуктивність праці при постійному значенні другого х2 (середнє значення х2).

Лінія регресії Y=f(X2) при X1=const відображає вплив другого фактора х2 на продуктивність праці при постійному значенні х1 (середнє значення х1).

 

X1

X2

Y=f(X1) при X2=const

Y=f(X2) при X1=const

Середні значення

min

4,2

13

30,64

35,64

X1

X2

max

14,2

28

40,38

41,34

7,0

22

Рис..1. Графічне зображення моделі

5. Висновки.

Згідно з обчисленими характеристиками можна сказати, що обсяг виробленої продукції на 94,2% залежить від вартості основних засобів та чисельності працюючих, а на 5,8% від неврахованих в задачі чинників. Кореляційний зв’язок між залежною змінною та незалежними факторами (вартістю основних засобів та чисельністю працюючих) досить високий (множинний коефіцієнт кореляції дорівнює 0,971).

Перевірено значимістьзв’язку між змінними моделі
Fрозр > F0,05табл (17,38>3,97) для рівня надійності a=0,95. З 5%-ним ризиком помилитися припускаємо присутність лінійного зв’язку.

Стандартні помилки параметрів не перевищують абсолютні значення цих параметрів:

Це означає, що оцінки параметрів є незміщеними відносно їх істотних значень.

Висновки стосовно стійкості оцінок параметрів можна зробити, порівнянням стандартних помилок з абсолютними значеннями оцінок параметрів моделі:

Велике значення похибок зумовлюється малою кількістю спостережень, а також неточністю специфікації (не всі основні чинники, що впливають на Y, внесено до моделі).

Середньоквадратичне відхилення

свідчить про те, що фактичні значення Y відхиляються від розрахункових його значень на ±0,77 тис. т.

Відносна похибка  – це характеризує модель з хорошої сторони.

Проведена перевірка значущості коефіцієнта детермінації за F-критерієм Фішера. Fтабл < Fексп (2,5705<40,95). Коефіцієнт детермінації значущій.

Перевірена значимість коефіцієнта кореляції за t-критерієм Стьюдента. tтабл < |tексп| (2,57 < 9,049). Коефіцієнт кореляції достовірний (зна­чущий) і зв’язок між залежною змінною та всіма незалежними фак­торами суттєвий.

Дана оцінка значимості кожного параметра моделі за допомогою
t-критерію Стьюдента: параметри моделі X0 та Х1 є значущими, змінна Х2, (чисельність працюючих) є незначущою.

Знайдені інтервали надійності для кожного параметра:

P (17,4 < b0 < 30,37) = 0,95

P (0,37 < b1 < 1,579) = 0,95

P (–0,02 < b2 < 0,779) = 0,95

Були обчислені прогнозні значення Yпр для Хпр = (1, 15, 35):

Yпр = 23,89 + 0,97 × 15 + 0,38 × 35 = 51,79 тис. т.

Так, при ймовірності р=0,95 (a=0,05), прогноз математичного сподівання M(Yпр) потрапляє в інтервал [47,9274; 55,6617], а прогноз індивідуального значення Yпр – в інтервал [46,6893; 56,8988].

В економічній інтерпретації це означає, що при прогнозних значеннях вартості основних засобів 15 тис. грн. та чисельності працюючих 35 чол. обсяг виробленої продукції потрапляє в інтервал:

47,9274

≤ M(Yпр) ≤

55,6617

Водночас окремі (інтервальні) значення обсягу виробленої продукції містяться в інтервалі:

46,6893

≤ Yпр ≤

56,8988

Отже, модель є достовірною та відображає тісний зв’язок між залежною та незалежними показниками і може бути використана для практичного економічного висновку.

На даному підприємстві збільшення виробництва продукції обумовлюється збільшенням вартості основних засобів та збільшенням чисельності працюючих на підприємстві. Так, на кожні 10 тис. грн. збільшення вартості основних засобів, можливе підвищення випуску продукції на 9,7 тис. т за умови незмінної дії інших чинників.

При збільшенні чисельності працюючих на 10 чол. можливе підвищення випуску продукції на 3,8 тис. т, за умови незмінної дії інших чинників.

З повагою ІЦ "KURSOVIKS"!