Роздрукувати сторінку
Главная \ Методичні вказівки \ Методичні вказівки \ 3818 Лабораторна робота 1 на тему Модель парної лінійної кореляційної залежності, Оцінка достовірності моделі, Економетрія, НУХТ

Лабораторна робота 1 на тему Модель парної лінійної кореляційної залежності, Оцінка достовірності моделі, Економетрія, НУХТ

« Назад

 

Лабораторна робота 1 на тему Модель парної лінійної кореляційної залежності, Оцінка достовірності моделі

 

Мета роботи: сформувати у студентів практичні навички знаходження взаємозв’язку між двома змінними, оцінювання параметрів вибіркової моделі, використання регресійного аналізу для перевірки моделі на адекватність, тестування значимості параметрів регресії, розрахунку інтервалів довіри для параметрів, прогнозування за моделлю, а також встановлення інтервалів довіри для прогнозного та середнього значення залежної змінної.

Завдання роботи: згідно з варіантом (додаток 2) побудувати парну лінійну кореляційну модель виду  Вибірка даних характеризує роботу підприємства. У вибірці кожному значенню залежної змінної Y відповідає значення незалежної змінної X.Оці­нити міру впливу на досліджуваний показник (Y) незалежного фактора (Х).

Порядок виконання роботи:

1. Знайти параметри моделі.

2. Проаналізувати достовірність моделі та її параметрів. Для аналізу необхідно розрахувати:

  • коефіцієнт детермінації, скоригований коефіцієнт детермінації, множинний коефіцієнт кореляції,парні коефіцієнти кореляції, частинні коефіцієнти кореляції, F-критерій Фішера;

  • стандартні похибки оцінок параметрів моделі (порівняти з величиною оцінок);

  • перевірити значущість коефіцієнта детермінації, коефіцієнта кореляції та оцінок параметрів моделі;

  • знайти прогнозне значення залежної змінної Yпр, яке відповідає очікуваному значенню незалежної змінної Xпр.

  • знайти інтервали надійності для оцінок параметрів моделі, інтервали довіри для прогнозного та середнього значення залежної змінної.

3. Побудувати модель в декартових координатах.

4. Зробити економічний висновок.

Приклад виконання завдання

Задача. Маємо вибірку даних, які характеризують роботу підприємства. Побудувати парну лінійну кореляційну модель залежності об’єму реалізації підприємства (Y), тис. грн. від витрат на впровадження інновацій в попередньому періоді (Х), тис грн. виду

Для аналізу моделі необхідно розрахувати: коефіцієнт детермінації; скоригований коефіцієнт детермінації, множинний коефіцієнт кореляції,парні коефіцієнти кореляції, частинні коефіцієнти кореляції, F-критерій Фішера; стандартні похибки оцінок параметрів моделі порівняти з величиною оцінок; перевірити значущість коефіцієнта детермінації, коефіцієнта кореляції та оцінок параметрів моделі; знайти інтервали надійності для оцінок параметрів моделі. Знайти прогнозне значення залежної змінної Yпр, яке відповідає очікуваному значенню незалежної змінної Xпр. Знайти інтервали надійності для оцінок параметрів моделі, інтервали довіри для прогнозного та середнього значення залежної змінної. Відобразити модель на графіку. Зробити економічний висновок.

Вихідні дані для розрахунку в табл. 1.

Таблиця 1

Спостереження

Об’єм реалізації,

тис. грн.

Витрати на впровадження інновацій в попередньому періоді, тис. грн.

 

Y

Х

1

862,3

27,1

2

804,9

25,2

3

804,9

25,0

4

559,5

14,3

5

592,3

14,2

6

583,1

11,5

7

832,1

24,3

8

851,7

21,5

Середнє значення

736,35

 

Для спрощення розрахунків використаємо статистичну функцію Microsoft Excel ЛИНЕЙН. Ця функція для визначення оцінок параметрів лінійної регресії застосовує метод найменших квадратів.

Результат застосування статистичної функції ЛИНЕЙН – це оцінка параметрів лінійної регресії та регресійна статистика: 

20,45

319,44

3,033

64,203

0,883

48,935

45,47

6

108879,7

14367,5

a0 = 319,44; a1 = 20,45

Можна побудувати рівняння регресії:

Yрозр = 319,44 + 20,45 × Х.

Коефіцієнт регресії a1 = 20,45 говорить про те, що збільшення витрат на впровадження інновацій на 1 тис. грн. збільшить об’єм реалізації на 20,45 тис. грн.

Для визначення статистичних коефіцієнтів та подальших розрахунків знаходимо відхилення (табл. 2).

Таблиця 2

Yфакт

Yрозр

(Yфакт – Yрозр)2

(Yфакт – Yсер)2

(Yрозр – Yсер)2

1

2

3

4

5

862,3

873,62

128,05

18842,0

18841,98

804,9

834,76

891,76

9685,0

9685,00

804,9

830,67

664,22

8896,7

8896,74

559,5

611,86

2742,07

15496,6

15496,58

592,3

609,82

306,94

16009,9

16009,89

583,1

554,61

811,87

33030,7

33030,65

832,1

816,36

247,81

6401,3

6401,28

851,7

759,10

8574,78

517,6

517,56

 

 

14367,5

123247,2

108879,7

Коефіцієнт детермінації 

коефіцієнт кореляції 

Іноді для спрощення розрахунків тісноту кореляційного зв’язку характеризують коефіцієнтом кореляції, який розраховується за формулою: 

F-критерій Фішера

Тестування значимості змінної Х, або адекватності моделі проводиться за критерієм Фішера. 

Fрозр = 8,58

F0,05табл визначаємо за допомогою статистичної функції Microsoft Excel FРАСПОБР(0,05;6;7) для рівня надійності a=0,05 і ступенів вільності відповідно f1 = (n–m–1) = 8–1–1=6 та f2 = (n–1)= 8–1=7:

F0,05табл = 3,87

Fрозр > F0,05табл , робимо висновок про адекватність побудованої моделі і з 5%-ним ризиком помилитися припускаємо присутність лінійного зв’язку.

Оцінка точності моделі

Визначаємо стандартні похибки оцінок параметрів моделі з урахуванням дисперсії залишків: 

де  – дисперсія залишків: 

елемент матриці похибок С (матриця, обернена до матриці коефіцієнтів системи нормальних рівнянь);

т1кількість параметрів моделі.

 

319,44

 

 

 

 

20,45

Стійкість оцінок параметрів визначається порівнянням стандартних похибок з абсолютними значеннями оцінок параметрів моделі.

Порівняємо стандартні похибки оцінки параметрів з величиною оцінки:

Визначається середньоквадратичне відхилення: 

Відносна похибка: 

Перевірка значущості та довірчі інтервали

Перевірка значущості коефіцієнта детермінації

Для перевірки статистичної значущості коефіцієнта детермінації R2 висувається нульова гіпотеза:

H0:  R2=0.

H0 : a1 = a2 = ... = an = 0.

Альтернативною до неї є:

НА:  aj ≠ 0

Обчислюють експериментальне значення F-статистики: 

F0.05табл = 3,87

Fексп > F0,05табл

Нульова гіпотеза відхиляється, тобто існує такий ко­ефіцієнт у регресійному рівнянні, який суттєво відрізняється від нуля, а відповідний фактор впливає на досліджувану змінну. Відхи­лення нуль-гіпотези свідчить про адекватність побудованої моделі.

Перевірка значущості коефіцієнта кореляції

Коефіцієнт кореляції перевіряєть­ся на значущість за допомогою
t-критерію Стьюдента. Фактичне зна­чення t-статистики обчислюється за формулою: 

tтабл визначаємо за допомогою статистичної функції Microsoft Excel СТЬЮДРАСПОБР(0,05;6) для рівня значимості a=0,05 та числу ступенів вільності (n–m1) = 8–2 = 6.

tтабл. = 2,45

|tексп|>tтабл,

Можна зробити висновок, що коефіцієнт кореляції достовірний (значущий), а зв’язок між залежною змінною та незалежним фак­тором суттєвий.

Оцінка статистичної значущості параметрів моделі

Статистичну значущість кожного параметра моделі можна пере­вірити за допомогою t-критерію. При цьому нульова гіпотеза має вигляд

Н0 : aj = 0,

альтернативна

НА : aj ≠ 0.

Експериментальне значення t-статистики для кожного параметра моделі обчислюється за формулою: 

де – дисперсія залишків;

сjj – діагональний елемент матриці похибок (Х′Х)–1 ;

стандартна похибка оцінки параметра моделі:

t1 = 6,74;

t0 = 4,98

 

tтабл =

2,45

|tексп|>tтабл,

Значення t-статистики потрапляє до критичної області (за абсолютним значенням пере­вищує tтабл), приймається альтернативна гіпотеза про значущість параметрів.

Знайдемо інтервали надійності для кожного окремого параметра за формулою: 

де t – табличне значення критерію Стьюдента при k=nm1 ступенях вільності та рівні значимості a=0,05.

 = 319,44 – 2,45 * 64,2 < a0 < 319,44 + 2,45 * 64,2

 = 20,45 – 2,45 * 3,03 < a1 < 20,45 + 2,45 * 3,03

P (0162,34 < a0 < 476,54)

P (13,03< a1 < 27,87)

Розрахуємо коефіцієнт еластичності за формулою: 

Коефіцієнт еластичності говорить про те, що збільшення витрат на впровадження інновацій на 1%, збільшить об’єм реалізації на 0,566%.

Зобразимо побудовану кореляційно-регресійну модель на графіку (рис. 1).

Рис. 1. Кореляційно-регресійна модель

Прогнозування за лінійною моделлю

Прогноз на перспективу буває двох видів: точковий та інтервальний.

Незміщена оцінка точкового прогнозурозглядається як індивідуальне значення Yпр для матриці незалежних змінних Хпр, що лежать за межами базового періоду.

У рівняння Yрозр = 319,44 + 20,45×Х підставимо прогнозні значення фактору Хпр = 27,1 (точковий прогноз):

Yпр = 319,44 + 20,45 · 27,1 = 873,616

Дисперсія похибки прогнозу дорівнює: 

де – дисперсія залишків u;

var(А) – дисперсійно-коваріаційна матриця, яка записується у вигляді: 

Матриця похибок:

(Х' * Х)-1 =

1,72139

-0,0783

-0,0783

0,0038407

Елементи на головній діагоналі матриці  та за її межами  розраховуються за формулами: 

де – дисперсія залишків u;

сjj, cjk – елементи матриці похибок (Х¢Х)–1. 

var (А) =

4122,016

-187,5018

-187,5018

9,19690

Тоді дисперсія прогнозу буде: 

Хпр=

1

27,1

 

Х'пр=

1

27,1

 

Х'пр * var (А) =

–959,2827488

61,73419732

Середньоквадратична (стандартна) похибка прогнозу: 

Довірчий інтервал математичного сподівання М(Yпр) для прогнозного значення буде в межах: 

873,616 – 2,45 · 26,71543 £ M(Yпр) £ 873,616 + 2,45 · 26,71543

 

808,2458

£ M(Yпр) £

938,9864

Визначення інтервального прогнозу індивідуального значення Yпр базується на знаходженні середньоквадратичної помилки прогнозу:

Обчислимо дисперсію та стандартну помилку прогнозу індивідуального значення Yпр: 

Тоді інтервальний прогноз індивідуального значення буде відповідати такому довірчому інтервалу: 

де t – табличне значення критерію Стьюдента при k=nm1 ступенях вільності та рівні значимості a=0,05.

873,616 – 2,45 · 55,7521 £ Yпр £ 873,616 + 2,45 · 55,7521

 

737,1956

£ Yпр £

1010,0366

Висновки.

Згідно з обчисленими характеристиками можна сказати, що об’єм реалізації продукції підприємства на 88,3% залежить від витрат на впровадження інновацій в попередньому періоді, а на 11,7% від неврахованих в задачі чинників. Зв’язок між залежною змінною Y та незалежною Х (об’ємом реалізації продукції та витратами на впровадження інновацій в попередньому періоді) досить високий (коефіцієнт кореляції дорівнює 0,94).

Перевірено значимістьзв’язку між змінними моделі
Fрозр > F0,05табл (8,58>3,87) для рівня надійності a=0,05. З 5%-ним ризиком помилитися припускаємо присутність лінійного зв’язку.

Стандартні помилки параметрів  не перевищують абсолютні значення цих параметрів.

Це означає, що оцінки параметрів є незміщеними відносно їх істотних значень.

Остаточні висновки стосовно стійкості оцінок параметрів можна зробити, коли порівняти стандартні помилки з абсолютними значеннями оцінок параметрів моделі.

Велике значення похибок зумовлюється малою кількістю спостережень, а також неточністю специфікації (не всі основні чинники, що впливають на Y внесено до моделі).

Середньоквадратичне відхилення свідчить про те, що фактичні значення Y відхиляються від розрахункових його значень на ±45,3 тис. грн.

Відносна похибка  – це характеризує модель з хорошої сторони.

Проведена перевірка значущості коефіцієнта детермінації за
F-критерієм Фішера. F0.05табл < Fексп (3,87 < 15,45). Коефіцієнт детермінації значущій.

Перевірена значимість коефіцієнта кореляції за t-критерієм Стьюдента. tтабл < |tексп| (2,45 < 6,74). Коефіцієнт кореляції достовірний (зна­чущий) і зв’язок між залежною змінною та незалежним фак­тором суттєвий.

Дана оцінка значимості кожного параметра моделі за допомогою
t-критерію Стьюдента: |tексп|>tтабл – параметри моделі є значущими.

Отже, модель є достовірною та відображає тісний кількісний взаємозв’язок між залежним та незалежним показниками і може бути використана для практичного економічного висновку.

Були обчислені прогнозні значення Yпр для Хпр = 27,1:

Yпр = 319,44 + 20,45 · 27,1 = 873,616 тис. грн.

Так, при ймовірності р=0,95 (a=0,05), прогноз математичного сподівання M(Yпр) потрапляє в інтервал [808,2458; 938,9864], а прогноз індивідуального значення Yпр – в інтервал [737,1956; 1010,03].

В економічній інтерпретації це означає, що при прогнозних значеннях збільшення витрат на впровадження інновацій до 27,1 тис. грн. об’єм реалізації продукції підприємства потрапляє в інтервал:

808,2458

≤ M(Yпр) ≤

938,9864

Водночас окремі (інтервальні) значення об’єму реалізації продукції підприємства містяться в інтервалі:

737,1956

≤ Yпр ≤

1010,0366

На даному підприємстві збільшення об’єму реалізації продукції обумовлюється збільшенням витрат на впровадження інновацій у попередньому періоді. Так, на кожні 10 тис. грн. збільшення витрат на впровадження інновацій, можливе підвищення об’єму реалізації продукції підприємства на 204,57 тис. грн. за умови незмінної дії інших чинників.

Коефіцієнт еластичності показує, що при збільшенні витрат на впровадження інновацій на 1%, можливе підвищення об’єму реалізації на 0,566%.

З повагою ІЦ "KURSOVIKS"!