Лабораторна робота 4 на тему Дослідження наявності мультиколінеарності між змінними, Економетрія, НУХТ
« НазадЛабораторна робота 4 на тему Дослідження наявності мультиколінеарності між змінними(алгоритм Фаррара-Глобера)Мета роботи: сформувати у студентів практичні навички оцінки якості параметрів регресійної моделі в залежності від особливостей статистичних даних з використанням алгоритму Фаррара-Глобера. Завдання роботи: На основі даних про чинники, що впливають на прибуток (додаток 7), дослідити їх на наявність мультиколінеарності за допомогою алгоритму Фаррара-Глобера, що містить три статистичні критерії: c2; F-критерій; t-критерій. Приклад виконання завдання при відсутності мультиколеніарностіНа середньомісячну заробітну плату впливає низка чинників. Вирізнимо серед них продуктивність праці, фондомісткість та коефіцієнт плинності робочої сили. Щоб побудувати економетричну модель заробітної плати від згаданих чинників за методом найменших квадратів, потрібно переконатися, що продуктивність праці, фондомісткість та коефіцієнт плинності робочої сили як незалежні змінні моделі – не мультиколінеарні. Вихідні дані наведено в табл. 1. Таблиця 1
Дослідити наведені чинники на наявність мультиколінеарності. Порядок виконання завданняДослідимо наявність мультиколінеарності, виконавши такі кроки:
Крок 1. Нормалізація зміннихПозначимо вектори незалежних змінних – продуктивності праці, фондомісткості, коефіцієнтів плинності робочої сили – через Х1, Х2, Х3. Елементи нормалізованих векторів обчислимо за формулою: де n – кількість спостережень, n = 10; m – кількість незалежних змінних, m = 3; – середнє арифметичне значення компонентів вектора Хk; – дисперсія змінної хk . Із формули випливає, що спочатку потрібно обчислити середні арифметичні значення і величини для кожної незалежної змінної: Дисперсії кожної незалежної змінної мають такі значення: Усі розрахункові дані для нормалізації змінних Х1, Х2, X3, згідно з поданими співвідношеннями наведено в табл. 2. Таблиця 2
Тоді знаменник для нормалізації кожної незалежної змінної буде такий. Матриця нормалізованих змінних подається у вигляді:
Крок 2. Визначення кореляційної матриціде – матриця нормалізованих незалежних змінних; – матриця, транспонована до X*. Ця матриця симетрична і має розмір 3 х 3. Запишемо шукану кореляційну матрицю
Кожний елемент цієї матриці характеризує тісноту зв’язку однієї незалежної змінної з іншою. Оскільки діагональні елементи характеризують тісноту зв’язку кожної незалежної з цією самою змінною, то вони дорівнюють одиниці. Решта елементів матриці rхх такі: тобто вони є парними коефіцієнтами кореляції між незалежними змінними. Користуючись цими коефіцієнтами, можна зробити висновок, що між змінними Х1, Х2, Х3 існує кореляційний зв’язок. Чи є цей зв’язок виявленням мультиколінеарності? Щоб відповісти на це запитання, потрібно ще раз звернутися до алгоритму Фаррара-Глобера і знайти статистичні критерії оцінки мультиколінеарності. Крок 3. Обчислимо детермінант кореляційної матриці r і критерій c2 Якщо ступінь свободи , а рівень значущості a=0,01, критерій. Оскільки доходимо висновку, що в масиві змінних не існує мультиколінеарності. Далі недоцільно реалізувати алгоритм Фаррара-Глобера, бо вже очевидно, що мультиколінеарності між досліджуваними незалежними змінними нема. Приклад виконання завдання при наявності мультиколеніарностіНа доход підприємства впливає низка чинників. Вирізнимо серед них продуктивність праці, кількість працівників, фондовіддача. Щоб побудувати економетричну модель доходу підприємства від вказаних чинників за методом найменших квадратів, потрібно переконатися, що продуктивність праці, кількість працівників, фондовіддача, як незалежні змінні моделі – не мультиколінеарні. Дослідити наведені чинники на наявність мультиколінеарності. Вихідні дані наведено в табл.3. Таблиця 3
Порядок виконання завданняДослідимо наявність мультиколінеарності, виконавши такі кроки:
Крок 1. Нормалізація (стандартизація) незалежних змінних моделі. Обчислимо середні арифметичні незалежних змінних: Визначимо стандартні відхилення. Позначимо вектори незалежних змінних – продуктивності праці, фондомісткості, коефіцієнтів плинності робочої сили – через Х1, Х2, Х3. Елементи нормалізованих векторів обчислимо за формулою: де n – кількість спостережень, n = 15; m – кількість незалежних змінних, m = 3; – середнє арифметичне значення компонентів вектора хk; – дисперсія змінної хk. Із формули випливає, що спочатку потрібно обчислити середні арифметичні значення і величини для кожної незалежної змінної. Дисперсії кожної незалежної змінної мають такі значення: Усі розрахункові дані для нормалізації змінних Х1, Х2, X3, згідно з поданими співвідношеннями наведено в табл. 4. Таблиця 4
Тоді знаменник для нормалізації кожної незалежної змінної буде такий: Матриця нормалізованих змінних подається у вигляді:
Крок 2. Розрахунок кореляційної матриці нульового порядку). де X* – матриця нормалізованих пояснювальних змінних; – матриця, транспонована до X*. Маємо:
Кожний елемент цієї матриці характеризує тісноту зв’язку однієї незалежної змінної з іншою. Оскільки діагональні елементи характеризують тісноту зв’язку кожної незалежної з цією самою змінною, то вони дорівнюють одиниці. Решта елементів матриці rхх такі:
Парні коефіцієнти кореляції характеризують тісноту зв’язку між двома змінними. Вони можуть змінюватися в межах Коефіцієнти парної кореляції r12 , r13 та r23 близькі до одиниці, тому можна передбачити, що досліджувані незалежні змінні є мультиколінеарними. Користуючись цими коефіцієнтами, можна зробити висновок, що між змінними Х1 і Х2 , Х1 і Х3 та Х2 і Х3 існує вельми високий зв’язок. Якщо цей зв’язок є виявленням мультиколінеарності, то це негативно впливатиме на оцінку параметрів економетричної моделі. Звертаємося до алгоритму Фаррара-Глобера. Крок 3. Обчислимо детермінант кореляційної матриці rхх і критерій c2: ln|rxx | = –4,482; Отже, критерій c2= 54,5307. Якщо ступінь свободи дорівнює а рівень значущості a=0,01, то критерій c2табл = 11,3449. Оскільки – робимо висновок, що в масиві змінних існує мультиколінеарний зв’язок. Крок 4. Розрахуємо матрицю, обернену до матриці rxx :
Матриця C – симетрична, і її діагональні елементи завжди мають бути додатними. Крок 5. Визначення F-критерію: де n – кількість спостережень; m – кількість пояснювальних змінних. Виконавши обчислення, дістанемо: Коли a = 0,05 і ступені свободи m–1=3–1=2, n–m=15–3=12 маємо Fкрит = 3,885. Фактично знайдене значення F-критерію порівнюємо з табличним. У нашому випадку Fфакт > Fкрит , тобто незалежні змінні мультиколінеарні з рештою змінних. Коефіцієнт детермінації до кожної змінної:
Якщо коефіцієнт детермінації наближається до одиниці, то незалежна змінна мультиколінеарна з іншими. Крок 6. Обчислення частинних коефіцієнтів кореляції: де сkj – елемент матриці С, що міститься в k-му рядку i j-му стовпці;
Частинні коефіцієнти кореляції характеризують рівень тісноти зв’язку між двома змінними за умови, що решта змінних на цей зв’язок не впливає. Частинні коефіцієнти кореляції за модулем нижчі, ніж коефіцієнти парної кореляції, бо на їхній рівень не впливає решта змінних, які мають зв’язок із цими двома. Крок 7. Обчислення t-критеріїв:
Обчислені t-критерії порівнюємо з табличним за вибраного рівня значущості a = 0,05 і ступенів свободи n–m= 12. Якщо tkj більше за tтабл, як у нашому випадку, то пара цих пояснювальних змінних тісно пов’язана між собою. Оскільки розраховані t12 > tтабл та t13 > tтабл , то можна зробити висновок, що пари цих пояснювальних змінних (X1 і X2 та X1 і X3) – тісно пов’язані між собою. Висновок. Оскільки – робимо висновок, що в масиві змінних існує мультиколінеарний зв’язок. t12 > tтабл – між змінними Х1 і X2 (продуктивністю праці та чисельністю працівників) існує мультиколінеарність. t13 > tтабл – між змінними Х1 і X3 (продуктивністю праці та фондовіддачею) існує мультиколінеарність. А це означає, що метод найменших квадратів застосувати в цьому разі не можна. З повагою ІЦ "KURSOVIKS"! |