Лабораторна робота 2 на тему Множинна лінійна кореляційна модель, Економетрія, НУХТ
« Назад
Лабораторна робота 2 на тему Множинна лінійна кореляційна модель
Мета роботи: сформувати у студентів практичні навички дослідження багатофакторної регресійної моделі на конкретному прикладі. Завдання роботи: згідно з варіантом (додаток 5) побудувати множинну лінійну регресійну модель виду . Вибірка статистичних даних характеризує дослідження обсягу виробленої продукції (Y), тис. т в залежності від вартості основних засобів (Х1), тис. грн. та чисельності працюючих (Х2), чол. Порядок виконання роботи: 1. Знайти параметри моделі. 2. Проаналізувати достовірність моделі та її параметрів. Для аналізу необхідно розрахувати:
3. Знайти прогнозні значення матриці залежних змінних Yпр, які відповідають очікуваним значенням матриці незалежних змінних Xпр. 4. Відобразити модель на графіку. 5. Зробити економічний висновок. У моделях множинної регресії розглядають множину даних по кожному зі змінних як вектор-стовпчик, а вільному членові відповідає вектор, що складається лише з одиниць. – вектор-стовпець залежної змінної. b*– вектор параметрів. Векторну оцінку параметрів теоретичної моделі (b*) знаходять за методом найменших квадратів. Для цього треба виконати обчислення за формулою (6.1), яка в нашому випадку буде мати вигляд. Приклад виконання завданняЗадача. Згідно з вибіркою статистичних даних за 8 років, які характеризують обсяг виробленої продукції (Y), тис. т в залежності від вартості основних засобів (Х1), тис. грн. та чисельності працюючих (Х2), чол. побудувати лінійну регресійну модель виду: Y = b0 + b1 X1 + b2 X2. Знайти векторну оцінку b* за методом найменших квадратів, для цього треба виконати обчислення за формулою (1) Оцінити тісноту та значимість зв’язку між змінними моделі; проаналізувати достовірність моделі та її параметрів. Відобразити модель на графіку. Застосувати модель для прогнозування розвитку економічних процесів. Виконати економічний аналіз отриманих результатів. Вихідні дані для розрахунку в табл..1. Таблиця 1
1. Знайти векторну оцінку b* за методом найменших квадратів. Складемо матрицю X. Перший її стовпчик містить лише одиниці (він відповідає незалежній змінній Х0 – вільному членові); інші стовпчики є відповідно векторами Х1, Х2.
Далі виконуємо операції над матрицями відповідно формули (1).
Транспонування матриці просто реалізувати за допомогою “майстра функцій f” (операція ТРАНСП(.) у категорії “Ссылки и массивы“). Звернення до математичних та статистичних функцій Excel. =МУМНОЖ(B41:I43;C29:E36)
Функція Microsoft Excel МУМНОЖ(. , .) – знаходить добуток матриць. Для цього треба: 1) відмітити поле, де буде знаходитись результат добутку матриць; 2) ввійти у "майстер функцій f". У категоріях вибираємо "математичні", а в функціях – МУМНОЖ. Вводимо адреси матриць, добуток яких знаходимо; 3) для того, щоб отримати на екрані значення добутку матриць, натискаємо спершу клавішу F2, а потім Ctrl+Shift+Еnter. Функція Microsoft Excel МОБР(D46:F48) – знаходить обернену матрицю. Матриця похибок
Функція Microsoft Excel МОБР(.) – знаходить матрицю, обернену до квадратної матриці. Процедура знаходження оберненої матриці аналогічна процедурі мумнож. =МУМНОЖ(B41:I43;H29:H36)
=МУМНОЖ(D51:F53;D56: D58)
Отже, наша регресійна модель має вигляд: Далі знаходяться відповідні значення Yрозр за формулою Y=Х×b* (за допомогою "майстра функцій f" МУМНОЖ( . ; . ) і заносяться до стовпчика "1" табл. 2. Таблиця 2
=МУМНОЖ(C29:E36;D61:D63) Останній рядок таблиці 2 – значення сум квадратів відхилень стовпчиків 2, 3 та 4, які розраховуються за допомогою процедури "майстра функцій f" СУММКВ(.). 2. Проаналізуємо достовірність моделі та її параметрів: Коефіцієнт детермінації моделі обчислюється за формулою: В економічних розрахунках вважається прийнятним такий зв’язок між факторами, при якому r2 > 0,7. Скоригований коефіцієнт детермінації: Скоригований коефіцієнт детермінації не перевищує одиниці Справедлива нерівність: 0,9194 < 0,94246 Множинний коефіцієнт кореляції R розраховується за формулою:, що свідчить про вельми високий кореляційний зв’язок між вхідними показниками Y та X1 і X2 . Парні коефіцієнти кореляції розраховують за формулою матриці коефіцієнтів парної регресії між змінними: Елементи нормалізованих векторів розраховують за формулами: Дисперсії змінних мають такі значення: Тоді знаменники для нормалізації кожної змінної будуть такими: y* : ; xk* : ; xj* : . Таблиця.3
Матриця нормалізованих змінних:
Матриця, транспонована до X*:
Запишемо шукану кореляційну матрицю:
Кожний елемент цієї матриці характеризує тісноту зв’язку однієї змінної з іншою. Оскільки діагональні елементи характеризують тісноту зв’язку кожної змінної з цією самою змінною, то вони дорівнюють одиниці. Решта елементів матриці rхх такі. Вони є парними коефіцієнтами кореляції між змінними. Користуючись цими коефіцієнтами, можна зробити висновок, що між змінними y та xj – високий зв’язок; між змінними y та xk існує досить високий кореляційний зв’язок Частинні коефіцієнти кореляції, як і парні, характеризують тісноту зв’язку між двома змінними, але за умови, що решта змінних сталі. Розрахунок частинних коефіцієнтів кореляції базується на оберненій матриці до матриці rxx(матриця С): де сkj – елемент матриці С, що міститься в k-му рядку i j-му стовпці; Розрахуємо матрицю, обернену до матриці rxx :
Матриця C – симетрична, і її діагональні елементи завжди мають бути додатними. Визначимо частинні коефіцієнти кореляції:
Частинні коефіцієнти кореляції характеризують рівень тісноти зв’язку між двома змінними за умови, що решта змінних на цей зв’язок не впливає. Частинні коефіцієнти кореляції за модулем нижчі, ніж коефіцієнти парної кореляції, бо на їхній рівень не впливає решта змінних, які мають зв’язок із цими двома. Коефіцієнт парної кореляції ryxk = 0,88, тому можна зробити висновок, що рівень тісноти зв’язку між двома змінними (y та xk;) високий за умови, що решта змінних на цей зв’язок не впливає. Коефіцієнт парної кореляції ryxj = 0,7377 – можна зробити висновок, що рівень тісноти зв’язку між двома змінними (y та xj ) високий за умови, що решта змінних на цей зв’язок не впливає. Перевіримо значимість зв’язку між змінними моделі:
Модель приймаємо – припускаємо присутність лінійного зв’язку для рівня надійності р =(1– a) = 0,95 . Стандартні похибки оцінок параметрів з урахуванням дисперсії залишків:
Стандартні помилки параметрів не перевищують абсолютні значення цих параметрів, то це означає, що оцінки параметрів є незміщеними відносно їх істотних значень. Стійкість оцінок параметрів визначається порівнянням стандартних похибок з абсолютними значеннями оцінок параметрів моделі. Порівняємо стандартні похибки оцінки з величиною оцінки параметра. Перевірка значимості коефіцієнта детермінації, коефіцієнта кореляції та оцінок параметрів моделі множинної регресії. Перевірка значимості коефіцієнта детермінації Висувається нульова гіпотеза H0: R2=0, або H0 : b1 = b2 = ... = bn = 0. Альтернативна до неї є НА: (bj ≠ 0) За отриманими в моделі значеннями коефіцієнта детермінації R2 обчислюємо експериментальне значення F-статистики: Визначимо табличне значення F-критерію Фішера:
Порівняємо з табличним значенням розподілу Фішера при ступенях вільності f1=n–m–1, f2=n–1 та рівні значущості a= 0,05: Fексп > Fтабл Нульова гіпотеза відхиляється. Відхилення нуль-гіпотези свідчить про значимість коефіцієнта детермінації. Перевірка значимості коефіцієнта кореляції Коефіцієнт кореляції, як вибіркова характеристика, перевіряється на значущість за допомогою t-критерію Стьюдента при k=n–m1 ступенях вільності та рівні значимості a=0,05.
Величина експериментального значення t-статистики перевищує табличне: |tексп| > tтабл 9,049 > 2,57058 Тобто можна зробити висновок, що коефіцієнт кореляції достовірний (значущий), а зв’язок між залежною змінною та всіма незалежними факторами суттєвий. Перевірка значимості оцінок параметрів моделі множинної регресії Для оцінки значимості кожного параметра моделі перевіряємо їх за допомогою t-критерію Стьюдента: де сjj – діагональний елемент матриці (Х' Х)-1 ; – стандартна похибка оцінки параметра моделі. Статистичну значущість кожного параметра моделі можна перевірити за допомогою t-критерію. При цьому нульова гіпотеза має вигляд: Н0 : bj = 0, альтернативна НА : bj ≠ 0. Будемо наслідувати відповідний алгоритм. Задамо рівень значущості a=0,05, визначимо табличне значення t-критерію Стьюдента (tтабл =2,5058) і розрахуємо значення t-критерію для кожного параметра.
Перевіряємо виконання нерівності | tспос | > tтабл робимо висновки про стійкість впливу відповідного параметру на залежну змінну Y. Знайдемо інтервали надійності для кожного окремого параметра за формулою:
P (17,4 < b0 < 30,37) = 0,95 P (0,37 < b1 < 1,579) = 0,95 P (–0,02 < b2 < 0,779) = 0,95 3. Обчислимо прогнозні значення Yпр: У рівняння Yрозр = 23,89 +0,97X1 +0,38X2 підставимо прогнозні значення фактору Хпр = (1, 15, 35), що лежить за межами базового періоду (точковий прогноз): Yпр = 23,89 + 0,97 × 15 + 0,38 × 35 = 51,79 Тоді M(Yпр) можна розглядати як оцінку прогнозного значення математичного сподівання та індивідуального значення обсягу виробленої продукції при відомих параметрах вартості основних засобів (Х1) та чисельності працюючих (Х2). Визначимо дисперсію прогнозу з урахуванням матриці похибок, яка для прикладу має вигляд:
Елементи дисперсійно-коваріаційної матриці, які розраховуються за формулами і мають значення:
Знайдемо дисперсію прогнозу: Середньоквадратична похибка прогнозу математичного сподівання M(Ynp): Довірчий інтервал для математичного сподівання M(Ynp) прогнозного значення розрахуємо за формулою: де t – табличне значення t-критерію Стьюдента з ступенем вільності k=n–m1 та рівнем значимості a=0,05. 51,79 – 2,57058 × 1,5046 ≤ M(Yпр) ≤ 51,79 + 2,57058 × 1,5046
Знайдемо межі інтервального прогнозу індивідуального значення Yпр. Для цього обчислимо дисперсію та стандартну похибку прогнозу індивідуального значення Yпр: 51,79 – 2,57058 × 1,9858 ≤ Yпр ≤ 51,79 + 2,57058 × 1,9858;
4. Графічне зображення моделі ґрунтується на побудові ліній регресії, в прямокутних координатах Y – x1 та Y – x2 (рис. 1). При цьому масштаб треба обрати таким, щоб мінімальні та максимальні значення x1 та x2 співпадали між собою. Лінія регресії Y=f(X1) при X2=const відображає вплив першого фактора х1 на продуктивність праці при постійному значенні другого х2 (середнє значення х2). Лінія регресії Y=f(X2) при X1=const відображає вплив другого фактора х2 на продуктивність праці при постійному значенні х1 (середнє значення х1).
Рис..1. Графічне зображення моделі 5. Висновки. Згідно з обчисленими характеристиками можна сказати, що обсяг виробленої продукції на 94,2% залежить від вартості основних засобів та чисельності працюючих, а на 5,8% від неврахованих в задачі чинників. Кореляційний зв’язок між залежною змінною та незалежними факторами (вартістю основних засобів та чисельністю працюючих) досить високий (множинний коефіцієнт кореляції дорівнює 0,971). Перевірено значимістьзв’язку між змінними моделі Стандартні помилки параметрів не перевищують абсолютні значення цих параметрів: Це означає, що оцінки параметрів є незміщеними відносно їх істотних значень. Висновки стосовно стійкості оцінок параметрів можна зробити, порівнянням стандартних помилок з абсолютними значеннями оцінок параметрів моделі: Велике значення похибок зумовлюється малою кількістю спостережень, а також неточністю специфікації (не всі основні чинники, що впливають на Y, внесено до моделі). Середньоквадратичне відхилення свідчить про те, що фактичні значення Y відхиляються від розрахункових його значень на ±0,77 тис. т. Відносна похибка – це характеризує модель з хорошої сторони. Проведена перевірка значущості коефіцієнта детермінації за F-критерієм Фішера. Fтабл < Fексп (2,5705<40,95). Коефіцієнт детермінації значущій. Перевірена значимість коефіцієнта кореляції за t-критерієм Стьюдента. tтабл < |tексп| (2,57 < 9,049). Коефіцієнт кореляції достовірний (значущий) і зв’язок між залежною змінною та всіма незалежними факторами суттєвий. Дана оцінка значимості кожного параметра моделі за допомогою Знайдені інтервали надійності для кожного параметра: P (17,4 < b0 < 30,37) = 0,95 P (0,37 < b1 < 1,579) = 0,95 P (–0,02 < b2 < 0,779) = 0,95 Були обчислені прогнозні значення Yпр для Хпр = (1, 15, 35): Yпр = 23,89 + 0,97 × 15 + 0,38 × 35 = 51,79 тис. т. Так, при ймовірності р=0,95 (a=0,05), прогноз математичного сподівання M(Yпр) потрапляє в інтервал [47,9274; 55,6617], а прогноз індивідуального значення Yпр – в інтервал [46,6893; 56,8988]. В економічній інтерпретації це означає, що при прогнозних значеннях вартості основних засобів 15 тис. грн. та чисельності працюючих 35 чол. обсяг виробленої продукції потрапляє в інтервал:
Водночас окремі (інтервальні) значення обсягу виробленої продукції містяться в інтервалі:
Отже, модель є достовірною та відображає тісний зв’язок між залежною та незалежними показниками і може бути використана для практичного економічного висновку. На даному підприємстві збільшення виробництва продукції обумовлюється збільшенням вартості основних засобів та збільшенням чисельності працюючих на підприємстві. Так, на кожні 10 тис. грн. збільшення вартості основних засобів, можливе підвищення випуску продукції на 9,7 тис. т за умови незмінної дії інших чинників. При збільшенні чисельності працюючих на 10 чол. можливе підвищення випуску продукції на 3,8 тис. т, за умови незмінної дії інших чинників. З повагою ІЦ "KURSOVIKS"! |