Практична робота 2 на тему Лінійна регресія
« НазадПрактична робота №2Тема: Лінійна регресія Створимо новий файл, в якому змінну VAR1 заповнимо послідовно значеннями від 0 до 10, змінну VAR2 – випадковими значеннями від 0 до 1, а змінну VAR3 задамо, як суму VAR1+ VAR2. Виконаємо послідовність команд: Statistics -> Basic Statistics/Tables -> Descriptive Statistics -> Prob.&Scatterplots (див. рис. 6.1). Як Variables виберемо VAR1-VAR3, натиснемо кнопку 2D Scatterplot. У першому списку змінних вкажемо VAR1, в другому – VAR3 і натиснемо кнопку ОK (див. рис. 6.2). На графіку, що з’явився, зображено пряму лінійної регресійної моделі для VAR3 через VAR1, а у верхній частині вікна бачимо рівняння лінійної регресії (див. рис. 6.3). Якщо у змінній VAR3 замінити одне із значень, наприклад на 70, і побудувати графік знову, то побачимо, що рівняння регресії буде враховувати дане значення і з графіка буде очевидно, що 70 є викидом (див. рис. 6.4). Натиснемо піктограму Brushing. У вікні, що з’явиться зробимо активними Exclude та Box, виділимо прямокутником значення (див. рис. 6.5) і натиснемо кнопку Apply. Виділене значення зникне з графіка і регресійна пряма змінить своє положення. Для того, щоб значення викиду не виводилось у наступних графіках та не враховувалось при обчисленні регресійної формули, у змінній VAR4 заповнимо всі значення одиницями, а те значення, що стоїть напроти викиду – нулем (див. рис. 6.6). У вікні Descriptive Statistics натиснемо кнопку Weight (див. рис. 6.1). Оберемо змінну VAR4, перемкнемо Status на On та натиснемо OK (див. рис. 6.7). Тепер при аналізі викиди враховуватися не будуть. Нехай маємо таку таблицю з даними:
де Y – врожайність, X – добрива, Z – опади. Потрібно знайти формулу багатофакторної лінійної регресії для Y: Y=B0 +B1 X+B2 Z, де Bі – невідомі коефіцієнти. Виконаємо послідовність команд: Statistics -> Multiple Regression, як змінні оберемо Y – залежна, X і Z – незалежні (див. рис. 6.8). Натиснемо OK. Отримуємо результат, який зображено на рис. 6.9. В закладці Quick натиснемо кнопку Summary: Regression results.У вікні, що з’явилось (див. рис. 6.10), бачимо оцінки параметрів та допоміжну статистику. Обидві змінні значимі (виділені червоним). У третьому стовпці таблиці вказані оцінки для коефіцієнтів Bі . Отже, Y=28.095+0.038*X+0.833*Z. Якщо наші змінні попередньо стандартизувати, то у результаті такого регресійного аналізу отримали б оцінки коефіцієнтів, які записані в першому стовпчику таблиці (зрозуміло, що В0=0). Коефіцієнти з першого стовпця показують внесок у регресійну модель змінних X та Z. Для того, щоб обчислити передбачуване значення для Y для заданих X та Z і побудувати 95% проміжок надійності, перейдемо у закладку Residuals/assumptions/prediction і натиснемо Predict dependent variable (див. рис. 6.11). У відповідні віконця вводимо значення змінних X та Z (див. рис. 6.12) і натискаємо OK. Якщо незалежні змінні набувають одного і того ж значення його можна ввести у віконці Common Value і натиснути Apply. У вікні результатів аналізу (див. рис. 6.13) бачимо передбачуване значення Y, верхню і нижню межу надійного проміжку для цього значення. Якщо ж потрібно подивитись як розподілені залишки, то натиснемо кнопку Perform residual analysis. У вікні, що з’явилось (див. рис. 6.14), зібрані різні методи для аналізу залишків регресійної моделі. Наприклад, натиснувши Normal plot of residuals отримаємо Q-Q графік, на якому видно наскільки залишки узгоджуються з нормальним законом розподілу (див. рис. 6.15). Контрольні запитання
З повагою ІЦ "KURSOVIKS"! |