Роздрукувати сторінку
Главная \ Методичні вказівки \ Методичні вказівки \ 296 Методичні вказівки до практичної роботи №13 - Застосування кореляційно-регресійного аналізу в табличному процесорі MS Excel, НУДПСУ

Методичні вказівки до практичної роботи №13 - Застосування кореляційно-регресійного аналізу в Excel

« Назад

Лабораторна робота № 2

Тема роботи: Застосування кореляційно-регресійногоаналізу в табличному процесорі MSExcelдлявизначення параметрів функціональної залежності між результативним  фактором та факторами-показниками при обґрунтуванні бізнес-плану створення нової  структурної одиниці

Мета роботи: оволодіти методикою застосування кореляційно-регресійного аналізу в  табличному процесорі MSExcelдля визначення параметрів функціональної  залежності.

 

Завдання та порядок виконання роботи

1. Визначити тісноту зв'язку між результативним показником - прибуток від реалізації  та кожним з показників-факторів (торгова площа, чисельність робітників, індекс інфляції, вартість основних засобів, власний капітал), використовуючи функцію КОРЕЛ. Записати формулу залежності між ними та  параметри цієї залежності (функція ЛИНЕЙН).  Довести, що визначена залежність не є  випадковою (за критерієм Фішера). Визначити формулу та параметри множинної регресії між результативним показником та всіма показниками-факторами. Необхідні дані наведені в таблиці. Результати проілюструвати  відповідними графіками.

Період дослідже-ння, місяць

Фактичний розмір прибутку від реалізації, тис.грн.

Торгова площа, кв.м

Чисель-ність працівни-ків, чол.

Індекс інфля-ції

Вартість основних засобів, тис.грн.

Власний капітал, тис.грн.

1

325

23333

1137.5

1.625

650

3939

2

177

23333

619.5

1.25

885

4477

3

1084

23333

3794

5.42

4336

5092

4

691

23244

2418.5

1.4

1382

5722

5

233

23409

815.5

1.165

1165

4090

6

670

23409

2345

3.35

4020

5090

7

780

23333

2730

1.54

3900

5467

8

500

23244

1750

2.5

1000

5600

9

920

23244

3220

1.69

3680

5780

10

670

23333

2500

1.75

2680

5899

11

419

23333

1000

2.095

838

6000

12

320

23409

1120

1.85

1280

6123

13

654

23409

2289

3.27

2616

6123

14

320

23409

900

1.6

640

6250

15

204

23409

800

1.02

1020

6300

16

540

23244

1890

2.05

1080

6320

17

460

23244

1620

2.3

1840

6470

18

365

23244

1100

2.15

730

6508

19

230

23244

900

2.25

460

6500

20

400

23244

1300

2

1600

6660

ПОРЯДОК РОЗВ'ЯЗКУ ЗАВДАНЬ ЛАБОРАТОРНОЇ РОБОТИ

1. Створимо на робочому аркуші подану в лабораторній роботі таблицю, значення факторів якої будуть використовуватися в подальшому для проведення кореляційно-регресійного аналізу.

2. Для розрахунку коефіцієнтів кореляції та визначення ступеня зв'язку між результативним показником (фактичний розмір прибутку від реалізації) та окремими факторами (торгова площа, чисельність працівників, індекс інфляції, вартість основних засобів, власний капітал) побудуємо на цьому ж  робочому аркуші  наступну таблицю (в комірках стовпчика Коефіцієнт кореляції нижче значень цих коефіціентів наведена також функція КОРРЕЛ із списком аргументів для їх розрахунку):

Результативний показник

Фактор

Коефіцієнт кореляції

Ступінь зв'язку

Фактичний розмір прибутку від реалізації

Торгова площа

-0.16558551 =КОРРЕЛ(B2:B21; C2:C21)  

слабкий

Фактичний розмір прибутку від реалізації

Чисельність працівників

0.989475321 =КОРРЕЛ(B2:B21; D2:D21)

сильний

Фактичний розмір прибутку від реалізації

Індекс інфляції

0.602440569 =КОРРЕЛ(B2:B21; E2:E21)

середній

Фактичний розмір прибутку від реалізації

Вартість основних засобів

0.862496521 =КОРРЕЛ(B2:B21; F2:F21)

 

сильний

Фактичний розмір прибутку від реалізації

Власний капітал

-0.015051516 =КОРРЕЛ(B2:B21; G2:G21)

слабкий

Вигляд цієї таблиці на робочому аркуші в табличному процесорі подано на малюнку.

Розрахунок коефіцієнтів кореляції здійснюється за допомогою статистичної функції КОРРЕЛ (масив1; масив2), один з аргументів якої задає область значень залежної змінної, а другий - область значень незалежної змінної. Для кожного показника фактора розраховується коефіцієнт кореляції. Усі коефіцієнти кореляції (К) оцінюються за такими критеріями:

  • К<0,5 - слабка залежність (фактор можна далі не досліджувати, оскільки він є не впливовим на результативний показник);

  • 0,5<K<0,7 - середній зв'язок (варто досліджувати вплив фактора на результативний показник далі);

  • K>0,7 - зв'язок сильний (фактор обов'язково включають до подальшого дослідження).

Кореляційний аналіз показав, що: між прибутком від реалізації та торговою площею існує слабка залежність (К=-0.16558551); між прибутком від реалізації та чисельністю працівників - сильний зв'язок (К=0.989475321); між прибутком від реалізації та індексом інфляції - середній зв'язок (К=0.602440569); між прибутком від реалізації та вартістю основних засобів - сильний зв'язок (К=0.862496521); між прибутком від реалізації та власним капіталом - слабка залежність (К=-0.015051516).

3. Для перевірки лінійності зв'язку між прибутком реалізації та чисельністю працівників, між прибутком реалізації та індексом інфляції, між прибутком реалізації та вартістю основних засобів (відібрані ті фактори, які суттєво пов'язані з результативним показником) застосуємо статистичну функцію ЛИНЕЙН. Ця функція використовує метод найменших квадратів для обчислення прямої лінії та повертає масив, який її описує. Рівняння для прямої має такий вигляд: Y=a1X1+a2X2+...+b (у випадку множинної регресії) або Y=aX+b, де залежне значення  Y є функцією незалежного значення Х. Значення а - це коефіцієнти, які відповідають кожній незалежній змінній Х, а b - це константа. У нашому випадку Y та X є масивами. Також функція ЛИНЕЙН може повертати додаткову регресійну статистику. Розглянемо синтаксис функції =ЛИНЕЙН (відомі значення Y; відомі значення Х; конст; статистика). Відомі значення Y та Х - це множина значень у та х, які вже відомі для співвідношення Y=aX+b; конст - це логічне значення, яке вказує на те, чи потрібно, щоб константа b була рівна 0 ( значення 1 - b обчислюється звичайним способом; значення 0  означає, що b=0 і значення а підбираються таким чином, щоб Y=aX); статистика - це логічне значення, яке вказує на те, чи потрібно повернути додаткову статистику по регресії (значення 0 - функція ЛИНЕЙН повертає тільки коефіцієнт а та константу b; значення 1 - функція ЛИНЕЙН повертає додаткову регресійну статистику, та масив, що повертається цією функцією буде мати вигляд: {an;an-1;...;a1;b:sen;sen-1;...;se1;seb:r2;sey:F;df:ssreg;ssresid}. Тлумачення величин масиву подано в таблиці:

Величина

Опис

sen;sen-1;...;se1

стандартні значення похибок для коефіцієнтів

an;an-1;...;a1

seb

стандартне значення похибки для константи b

r2

коефіцієнт детермінованості, нормований від 0 до 1.Якщо він дорівнює 1, то нема різниці між фактичними та оцінюваними значеннями Y; якщо ж він дорівнює 0, то рівняння регресії не може бути використане для передбачення значень Y.

sey

стандартне значення похибки для Y

F

F-статистика використовується для визначення випадковості зв'язку між залежною та незалежною змінними.

df

ступені вільності, використовуються для знаходження F-критичних значень в статистичній таблиці.

ssreg

регресійна сума квадратів

ssresid

залишкова сума квадратів

В наступній таблиці показано, в якому порядку повертається регресійна статистика функцією ЛИНЕЙН на полі робочого аркуша табличного процесора:

an

an-1

...

a2

a1

b

sen

sen-1

...

se2

se1

seb

r2

sey

 

 

 

 

F

df

 

 

 

 

ssreg

ssresid

 

 

 

 

Обчислимо значення параметрів лінійної регресії та коефіцієнти рівняння прямої Y=aX+b  для масиву незалежної змінної - прибуток від реалізації (Y) та масиву залежної змінної - чисельністю працівників (Х). У нашому випадку функція ЛИНЕЙН буде мати такий синтаксис =ЛИНЕЙН(B2:B21;D2:D21;1;1) та вигляд у вікні Майстра функцій.

Після натискання кнопки Готово у комірці B34 з'явиться тільки перша величина з масиву параметрів лінійної регресії - значення коефіцієнта а. Для того, щоб на робочому листі MS Excel з'явилися всі величини зазначеного вище масиву, необхідно за допомогою мишки виділити блок комірок B34:C38, поставити курсор в кінець рядка формул та одночасно натиснути комбінацію клавіш Ctrl+Shift+Enter. Після цих дій у блоці комірок B34:C38 з'являться всі параметри лінійної регресії, значення яких представлені в наступній таблиці:

0.274105055

28.70879776

0.00944821

18.18253339

0.979061411

37.1013424

841.6567677

18

1158548.627

24777.17294

 Виходячи з одержаних параметрів лінійної регресії, запишемо рівняння Y=0,274X+28,71, яке описує лінійний зв'язок між прибутком, одержаним від реалізації, та чисельністю працівників. Коефіцієнт детермінованості становить 0,9771. Для перевірки не випадковості лінійності зв'язку визначимо табличне значення F-критерія та порівняємо його з одержаним за допомогою функції ЛИНЕЙН. Для визначення табличного значення F-критерія застосуємо функцію FРАСПРОБР(ймовірність; ступені вільності1;ступені вільності2), де ступені вільності1 - число змінних, ступені вільності2 - число точок даних, ймовірність - ймовірність, пов'язана з F-розподіленням. У нашому випадку  табличне F-критичне, розраховане за допомогою функції =FРАСПРОБР(0.05;1;20), становить 4,35, і воно в 193 рази менше F-критичного, поверненого функцією ЛИНЕЙН. Цей результат свідчить про невипадковість лінійності зв'язку між прибутком та чисельністю працівників. Вікно функції FРАСПРОБР у вікні Майстра функцій.

Розрахуємо теоретичні значення Y згідно з функцією Y=0,274X+28,71 та порівняємо їх з експериментальними. Для цього побудуємо на робочому аркуші табличного процесора наступну таблицю:

Y-експериментальне

Х

Y-теоретичне

325

1137.5

340.385

177

619.5

198.453

1084

8011.5

2223.861

691

2418.5

691.379

233

815.5

252.157

670

2345

671.24

780

2730

776.73

500

1750

508.21

920

3220

910.99

670

2500

713.71

419

1000

302.71

320

1120

335.59

654

2289

655.896

320

900

275.31

204

800

247.91

540

1890

546.57

460

1620

472.59

365

1100

330.11

230

900

275.31

400

1300

384.91

На робочому аркуші табличного процесора ця таблиця займає блок комірок A39:C59. За даними таблиці побудуємо діаграму у вигляді графіка з зображенням різниці між Y-теоретичним та Y-експериментальним за допомогою Майстра діаграм MS Excel. Алгоритм побудови графіка проілюструємо послідовністю діалогових вікон Майстра діаграм.

Побудована діаграма наведена в Додатку А. Для перевірки лінійності зв'язку між прибутком реалізації та індексом інфляції, між прибутком реалізації та вартістю основних засобів, а також його кількісного виразу  слід повторити наведене у пункті 3 дослідження, яке стосувалося таких факторів, як прибуток реалізації і чисельність працівників. При цьому необхідно за допомогою статистичної функції ЛИНЕЙН отримати коефіцієнти лінійного рівняння та параметри лінійної регресії, довести невипадковість лінійного зв'язку, а також розрахувати теоретичні значення результативного показника-прибутку реалізації та візуально порівняти їх з експериментальними за допомогою діаграми.

4. Тепер дослідимо лінійність зв'язку між результативним показником- прибутком реалізації та сукупністю факторів: чисельність працівників, індекс інфляції та вартістю основних засобів. А також обрахуємо коефіцієнти лінійного рівняння виду Y=a1X1+a2X2+a3X3+b та параметри лінійної множинної регресії за допомогою статистичної функції ЛИНЕЙН.

 Обчислимо значення параметрів множинної лінійної регресії та коефіцієнти рівняння прямої Y=a1X1+a2X2+a3X3+b для масиву незалежної змінної - прибутку від реалізації (Y) та масиву залежних змінних - чисельності працівників (Х1), індексу інфляції (Х2), вартості основних засобів (Х3). У нашому випадку функція ЛИНЕЙН буде мати такий синтаксис = ЛИНЕЙН(B2:B21;D2:F21;1;1), вона поверне масив параметрів лінійної множинної регресії, значення яких представлені в наступній таблиці:

0.08954611

-38.486972

0.09916265

228.433349

0.02811293

37.7088085

0.02961645

61.5884969

0.86322247

100.577202

#Н/Д

#Н/Д

33.6594272

16

#Н/Д

#Н/Д

1021473.42

161852.376

#Н/Д

#Н/Д

Виходячи з одержаних параметрів лінійної регресії, запишемо рівняння Y=0,10X1-38,49Х2+0,09Х3+228,43, яке описує лінійний зв'язок між прибутком, одержаним від реалізації, та факторами: чисельністю працівників, індексом інфляції та вартістю основних засобів. Коефіцієнт детермінованості становить 0,863. Для перевірки невипадковості лінійності зв'язку визначимо табличне значення F-критерія та порівняємо його з одержаним за допомогою функції ЛИНЕЙН. Для визначення табличного значення F-критерія застосуємо функцію FРАСПРОБР з таким синтаксисом: = FРАСПРОБР(0.05;1;20) становить 4,35 і воно приблизно в 8 разів менше F-критичного, поверненого функцією ЛИНЕЙН. Цей результат свідчить про невипадковість лінійності зв'язку між прибутком та факторами: чисельністю працівників, індексом інфляції та вартістю основних засобів.

Розрахуємо теоретичні значення Y згідно з функцією Y=0,10X1-38,49Х2+0,09Х3+228,43 та порівняємо їх з експериментальними. Для цього побудуємо на робочому аркуші табличного процесора наступну таблицю:

Y- експериментальне

Х1

X2

X3

Y-теоретичне

325

1137.5

1.625

650

108.46

177

619.5

1.25

885

92.57

1084

8011.5

5.42

4336

974.11

691

2418.5

1.4

1382

309.70

233

815.5

1.165

1165

140.35

670

2345

3.35

4020

463.58

780

2730

1.54

3900

560.67

500

1750

2.5

1000

166.86

920

3220

1.69

3680

583.79

670

2500

1.75

2680

420.54

419

1000

2.095

838

93.57

320

1120

1.85

1280

154.48

654

2289

3.27

2616

335.38

320

900

1.6

640

84.98

204

800

1.02

1020

131.41

540

1890

2.05

1080

205.23

460

1620

2.3

1840

236.89

365

1100

2.15

730

91.70

230

900

2.25

460

43.84

400

1300

2

1600

195.21

За даними таблиці побудуємо діаграму у вигляді графіка з зображенням різниці між Yтеоретичним та Yекспериментальним за допомогою Майстра діаграм MS Excel. Побудована діаграма наведена в Додатку Б.

5. Самостійно провести кореляційно-регресійний аналіз зв"язку зміни   балансового прибутку підприємства та факторів, що його ймовірно обумовлюють, за даними наступної таблиці: 

Період дослідже-ння варіації основних засобів та факторів

Фактичний розмір балансо-вого прибутку

Торгова площа

Середрьо-спискова чисельність

Обігові активи

Власний капітал

01.05.98

10,20

705,00

133

504,60

622,80

01.06.98

10,70

705,00

133

510,20

623,00

01.07.98

11, 40

705,00

133

514,40

623,40

01.08.98

16,40

740,00

136

469,30

634,90

01.09.98

16,20

740,00

136

476,10

658,20

01.10.98

15,10

740,00

135

474,00

665,00

01.11.98

11,45

720,00

129

397,80

670,00

01.12.98

11,35

720,00

129

396,20

679,10

01.01.99

11,20

720,00

129

396,00

673,00

01.02.99

11,10

720,00

131

509,00

670,90

01.03.99

10,60

720,00

132

509,80

670,00

01.04.99

10,30

720,00

132

509,40

672,20

З повагою ІЦ "KURSOVIKS"!