Методичні вказівки до лабораторної роботи №2 на тему Класифікація і кодування економічної інформації
« НазадЛабораторна робота № 2. Класифікація і кодування економічної інформаціїМета. Засвоєння і закріплення студентами теоретичних знань про методи класифікації та кодування економічної інформації, створення і використання класифікаторів економічної інформації, набуття практичних навиків побудови кодів економічних об'єктів. Короткі теоретичні відомості Методи класифікації Під класифікацією розуміють поділ множини об'єктів на частини за їхньою подібністю чи розбіжністю згідно з прийнятими методами. Існують наступні методи класифікації:
Ієрархічний метод класифікації — це послідовний поділ множини (об'єктів) на підлеглі класифікаційні групування. Множину, яка класифікується, поділяють на підпорядковані підмножини спочатку за певною ознакою (основою поділу) на великі групування, потім кожну з них — на ряд наступних групувань, які в свою чергу поділяють на дрібніші, поступово конкретизуючи об'єкт класифікації. Між цими групуваннями встановлюються відношення підпорядкованості (ієрархії). Приклад. Створити ієрархічну систему класифікації для інформаційного об'єкту "Факультет", яка дозволить класифікувати інформацію про всіх студентів по наступних класифікаційних ознаках: факультет, на якому він вчиться, віковий склад студентів, стать студента, для жінок — наявність дітей. Система класифікації представлена на рис. 3 і матиме наступні рівні: 0-й рівень. Інформаційний об'єкт "Факультет"; 1-й рівень. Вибирається класифікаційна ознака — назва факультету, що дозволяє виділити декілька класів з різними назвами факультетів, в яких зберігається інформація про всіх студентів. 2-й рівень. Вибирається класифікаційна ознака — вік, який має три градації: до 20 років, від 20 до 30 років, понад 30 років. По кожному факультету виділяються три вікові підкласи студентів. 3-й рівень. Вибирається класифікаційна ознака — стать. Кожний підклас 2-го рівня розбивається на дві групи. Таким чином, інформація про студентів кожного факультету в кожному віковому підкласі розділяється на дві групи — чоловіків і жінок. 4-й рівень. Вибирається класифікаційна ознака — наявність дітей у жінок: є, ні. Створена ієрархічна система класифікації має глибину класифікації, рівну чотирьом. Фасетний метод класифікації — це паралельний поділ множини об'єктів на незалежні класифікаційні групування. При цьому множина об'єктів, що характеризується певним набором однакових для всіх об'єктів ознак (фасет), значення яких відповідають конкретним виразам зазначених ознак, може поділятися багаторазово і незалежно. Фасетний метод класифікації є однорівневим, оскільки вхідна множина об' єктів ділиться на підмножини відповідно до значень ознак окремих фасет. Для кожного об'єкта задається конкретне групування фасетів структурною формулою, в якій відображається порядок їх слідування: Кs = Ф1 ,Ф2 ,... ,Фn де Ф і - і-й фасет; п - кількість фасетів. Приклад. Використаємо дані попереднього прикладу, де показана побудова ієрархічної системи класифікації. Для зіставлення розробимо фасетну систему класифікації. Згрупуємо і представимо у вигляді таблиці всі класифікаційні ознаки по фасетах:
Структурну формулу будь-якого класу можна представити у вигляді: Кs = (Факультет, Вік, Пол, Діти). Привласнюючи конкретні значення кожному фасету, отримаємо наступні класи: К1 = (Радіотехнічний факультет, вік до 20 років, жінка, є діти); К2= (Комерційний факультет, вік від 20 до 30 років, жінка, дітей немає); К3 = (Математичний факультет, вік до 20 років, жінка, дітей немає) і т. д.
Дескрипторна система класифікації. Для організації пошуку інформації, для ведення тезаурусів (словників) ефективно використовується дескрипторна (описова) система класифікації, мова якої наближається до природної мови опису інформаційних об'єктів. Особливо широко вона використовується в бібліотечній системі пошуку. Суть дескрипторного методу класифікації полягає в наступному:
Приклад. Як об'єкт класифікації розглядається успішність студентів. Ключовими словами можуть бути вибраний: оцінка, іспит, залік, викладач, студент, семестр, назва предмету. Тут немає синонімів, і тому вказані ключові слова можна використовувати як словник дескрипторів. Як наочна область вибирається учбова діяльність у вищому учбовому закладі. Ключовими словами можуть бути вибраний: студент, навчаний, вчиться, викладач, вчитель, педагог, лектор, асистент, доцент, професор, колега, факультет, підрозділ університету, аудиторія, кімната, лекція, практичне заняття, заняття і т. д. Серед вказаних ключових слів зустрічаються синоніми, наприклад: студент, навчаний, вчиться; викладач, вчитель, педагог; факультет, підрозділ університету і т.д. Після нормалізації словник дескрипторів складатиметься з наступних слів: студент, викладач, лектор, асистент, доцент, професор, факультет, аудиторія, лекція, практичне заняття і т.д. Між дескрипторами встановлюються зв'язки, які дозволяють розширити область пошуку інформації. Зв'язки можуть бути трьох видів: • синонімічні, які вказують деяку сукупність ключових слів як синоніми; • родо-видові, що відображають включення деякого класу об'єктів в більш представницький клас; • асоціативні, дескриптори які використовуються для сполучення, що володіють загальними властивостями. Приклад. Синонімічний зв'язок: студент — що вчиться — навчаний. Родо-видовий зв'язок: університет — факультет — кафедра. Асоціативний зв'язок: студент — іспит — професор — аудиторія.
Система кодування Система кодування застосовується для заміни назви об'єкту на умовне позначення (код) в цілях забезпечення зручної і більш ефективної обробки інформації. Система кодування — сукупність правил кодового позначення об'єктів. Код будується на базі алфавіту, що складається з букв, цифр і інших символів. Код характеризується:
Класифікаційне кодування Класифікаційне кодування застосовується після проведення класифікації об'єктів. Воно ділиться на послідовне і паралельне кодування. Послідовне кодування використовується для ієрархічної класифікаційної структури. Суть методу полягає в наступному: спочатку записується код старшого угрупування 1-го рівня, потім код угрупування 2-го рівня, потім код угрупування 3-го рівня і т.д. В результаті виходить кодова комбінація, кожний розряд якої містить інформацію про специфіку виділеної групи на кожному рівні ієрархічної структури. Послідовна система кодування володіє тими ж достоїнствами і недоліками, що і ієрархічна система класифікації. Приклад. Проведемо кодування інформації, класифікованої за допомогою ієрархічної схеми (див. рис. 3). Кількість кодових угрупувань визначатиметься глибиною класифікації і дорівнює 4. Перш ніж почати кодування, необхідно визначитися з алфавітом, тобто які використовуватимуться символи. Для більшої наочності виберемо десяткову систему числення — 10 арабських цифр. Аналіз схеми на рис. 3 показує, що довжина коду визначається 4 десятковими розрядами, а кодування угрупування на кожному рівні можна робити шляхом послідовної нумерації зліва направо. В загальному вигляді код можна записати як ХХХХ, де X — значення десяткового розряду. Розглянемо структуру коду, починаючи із старшим розрядом: 1-й (старший) розряд виділений для класифікаційної ознаки "назва факультету" і має наступні значення: 1 — комерційний; 2 — інформаційні системи; 3 — для наступної назви факультету і т.д.; 2-й розряд виділений для класифікаційної ознаки "вік" і має наступні значення: 1 — до 20 років; 2 — від 20 до 30 років; 3 — понад 30 років; 3-й розряд виділений для класифікаційної ознаки "підлога" і має наступні значення: 1 — чоловіки; 2 — жінки. 4-й розряд виділений для класифікаційної ознаки "наявність дітей у жінок" і має наступні значення: 1 — є діти; 2 — немає дітей, 0 — для чоловіків, оскільки подібної інформації не вимагається. Прийнята система кодування дозволяє легко розшифрувати будь-який код угрупування, наприклад: 1310 — студенти комерційного факультету, понад 30 років, чоловіки; 2221 — студенти факультету інформаційних систем, від 20 до 30 років, жінки, не мають дітей. Паралельне кодування використовується для фасетної системи класифікації. Суть методу полягає в наступному: всі фасети кодуються незалежно один від одного; для значень кожного фасета виділяється певна кількість розрядів коду. Паралельна система кодування володіє тими ж достоїнствами і недоліками, що і фасетна система класифікації. Приклад. Проведемо кодування інформації, класифікованої за допомогою фасетної схеми (див. табл. 3). Кількість кодових угрупувань визначається кількістю фасетів і дорівнює 4. Виберемо десяткову систему счислення як алфавіту кодування, що дозволить для значень фасетів виділити один розряд і мати довжину коду, рівну 4. На відміну від послідовного кодування для ієрархічної системи класифікації в даному методі не має значення порядок кодування фасетів. В загальному вигляді код можна записати як ХХХХ, де X — значення десяткового розряду. Розглянемо структуру коду, починаючи із старшим розрядом: 1-й (старший) розряд виділений для фасета "стать" і має наступні 28 значення: і — чоловіки; 2 — жінки; 2-й розряд виділений для фасета "наявність дітей у жінок" і має наступні значення: 1 — є діти; 2 — немає дітей, 0 — для чоловіків, оскільки подібної інформації не вимагається; 3-й розряд виділений для фасета "вік" і має наступні значення: 1 — до 20 років; 2 — від 20 до 30 років; 3 — понад 30 років; 4-й розряд виділений для фасета "назва факультету" і має наступні значення: 1 — радіотехнічний, 2 — машинобудівний, 3 — комерційний; 4 — інформаційні системи; 5 — математичний і т.д. Прийнята система кодування дозволяє легко розшифрувати будь-який код угрупування, наприклад: 2135 — жінки у віці понад 30 років, мають дітей і є студентами математичного факультету; 1021 — чоловіки віку від 20 до 30 років, є студентами радіотехнічного факультету.
Реєстраційне кодування Реєстраційне кодування використовується для однозначної ідентифікації об'єктів і не потребує попередній класифікації об'єктів. Розрізняють порядкову і серійно-порядкову систему. Порядкова система кодування припускає послідовну нумерацію об'єктів числами натурального ряду. Цей порядок може бути випадковим або визначатися після попереднього впорядкування об'єктів, наприклад за абеткою. Цей метод застосовується у тому випадку, коли кількість об'єктів невелика, наприклад кодування назв факультетів університету, кодування студентів в учбовій групі. Серійно-порядкова система кодування передбачає попереднє виділення груп об'єктів, які складають серію, а потім в кожній серії проводиться порядкова нумерація об'єктів. Кожна серія також матиме порядкову нумерацію. По своїй суті серійно-порядкова система є змішаною: класифікуючої і ідентифікуючої. Застосовується тоді, коли кількість груп невелика. Приклад. Всі студенти одного факультету розбиваються на учбові групи (в даній термінології — серії), для яких використовується порядкова нумерація. Усередині кожної групи проводиться впорядкування прізвищ студентів за абеткою і кожному студенту привласнюється номер. Розв'язок проблеми інформаційної взаємодії АІС базується на застосуванні загальнодержавних і галузевих класифікаторів техніко-економічної інформації.
Класифікатори Під класифікаторами розуміють систематизовані назви груп класифікаційних групувань, об'єктів, ознак класифікації і їх кодові позначення. Із загальнодержавних класифікаторів найбільший інтерес представляє загальнодержавний класифікатор промислової і сільськогосподарської продукції (ЗКП). ЗКП складається з двох блоків — ідентифікації і назви, — як класифікаційних ознак, так і конкретної продукції. Загальна формула структури повного кодового позначення продукції за ЗКП. Ідентифікаційний блок побудований з використанням шестирівневої ієрархічної системи класифікації, послідовної і паралельної системи кодування десятьма цифровими десятковими знаками, а також ідентифікації об'єктів в межах класифікаційних групувань і включає класифікаційну та ідентифікаційну частини. Класифікаційна частина класифікатора складається з вищих класифікаційних груп (ВКГ). Приєднання до ВКГ ідентифікаційної частини дає ЗКП в повній номенклатурі. Необхідно знати, що ВКГ класу 85 «Швейні вироби» побудовані з використанням п'ятирівневої ієрархічної системи кодування, послідовної і паралельної системи кодування (хх + х + х +:х +:х). Послідовність класифікаційних ознак така: 2 знаки — ознака галузевої приналежності; один знак — ознака виду одягу; один знак — ознака виробу; один знак — ознака матеріалу (паралельне кодування); один знак — вікова ознака. Виділені такі види одягу: одяг верхній, костюми і платтєві вироби, вироби білизняні і одіяла, головні убори, вироби робочі і спеціального призначення, вироби швейні тощо. Види тканин: бавовняні тканини, льяні тканини, штучна шкіра, шерстяні тканини, шовкові тканини, неткані плівкові матеріали, неткані матеріали. Види вікових груп: чоловічі, жіночі вироби, вироби для хлопчиків і дівчат шкільного віку, вироби для хлопчиків і дівчат дошкільного віку, вироби для новонароджених, вироби для дітей. В результаті виконання завдань повинні бути засвоєні загальні принципи різних систем класифікації і кодування номенклатур ознак економічної інформації і методика проектування класифікаторів. Проектування класифікаторів необхідно здійснювати в такому порядку:
Граф класифікаційної множини потрібно подати у вигляді. Структуру класифікаторів, побудованих за багатоаспектною класифікацією, подайте у вигляді набору фасетів з заданиям довжини кожного фасету:
Розрахунок контрольного числа Захист від помилок, які з'явилися в процесі проставлення кодів в документації, первинної обробки, підготовки і передачі даних, вводі інформації в ПК досягається шляхом введення в структуру коду контрольного числа. В загальнодержавних класифікаторах контрольне число коду об'єкта найчастіше є однорозрядним і розраховується за модулем 11. Суть методики розрахунку контрольного числа така. Кожному розряду коду, починаючи із старшого, присвоюється вага у вигляді послідовних чисел натурального ряду.
Далі контрольне число обчислюється за формулою: Контрольне число має один розряд, тобто КЧ = 0, 1, 2,..., 9. Якщо при розрахунку КЧ одержують залишок, рівний 10, то для забезпечення однорозрядного КЧ необхідно зробити його повторний розрахунок, застосовуючи іншу послідовність ваг:
Якщо при повторгому розрахунку КЧ залишок від ділення виявляється рівним 10, то контрольне число приймається рівним 0. Приклад. Потрібно визначити котрольне число коду 290304. В цьому випадку ваги цифр коду будуть такими:
Штрихове кодування Штриховий код являє собою послідовність темних і світлих смуг різної ширини. Інформацію несуть відносні розміри ширини світлих і темних смуг та їх сполучення, причому відносна ширина смуг строго обумовлена. Темні смуги називаються штрихами, а світлі — проміжками (пропусками). Ширина штрихів та пропусків визначається кратною одиницею ширини штриха коду (модулем); так само визначається і висота штрихів і пропусків. Певна сукупність штрихів і пропусків називається знаком і відображає законодавче позначення визначеного символу будь-якого алфавіту. Сполучення знаків, включаючи і допоміжні, відображають інформаційний код. Зчитування штрихового коду здійснюється спеціальними пристроями (сканерами) різних типів. Кожному виду товару присвоюється номер, який складається з 13цифр. Перші дві цифри (зчитування виконується зліва направо) визначають державу, де вироблений даний товар; наступні 5 цифр — фірму (підприємство) — виробника; ще 5 розрядів визначають назву товару та його окремі споживчі властивості; остання цифра коду контрольна і використовується для перевірки правильності зчитування коду сканером. Можливий варіант, коли для коду держави відводиться 3 знаки, а для коду підприємства — 4 знаки. Найчастіше код держави присвоюється Асоціацією EAN (Europen Article Numbering — Європейська система кодування товарів). Подамо деякі коди держав, товари яких найчастіше пропонуються на ринку України. Таблиця 4 ФРАГМЕНТ ЄВРОПЕЙСЬКОЇ СИСТЕМИ КОДУВАННЯ ТОВАРІВ
Розрахунок контрольного розряду коду виконується в такій послідовності:
Приклад. Розглянемо штриховий код 4820000570107 розчинної кави «Галка», виділимо і проінтерпретуємо його компоненти: - 482 — Україна; - 0000— без ідентифікації виробника: - 57010 — 100% натуральна розчинна кава, енергетична цінність 250—300 ккал (ГОСТ 29148-91). Остання цифра коду 7 — контрольне число. Розглянемо порядок розрахунку контрольного числа:
Під час виконання завдання споживчі властивості товарів потрібно характеризувати відповідно до Державного класифікатора продукції та послуг, т. 1. (Київ, Держстандарт України, 1998).
Завдання для лабораторних занять і самостійної роботи
ЗАВДАННЯ 1. Розробити порядковий код торговельних відділів гуртової бази та серійний-порядковий код торговельних складів, використовуючи дані табл. 5. ПОЧАТКОВІ ДАНІ. Гуртова база складається з наступних торговельних відділів та складів (табл. 5). Таблиця 5
ЗАВДАННЯ 2. Використовуючи порядкову, серійно-порядкову системи кодування, закодуйте працюючих в структурних підрозділах райспоживспілки. Розрахуйте контрольне число для десяткового коду одного працюючого в кожному структурному підрозділі. Результати занесіть в табл.6. Таблиця 6 Коди працівників райспоживспілки
ПОЧАТКОВІ ДАНІ. В складі РСС містяться наступні структурні підрозділи з такою кількістю працюючих:
ЗАВДАННЯ 3. Побудуйте вищі класифікаційні групування загальнодержавного класифікатора промислової і сільськогосподарської продукції (ЗКП) для класу 85 «Швейні товари». ПОЧАТКОВІ ДАНІ. Назви швейних виробів класу 85 ЗКП: шерстяні пальто і півпальто; чоловічі костюми із шерстяної тканини; жіночі плаття; плаття із шовкових тканин для дівчат; шкільна форма із шерстяної тканини для хлопчиків; халати робочі з бавовнянопаперової тканини; комбінезони для новонароджених із нетканих матеріалів. При виконанні завдання 3 слід скористатися класифікатором товарів групи «Взуття». ЗАВДАННЯ 4. Розробити код одиниць виміру матеріальних цінностей згідно заданої системи кодування. ПОЧАТКОВІ ДАНІ. На підприємстві використовуються такі одиниці виміру матеріальних цінностей: вартісні — гривні, копійки; лінійні — сантиметр, дециметр, метр, кілометр; об'ємні — літр, кубічний метр, кубічний дециметр; одиниці маси — тона, центнер, кілограм, грам, міліграм; натуральні — штука, флакон, рулон, пачка, коробка, упаковка. ЗАВДАННЯ 5. При побудові коду, захищеного натуральним розрядом, розрахованим за модулем 11, обчислити контрольні розряди для таких кодів:
ЗАВДАННЯ 6. Навести приклади трьох штрихових кодів товарів, виготовлених в Україні, дати повну характеристику товарів відповідно до структури коду і показати порядок обчислення контрольного розряду коду.
Контрольні питання
З повагою ІЦ "KURSOVIKS"! |