Методичний предмет Сучасні інформаційні системи і технології, НУДПСУ
« Назад Метою вивчення курсу “Сучасні інформаційні системи і технології” є ознайомлення студентів з основними поняттями, методами та засобами подання та обробки інформації та формування практичних навичок з питань побудови та функціонування ІСТ у сучасному суспільстві. У результаті вивчення дисципліни студенти набувають необхідних підготовку із застосування ІСТ у своїй фаховій діяльності. Завданням курсу “Сучасні інформаційні системи і технології” є теоретична та практична підготовка майбутніх фахівців з таких питань:
ГЛАВА 1. Сучасні ІСТ: основні визначення та проблемиСучасний етап розвитку суспільства характеризується якісно новою роллю інформації та засобів її обробки. Важливою ознакою сьогодення є перетворення інформаційної сфери на вирішальний чинник розвитку держави. Це підвищує важливість грамотного та ефективного впровадження інформаційних систем та технологій в Україні. З появою персональних комп’ютерів ІСТ отримали новий імпульс для розвитку, все більше задовольняючи інформаційні потреби людей в професійній та побутовій діяльності. Сучасні інформаційні системи значно різняться за рівнем та сферою діяльності, за ступенем централізації обробки інформації, за ступенем інтеграції функцій та за багатьма іншими параметрами. Інформаційні технології та процеси обробки інформаціїТехнологія (від грецьк. "techne" – “вміння”, "logos" – “вчення”). — це сукупність наукових та інженерних знань, що реалізовані у матеріальних та технічних факторах виробництва. ЮНЕСКО визначає інформаційні технології (ІТ) як комплекс наукових, технологічних, інженерних дисциплін, що вивчають методи ефективної організації праці людей, зайнятих обробкою та зберіганням інформації, обчислювальну техніку, методи організації взаємодії з людьми та виробничим обладнанням, їх практичне застосування, а також пов’язані з цим обробленням соціальні, економічні та культурні проблеми. Інформаційна технологія - процес отримання потрібної користувачеві інформації, що складається з чітко регламентованих правил виконання операцій та етапів. Можна розглядати ІТ як сукупність методів та способів розв’язання типових задач обробки інформації, їх програмне реалізація з детальним описом технології вирішення цих задач. Технологічний процес обробки інформації – це послідовність взаємопов’язаних операцій перетворення інформації від її виникнення до використання користувачами для досягнення поставленої цілі. ІТ поєднує об’єкти, дії, правила обробки інформації в індивідуальній та масовій виробничій діяльності. ІТ можна уявити у вигляді ієрархічної структури, що складається з етапів, дій та операцій. До складу ІТ входять мікроелектроніка, виробництво комп’ютерів та програмного забезпечення, зв’язок та телефонія, послуги мобільного зв’язку, забезпечення послуг Інтернет, автоматизація виробництва тощо. Інформаційна система (ІС) - сукупність апаратних та програмних засобів оброблення інформації в певній предметній області для досягнення поставленої користувачем мети. Методологічну основу ІС складає системний підхід, відповідно до якого будь-яка система – це сукупність взаємопов’язаних об’єктів, що функціонують сумісно для досягнення загальної мети. Поведінка системи має ряд властивостей:
Упродовж останнього десятиліття відбулося становлення ітології - нової фундаментальної науки, що вивчає ІСТ, процеси створення й застосування ІС. Поняття інформації. Дані та знанняТермін “інформація” походить від латинського слова “informatio”, що означає “роз'яснення”, “повідомлення”. Під інформацією звичайно розуміють певні відомості, що отримує людина. Інформація - це особливий вид ресурсів – невичерпний. Їй властиві запам’ятовування, передавання, перетворювання, відтворювання, стирання. Інформація є одним з фундаментальних понять науки, таких, як матерія або енергія, тому її важко визначити через інші поняття. Інформацію розглядають як об’єкт комп’ютерної обробки, як продукт праці людини, як міру подолання невизначеності, як взаємини між даними та їх одержувачем тощо. Сировиною для створення інформації є дані - це величини, їх відношення, словосполучення і факти, шляхом перетворення та обробкою яких можна здобути інформацію про предмети, процеси або явища. Можна сказати, що дані - це інформація, зареєстрована за допомогою різноманітних матеріальних носіїв. Знання - це інформація, з якої можна отримати нову інформацію за допомогою логічного виведення та практичного досвіду. Як дані, так і знання входять до інформаційної піраміди. Дані є основою інформаційної піраміди. У будь-якій предметній області (ПрО) існує власне визначення даних. Це ідеї та факти, наведені в формалізованому вигляді, що дозволяє передавати та обробляти їх за допомогою якогось процесу та відповідних технічних засобів. Формування інформації відбувається в момент передавання даних. Інтерпретуючи інформацію, користувач отримує знання. Мудрість утворюється в результаті здобуття знань. Вона з’являється тоді, коли людина знаходить шляхи правильного використання накопичених нею знань. Інформація як властивість матеріїЗ позицій матеріалістичної філософії інформація - це відображення реального світу за допомогою повідомлень. Повідомлення - це форма подання інформації, придатна для передачі. Інформація характеризує взаємодію повідомлення зі споживачем. Інформація як властивість матерії не може існувати поза матерією, тобто вона існувала і буде існувати завжди, її можна накопичувати, зберігати та переробляти. В ІС для передавання інформації мають бути: матеріальний носій інформації, джерела інформації, приймач інформації, канали зв’язку між джерелом та приймачем інформації та повідомлення. Приміром, при передачі усного повідомлення як канал зв’язку можна розглядати повітря, що розповсюджує звукові хвилі. Одержувачами та джерелами інформації можуть бути люди. Активними учасниками цієї системи можуть бути не тільки люди, обмін інформацією може відбуватися у тваринному і рослинному світі або між штучними об’єктами. Носій інформації – це матеріальна субстанція, потрібна для того, щоб повідомлення було передано від джерела до одержувача. Сигнал - це повідомлення, що передається за допомогою носія. Сигнал - це фізичний процес, що змінюється у часі. Такий процес може мати різні характеристики (приміром, під час передачі електричних сигналів можуть змінюватися напруга і сила струму). Параметр сигналу - та з його характеристик, що використовується для подання повідомлень. Дискретнийсигнал - сигнал, параметр якого приймає послідовно в часі скінчену кількість значень. Дискретнеповідомлення - повідомлення, що передається за допомогою дискретних сигналів. Приклад дискретного повідомлення - процес читання книги, інформацію в якій подано у вигляді тексту, тобто дискретною послідовністю окремих символів - букв. Неперервнийсигнал - сигнал, параметр якого - неперервна функція часу. Неперервнеповідомлення - повідомлення, що передається за допомогою неперервнихсигналів. Приклад неперервного повідомлення - людське мовлення, що передається модульованою звуковою хвилею; параметром сигналу в цьому разі є тиск, що утворюється цією хвилею в точці перебування приймача - людського вуха. Дискретизація - перетворення неперервного повідомлення в дискретне. Для цього з нескінченної множини значень цієї функції (параметра сигналу) вибирається скінчена їх множина, елементи якої приблизно можуть характеризувати інші значення. Логіко-семантичний підхід до інформаціїІнформація має використовуватися для орієнтування, активних дій та управління. Властивості інформації:
Під час переходу від нижчих форм руху матерії до вищих властивості інформації якісно змінюються. Приміром, біологічна і соціальна інформація мають, поряд із загальними властивостями, свої специфічні властивості та характеристики. Оцінка кількості інформаціїНайважливіший етап у розвитку теорії інформації - засоби кількісної оцінки інформації. Внаслідок цього з’являється можливість порівняти інформаційні потоки у об'єктах, різних за своєю природою (системи зв'язку, обчислювальні машини, процеси управління, нервова система живого організму). Для вимірювання інформації використовують параметри кількості інформації та обсягу інформації, що мають різні вираження й інтерпретацію залежно від форми аналізу інформації. У 1931 р. французький інженер Р.-Л.Валтат висунув ідею використання бінарної системи числення під час створення механічних лічильних засобів. Бінарна система числення найкраще відображає фізичний стан технічних приладів. У різних системах числення один розряд має різноманітну вагу, і відповідно змінюється одиниця виміру даних: у бінарній системі числення одиниця виміру - біт; у десятковій системі числення одиниця виміру - діт (десятковий розряд). Розроблювачі комп'ютерів віддають перевагу бінарній системі числення тому, що в технічному пристрої найпростіше реалізувати два протилежні фізичних стани: деякий фізичний елемент, що має два різних стани: намагніченість у двох протилежних напрямках; прилад, що пропускає або ні електричний струм; конденсатор, заряджений або не заряджений тощо. Обсяг інформації V, записаної бінарними знаками в пам'яті комп'ютера або на зовнішньому носії інформації, підраховується просто за кількістю необхідних для такого запису бінарних символів. При цьому неможливе не ціле число бітів. Біт - обсяг інформації, записаної одним бінарним знаком - є найменшою можливою одиницею обсягу інформації. Кількість інформації в повідомленні залежить від імовірності його отримання: чим більш імовірним є повідомлення, тим менша кількість інформації в ньому. Цей підхід, запропонований К.Шенноном, хоч і не враховує змістовний бік інформації, виявився дуже корисним у телекомунікаціях та обчислювальній техніці як основа для оптимального кодування повідомлень. Кількість інформації C - теоретико-множинна міра величини інформації в одній випадковій змінній відносно іншої. Біт (bit) - кількість інформації у виборі однієї з двох рівноймовірних подій. Кількість інформації є мірою зменшення невизначеності однієї події через отримання повідомлення про іншу подію. Приміром, повідомлення "Студент Іванов відвідував усі лекції" збільшує ймовірність твердження "Студент Іванов добре складе екзамен". Якщо між подіями не існує зв’язку, то кількість інформації у першому повідомленні про друге дорівнює нулю. Приміром, повідомлення "Студент Іванов має двох кішок та собаку" не зменшує невизначеність результатів екзамену. Зовсім не всякий текст, записаний бінарними символами, припускає вимірювання кількості інформації в ньому, але завжди можна виміряти його обсяг. Якщо ж для якогось повідомлення можна визначити й обсяг, і кількість інформації, то вони не обов’язково збігаються, але кількість інформації не може бути більшою за обсяг. Коефіцієнт інформативності повідомлення - відношення кількості інформації до обсягу даних. Коефіцієнт інформативності повідомлення Y визначається відношенням кількості інформації до обсягу даних, тобто , причому завжди . Збільшення коефіцієнта Y призводить до збільшення ефективності перетворення інформації у системі. Форми адекватності інформаціїПравильність прийняття рішення споживачем інформації залежить від того, наскільки ця інформація адекватна реальному стану об'єкта. Адекватність інформації може виражатися в трьох формах: синтаксичній, семантичній та прагматичній. Синтаксична адекватність відображає формально-структурні характеристики інформації і не торкається її змісту. На синтаксичному рівні враховуються тип носія, спосіб подання інформації, швидкість передачі й обробки, розміри кодів, надійність і точність перетворення цих кодів тощо. Інформацію, що розглядається тільки з цієї точки зору, звичайно називають даними, тому що при цьому не має значення її змістовність. Семантична адекватність визначає ступінь відповідності образу об'єкта самому об'єкту. Вона служить для формування понять і уявлень, виявлення змісту інформації та її узагальнення. Прагматична адекватність відображає відношення між інформацією та її споживачем. Прагматичні властивості інформації можна розглядати тільки тоді, якщо існують інформація про об'єкт, користувач і цілі керування. Прагматична форма адекватності безпосередньо пов'язана з практичним використанням інформації. Семантична та прагматична міри інформаціїСемантична міра інформації S пов'язує семантичні властивості інформації зі спроможністю користувача зрозуміти повідомлення, що надійшло. Семантична міра інформації повідомлення дорівнює 0:
Приміром першого граничного випадку може бути текст на невідомій користувачеві мові, другого – таблиця множення для студента. Максимальну кількість семантичної інформації користувач здобуває при узгодженні її змісту зі своїми знаннями. Коефіцієнт змістовності К - відношення кількості семантичної інформації до її обсягу . Прагматична міра інформації – цінність інформації для досягнення користувачем поставленої мети. Ця міра - величина відносна, зумовлена особливостями використання інформації у тій чи іншій ІС. Цінність інформації визначається тим, наскільки вона допомагає користувачеві у досягнення поставленої перед ним мети. Корисна інформація - інформація, що зменшує невизначеність прийняття рішення. Приміром, підчас екзамену для студента значно ціннішим порівняно з іншими є конспект лекцій саме з цього предмету. Якщо до отримання інформації ймовірність досягнення цілі дорівнює Р0, а після її отримання - Р1, то цінність інформації визначається за формулою та вимірюється у бітах. Якість інформаціїЕфективність використання інформації обумовлюють такі її характеристики, як:
Репрезентативність інформації - правильність її відбору і формування для адекватного відображення істотних властивостей об'єкта. Найважливіше значення тут мають правильність концепції, на базі якої формалізоване вихідне поняття та обґрунтованість відбору істотних ознак і зв'язків об’єкта. Змістовність інформації – це відношення кількості семантичної інформації в повідомленні до його обсягу. Зі збільшенням змістовності інформації зростає ефективність інформаційної системи, тому що для отримання тих самих відомостей потрібно обробити менший обсяг даних. Повнота інформації - наявність достатнього для прийняття правильного рішення набору показників. Як неповна, тобто недостатня для прийняття правильного рішення, так і надлишкова інформація знижують ефективність прийнятих користувачем рішень. Доступність інформації – це можливість отримання і перетворення інформації. Актуальність інформації - ступінь збереження корисності інформації в момент її використання, що залежить від динаміки зміни її характеристик і від інтервалу часу, що пройшов із моменту отримання даної інформації. Своєчасність інформації - її надходження не пізніше заздалегідь призначеного часу, узгодженого з часом вирішення поставленого перед користувачем завдання. Точність інформації - ступінь подібності отриманої інформації до реального стану об'єкта, процесу, явища тощо. Розрізняють:
Достовірність інформації - її властивість відображати реально існуючі об'єкти з необхідною точністю. Достовірність інформації вимірюється ймовірністю того, що відображуване інформацією значення параметра відрізняється від істинного значення цього параметра в межах необхідної точності. ВисновкиІнформація сьогодні - важливий, а іноді і стратегічний ресурс, яким забезпечуються будь-яка діяльність суспільства, держави чи людини. Інформація є одним з фундаментальних наукових понять, тому існують різні підходи до її визначення, вимірювання та оцінки. Список літератури
Контрольні питання1. Що таке інформаційна технологія? 2. Що таке інформаційна система? 3. Що є предметом ітології? 4. Які існують визначення інформації? 5. Як визначається кількість інформації? 6. Що таке повідомлення? 7. Назвіть параметри оцінки якості інформації. 8. Назвіть форми адекватності інформації. ГЛАВА 2. Інформаційні ресурси – об’єкт інформаційних систем та технологійІнформація - один з найцінніших ресурсів суспільстваІнформація являє собою один з найцінніших ресурсів суспільства, таких як природні копалини, тому процес обробки інформації закономірно сприймати як технологію. У сучасному інформаційному суспільстві інформація – це найважливіший стратегічний ресурс. Інформаційні ресурси (ІР) - це інформація, яка має певну цінність та може бути використана людиною в продуктивній діяльності Інформаційні ресурси та документопотоки – основні складові інформаційних технологій та систем. ІР - це окремі документи або масиви документів у ІС (бібліотеках, архівах, фондах, банках даних). Вони використовуються в усіх сферах людської діяльності. Це поняття широко застосовується поряд із такими поняттями, як матеріальні, енергетичні і трудові ресурси. Можна розглядати ІР окремої особистості, підрозділу, підприємства, країни, корпорації. ІР - основний об’єкт інформаційних технологій. ІТ відіграють роль генераторів додаткової вартості ІР, створюючи інформаційні продукти та перетворюючи інформаційну сировину. Собівартість інформаційних продуктів може підвищуватися за рахунок їх модифікації, введення нових процедур обробки даних. Використання ІР збільшує також додаткову вартість інших ресурсів, знижує потреби у землі, праці і капіталі, витрати сировини та енергії, призводить до розвитку нових видів виробництва та звільнення людей від рутинної праці . Загальновідомо, що, застосовуючи різні технології до одного ж того самого матеріального ресурсу, можна отримати різні вироби. Технологія матеріального виробництва описує засоби та методи виготовлення продукції, зміни властивостей сировини та матеріалів. Вона змінює якість та початковий стан матерії з метою отримання матеріального продукту. Це справедливо й для технологій перероблення інформації. Приміром, для підготовки реферату на задану тему кожен студент знаходить відповідні ІР та на основі власних знань відбирає з них найбільш істотні відомості. Інформаційний продукт, який отримує студент (розв’язок задачі), залежить від того, яку технологію він обирає . Кодування інформаціїКодування - процедура присвоєння об'єкту кодового позначення. Система кодування застосовується для заміни назв об'єкта на умовне позначення (код) з метою забезпечення зручної і ефективної обробки інформації. У процесі кодування об’єктам присвоюють цифрові, літерні або цифрово-літерні позначення - коди. Кожний код характеризується:
Алфавіт коду – це сукупність символів, що використовуються для його створення, - букв, цифр тощо. Основа коду – це кількість елементів алфавіту. Довжина коду – кількість символів алфавіту, що використовуються для кодування об’єкта. Структура коду визначає його склад і послідовність розміщення знаків у ньому. Алфавіт і основа коду, якщо задано структуру, визначають місткість коду, тобто кількість об'єктів, які можуть бути закодовані цим кодом без порушення його структури. Місткість коду Е, якщо задано його довжину l та основу a, можна визначити за формулою. Можна виділити дві групи методів, що використовуються у системі кодування:
Існують чотири системи кодування економічної інформації. 1. Порядкова (реєстраційна) система створення коду з натуральних чисел. Алфавіт цього коду становлять числа 0, 1,...,9; основа коду дорівнює 10. 2. Серійно-порядкова система створення коду з натуральних чисел та закріплення серій (діапазонів) кодів за об'єктами з однаковими ознаками. 3. Послідовна система побудови коду з використанням кодів послідовно розміщених класифікаційних угруповань, здобутих у результаті застосування ієрархічної системи класифікації. 4. Паралельна система утворення коду з кодів незалежних угруповань, здобутих у результаті застосування фасетної класифікації. Кодування широко застосовується під час автоматизованої обробки інформації у фінансово-кредитних установах. При цьому кодуються не лише об'єкти, а й самі процеси та операції оброблення, технології, моделі тощо. Завдяки такому підходу вдається істотно зменшити обсяги даних, а отже, і час їх оброблення. Кодування даних застосовують не тільки для спрощення їх оброблення, але й для шифрування, аби приховати зміст інформації. Шифрування як технологічна операція ускладнює процес оброблення даних і збільшує загальні витрати часу за рахунок операцій шифрування і розшифрування. Кодування має забезпечувати в процесі автоматизованого оброблення інформації :
Кодувати об'єкти можна різними способами: вручну, автоматизовано (за допомогою ЕОМ), за допомогою спеціального обладнання тощо. Щоб спроектувати код, потрібно:
Під час автоматизованої обробки економічної інформації важливо контролювати правильність кодів даних, що вводяться з первинних документів, передаються та обробляються в ІС. Тому слід забезпечити автоматичний контроль правильності кодів. Автоматизація контролю правильності кодів базується здебільшого на використанні методу контрольних чисел (контрольних розрядів). Суть цього методу полягає в тому, що до коду, який потрібно контролювати, додають ще один розряд, значення якого обчислюється за значеннями інших розрядів коду. Автоматичне обчислення значення контрольного розряду і його порівняння з переданим або введеним значенням забезпечує контроль правильності передачі або вводу інших розрядів коду. Найрозповсюдженішою функцією, за якою визначається значення контрольного розряду, є просте арифметичне підсумовування. Штрихове кодування інформаціїРозвиток міжнародних торговельних та виробничих стосунків призводить до росту товарних та інформаційних потоків, які необхідно обробляти в умовах територіальної розосередженості виробників і споживачів продукції. Труднощі обліку інформації про товар на його упаковці, наявність неточностей у супровідній документації, відсутність достовірної і своєчасної інформації в постачальників продукції про надходження товару до покупця призводять до необхідності автоматизації маркування та ідентифікації товару. Метою штрихового кодування є відображення основних інформаційних характеристик товару в штрихах-кодах, що забезпечує можливість простежити за рухом товару до споживача. Технологія штрихового кодування призначена для здійснення автоматизованого запису, зчитування й ідентифікації інформації про об'єкти або бізнес-процеси. Ця технологія заснована на використанні бінарного коду для запису і запам'ятовування у вигляді послідовностей штрихів. Штриховий код - це послідовність широких і вузьких, темних і світлих смуг, яким присвоюються логічні значення (широким - 1, вузьким - 0). У різних країнах світу застосовують три системи штрихового кодування:
Коди типу EAN і UCC/EAN широко використовують у всіх країнах світу, у тому числі - в Україні. У кожній системі існують свої типи кодів: UPC-12, EAN-8, EAN-12, EAN-13, EAN-14, UCC/EAN-128 (Code 39). Використання штрихових кодів забезпечує спільну діяльність виробників і споживачів товарів на єдиному товарному ринку. Ця технологія надає захист продукції шляхом її оперативного обліку, управління потоками інформації про пересування і використання продукції, пошук відомостей про ці процеси за запитом у реальному часі на основі ідентифікації об'єктів. Крім того, ця технологія прискорює обмін інформацією як усередині підприємства, так і між підприємствами за допомогою методів і засобів електронного обміну даними. Інформаційні революціїПринципові зміни у ставленні людини до інформації відбулися у зв'язку з можливістю перейти від ручних способів збору й обробки інформації до автоматизованих. Зростання інформаційних потоків призводить до збільшення кількості людей, що працюють в інформаційній сфері. З розвитком продуктивних сил, ускладненням виробництва, його спеціалізацією і кооперацією спостерігається посилення цієї тенденції внаслідок того, що обсяг інформації постійно збільшується, а складність обробки зростає. Тому продуктивність праці людей, зайнятих в інформаційній сфері, зростає набагато повільніше, ніж тих, що безпосередньо створюють матеріальні цінності. Ускладнення індустріального виробництва, соціального, економічного та політичного життя, зміна динаміки процесів усіх сфер діяльності людини привели до зростання потреб у знаннях, створення інших засобів задоволення цих потреб. Екстенсивні засоби еволюції людства виявилися практично вичерпані, але розвиток телекомунікацій, ІТ, обчислювальної техніки дає новий імпульс для створення інформаційного суспільства. Обсяг інформації збільшується в геометричній прогресії, натомість витрати на зберігання, передачу, перероблення інформації перебільшують витрати на енергетику, відтак більша частина працездатного населення переходить працювати в інформаційні сфери. Рушійною силою розвитку суспільства стає виробництво інформаційного, а не матеріального продукту, а товар за сучасних умов стає інформаційно ємнішим, інформаційний фактор впливає на його дизайн, маркетинг та вартість. Найближче на шляху до інформаційного суспільства перебувають країни з високо розвинутою інформаційною інфраструктурою: Японія, США, Німеччина. Приміром, наукові технопарки, які утворилися в процесі інтеграції науки, промисловості та сучасних інформаційних технологій, все більше впливають на електронний бізнес. В історії розвитку цивілізації відбулося кілька інформаційних революцій, внаслідок яких збільшувалась частка людей, що професійно займаються обробленням інформації. Інформаційна революція – це перетворення суспільних відносин, що відбуваються внаслідок змін в інформаційних технологіях. Перша інформаційна революція пов’язана з винаходом писемності, що уможливило накопичення досвіду людства у різних галузях діяльності та призвело до змін у засобах передання інформації від покоління до покоління. Друга інформаційна революція (середина XVI століття) викликана винаходом книгодрукування, що суттєво спростило та пришвидшило передання інформації. Третя інформаційна революція (кінець XIX століття) зумовлена застосуванням електрики для обробки та передання інформації на великі відстані (телеграф, телефон, радіо). Четверта інформаційна революція (70р. XX ст.) пов’язана з винаходом мікропроцесорної технології та застосуванням персональних комп’ютерів для оброблення інформації. П’ята інформаційна революція (початок XXI століття) зумовлена розвитком телекомунікацій та призвела до поступового переходу до інформаційного суспільства. Інформаційне суспільствоСучасне суспільство перетворюється з індустріального на інформаційне, яке характеризується не лише технологічною складовою, але й відповідним рівнем розвитку культури, знань, рівнем освіти, випереджаючими темпами розвитку науки та наукоємних технологій. В інформаційному суспільстві більша частина працездатного населення зайнята у сфері обробки інформації. Про перехід до інформаційного суспільства свідчать такі реалії сьогодення: • прозорість географічних і геополітичних кордонів в умовах міжнародного інформаційного обміну; • глобалізація інформаційних потоків і формування способів та засобів інформаційного обміну, що слабко піддаються контролю державами; • розширення можливостей безпосередніх контактів між різними соціальними і політичними групами; • поява нових форм та видів діяльності в інформаційних мережах (робота, торгівля, відпочинок, творчість, розваги, освіта, медичні послуги тощо); • розвиток нового мультимедійного середовища, яке надає можливість конструювати віртуальні світи і діяти у них. Інформаційні впливи на держави, суспільства, людей сьогодні часом бувають ефективнішими за політичні, економічні чи військові. Інформатизація та комп’ютеризаціяІнформатизація - це процес підвищення наукової ємності виробництва із застосуванням нових видів інформаційного обміну в технічній та соціальній сферах. Інформатизація - організований соціально-економічний і науково-технічний процес створення оптимальних умов для задоволення інформаційних потреб та інтенсифікації економіки на основі впровадження ІТ, створення передумов переходу до інформаційного суспільства. В Законі України «Про концепцію національної програми інформатизації України» від 4 лютого 1998 року інформатизація визначається як сукупність взаємопов'язаних організаційних, правових, політичних, соціально-економічних, науково-технічних, виробничих процесів, що спрямовані на створення умов для задоволення інформаційних потреб, реалізації прав громадян і суспільства на основі створення, розвитку, використання інформаційних систем, мереж, ресурсів та інформаційних технологій, побудованих на основі застосування сучасної обчислювальної та комунікаційної техніки. В інформаційному суспільстві процес комп'ютеризації дає людям змогу працювати з багатьма джерелами інформації, забезпечує високий рівень автоматизації обробки інформації у виробничій та соціальній сферах. Комп’ютеризація – процес розвитку та впровадження комп’ютерів, що забезпечують автоматизацію інформаційних процесів та технологій. Комп'ютеризація – процес забезпечення окремих людей та виробничих колективів комп'ютерною і телекомунікаційною технікою та відповідним програмним забезпеченням. Інформатизація та комп'ютеризація - це різні поняття. Комп’ютеризація - це цілісний процес формування нового автоматизованого інформаційного середовища для ефективного застосування наслідків інформатизації, а інформатизація - це більш широкий підхід порівняно з комп'ютеризацією, що містить як створення відповідної технічної бази, так і модернізацію організаційно-економічних, юридичних і “людських” чинників. Інформаційне середовище - сукупність технічних і програмних засобів зберігання, оброблення та передавання інформації, а також політичні, економічні та культурні чинники інформаційних процесів . Найважливіша цільінформатизації – це застосування інформаційних технологій у різноманітних галузях. Інформаційні технології - вирішальний чинник зростання ефективності праці. Основні етапи інформатизації суспільства:
Нові комп’ютерні технології вимагають організаційних змін у менеджменті, кадрах, системах документообігу. Значна частина комп’ютеризації об’єктів і процесів пов’язана зі систематизацією документопотоків та їх відображенням у комп’ютері в певному формалізованому вигляді. Ці дії регламентують механізми накопичення, зберігання та обробки даних. Результатом комп’ютеризації є розроблення інтелектуалізованих автоматизованих систем управління, що охоплюють по вертикалі та горизонталі всі рівні і ланки виробництва. В інформаційному суспільстві акцент зміщується на виробництво та використання інтелекту, знань, що призводить до збільшення питомої ваги розумової праці. Матеріальною та технологічною базою інформаційного суспільства стають різноманітні системи на базі комп’ютерної техніки, телекомунікаційних мереж, ІТ. Інформатизація економіки – це процес її інтенсифікації на базі сучасних ІТ та створення індустрії інформаційних послуг. Інформаційна послуга - діяльність, спрямована на задоволення інформаційних потреб користувача. Інформатизація суспільства охоплює всі процеси в економіці держави. Наслідком цього має стати створення єдиного ринку фінансів, товарів, робочої сили, послуг, розвиток фінансово-економічних структур та механізмів в інформаційному суспільстві, підтримка електронного бізнесу та електронної комерції, систем електронних платежів. Предметна область (ПрО) – це та частина реальності, що викликає у людини спеціальний інтерес і виділяється нею із загальної картини навколишньої об'єктивної дійсності. ПрО відображає в базі даних сукупності об’єктів реального світу з їх зв’язками, що належать до певної області знань та становлять практичну цінність для користувачів. ПрО існує незалежно як від створювача ІС, так і від самої ІС. Економічна інформаціяЕкономічна інформація має досить яскраво визначену специфіку, пов’язану з характером її використання в управлінні виробництвом, її призначенням та джерелами отримання. Інформація, яку людина використовує у своїй виробничій діяльності, стає інформаційним ресурсом, а в інформаційному суспільстві саме інформаційні ресурси та засоби їх обробки – інформаційні технології та системи - визначають рівень економічного розвитку. Економічна інформація - сукупність даних, що відображають явища економічного стану суспільства. Це інструмент організаційно-економічного управління. У сфері матеріального виробництва вона є інструментом управління виробництвом та економікою. В управлінні виробництвом вирізняють інформаційні процеси, в яких інформація виконує роль предмета або продукту праці. Інформаційний процес управління можна розглядати як перетворення вхідних даних на економічну інформацію, необхідну для прийняття рішень. Економічній інформації притаманні певні особливості, що випливають з її сутності. Найважливішими з них є:
Економічна інформація класифікується за стадіями відтворення та елементами виробничого процесу, що розглядаються як об’єкт управління. Тому можна розглядати інформацію постачання і розподілу, за матеріальними та трудовими ресурсами. Інформація, яка використовується для прийняття управлінських рішень, дуже різноманітна за своїм змістом. З точки зору функцій управління економічна інформація поділяється на прогнозну, планову, облікову, аналітичну, та в свою чергу планова інформація буває перспективною, техніко-економічною та оперативного планування. Наприклад, обліково-операційна діяльність банків оперує обліковою інформацією, проте для аналізу та контролю господарчої діяльності клієнтів банки використовують економічну, технічну, нормативно-довідкову, директивну інформацію та іншу інформацію. Економічну інформацію можна також класифікувати за характером її використання в управлінні на:
ВисновкиІнформація є основним об’єктом та основним продуктом ІТ. Створення ІС неможливо без врахування форм подання інформації, способів оцінки її кількості та якості. Інформаційне суспільство - це суспільство, в якому більшість працездатного населення зайнята в сфері застосування ІСТ. Інформація, яку людина використовує у своїй виробничій діяльності, стає інформаційним ресурсом, а в інформаційному суспільстві саме інформаційні ресурси та засоби їх обробки – інформаційні технології та системи - визначають рівень економічного розвитку. Список літератури
Контрольні питання1. Дайте визначення інформатизації. 2. Дайте визначення інформаційної революції. 3. Які існують визначення інформації? 4. Як визначається кількість інформації? 5. Що таке інформаційні ресурси? ГЛАВА 3. Складові інформаційної технологіїХоч ІС, як і будь-яка інша система, може існувати тільки як єдине ціле, для аналізу її доцільно виділити такі її складові, як організаційне, інформаційне, математичне, лінгвістичне, апаратне, програмне та правове забезпечення тощо. Сукупність методів та засобів підвищення ефективного управління об’єктами управління на всіх стадіях їх життєвого циклу називається організаційним забезпеченням. Організаційне забезпечення ІС містить організацію якісного функціонування автоматизованої ІС, контроль за її роботою згідно з інструкцією користувача, технічну модернізацію, правове забезпечення програм тощо. Організаційне забезпечення складається з 4 груп компонентів:
Інформаційне забезпечення дає можливість інтегрованої обробки всіх видів інформації, що циркулює в організації, вхідної, вихідної, внутрішньої, всіх документів електронного та паперового документообігу. Лінгвістичне забезпечення - сукупність мовних засобів, що використовуються для створення та функціонування ІС (як мови програмування, так і природні мови). Математичне забезпеченняМатематичне забезпечення (МЗ) - це сукупність математичних моделей і алгоритмів для вирішення питань обробки інформації з застосуванням вибраної ІТ, а також комплекс засобів і методів, що дозволяють будувати економіко-математичні моделі задач керування. Ступінь розвитку математичного забезпечення значною мірою визначає ефективність використання певної ІТ. У даний час спостерігається тенденція до зростання частки витрат на розроблення математичного апарата в витратах на проект ІС. Останнє десятиліття характеризується значним розвитком математичних дисциплін, методи яких використовуються для вирішення задач в інформаційних системах. Мережні методи знаходять найширше застосування в проектуванні. Вони дозволяють визначати параметри мережних моделей і аналізувати хід робіт з реалізації виробничих планів. У рамках мережного моделювання можлива одно- чи багатокритеріальна оптимізація, у тому числі за часом і за ресурсами. Евристичні методи дозволяють вирішувати слабо структуровані задачі, які неможливо розв’язати повним перебором варіантів, приміром, задачі календарного планування. Сутність евристичного методу в тому, щоб запланувати роботи в найкоротші терміни, але так, щоб не перевищити заданий верхній рівень ресурсів. Як правило, використання евристичних методів передбачає наявність діалогу з користувачем, під час якого на комп’ютер покладаються обчислення і видача проміжних результатів, включаючи різні графіки і діаграми. Користувач залежно від отриманих даних визначає подальший напрямок розрахунків. Методи комбінаторики, математичної логіки, інформаційної алгебри використовуються для рішення інформаційно-логічних задач. Це - групування та впорядкування даних, об'єднання масивів даних і корегування інформації, введення, декомпозиція й обмін даними між електронними сховищами в межах однієї або кількох ЕОМ. Математичне програмування поєднує лінійне, нелінійне, динамічне і стохастичне програмування. З використанням лінійного програмування вирішуються і аналізуються такі питання, як розроблення та складання прогнозів планів розвитку галузей, оптимального розподілу ресурсів. Нелінійне математичне програмування застосовується рідше за лінійне, причому найчастіше нелінійні задачі розв’язуються також способами лінійного програмування, для чого криволінійні залежності апроксимуються прямими (лінеаризація). Суть динамічного програмування полягає у тому, що з двох шляхів досягнення результату довший шлях відкидається, щоб зменшити обсяг обчислень на ЕОМ. Стохастичне програмування характеризується введенням у задачі імовірнісних значень параметрів, що відображають ризик і невизначеність. Методи теорії ігор дозволяють формалізувати та вирішувати задачі, що зазвичай вирішуються емпірично, без використання кількісних вимірників. До таких задач належить, приміром, дослідження конфліктних ситуацій в умовах невизначеності інформації про дії учасників. Методи теорії ігор широко застосовуються при аналізі організаційних, економічних, військових і політичних ситуацій. Теорія черг або масового обслуговування вивчає імовірнісні моделі поведінки систем. Базою для вирішення задач масового обслуговування є теорія ймовірностей. Математична статистика, що є одним з розділів теорії ймовірностей, дозволяє дати оцінку певній сукупності даних. Метод статистичних іспитів також призначений для вивчення імовірнісних систем, застосовується при моделюванні найрізноманітніших ситуацій. Цим методом удається, зокрема, одержати характеристики системи без проведення натурних експериментів. Метод теорії розкладів дозволяє знайти оптимальну послідовність побудови об'єктів за якимось критерієм. Приміром, критерієм може служити “найменший термін будівництва”, “мінімум простоїв виконавців на об'єктах”, “максимальна щільність робіт на об'єктах” тощо. Методи теорії множин дозволяють значно компактніше описувати задачі керування, знаходити ефективні шляхи їхнього рішення. Апаратне забезпеченняАпаратне забезпечення - це технічні засоби, що забезпечують передачу й обробку інформації. Обчислювальна машина - це технічний пристрій, призначений для вводу, збереження, обробки і виводу інформації. Термін “архітектура ЕОМ“ використовується для опису найбільш загальних принципів дії, конфігурації основних логічних вузлів ЕОМ, а також взаємодії між ними. Архітектура обчислювальної системи описує принципи її роботи на функціональному рівні безвідносно до фізичної реалізації. З погляду архітектури становлять інтерес лише найбільш загальні зв'язки і принципи, властиві багатьом конкретним реалізаціям обчислювальних машин. Часто говорять навіть про сімейства ЕОМ, тобто групи моделей, сумісних між собою. У межах одного сімейства основні принципи функціонування машин однакові, хоча окремі моделі можуть істотно різнитися за продуктивністю, вартістю та іншими параметрами. До архітектури належать:
Загальні принципи роботи обчислювальних пристроїв сформульовані Джоном фон Нейманом. У 1945 р. цей американський математик запропонував ввести до складу комп'ютера спеціальний пристрій для збереження команд і даних - пам'ять - і реалізувати можливість передачі керування від однієї програми до іншої, а також обґрунтував переваги використання бінарної системи для подання інформації та збереження програми як набору бітів у тій же самій пам'яті, що й інформації, яку ця програма обробляє. У 1945 р. Джон фон Нейман підготував звіт, у якому визначив архітектуру й основні принципи роботи комп'ютера:
Процесор виконує команди програми відповідно до зміни вмісту лічильника команд, поки не дістане команду зупинитися. Переважна більшість обчислювальних машин на сьогоднішній день має фон-нейманівську архітектуру. Але швидкодія комп’ютерів з фон-нейманівською архітектурою обмежена швидкістю світла, з якою електрони рухаються усередині схем ЕОМ. Тому дослідники піддають ревізії ці принципи структури ЕОМ. Однак підходи, засновані на заміні одного чи двох принципів Джона фон Неймана, не дали бажаних результатів. Причина невдач крилася в органічній єдності всіх трьох принципів. Найбільш успішну спробу ревізії традиційних принципів архітектури ЕОМ здійснив у середині 70-х років радянський учений академік В.М.Глушков. У роботах В.М.Глушкова ревізії піддавалися всі три основні принципи Джона фон Неймана. Низький рівень машинної мови вступає в конфлікт з прагненням користувача застосовувати різноманітні і потужні засоби обробки даних. Лінійна організація пам'яті не адекватна складним типам даних, що застосовують у сучасних алгоритмічних мовах. Послідовне централізоване управління призводить до величезної кількості обмінів елементарними командами між центральним процесором і оперативною пам'яттю ЕОМ. Академік Глушков запропонував принципи побудови машин не фон-нейманівського типу, здатних настроювати свою архітектуру на тип задач і максимально використовувати розпаралелювання алгоритмів. Ідеї Глушкова близькі до концепції ЕОМ п'ятого покоління. Така ЕОМ макроконвеєрного типу реалізована колективом вчених Інституту кібернетики АН УРСР. Макроконвеєрність означає, що алгоритм рішення задачі або класу задач розбивається на окремі незалежні блоки, що обмінюються між собою інформацією про виконання одночасно з високою швидкістю. Програмне забезпеченняКомп’ютерна програма – це алгоритм вирішення певної задачі на мові, зрозумілій комп’ютеру. Програмне забезпечення складається з операційної системи, мов програмування та застосовних програм. Операційна система (ОС) - це комплекс спеціальних програмних засобів, призначених для управління завантаженням, запуском і виконанням прикладних програм, вводом-виводом даних, а також для планування та управління обчислювальними ресурсами комп'ютера. Та частина ОС, що взаємодіє з апаратними засобами безпосередньо і тому постійно зберігається в комп'ютері, називається ядромОС. Програмне забезпечення, що входить до складу ядра ОС, відповідає за перевірку працездатності компонент комп'ютера і виконання елементарних операцій, пов'язаних з роботою дисплея, клавіатури, магнітних накопичувачів і т.п. При вмиканні комп'ютера ОС автоматично завантажується в оперативну пам'ять. Крім ядра, ОС містить сервісні програми: для тестування обладнання, зміни параметрів його функціонування, форматування магнітних дисків тощо. Кожна прикладна програма пов'язана з якою-небудь ОС і може експлуатуватися тільки на тих комп'ютерах, де є відповідна ОС. За кількістю задач, що можуть виконуватися одночасно, ОС поділяють на ті, що виконують одну задачу (MS DOS, MSX) та ті, що здатні виконувати одночасно багато задач (OS/2, UNIX, Windows 95), а за кількістю користувачів, що працюють одночасно, - на ОС, що взаємодіють з одним користувачем (MS DOS, Windows 3.x) та ті, що взаємодіють з багатьма (UNIX, Windows NT). Файлова система забезпечує взаємодію програм і фізичних пристроїв вводу-виводу. Її основні функції можна поділити на дві групи: для роботи з файлами (створення, видалення, зміна атрибутів), для роботи з даними, що зберігаються у файлах (читання, запис, пошук тощо). Основний атрибут файлу - його ім'я. Мови програмування – це інструментальні засоби, призначені для створення програмного забезпечення. Програма розробляється на зрозумілій людині формалізованій мові, а потім за допомогою транслятора перетворюється в машинні коди. Існує два типи трансляторів: інтерпретатори, що обробляють команди безпосередньо в процесі виконання програми, та компілятори, що переробляють програму в машинні коди до її виконання. Програми, що інтерпретуються, працюють повільніше за програми, що компілюються. Компілятори зберігають результати обробки в окремих файлах, які можна використовувати на інших комп’ютерах. Прикладне програмне забезпечення – це програми, призначені для розв’язання конкретних задач або класів задач у певній ПрО. Прикладні програми призначені для вирішення конкретних задач, що стоять перед користувачами, як спеціалізованих, так і загальновживаних. Найпоширеніші типи прикладних програм:
Правове забезпеченняВиникнення самого терміну "інтелектуальна власність" припадає на кінець XVIII ст. Він уперше з’явився у французькому законодавстві. Авторське та патентне права виникли у Франції на ґрунті теорії природного права, яке одержало свій найбільш послідовний розвиток саме в працях французьких філософів-просвітителів (Вольтер, Дідро, Руссо). Право власності на інформацію - це врегульовані законом суспільні відносини щодо володіння, користування і розпорядження інформацією. Інформація є об'єктом права власності громадян, організацій (юридичних осіб) і держави. Інформація може бути об'єктом права власності як у повному обсязі, так і об'єктом лише володіння, користування чи розпорядження. Власник інформації щодо об'єктів своєї власності має право здійснювати будь-які законні дії. Право інтелектуальної власності – це право володіння, користування і розпорядження результатами інтелектуальної діяльності. Інформаційна продукція та інформаційні послуги громадян та юридичних осіб, які займаються інформаційною діяльністю, можуть бути об'єктами товарних відносин, що регулюються чинним цивільним та іншим законодавством. Ціни і ціноутворення на інформаційну продукцію та інформаційні послуги встановлюються договорами, за винятком випадків, передбачених законом. Діяльність програмістів та інших фахівців, що працюють у сфері ІСТ, усе частіше виступає як об'єкт правового регулювання. Деякі дії при цьому можуть бути кваліфіковані як правопорушення (злочини). Правова свідомість у цілому, а в ІТ особливо, у нашому суспільстві перебуває на досить низькому рівні. Головне призначення правового регулювання в галузі ІТ - юридичне визначення понять, пов'язаних з авторством і поширенням комп'ютерних програм і БД, а також установлення прав, що виникають при створенні програм і БД - авторських, майнових, на передачу, захист, реєстрацію, недоторканність. Правове забезпечення ІС – це сукупність правових норм, що реалізують створення та функціонування ІС. Правове забезпечення функціонування ІС містить умови надання юридичної сили документам, що отримані з використанням обчислювальної техніки, права, обов’язки персоналу, правила користування інформацією, порядок вирішення конфліктів з приводу її достовірності. Для сучасного стану правового регулювання сфери, що пов'язана з інформатикою, в Україні на сьогодні найбільш актуальними є питання, пов'язані з порушенням авторських прав та використанням не ліцензованої продукції ІТ. Велика частина ПЗ, що використовується окремими програмістами, користувачами і цілими організаціями, придбана в результаті незаконного копіювання, розкрадання. Зараз назріла потреба узаконити способи боротьби з цією практикою, оскільки вона заважає, насамперед, розвитку індустрії ІТ. Правове регулювання в галузі ІТ базується на Конституції України, законах України “Про інформацію”, “Про захист інформації в автоматизованих системах” тощо. Порушення цих законів призводить до дисциплінарної, цивільно-правової, адміністративної або кримінальної відповідальності згідно із чинним законодавством України. Національне законодавство про охорону права інтелектуальної власності має чинність тільки в межах тієї держави, яка його прийняла. За межами держави правова охорона результатам інтелектуальної діяльності не надасться. Це призводить до можливості використання інформації без дозволу її власника чи володільця. Для вирішення цієї проблеми вже з кінця минулого століття починають укладатися різноманітні міжнародні угоди, якими передбачається охорона прав на результати творчої діяльності. Хоч такі угоди не завжди досягали поставленої мети, проте дозволили визначити напрямки, в яких слід їх розвивати та удосконалювати. Так склалася міжнародна система охорони інтелектуальної власності. На сьогодні найбільш авторитетною організацією є Всесвітня організація інтелектуальної власності (ВОІВ), яка фактично була заснована ще в 1883—1886 рр. внаслідок прийняття Паризької конвенції про охорону промислової власності і Бернської конвенції про охорону літературних і художніх творів. У липні 1967 р. в Стокгольмі була підписана конвенція щодо утворення Всесвітньої організації інтелектуальної власності, яка набула чинності в 1970 р. У грудні 1974 р. ВОІВ набула статусу спеціалізованої установи Організації Об'єднаних Націй. Згідно з конвенцією, ВОІВ має вирішувати такі завдання:
Сприяючи охороні інтелектуальної власності в усьому світі, ВОІВ заохочує укладання нових міжнародних договорів і сприяє удосконаленню національних законодавств. У сфері адміністративного співробітництва ВОІВ централізує адміністративне управління союзами в Міжнародному бюро в Женеві, яке є секретаріатом ВОІВ, а також здійснює контроль за таким управлінням через свої органи. ВОІВ несе відповідальність за розвиток інтелектуальної діяльності і сприяє передачі технологій, які стосуються промислової власності, країнам, що розвиваються, з метою прискорення їх економічного, соціального і культурного розвитку. При виконанні своїх функцій ВОІВ керується завданнями міжнародного співробітництва з метою розвитку; повною мірою використовуючи досягнення інтелектуальної діяльності, сприяє більш широкому використанню інтелектуальної власності для заохочення національної творчої діяльності. ВисновкиОсновними компонентами інформаційних технологій є організаційне, інформаційне, математичне, апаратне, програмне та правове забезпечення. Інформаційна продукція та інформаційні послуги громадян та юридичних осіб, які займаються інформаційною діяльністю, можуть бути об'єктами товарних відносин, що регулюються чинним цивільним та іншим законодавством. Список літератури
Контрольні питання1. Назвіть складові ІТ. ГЛАВА 4. Програмна інженерія як сукупність технологій розробки інформаційних системВиробництво та використання програмного забезпечення – однієї з найважливіших складових ІТ - набуло характеру масової дiяльності: за статистичними даними, розробленням програм зайнятi майже сiм мiльйонiв людей. ІС набули статусу соцiально значущого чинника, що впливає на безпеку та добробут суспiльства. За таких обставин технологiя виробництва програм потребує свого оформлення як самостiйного iнженерного фаху. Базові знання з програмної інженерії потрібні не лише розробникам ПЗ, але й фахівцям різних галузей, які прагнуть бути грамотними замовниками сучасних ІС. Базовi поняття програмної інженеріїТермін “програмна інженерія” (Software Engineering) вперше вжито в 1968 р., коли створення програмного забезпечення досягло такого ступеня розвитку, що можна застосовувати інженерні технології. Зараз розроблення програмного забезпечення стало справді масовим явищем. Програмна iнженерiя (ПІ) - це система методів та засобів планування, розроблення, експлуатації та супроводження ПЗ. Методи ПІ - це способи розроблення ПЗ, що містять рекомендації щодо послідовності обробки інформації, нотації, правила опису ІС тощо. ПІ - це інженерна дисципліна, що розглядає всі аспекти виробництва ПЗ від етапу створення специфікацій до підтримки ІС після вводу в експлуатацію. Інженерiя - це застосування наукових результатів, яке дозволяє отримувати користь вiд властивостей матерiалiв та джерел енергiї. Основні проблеми, що постають перед ПІ, пов’язані з інтеграцією створеного раніше ПЗ у нові розробки (legacy challenge), роботою в розподіленому гетерогенному середовищі (heterogeneity challenge) та обмеженнями часу, що відводиться на розроблення інформаційних продуктів (delivery challenge). Основні роздiли програмної інженерії:
Життєвий цикл ПЗПоняття життєвого циклу програмного забезпечення (ЖЦ ПЗ) є одним з базових у програмній інженерії. Життєвий цикл ПЗ - певна послiдовнiсть фаз або стадiй вiд моменту прийняття рішення про необхідність створення ПЗ до повного вилучення ПЗ з експлуатації На кожнiй фазi вiдбувається певна сукупнiсть процесiв, кожний з яких породжує певний продукт, використовуючи необхіднi ресурси. Процеси поділяються на набори дій, а дії - на набори задач. Головні ресурси програмної iнженерiї, що визначають ефективнiсть розроблень, - це час та вартiсть. Усі процеси ЖЦ ПЗ поділяються на три групи: основні процеси (придбання, доставка, розроблення, експлуатація, супровід); організаційні процеси (управління, удосконалення, навчання); допоміжні процеси (документування, забезпечення якості, верифікація, атестація, аудит, загальна оцінка тощо). До головних процесів відноситься процес розроблення, що визначає дiї органiзацiї-розробника інформаційного продукту. Процес розроблення ПЗ має забезпечити шлях вiд усвiдомлення потреб замовника до передачi йому готового продукту. Характерні роботи процесу розроблення:
Інженерiя вимогСтадія формування вимог до ПЗ - це найважливіша стадія, оскільки визначає успіх усього проекту. Ця стадія містить такі етапи:
Перехід від моделі "як є" до моделі "як має бути" можна виконувати двома способами: 1) удосконалюванням існуючих технологій на основі оцінки їхньої ефективності; 2) радикальною зміною технологій і перепроектуванням бізнес-процесів. Вимоги до програмної системи – це властивостi, які слід мати системі для адекватного виконання своїх функцiй. У сучасних ІТ фаза життєвого циклу, на якiй фiксуються вимоги на розроблення програмного забезпечення, є визначальною для його якостi, термiнiв та вартостi робiт. Цiна помилок та нечiтких неоднозначних формулювань на цiй фазi дуже висока, бо час та засоби витрачаються на непотрiбну замовникові програму. Є кiлька класiв нефункцiональних вимог, суттєвих для бiльшостi ІС, якi виражають обмеження, актуальнi для багатьох проблемних галузей:
Наступний крок аналiзу вимог - встановлення їх пріоритетностi, бо вимоги, висунутi рiзними носiями iнтересiв у системi, можуть конфлiктувати мiж собою. Крiм того, кожна з вимог потребує для свого втiлення певних ресурсiв, надання яких може залежати також вiд визначеного для неї пріоритету. Ще одним важливим завданням аналiзу є передбачення здатності адаптацiї до можливих змiн у вимогах та забезпечення можливостей внесення змiн без суттєвого перегляду всiєї системи. В процесi аналiзу вимог мають бути перевiренi їх правдивiсть та вiдповiднiсть iнтересам замовника. Тестування програм та системТестування програм та систем - це спосіб семантичної перевірки програми, який полягає в опрацюванні програмою послідовності різноманітних контрольних наборів тестів з відомими результатами. Тести підбираються так, щоб вони охопили найрізноманітніші типи можливих ситуацій. Тестування становить від 30% до 50% трудомісткості робіт зі створення коду. Історично першим різновидом тестування було налагодження - перевірка програмного об'єкта на наявність у ньому помилок для їх усунення. При цьому можуть вноситися нові помилки. Методи тестування й верифікації цілком залежать від методів проектування та стадій, з яких починається перевірка правильності функціонування результатів проектування. Основна мета тестування - забезпечення повноти й узгодженості реалізованих у програмних компонентах функцій та інтерфейсів між ними. Верифікація - перевірка відповідності реалізації системи специфікаціям результатів проектування й опису компоненти. Валидація - перевірка відповідності створеного ПЗ потребам та вимогам замовника. Це дорогий процес, що забезпечує високу якість програмного коду. Валидація дозволяє підтвердити, що програмне забезпечення є коректною реалізацією початкових умов у системі й провадиться після завершення кожного етапу розроблення цього забезпечення. Помилка - це стан програми, при якому генеруються неправильні результати. Причиною помилок є недоліки в операторах програми або в технологічному процесі її розроблення, що призводить до неправильного перетворення вхідної інформації у вихідну. Дефект у програмі виникає внаслідок помилок розробника. Він може міститися у вхідних або проектних специфікаціях, текстах кодів програм, в експлуатаційній документації тощо. Відмова - це неможливість виконувати функції, визначені вимогами й обмеженнями. Усі помилки, що виникають у програмах, прийнято підрозділяти на кілька класів:
Тест - це програма, призначена для перевірки працездатності іншої програми і виявлення в ній помилкових ситуацій. Тестову перевірку можна провести також шляхом додання до програми, що перевіряється, додаткових операторів, які будуть сигналізувати про перебіг її виконання й отримання результатів. Тестові дані слугують для перевірки роботи системи і готуються по-різному: генератором тестових даних, проектною групою на основі документів або файлів, користувачем із специфікації вимог тощо. Дуже часто розробляються спеціальні форми вхідних документів, у яких відображається процес виконання програми за допомогою тестових даних. Багато типів тестів готує сам замовник для перевірки роботи ІС. Структура й зміст тестів залежать від виду елемента - модуль, компонента, група компонент, підсистема або система. Деякі тести пов’язані з необхідністю перевірити, чи працює ІС відповідно до проекту, чи задоволено вимоги замовника. Для проведення тестування створюється спеціальна команда тестувачів. За функціональні тести відповідає розробник, а замовник більше впливає на складання випробувальних та інсталяційних тестів. Як правило, команда тестувачів не залежить від штату розробників ІС. Деякі члени цієї команди є досвідченими тестувачами або навіть професіоналами в цій галузі. До них належать аналітики, програмісти, інженери-тестувачі, котрі присвячують увесь свій час проблемам тестування систем. Вони мають справу не лише зі специфікаціями, а й з методами та засобами тестування, організують створення і виконання тестів на машині. Тестувачів включають до процесу розроблень з початку створення проекту для складання тестових наборів та сценаріїв, а також графіків виконання тестів. До складу команди тестувачів входять також користувачі. Вони оцінюють отримані результати та зручність використання, а також висловлюють свою думку щодо принципу роботи системи на початкових етапах проекту. Представники замовника планують роботи для тих, хто буде використовувати і супроводжувати систему. При цьому вони можуть привнести деякі в проект зміни, викликані неповнотою заданих раніше вимог, та сформулювати системні вимоги для проведення верифікації системи й ухвалення рішення про її готовність та корисність. Супроводження - це роботи з внесення змін до ІС після того, як її було передано користувачеві для експлуатації. На відміну від обладнання, яке з часом потребує ремонту, ПЗ не "зношується", тому процес супроводження націлений на підтримку передовсім еволюціонування системи, тобто на зміну її функцій та властивостей. Як засвідчують експерти, процес внесення змін є досить дорогим - оцінки його вартості сягають 60-80 % від загальної вартості розроблення. Види супроводження:
Аналіз якості програмного забезпеченняЯкість ПЗ – це сукупність властивостей, що визначають спроможність задовольнити запити замовника, які він висловив у вигляді вимог до розроблень. Функціональність - це сукупність властивостей, які визначають спроможність ПЗ виконувати в заданому середовищі свої функції відповідно до вимог обробки і загальносистемним засобам. Функція - це упорядкована послідовність дій для задоволення споживчих властивостей, замовлених користувачем. Атрибути функціональності ПЗ:
Надійність - це множина атрибутів, які вказують на спроможність ПЗ коректно перетворювати вхідні дані на результати. Зниження надійності ПЗ відбувається через помилки у вимогах, проектуванні і виконанні. Атрибути надійності ПЗ:
Деякі типи систем (реального часу, радарні системи, системи безпеки, комунікація, медичне устаткування тощо) містять особливі вимоги до забезпечення високої надійності з такими атрибутами, як недопустимість помилок, безпека, захищеність і зручність застосування, а також достовірність як основний критерій надійності. Зручність застосування - це множина атрибутів, що характеризують умови взаємодії користувача з ПЗ. Атрибути зручності застосування ПЗ:
Супроводжуваність - це зусилля, які необхідно витратити на коригування, вдосконалення й адаптацію ПЗ через зміну середовища, вимог або функціональних специфікацій. Атрибути супроводжуваності ПЗ:
Переносність - це здатність ПЗ пристосовуватися до роботи при зміні середовища виконання. Атрибути переносності ПЗ:
Оцінювання якості ПЗ - це дії, які мають визначити, якою мірою ПЗ відповідає своєму призначенню. ВисновкиВ інформаційному суспільстві розроблення програмного забезпечення ІТ стало масовою діяльністю. За таких обставин свiтове суспiльство прийшло до висновку, що технологiя виробництва програм потребує свого оформлення як самостiйного iнженерного фаху, який мусить забезпечити у свiтi вiдповiдний кадровий потенцiал для постiйно зростаючого обсягу програмних розробок. Розроблення ІС визначається як iнженерна дiяльнiсть. Разом з тим, корисно навести її досить значнi вiдмiни вiд традицiйної iнженерiї:
Виникнення програмної інженерії визначено кількома факторами: - появою різноманітних складних методів аналізу та моделювання ПрО; - великою кількістю помилок в ПЗ; - потребою в організації роботи великих колективів розробників ПЗ; - необхідністю використання високотехнологічних засобів керування розробкою ПЗ. Програмна інженерія робить акцент на оцінку якості ПЗ, що створюється, та повторне застосування програмних компонент з метою прискорення та підвищення якості ІС. Наведені у цій главі основні положення програмної інженерії корисні як потенційним розробникам ІС, так і замовникам інформаційних продуктів. Список літератури
Контрольні питання:
ГЛАВА 5. Проблеми безпеки у відкритих інформаційних системахІнформація як об’єкт захистуІнформаційні ресурси, що є основним об’єктом ІТ, - це інформація, яка має певну цінність. Цінність інформації - основний критерій у прийнятті рішень щодо її захисту. Інформаційна безпека (ІБ)- захищеність інформації та інфраструктури, яка її підтримує, від випадкових або навмисних впливів природного чи штучного характеру, здатних завдати збитків власникам або користувачам інформації. Безпека - це якісна характеристика системи, її не можна вимірювати в якихось одиницях. Більш того, неможливо навіть з однозначним результатом порівнювати дві системи - одна буде мати кращий захист в одному випадку, друга – в іншому. ІБ не зводиться винятково до захисту інформації (ЗІ). Суб'єкт інформаційних відносин може постраждати (зазнати збитків) не тільки від несанкціонованого доступу (НСД), але й від поломки системи, що спричиняє перерву в обслуговуванні. Для багатьох відкритих організацій (приміром, навчальних) власне захист інформації займає не перше місце. Основні аспекти інформаційної безпекиОсновні аспекти інформаційної безпеки пов’язані з доступністю, цілісністю та конфіденційністю інформації. Доступність – це можливість за прийнятний час одержати необхідну інформаційну послугу. Цілісність – це актуальність і несуперечність інформації, її захищеність від руйнації і несанкціонованої зміни. Конфіденційність – це захист інформації від несанкціонованого читання. Крім того, інформацію слід використовувати відповідно до чинного законодавства. Але специфіка ІТ полягає у винятково швидких темпах розвитку. Тому законодавство майже завжди відстає від потреб практики, і це створює певні проблеми. Політика безпеки (ПБ) – це комплекс законів, правил та норм поведінки, що визначають, яким чином підприємство обробляє, захищає та поширює інформацію. Механізми захисту - це криптографічні протоколи, криптографічні алгоритми, системи створення захищеного середовища, системи оновлення ресурсів тощо. Вони дозволяють реалізувати системи підтримки політики безпеки. Загроза - це потенційно можлива несприятлива дія на інформацію. Спектр загроз безпеки досить великий. З огляду на те, що на безпеку об'єктів захисту впливає багато різноманітних загроз, принципи створення і роботи засобів захисту також досить різноманітні. Загрози інформації – це способи реалізації впливів, що вважаються небезпечними. Інформація має цінність, тому для ефективного її збереження необхідно знати, в чому саме ця цінність полягає та яка небезпека їй загрожує:
Приміром, загроза перехоплення випромінювання з дисплея призводить до втрати таємності, загроза пожежі - до порушення цілісності інформації, загроза розірвання каналу може реалізувати небезпеку втрати доступності. Загроза збою електроенергії може спричинити небезпеку неправильної оцінки ситуації у системі управління. Класи загроз інформації:
Кожний з класів містить більш конкретні види загроз, приміром, для порушення конфіденційності це: а) загрози при управлінні потоками інформації; б) загрози існування безконтрольних потоків інформації (наявність прихованих каналів); в) порушення конфіденційності при обміні - загрози при експорті/імпорті інформації через незахищене середовище. Дестабілізуючий фактор (ДФ) - це подія, наслідком якої може бути загроза інформації. ДФ може виникати на будь-якому етапі життєвого циклу ІС. Усі відомі ДФ можна поділити на такі типи:
Порушник – особа, яка здійснила спробу виконання забороненої операції (дії) за помилкою, незнанням або свідомо зі злими намірами (з корисливих інтересів або без таких - заради гри або задоволення, з метою самоствердження). Для досягнення своєї мети порушник має прикласти певні зусилля, витратити певні ресурси, використовуючи для цього різні можливості, методи та засоби. Зловмисник - це порушник, який навмисно йде на порушення. Порушників поділяють на зовнішніх та внутрішніх. Методи вторгнення поділяють на активні та пасивні. При активному вторгненні порушник прагне замінити інформацію, яка передається в повідомленні. Він може вибірково модифікувати, заміняти або додавати вірне чи невірне повідомлення, змінювати порядок повідомлень. Порушник може також анулювати або затримувати всі повідомлення. При пасивному вторгненні порушник тільки спостерігає за проходженням інформації лініями зв’язку, не вторгаючись ані в інформаційні потоки, ані в зміст інформації, що передається. Зазвичай він аналізує потік повідомлень, фіксує пункти призначення або факт проходження повідомлення, його розмір та частоту обміну, якщо зміст не підлягає розпізнанню. Мотиви порушень можна поділити на три категорії: безвідповідальність, самоствердження та дії з корисливою метою. При порушеннях, викликаних безвідповідальністю, користувач цілеспрямовано або випадково здійснює руйнуючі дії, що не пов'язані проте зі злим умислом. Здебільшого це наслідок некомпетентності або недбалості. Деякі користувачі намагаються отримати доступ до системних даних заради самоствердження або у власних очах, або в очах колег. Порушення безпеки ІС може бути викликано корисливим інтересом користувача системи, який цілеспрямовано намагається подолати систему захисту для доступу до інформації в ІС. Навіть наявність в ІС засобів, що роблять таке проникнення надзвичайно складним, не може цілком захистити її від проникнення. Класифікацію порушників можна здійснювати й за багатьма іншими параметрами, приміром, за рівнем знань про систему або за рівнем можливостей. Формування режиму інформаційної безпеки – це комплексна проблема. Заходи формування режиму інформаційної безпеки мають кілька рівнів: законодавчий рівень - закони, нормативні акти, стандарти тощо; адміністративний рівень – дії загального характеру, що виконуються керівництвом організації; процедурний рівень - конкретні заходи безпеки, пов’язані з людьми; технічний рівень – конкретні технічні засоби, апаратура, програмні продукти. Найбільша питома вага форм захисту комп’ютерної інформації припадає саме на правові засоби. Сьогодні спеціальні закони, спрямовані на захист секретної інформації, прийняті в Австрії, Канаді, Данії, ФРН, Франції, Ізраїлі, Великобританії тощо. У деяких федеративних країнах, таких, як США, крім федеративних статутів з обробки інформації, існують аналогічні закони в різних штатах. Державна політика забезпечення інформаційної безпеки визначена в Законі України «Про основи державної політики в сфері науки і науково-технічної діяльності», прийнятому 13 грудня 1991 року. Стандарти захисту інформаціїДля узгодження всіх підходів до проблеми створення захищених систем розроблені стандарти інформаційної безпеки - документи, які регламентують основні поняття та концепції інформаційної безпеки на державному та міждержавному рівнях, визначають поняття “захищена система” шляхом стандартизації вимог та критеріїв безпеки, які формують шкалу оцінки ступеня захищеності ІС. Саме наявність таких стандартів дозволяє узгоджувати потреби користувачів та замовників ІС з якісними характеристиками ПЗ, що створюють розробники ІС. Захищена система - це система, яка відповідає конкретному стандарту інформаційної безпеки. Будь-який захист починається з визначення того, що потрібно захищати, від яких загроз і якими засобами. Тому захист інформації починається із встановлення співвідношень між трьома фундаментальними властивостями інформації - конфіденційність (запобігання несанкціонованому читанню або отриманню деяких відомостей про інформацію); цілісністю (запобігання несанкціонованій модифікації або руйнуванню інформації) й доступністю (забезпечення доступності даних для авторизованих користувачів) - для конкретної ПрО. Саме ці співвідношення і є змістом політики безпеки інформації. Дотримання ПБ має забезпечити той компроміс, що обрали власники цінної інформації для її захисту. Після прийняття такого рішення можна будувати захист, тобто систему підтримки виконання правил ПБ. Таким чином, побудована система захисту інформації задовільна, якщо вона надійно підтримує виконання правил ПБ. Таке визначення проблеми захищеності інформації дозволяє залучити точні математичні методи для доведення того, що дана система у заданих умовах підтримує ПБ. Це дозволяє говорити про “гарантовано захищену систему”, в якій при дотримуванні початкових умов виконуються усі правила ПБ. Термін “гарантований захист” вперше зустрічається у стандарті міністерства оборони США на вимоги до захищених систем - "Оранжевій книзі" (OK). ОК була розроблена у 1983 р. і прийнята стандартом у 1985 р. Міністерством оборони США для визначення вимог безпеки до апаратного, програмного і спеціального забезпечення комп’ютерних систем та створення відповідних методологій аналізу ПБ, що реалізувалася в комп’ютерних системах військового призначення. OK надає виробникам стандарт, що встановлює, якими засобами безпеки варто оснащувати свої продукти, щоб вони задовольняли вимоги гарантованої захищеності (мається на увазі, насамперед, захист від розкриття даних) для використання при обробці цінної інформації. Країни Європи (Франція, Німеччина, Нідерланди, Великобританія) у 1991 р. розробили спільні “Критерії безпеки інформаційних технологій” (“Information Technology Security Evaluation Criteria”), в яких розглянуті такі цілі засобів інформаційної безпеки:
У 1992 році Державна технічна комісія Росії видала від свого імені документи, аналогічні за цілями і змістом ОК. У всіх документах,пов'язаних з ОК, безпеку інформації розуміють як контроль за доступом до інформації. Окрім передумов для протидії всім основним видам загроз, ОК містить вимоги, в основному спрямовані на протидію загрозам конфіденційності. Це пояснюється її орієнтованістю на системи військового призначення. Європейські критерії безпеки ІТ перебувають приблизно на тому ж рівні, хоч і приділяють загрозам цілісності набагато більшу увагу. Документи Державної технічної комісії Росії виглядають більш відсталими, тому що навіть у самій їхній назві визначена єдина аналізована в них загроза - несанкціонований доступ. Федеральні критерії безпеки інформаційних технологій, що були розроблені в складі американського федерального стандарту з обробки інформації як альтернатива ОК, докладно розглядають усі види загроз і пропонують механізм профілів захисту для опису загроз безпеки, що властиві середовищу експлуатації конкретного продукту ІТ. Це дозволяє враховувати специфічні види загроз. Канадські критерії безпеки комп'ютерних систем, що були розроблені в Центрі безпеки відомства безпеки зв'язку Канади на основі ОК і під впливом Федеральних критеріїв безпеки інформаційних технологій США, обмежуються типовим набором загроз безпеки. Єдині критерії безпеки інформаційних технологій ставлять на перше місце задоволення потреб користувачів, пропонуючи для цього відповідні механізми, що дозволяє говорити про якісно новий підхід до проблеми безпеки інформаційних технологій. Прийняті в Україні критерії, що складаються з чотирьох документів, найбільш близькі до Канадських критерії безпеки. Комп’ютерна система безпечна, якщо вона забезпечує контроль за доступом до інформації так, що тільки уповноважені особи або процеси, що функціонують від їхнього імені, мають право читати, писати, створювати або знищувати інформацію. Політика безпеки містить норми, правила і практичні прийоми, що регулюють управління, захист і розподіл цінної інформації. ПБ надає комплекс поглядів, основних принципів, практичних рекомендацій і вимог, що закладаються в основу комплексної системи захисту інформації. Рівні ПБ:
Створення політики захисту означає розроблення плану вирішення питань, що пов’язані з комп’ютерним захистом. Один з найбільш загальних підходів до рішення цієї проблеми полягає в формулюванні відповідей на питання:
Ідентифікація - розпізнавання імені об'єкта. Об'єкт, що ідентифікується, має бути однозначно розпізнаваним. Аутентифікація - це підтвердження того, що пред'явлене ім'я відповідає об'єкту. Аудит - реєстрація подій, що дозволяє відновити і довести факт здійснення цих подій. Крім того, аудит передбачає аналіз тієї інформації, що реєструється. Гарантованість – міра довіри, яка має бути надана архітектурі та реалізації ІС. Загальні рекомендації щодо інформаційної безпеки1. Необхідний комплексний підхід до інформаційної безпеки. Інформаційну безпеку слід розглядати як складову частину загальної безпеки, причому як важливу і невід'ємну її частину. Розроблення концепції інформаційної безпеки має обов'язково проходити за участю керівництва об’єкта захисту. У цій концепції потрібно передбачати не тільки заходи, пов'язані з інформаційними технологіями (криптозахист, програмні засоби адміністрування прав користувачів, їх ідентифікації й аутентифікації, "брандмауери" для захисту входів-виходів мережі тощо), але й заходи адміністративного і технічного характеру, включаючи жорсткі процедури контролю фізичного доступу до автоматизованої банківської системи, а також засоби синхронізації й обміну даними між модулем адміністрування безпеки банківської системи і системою охорони. 2. Необхідна участь співробітників керівництва безпеки на етапі вибору-придбання-розроблення автоматизованої системи. Цю участь не слід зводити до перевірки надійності постачальника та його продукції. Керівництво безпеки має контролювати наявність належних засобів розмежування доступу до інформації, що одержує система. Необхідний рівень захисту можна визначити за допомогою управління ризиком - процесом, що містить процедури:
ШифруванняОдним із поширених методів захисту інформації є її криптографічний захист, тобто шифрування. Найважливіші критерії, за якими оцінюють системи шифрування, визначені К.Шенноном ще у 1945 р. таким чином:
Ці п’ять критеріїв виявляються несумісними, якщо їх застосовують до природномовних текстів зі складною структурою. Але, якщо відкинути будь-який з них, інші чотири задовольняються досить успішно. Шифрування даних може здійснюватися в режимах On-Line (у темпі надходження інформації) і Off-Line (автономному). Найбільш поширені два алгоритми шифрування: DES та RSA. Ці алгоритми покладені в основу електронного цифрового підпису. Стандарт шифрування даних DES (Data Encryption Standard) розроблений фірмою IBM на початку 70-х років і в даний час є урядовим стандартом для шифрування цифрової інформації. Він рекомендований Асоціацією Американських Банкірів. Складний алгоритм DES використовує ключ довжиною 56 біт і 8 біт перевірки на парність і вимагає від зловмисника перебору 72 квадрильйонів можливих ключових комбінацій, забезпечуючи високий ступінь захисту при невеликих витратах. При частій зміні ключів алгоритм задовільно вирішує проблему перетворення конфіденційної інформації у недоступну. Алгоритм RSA був винайдений Ривестом, Шаміром і Альдеманом у 1976 році. Він являє собою значний крок у криптографії. Цей алгоритм також був прийнятий як стандарт Національним Бюро Стандартів. В асиметричних алгоритмах шифрування використовуються різні ключі при шифруванні і дешифруванні, а у симетричних - один. Користувачі асиметричних алгоритмів шифрування мають два ключі і можуть вільно поширювати свій відкритий ключ. Відкритий ключ використовується для шифрування повідомлення користувачем, але тільки визначений одержувач може дешифрувати його своїм секретним ключем; відкритий ключ не придатний для дешифрування. Це робить непотрібними секретні угоди про передачу ключів між кореспондентами. DES є симетричним алгоритмом, а RSA - асиметричним. Чим довший ключ, тим вищий рівень безпеки (але стає довшим і процес шифрування та дешифрування). DES визначає довжину даних і ключа в бітах, а RSA може бути реалізований за будь-якої довжини ключа. Ключі DES можна згенерувати за мікросекунди, тоді як зразковий час генерації ключа RSA - десятки секунд. Тому відкритим ключам RSA надають перевагу розроблювачі програмних засобів, а секретним ключам DES - розроблювачі апаратури. Комп’ютерні злочиниІнтенсивне впровадження електронної обробки інформації в економіку, управління та у сферу кредитно-фінансової системи зумовило виникнення злочинів нового типу - комп'ютерних злочинів. Зловживання у сфері використання комп'ютерної техніки розпочалися водночас з появою комп'ютерів. Модель скоєння цих злочинів зазнала багато змін. Спочатку найбільші проблеми для власників комп'ютерної техніки спричиняли злочини, пов'язані з розкраданням машинного часу. Це зумовлювалось тим, що комп'ютери, маючи невелику потужність, водночас були надто дорогими. Поширення загальних комп'ютерних знань, постійне підвищення технічних характеристик та застосування комп'ютерів в ycix галузях, розвиток машинних мов високого рівня, що легко засвоюються будь-якою зацікавленою особою, i, як наслідок, постійне зростання кількості користувачів зумовило зростання масштабів протизаконних дій, пов'язаних із використанням ЕОМ. Збільшення кількості кримінальних справ з комп'ютерної злочинності спостерігається практично у всіх промислово розвинутих країнах [10]. Комп’ютерний злочин – це злочин, де комп’ютер безпосередньо є об’єктом або знаряддям здійснення правопорушень у суспільних сферах, пов’язаних із використанням обчислювальної техніки. Комп'ютерні злочини умовно можна поділити на дві категорії: 1) злочини, що пов'язані з втручанням у роботу комп'ютерів; 2) злочини, що використовують комп'ютери як необхідні технічні пристрої. До першого типу комп'ютерної злочинності належать:
Серед комп'ютерних злочинів другого типу можна виділити злочини, що сплановані за допомогою комп'ютерних моделей, приміром, у сфері бухгалтерського обліку. ВисновкиЦінність інформаційних ресурсів визначає рівень інформаційної безпеки, що потребують відповідні ІС. Інформаційна безпека забезпечує доступність, цілісність та конфіденційність інформації тою мірою, якою цього потребують власники цієї інформації. Слід відмітити, що саме замовники та користувачі ІС (а не розробники) визначають ці параметри. Захист інформації в даний час стає першочерговою проблемою, важливість якої обумовлена як зростанням цінності інформації, так і можливими наслідками атак. Складність проблеми викликається рядом причин, серед яких слід насамперед відзначити зростання масштабів КІС, зростання кількості можливих об'єктів і цілей атак (мережних протоколів, операційних систем, прикладних програм), постійну появу нових, раніше невідомих типів атак . Через неможливість створення ідеальної системи захисту необхідно вибирати той або інший ступінь ризику, виходячи з особливостей загроз безпеки і конкретних умов існування об'єкта захисту для будь-якого моменту часу. Обсяг прийнятих заходів безпеки має відповідати існуючим загрозам, інакше система захисту буде економічно невигідна. Стандарти інформаційної безпеки регламентують основні поняття та концепції інформаційної безпеки на державному та міждержавному рівнях. Формування режиму інформаційної безпеки – це комплексна проблема, що має розглядатися як складова частина загальної безпеки. Список літератури
Контрольні питання 1. Що є основним критерієм у прийнятті рішень про захист інформації? ГЛАВА 6. Засоби інтелектуалізації сучасних ІСОсновні напрямки розвитку штучного інтелектуНа сучасному етапі розвитку суспільства більшість відносно простих, рутинних операцій з переробки інформації вже автоматизована, і тому подальше збільшення ефективності праці пов’язано з автоматизацією інтелектуальної діяльності. Інтелектуальна діяльність — це дії людей, що призводять до отримання бажаного результату у ситуаціях, коли алгоритм вирішення проблеми відсутній. Інтелектуальні задачі - задачі, для розв’язання яких невідомий алгоритм (нехай навіть і дуже складний), виконання якого завжди призводить до результату. Так, приміром, для гри у шахи, медичної діагностики або перекладу тексту іншою мовою не знайдено чітких алгоритмів, проте значна кількість людей досить успішно ці задачі виконують, використовуючи власний досвід та знання, що отримані від інших людей. Термін “штучний інтелект” почали використовувати у 1956 році. Штучний інтелект (ШІ) - це наукова дисципліна, мета якої - автоматизувати інтелектуальну діяльність людини. Ця наука виникла у 50-х роках XX сторіччя на базі кібернетики, лінгвістики, психології та теорії програмування внаслідок загальної спрямованості наукової й інженерної думки на автоматизацію інтелектуальної діяльності, тобто на рішення складних інтелектуальних задач, що вважалися прерогативою людини, за допомогою технічних засобів. Характерні риси задач штучного інтелекту:
Існує два основні підходи у дослідженні ШІ:
Основні періоди історії розробок систем ШІ:
Основні напрямки ШІ: I. Розпізнавання образів (pattern recognition). 2. Автоматичний доказ теорем. 3. Ігри, що характеризуються скінченною кількістю ситуацій і чіткими правилами, із самого початку досліджень з ШІ привернули до себе увагу як полігон для застосування нових методів. Інтелектуальні системи швидко досягли і перевершили рівень людини середніх здібностей, проте рівень найкращих спеціалістів не досягнуто дотепер. 4. Розв’язання задач, що зустрічаються в повсякденному житті та потребують винахідливості і здатності до узагальнення. 5. Розуміння природної мови - задача аналізу і генерації текстів, їх внутрішнього подання, виявлення знань, необхідних для розуміння текстів. 6. Виявлення і подання знань спеціалістів певної предметної області в експертних системах. 7. Машинне навчання (machine learning) ставить задачу автоматичного здобуття та формування знань на основі аналізу та узагальнення даних. Цей напрямок ШІ зараз активно розвивається. З ним тісно пов’язані системи аналізу даних (data mining) та дослідження знань (knowledge discovery). 8. Інтелектуальні роботи - електротехнічні пристрої, що призначені для автоматизації фізичної праці людини. У цьому напрямку широко використовуються теоретичні розробки, пов’язані з програмними агентами. Основна проблема робототехніки полягає в плануванні рухів та управлінні маніпуляторами з ціллю реалізації запланованих дій. Нейронні мережіНейробіонічний підхід до проблеми ШІ ґрунтується на використанні принципів роботи мозку для конструювання інтелектуальних систем. Основу нейрокомп’ютерів становлять нейронні мережі - ієрархічно організовані паралельні з'єднання адаптивних елементів - нейронів, поєднаних один з одним каналами обміну інформацією для спільної роботи, що забезпечують взаємодію з об'єктами реального світу так само, як і біологічна нервова система. Основні відмінності нейрокомп’ютера від звичайної ЕОМ:
Нейрон — елементарний перетворювальний елемент, складова частина нейромережі, у свою чергу, складається з елементів трьох типів - синапсів, суматора і нелінійного перетворювача. Розв’язання задачі на нейрокомп'ютері принципово відрізняється від розв’язання тієї ж задачі на звичайній ЕОМ. Нейрокомп'ютеру «показують» вхідні дані задачі і результат, що відповідає цим даним. Нейрокомп'ютер має сам побудувати алгоритм рішення цієї задачі, щоб видати відповідь, що збігається з правильною. Природно очікувати, що чим більше різних пар “вхідні дані-результат” отримує нейрокомп'ютер, тим адекватнішу модель задачі він сформулює. Більше того, якщо після етапу навчання нейрокомп'ютеру надати вхідні дані, яких він раніш не зустрічав, то він теж має знаходити правильні результати. У цьому й полягає здатність нейрокомп'ютера до узагальнення. Класифікація методів навчання нейронних мереж:
Формальні методи в системах штучного інтелектуМіркування - один із найважливіших видів розумової діяльності людини, завдяки якому вона формулює на основі деяких пропозицій, висловлювань, суджень нові пропозиції, висловлювання, судження. Справжній механізм міркування людини залишається поки недостатньо дослідженим. Людським міркуванням властиві неформальність, нечіткість, нелогічність, широке використання образів, емоцій і почуттів, що робить надзвичайно складним їх дослідження і моделювання. Загалом людині властиві такі види міркувань: від загального до окремого - дедуктивні; від окремого до загального - індуктивні; від окремого до окремого - традуктивні (за аналогією). Найбільш вивчені в даний час природа і механізми дедуктивних міркувань. Логіка в найбільш загальному значенні - наука про закони мислення. Логіка вивчає побудову міркувань, що гарантують отримання правильних висновків з істинних посилок. Вона надає засоби точного формулювання думок, що підвищує ефективність будь-якої інтелектуальної діяльності. Математична (символьна) логіка будується на основі загальнолюдської і дозволяє застосувати математичні методи до міркувань. Інтерес до логіки зростає у зв'язку зі спробами навчити машину робити логічні висновки. У логіці виділяють такі форми мислення: поняття, висловлювання і міркування. Поняття про предмет надає можливий варіант відповіді на питання “Що це?”. З поняттям пов'язуються найбільш істотні ознаки предмета. Основними типами визначення понять є:
Усі поняття поділяються на ряд класів:
Інтенсіональне визначення - це визначення поняття через більш загальне поняття (більш високого рівня абстракції) з наведенням специфічних видових властивостей. Екстенсіональне визначення - це визначення поняття через поняття нижчого рівня ієрархії або через факти та дані, що належать до цього поняття. Кожне поняття має зміст і обсяг. Зміст – це комплекс ознак предмета в даному понятті, а обсяг – це сукупність об'єктів, що входять у дане поняття. Зміст поняття визначається в результаті логічної операції визначення поняття. Класифікація – це розподіл об’єктів на класи за найістотнішими ознаками, що властиві цим об’єктам та відрізняють їх від об’єктів інших класів, при цьому кожен клас може поділятися на підкласи. Поняття – це матеріал для побудови висловлень. З граматичної точки зору висловлення – це просте речення. У висловленнях міститься інформація про предмети, явища, процеси тощо. Висловлення можуть бути істинними або хибними. Елементарне висловлення складається із суб'єкта А (логічний підмет - те, про що йдеться у висловленні), предиката Р (логічний присудок - те, що затверджується або заперечується у висловленні про суб'єкт), і квантора (“усі” - або “існує” - ). Логічний зв'язок між суб'єктом і предикатом висловлення - це зв’язок “є” або “не є”, який у самому реченні може міститися неявно. Відповідність або невідповідність цього зв'язку реальності визначає істинність або хибність судження. Приклад істинного висловлювання: “Штрих-код використовують для маркування товарів”, хибного – “Усі ІС використовують одну ОС”. Найпростішим видом міркувань є отримання з одного або кількох висловлень нового висловлення. З висловлень А1, А2,... , Аn випливає висловлення В, якщо В істинно завжди, якщо істинні А1, А2,... , Аn. Похідні висловлення - посилки, а нове висловлення В - висновок (наслідок). Можливість виведення висновку з посилок забезпечується логічним зв'язком між ними. Перевірити слушність виведення з посилок можна логічними засобами, не звертаючись до безпосереднього досвіду. Істинні з погляду логіки висновки будуються за допомогою правил логічного виведення. Логічне виведення - це багатоетапний процес переходу від посилок до висновку. Залежно від наявності проміжних кроків міркування поділяються на безпосередні й опосередковані. Нові знання можуть бути отримані різними способами. Можна вивести їх як логічний наслідок з уже існуючих знань, вивести загальне правило з наявних фактів або перенести факти та знання, істинні для одних об’єктів, на інші об’єкти на підставі їх подібності. З цієї точки зору міркування поділяють на: • дедуктивні (від загального до часткового); • індуктивні (від часткового до загального); • за аналогією (від часткового до часткового). Якщо процес міркування йде від одиничних чи окремих фактів до загального правила, що поширюється на ці одиничні чи окремі факти, то має місце індуктивний умовивід. У дедуктивному умовиводі процес міркування йде від загального правила до знання про одиничний, окремий або менш загальний факт, на який поширюється загальне правило. На відміну від індукції і дедукції в традуктивному умовиводі посилка і висновок є судженнями однакового рівня узагальнення, тобто процес виведення йде від знання певного ступеня узагальнення до нового знання того ж ступеня узагальнення. Дедуктивні міркування мають найбільшу доказовість, а міркування за аналогією - найменшу. Дедуктивні міркуванняДедукція - це виявлення наслідків, що неявно містяться в наявній інформації. У дедуктивних міркуваннях: 1) вихідні посилки міркування є істинними; 2) правильне використання істинних посилок породжує тільки істинні висновки. У логіці особливу роль відіграють логічні форми, істинність яких справедлива внаслідок їхньої структури. Їх називають тавтологіями, або загальнозначущими формами (приміром, А=А). Правила виведення в дедуктивних міркуваннях по суті описують тавтології. Розглядаються два види формальних логічних конструкцій: терми - аналоги імен іменників, і формули - аналоги речень. Слова "НЕ", "ТА", "АБО", "ЯКЩО... ТОДІ", "ТОДІ І ТІЛЬКИ ТОДІ", квантори "ІСНУЄ" та "УСІ" і деякі інші називаються логічними зв'язками (операторами) і позначають логічні операції, за допомогою яких із виразів, що позначають деякі поняття, формують більш складні судження. Особливо важливе значення має імплікація, оскільки саме вона використовується у запису продукцій. Складні висловлення залежно від зв'язки поділяють на
1) нестрога диз'юнкція "АБО А, АБО В, АБО ОБИДВА"; 2) строга диз'юнкція - "АБО А, АБО В" (виключне АБО - припускається тільки одна з альтернатив);
Змінні, яким відповідають квантори, називають зв'язаними. Апарат дедуктивного виведення використовується людиною відносно рідко: майже всі знання за межами математики і доказової логіки складаються з припущень, підкріплених правдоподібними міркуваннями. Проте дедуктивна логіка вивчена значно повніше порівняно з проблемою правдоподібних міркувань. Індуктивні міркуванняІндукція – це метод переходу від набору спостережень до загальної закономірності, яка відповідає всім цим спостереженням. Індуктивне виведення - це виведення з наявних даних (спостережень, фактів) загальної закономірності (правила), що їх пояснює. Отримана гіпотеза використовується для пояснення наявних даних і класифікації та прогнозування нових даних. Розрізняють повну (математичну) та неповну (емпіричну) індукцію. Індуктивні міркування від часткового до загального відображають природний шлях пізнання навколишнього світу: загальні твердження виникають внаслідок узагальнення отриманої з досвіду сукупності одиничних фактів. Загальне твердження є хибним, якщо його спростовує хоч один факт. Повна індукція - це формальне доведення істинності певної закономірності шляхом її перевірки для скінченної кількості фактів та обґрунтування того, що додання довільного нового факту не призводить до зміни цієї закономірності. Повна індукція дозволяє отримати істинні знання за умови обмеженості класу об'єктів, який слід проаналізувати. Повну індукцію найчастіше застосовують у математиці для доведення теорем. Метод математичної індукції відносно натуральних чисел – це метод доведення істинності певної гіпотези , що полягає у перевірці його істинності для та доведення того, що з істинності випливає істинність твердження . Неповна індукція полягає в знаходженні закономірностей, яким задовольняє скінченна множина отриманих на поточний час фактів. При цьому знайдені закономірності можуть надалі спростовуватися новими спостереженнями. Хибні висновки можуть виникати внаслідок використання другорядних ознак замість істотних та поспішного узагальнення. Основне призначення неповної індукції – генерація гіпотез, що можуть потім доводитися або спростовуватися іншими методами. Приміром, узагальнивши три приклади (1<10, 2<10, 3<10), отримуємо, що всі числа менше десяти (), але наступний приклад n=11 суперечить цій гіпотезі, тому що 11>10. Незалежно від вигляду індуктивної гіпотези та алгоритму її формування на основі вибірки для навчання, завжди існує таке розширення цієї вибірки, на якій сформована гіпотеза є хибною. Індуктивна логіка - це формальна система, що описує правила формування загальних тверджень на основі скінченної множини окремих тверджень. Інтелектуальність поведінки системи пов'язана з її здатністю навчатися за власним досвідом, тобто узагальнювати відомі системі факти у деякі загальні правила. Задача індуктивного узагальнення полягає в тому, щоб за набором прикладів (приклад - це пара (x,f(x)), де x - це вхідні дані, а f(x) - значення функції для x) побудувати для функції f функцію-гіпотезу h, що апроксимує f. При виборі засобів подання для такої функції виникає конфлікт між виразністю й ефективністю. Функції можна подати через логічні висловлення, многочлени, нейронні мережі тощо. Найпростішою з таких форм подання є дерева рішень, що можуть використовуватися для широкого спектра задач класифікації. Дерево рішень - це один із способів поділу множини даних на класи або категорії. Корінь дерева неявно містить усі дані, які слід класифікувати, а листя — певні класи. Проміжні вузли дерева відповідають пунктам прийняття рішення про вибір значень атрибутів даних, що служать для подальшого поділу даних у цьому вузлі. Дерево рішень – це структура, яка складається з:
Можна розглядати дерево рішень і з іншої точки зору: проміжні вузли дерева відповідають атрибутам об'єктів, а дуги — можливим альтернативним значенням цих атрибутів. Дереву можна поставити у відповідність певне правило класифікації, за яким кожний об'єкт, що має певний набір атрибутів (має множину проміжних вузлів дерева) можна віднести до якогось класу (набір класів подано множиною значень листя дерева). Використання дерев рішень звичайно пов'язане з відсівом атрибутів, що не впливають на вибір рішення (так, колір очей пацієнта не впливає на діагноз). Міркування за аналогієюДля середовищ, що динамічно змінюються, є типовими ситуації, в яких неможливо вивести необхідні знання дедуктивно з наявних даних, а набутого досвіду не вистачає для здійснення індуктивного узагальнення. Але іноді необхідно приймати рішення та планувати свої дії навіть за таких складних умов. У цьому разі звертаються до виведення за аналогією. Таке виведення не є достовірним, а має характер припущення. Виведення за аналогією - це виведення, в якому посилки стосуються одного об'єкта, а висновок - іншого. Можливість мислення за аналогією дозволяє людині відтворювати вже відомі механізми обробки інформації для нових ситуацій. Умовивід за аналогією - міркування, у яких з подібності двох об'єктів за деякими ознаками формують висновок про їх подібність за іншими ознаками. Приклад аналогії: посилка - “З усіх плоских фігур рівної площі найменший периметр має коло”, висновок - “З усіх тіл рівного об’єму найменшу поверхню має куля”. ПредикатиПредикат Р - це конструкція, що відображає якийсь зв'язок між об'єктами або властивостями об'єктів. Предикат - це логічна функція, що приймає значення “істина” або “хиба” залежно від значень своїх аргументів. Кількість аргументів у предиката називають йогоарністю. Об'єкти, зв'язані предикатом Р, називають термами. Терми бувають лише трьох типів: 1) константа (позначає індивідуальний об'єкт або поняття); 2) змінна (позначає в різний час різноманітні об'єкти); 3) складовий терм – функція. Предикати можуть об'єднуватися у формули за допомогою логічних зв'язок. Формули логіки предикатів визначаються рекурсивно:
Інших формул не буває. Багато формул логіки предикатів використовуютьквантори загальності та існування, які визначають область значень змінних - аргументів предикатів. Квантори зв'язують змінні предикатів, на які вони діють, і перетворюють предикати у висловлення. При інтерпретації предикатів можливі три основні ситуації: 1) формула A здійсненна, тобто існує набір констант x, що робить предикат істинним, - ; 2) формула A загальнозначуща, тобто вона здійсненна для будь-яких наборів - ; 3) формула нездійсненна (суперечлива), тобто не існує набір констант x, що робить предикат істинним, - . Формальні теоріїСинтаксична структура понять ПрО звичайно описується формальною теорією, яка дозволяє за допомогою формальних методів отримувати нові твердження про властивості об'єктів або явищ ПрО, що є змістовною інтерпретацією виведених формул. У алфавіт мови системи входять предметні та предикатні константи, предметні та предикатні змінні, логічні зв'язки і квантори, а також допоміжні символи (дужки, коми тощо). Множина слів мови складається з правильно побудованих формул. Це насамперед аксіоми, що задаються при побудові теорії. Правила виведення дозволяють одержувати з аксіом новіправильно побудовані формули - теореми. Множина аксіом називається незалежною, якщо жодну з них не можна вивести як теорему із сукупності інших. Часто для спрощення доказу теорем у систему аксіом включають і залежні. У формальних системах логічного типу в множині аксіом завжди містяться логічні аксіоми, використання яких поряд із специфічними для даної теорії правилами виведення дозволяє формалізувати процес доведення. Логічне числення - несуперечливе, якщо в ньому не виводяться водночас Р та заперечення Р. У суперечливих численнях може бути виведена будь-яка формула. Цю обставину можна використовувати для доведення несуперечливості числення: досить показати існування в ньому невиведеної формули. Доведення або спростовання формули називається логічним виведенням. У процесі виведення використовуються набуті раніше формалізовані знання, а не нові експерименти і спостереження. Нечіткі множини та нечітка логікаУ постановці задач часто зустрічаються елементи нечіткості. Нечіткість може бути лінгвістичною, тобто виникати з властивостей мови опису задач (приміром, такі характеристики, як “великий” або “малий”, не задають кількісну міру та мають сильну контекстну залежність - так, карликовий бегемот напевно більше крупного хом’яка). Теорія нечітких множин дає строгий математичний опис розпливчастих тверджень (“fuzzy logic”), дозволяючи тим самим подолати лінгвістичний бар'єр між людиною, судження й оцінки якої є наближеними і нечіткими, і комп’ютерами, здатними виконувати тільки чіткі інструкції. Зараз існує кілька підходів до формалізації нечітких понять. Один з них - нечіткі множини Заде. Він долає обмеження класичної теорії множин щодо того, що елемент може або належати, або не належати множині. Вводиться характеристична функція належності, що приймає свої значення на інтервалі від 0 до1. Галузь застосування нечітких множин дуже широка і різноманітна. У царині аналізу великих систем, таких, як управління економікою країни або галузі, з'являється можливість моделювання невизначеності, яка подається у градаціях поінформованості центру про нижчі рівні. У галузі лінгвістики – це моделювання змісту речень і текстів за допомогою розподілу можливостей, які описують функції належності. В техніці теорія нечітких алгоритмів стимулює розвиток гнучких автоматизованих виробництв і робототехнічних комплексів, зокрема, роботів, здатних виконувати окремі інтелектуальні дії людини. Теорія нечітких множин корисна при створенні діалогових систем з мовою спілкування, близькою до природного. Між ШІ і теорією нечітких множин існує тісний взаємозв'язок, що випливає з тези Л. Заде про те, що «людина мислить не числами, а нечіткими поняттями». Експертні системиЕкспертна система (ЕС) — це складна ІС, що оперує знаннями в певній ПрО з метою надання рекомендацій або вирішення проблеми. ЕС акумулює знання експертів, щоб надати можливість використовувати їх менш кваліфікованим користувачам. Вона на основі обробки цих знань може давати інтелектуальні поради, приймати рішення на рівні експерта-професіонала, а також пояснювати процес знаходження того або іншого рішення. ЕС - це програма, що поводиться як експерт в певній вузькій ПрО. ЕС мають розв’язувати задачі з невизначеними і неповними вихідні даними, застосовуючи для цього експертні знання. Ці системи надають пояснення своєї поведінки і свого рішення, але відповідальність за прийняте рішення несе особисто користувач.ЕС мають широке практичне застосування. Розроблені ЕС у науці (класифікація тварин і рослин за видами), у медицині (постановка діагнозу, аналіз електрокардіограм, визначення методів лікування), у техніці (пошук несправностей у технічних пристроях), у соціології, криміналістиці, лінгвістиці тощо. Прийнято виділяти в ЕС три основні модулі: • база знань; • машина виведення; • інтерфейс із користувачем. Оцінка ЕС користувачем значною мірою залежить від того, наскільки праця з експертною системою схожа на співробітництво з експертом, і, відповідно, істотно залежить від якості пояснень, які система надає користувачеві у відповідь на його запитання. Важлива риса ЕС - їх адаптивність, тобто здатність до навчання. Для функціонування ЕС її БЗ має бути наповнена знаннями. Для цього запрошують експертів - висококваліфікованих спеціалістів у тій галузі, для якої розробляється ЕС. Їх завдання — формально описати всі свої знання, потрібні для функціонування ЕС. У БЗ містяться знання двох типів: 1) загальновідомі факти, явища, закономірності даної ПрО; 2) набір емпіричних правил, за якими спеціалісти приймають рішення за умов невизначеності, неповноти та суперечливості інформації. Класифікація ЕС за призначеннямЕС, що виконують інтерпретацію, як правило, використовують інформацію від датчиків для опису ситуації. Приміром, це може бути інтерпретація показників вимірювальних приладів на заводі для визначення стану процесу. Такі ЕС мають справу не з чіткими символьними поданням проблемної ситуації, а безпосередньо з реальними даними. Це призводить до ускладнень, яких немає в інших ЕС, тому що їм доводиться обробляти інформацію недостатню, неповну, ненадійну або помилкову. Вони використовують спеціальні методи реєстрації характеристик безупинних потоків даних, сигналів або зображень і методи їх символьного подання. ЕС, що здійснюють прогноз, визначають імовірні наслідки заданих ситуацій. Прикладами проблем, що вирішують такі ЕС, служать прогноз збитків врожаю від деяких видів шкідливих комах, оцінка попиту на нафту на світовому ринку, прогнозування місця виникнення наступного збройного конфлікту на підставі даних розвідки. Системи прогнозування іноді використовують імітаційне моделювання, тобто програми, що відображають причинно-наслідкові взаємозв'язки в реальному світі, щоб генерувати ситуації або сценарії, які можуть виникнути за тих або інших вхідних даних. Можливі ситуації разом із знаннями про процеси, що породжують ці ситуації, утворюють передумови для прогнозу. Поки що розроблено порівняно мало систем для прогнозування, можливо, тому, що дуже важко взаємодіяти з імітаційними моделями і створювати їх. ЕС виконують діагностику, використовуючи описи ситуацій, характеристики поведінки або знання про конструкцію компонентів, щоб установити ймовірні причини неправильного функціонування системи. Прикладами служать визначення причин захворювання за симптомами, що спостерігаються в пацієнтів; локалізація несправностей в електронних схемах і визначення відмов у системі охолодження ядерних реакторів. Діагностичні системи часто є консультантами, що не тільки ставлять діагноз, але і допомагають у налагоджуванні. Вони можуть взаємодіяти з користувачем, щоб надати допомогу в пошуку несправностей, а потім запропонувати порядок дій з їх усунення. Медицина - це цілком природна галузь для діагностики, і дійсно, у ній було розроблено більше діагностичних систем, чим у будь-який іншій ПрО, проте зараз багато діагностичних систем розробляють для застосування в інженерній справі та комп'ютерних системах. ЕС, що виконують проектування, розробляють конфігурацію об'єктів, враховуючи обмеження ПрО. Прикладами можуть служити генна інженерія та синтез складних органічних молекул. ЕС, зайняті плануванням, проектують дії; вони визначають повну послідовність дій перед тим, як починається їх виконання. Прикладами можуть служити створення плану використання послідовності хімічних реакцій для синтезу складних органічних сполук або створення плану повітряного бою з метою нейтралізації певного чинника боєздатності ворога. ЕС, що виконують спостереження, порівнюють справжню поведінку системи з її очікуваною поведінкою. Приміром, спостереження за показаннями вимірювальних приладів у ядерних реакторах мають виявляти аварійні ситуації, а оцінка даних моніторингу хворих у блоках інтенсивної терапії – небезпеку для життя людини. ЕС порівнюють результати спостереження з даними, що притаманні стандартним ситуаціям. Такі ЕС за самою своєю природою мають працювати в режимі реального часу і здійснювати залежну як від часу, так і від контексту інтерпретацію поведінки об'єкта спостереження. ЕС, що навчають, аналізують та коригують поведінку того, кого навчають. Ці системи створюють модель знань того, хто навчається, і модель того, як він ці знання застосовує до рішення проблеми. ЕС діагностує помилки і вказує на них, здійснює аналіз і будує плани виправлень цих помилок. ЕС, що здійснюють управління, адаптивно управляють поведінкою системи в цілому. Приклади - управління виробництвом і розподілом комп'ютерних систем або контроль за станом хворих при інтенсивній терапії. Такі ЕС мають містити компоненти спостереження, щоб відслідковувати поведінку об'єкта. “Порожні” ЕС - це інструментальні засоби для побудови інших ЕС. Вони не містять конкретних правил ПрО. Прикладом такої системи є інструментальний комплекс ІндЕкс, розроблений автором даної глави, що призначається для автоматичної розробки консультуючих систем. Цей комплекс містить бібліотеку алгоритмів індуктивного здобуття знань, підсистему візуалізації дерева рішень у вигляді Р-графів, інтелектуальний користувацький інтерфейс, засоби пояснення та механізм інтерпретації дерева рішень. Система здатна обробляти неповні та нечіткі дані. За допомогою ІндЕкс були створені прикладні ЕС для оцінки якості геологічних досліджень, для прогнозування масового розмноження шкідливих комах, для оптимізації медико-біологічних досліджень осіб, що потерпіли внаслідок аварії на Чорнобильській АЕС, економічного прогнозування тощо. За зв’язком з реальним часом ЕС поділяють на:
Статичні ЕС розробляються для ПрО, в яких БЗ та дані, що вона інтерпретує, стабільні та незмінні. Приклад статичної системи – ЕС для діагностики несправностей автомобіля. Квазідинамічні ЕС здатні інтерпретувати ситуацію, що змінюється за певний інтервал часу. Приклад квазідинамічної системи – ЕС для обробки лабораторних вимірів технологічного процесу. Динамічні ЕС здатні обробляти інформацію від датчиків у режимі реального часу. Приміром, динамічні ЕС використовують для управління гнучкими виробничими комплексами. Системи підтримки прийняття рішеньСистеми підтримки прийняття рішень (СППР) виникли на початку 70-х років завдяки розвитку ІС для підтримки процесів прийняття рішень управлінських в складних і слабо структурованих ситуаціях, пов'язаних з розробленням і прийняттям рішень. Термін “системи підтримки прийняття рішень” (DSS - Decision Support System) було запропоновано у 1971р. С.Горрі та С.Мортоном для програмних засобів, призначених допомагати у прийнятті управлінських рішень. Звичайно під СППР розуміють інтерактивну систему, яка забезпечує особам, що приймають рішення (ОПР), засоби доступу до даних і моделей для вирішення неструктурованих і слабо структурованих проблем. СППР використовують для підтримки різних видів діяльності в ситуаціях, де неможливо або небажано мати автоматичну систему, що повністю виконує весь процес рішень. Пріоритетні галузі використання СППР – це фінансова діяльність, урядова діяльність, промисловість. Підтримка процесу прийняття рішень має забезпечувати:
СППР - це людино-машинна система, яка дозволяє керівнику використовувати свої знання, досвід і переваги, об'єктивні і суб'єктивні моделі, оцінки та дані для реалізації комп'ютерних методів знаходження рішень. Вона виконує:
Основні властивості СППРІнтерактивність - система озивається на різного роду дії, якими людина має намір вплинути на обчислювальний процес. Людина і система обмінюються інформацією в темпі обробки інформації людиною. Проте практика свідчить, що надто мало керівників бажають і вміють вести прямий діалог з комп'ютером. Більшість з них віддає перевагу взаємодії з системою через посередника або в режимі непрямого доступу, де можлива пакетна обробка інформації. Водночас властивість інтерактивності необхідна при дослідженні нових проблем і ситуацій, при адаптивному проектуванні прикладних СППР. Інтегрованість забезпечує сумісність складових системи, що управляють даними та користувацьким інтерфейсом. Потужність означає спроможність системи відповідати на складні питання. Доступність — це здатність відповідати на запити користувача в потрібній й зрозумілій йому формі і за прийнятний час. Гнучкість характеризує можливість системи адаптуватися до змін потреб користувача та для прийняття рішень у нових ситуаціях. Надійність полягає в здатності системи виконувати потрібні функції впродовж заданого періоду часу. Робастість — це ступінь здатності системи відновлюватися в разі виникнення помилкових ситуацій як зовнішнього, так і внутрішнього походження (приміром, помилки у вхідній інформації або несправності апаратних засобів). Хоч між надійністю і робастістю існує певний зв'язок, проте ці дві характеристики системи різні: система, що ніколи не поновлюватиметься при виконанні помилкових ситуацій, може бути надійною, але не робастою; система з високим рівнем робастості, що здатна відновлюватися і продовжувати роботу при багатьох помилкових ситуаціях, може бути водночас віднесена до ненадійних, оскільки вона не здатна заздалегідь, до пошкодження виконати необхідні процедури. Керованість означає спроможність користувача контролювати дії системи і втручатися в хід розв'язування задачі. Сучасні СППР здатні:
Архітектура СППР складається з трьох основних підсистем:
Система управління моделями є одним із компонентів архітектури універсальної СППР. Функціями цього компонента є класифікація, організація і доступ до моделей, тобто ці функції аналогічні функції СУБД. Список літератури
Контрольні питання 1. Що таке штучний інтелект? ГЛАВА 7. Відкриті системи. Комп’ютерні мережі.Виникнення комп'ютерних мереж було викликано практичною потребою в спільному використанні ресурсів (даних і зовнішніх пристроїв). Компоненти комп'ютерної мережіКомп'ютерна мережа — це система програмних і апаратних компонентів, взаємопов’язаних один з одним, шо призначена для забезпечення спільного використання ресурсів. Найпростіша мережа складається з двох комп'ютерів, здатних обмінюватися даними. Усі мережі незалежно від складності ґрунтуються саме на цьому принципі. Для ефективної роботи комп'ютерних мереж застосовують мережні операційні системи, що призначені для управління роботою мережі комп'ютерів. Мережні застосуванні - це прикладні програми, що забезпечують додаткові можливості при роботі в мережі: поштові програми, мережні бази даних тощо. Існують локальні та глобальні мережі. Локальні мережі використовують швидкі канали передання даних у межах певної обмеженої території. Глобальна мережа складається з кількох локальних мереж, що поєднані зовнішніми лініями зв’язку. Усі комп'ютери, що підключаються до мережі, можна розділити на три функціональні групи: • робочі станції; • сервери мережі; • комунікаційні вузли. Робоча станція — це підключений до мережі комп'ютер, на якому користувач мережі виконує свою роботу. Кожна робоча станція використовує власну операційну систему і може обробляти як свої локальні файли, так і ресурси мережі. Сервер — це підключений до мережі комп’ютер, що надає користувачам мережі певні послуги. Мережі підрозділяються на два типи:
В однорангових мережах усі комп'ютери рівноправні, серед них немає ієрархії. Кожен комп'ютер є одночасно і клієнтом, і сервером. Користувачі самі визначають, які дані на своєму комп'ютері зробити доступними для інших користувачів мережі. Як правило, однорангові мережі застосовуються при невеликій кількості користувачів, що компактно розташовані. На відміну від однорангових мереж, мережі на основі сервера містять як мінімум один комп'ютер, що використовується винятково як сервер. За виконуваними функціями можна виділити наступні групи серверів. Файловий сервер — комп'ютер, що зберігає загальних даних користувачів мережі й одночасний доступ користувачів, що забезпечує, до цих даних. Файловий cepвер дозволяє погоджувати зміни даних, що виконуються різними користувачами; Сервер баз даних — комп'ютер, що виконує функції збереження, обробки і управління файлами БД. Він забезпечує авторизований доступ, прийом і обробку запитів користувачів до БД і пересилання результатів користувачам. Сервер прикладних програм — комп'ютер, що використовується для виконання прикладних програм користувачів. Поштовий сервер забезпечує обмін повідомленнями електронної пошти між користувачами мережі. Сервер каталогу містить відомості про структуру мережі і дозволяє користувачам мережі знаходити необхідну інформацію. Комунікаційний сервер — комп'ютер, що надає користувачам мережі доступ до своїх послідовних портів уведення/виведення. Наприклад, за допомогою комунікаційного сервера можна використовувати поділюваний модем, підключивши його до одному з портів сервера. Слід зазначити, що всі ці типи серверів можуть функціонувати на одному комп'ютері. При передачі даних у будь-якім середовищі відбувається загасання сигналу, що і приводить до обмеження відстані. Щоб перебороти це обмеження і розширити мережу, установлюють спеціальні пристрої — комунікаційні вузли мережі. Повторювач (wpealer) - пристрій, що підсилює або регенерує сигнал, що прийшов на його. Комутатор (switch) — це пристрій, що дозволяє поєднувати кілька сегментів мережі й одночасно підтримує процеси обміну даними для різних сегментів. Маршрутизатор (router) — пристрій, що з'єднує мережі одного чи різних типів за єдиним протоколом обміну даними. Він аналізує адресу призначення і направляє дані за оптимальним маршрутом. Шлюз (gateway) — це пристрій, що дозволяє організувати обмін даним між різними мережними об'єктами, що використовують різні протоколи обмін даними. Для опису мереж використовують два терміни - географія та топологія мереж. Топологія мережі - це конфігурація графа, вершинами якого є комп'ютери й інші мережні пристрої, а ребрами - фізичні зв'язки між ними. Усі мережі будуються на основі трьох базових топологій:
і їхніх комбінацій. У мережі з топологією "шина" використовується один спільний кабель, до якого підключені всі комп'ютери мережі. Повідомлення передається від одного конкретного комп'ютера до всіх комп'ютерів, але приймає його тільки той комп'ютер, якому воно адресовано. При топології "зірка" усі комп'ютери підключені до концентратора, і повідомлення передаються через нього. При топології "кільце" сигнали передаються по кільцю, і кожен комп'ютер виступає в ролі повторювача. Географія мережі визначає локалізацію компонентів мережі. Приміром, географія розрізняє використання спільного принтера комп’ютерами, що знаходяться в одній або у різних кімнатах, тоді як топологія ігнорує такі відмінності. Таким чином, одна й та сама топологія може відповідати різним варіантам географії. Основні вимоги до сучасних обчислювальних мережОсновні показники якості функціонування мережі:
Продуктивність обчислювальної мережі визначають як час реакції системи - час між моментом виникнення запиту і моментом одержання відповіді, так і її пропускна здатність - кількість інформації, що передається через мережу за одиницю часу. Надійність роботи мережі визначається надійністю роботи всіх її компонентів, забезпеченням захисту інформації (як тієї, що зберігається, так і тієї, що передається) від перекручувань і несанкціонованого доступу. Характеристиками керованості є засоби впливу на роботу будь-якого елемента мережі і виявлення проблем у їхній роботі, а також можливість автоматизації цих процесів. Розширюваність мережі - можливість модернізації її елементів, а також додавання нових елементів мережі (користувачів, комп'ютерів, служб). Масштабуємість мережі визначається можливістю її розширення без істотного зниження продуктивності. Інтегрованість означає можливість підключення до мережі різноманітного і різнотипного устаткування, програмного забезпечення від різних виробників. Основним напрямком розвитку інтегрованості обчислювальних мереж є стандартизація мереж, їхніх елементів і компонентів. Відкриті системиВідкриті системи - це системи, які можуть взаємодіяти з іншими системами відповідно зі встановленими правилами. Середовище відкритих систем - це набір міжнародних стандартів, що забезпечують інтероперабельність і мобільність застосувань, даних та персоналу, описують середовище, яке надає відкрита система для використання. Взаємозв’язок компонентів здійснюється за допомогою протоколів - домовленостей відносно форматів подання інформації та правил, що визначають функціонування компонентів, що виконують інформаційний обмін Міжнародна організація зі стандартизації (International Standards Organization - ISO) у 1984 р. розробила еталонну модель взаємодії відкритих систем (Open System Interconnection - OSI). Еталонна модель OSI швидко стала основною архітектурною моделлю для передачі міжкомп’ютерних повідомлень. Даний стандарт визначає лише вимоги відносно організації взаємодії окремих компонентів розподіленої системи. Еталонна модель OSI поділяє проблему переміщення інформації між комп'ютерами через середовище мережі на сім менших, і отже, простіших проблем, які обрані через свою відносну автономність. Кожна із семи областей проблеми вирішується за допомогою одного з рівнів моделі. Ці рівні відносно незалежні. Тому модулі, що реалізують кожний з рівнів, можуть бути модифіковані без внесення змін у модулі інших рівнів. Рівні еталонної моделі OSI 1. Прикладний Рівні моделі утворюють ієрархічну систему, у якій запит, який виникає на якому-небудь рівні, передається для виконання на більш низький рівень, і навпаки, результати обробки запитів передаються з більш низьких рівнів на більш високі. Для опису зв'язків між двома сусідніми рівнями встановлюється набір правил і угод - інтерфейс, що і визначає набір сервісів, які надаються рівнями. Більшість пристроїв мережі реалізує всі сім рівнів. Однак деякі реалізації мережі пропускають один або більше рівнів. Два нижчі рівні OSI реалізуються апаратним і програмним забезпеченням; інші п'ять вищих рівнів, як правило, реалізуються програмним забезпеченням.
В основі моделі OSI лежать 2 ключові принципи: 1. Концепція відкритих систем, тобто 2 різні системи, що підтримують функції відповідного рівня, можуть обмінюватися даними на цьому рівні; 2. концепція однорангового з'єднання типу “точка-точка“, тобто дані, що сформовані на конкретному рівні моделі, призначені тільки відповідному рівню іншого пристрою. Прикладний рівень - це найближчий до користувача рівень OSI. Він відрізняється від інших рівнів тим, що не забезпечує послуг жодному з інших рівнів OSI, однак він забезпечує ними прикладні процеси, що лежать за межами масштабу моделі OSI. Прикладами таких прикладних процесів можуть служити програми обробки таблиць, програми обробки текстової інформації, програми банківських терміналів тощо. Прикладний рівень ідентифікує і встановлює наявність передбачуваних партнерів для зв'язку, синхронізує спільно працюючі прикладні програми, а також встановлює угоди по процедурах усунення помилок і управління цілісністю інформації. Прикладний рівень також визначає, чи є в наявності досить ресурсів для передбачуваного зв'язку. Рівень подання даних відповідає за те, щоб інформація, що посилається з прикладного рівня однієї системи, синтаксично зрозуміла відповідному рівню іншої системи. При необхідності він здійснює трансляцію між форматами подання інформації шляхом використання спільного формату подання інформації. Цей рівень відповідає не тільки за формат і подання даних користувача, але також за структури даних, що використовують програми. Сеансовий рівень установлює, кординує і завершує сеанси взаємодії між прикладними задачами. Сеанси складаються з діалогу між двома або більше об'єктами подання. Цей рівень синхронізує діалог між об'єктами рівня подання даних і керує обміном інформацією між ними, а також надає засоби для відправлення повідомлень у виняткових ситуаціях про проблеми сеансового, представницького і прикладного рівнів. У той час як прикладний, представницький і сеансовий рівні відповідають за прикладні питання, чотири нижчих рівні вирішують проблеми транспортування даних. Транспортний рівень забезпечує транспортування даних об’єктами, що взаємодіють, та надання послуг з надійного обміну даними між логічними об’єктами сеансового рівня. Це дозволяє вищім рівням не вникати в ці деталі. Зокрема, транспортний рівень вирішує такі питання, як виконання надійного транспортування даних через мережу. Мережний рівень забезпечує можливість зв’язок між двома абонентами за допомогою мережної адреси у пакеті даних, забезпечуж передання даних та обробку помилок, керує потоками даних, надає послуги з формування пакетів та маршрутів проходженя запитів та даних через мережу. Канальний рівень забезпечує надійний транзит даних через фізичний канал. Виконуючи цю задачу, канальний рівень вирішує питання фізичної адресації (на противагу мережної чи логічної адресації), топології мережі, лінійної дисципліни (яким чином кінцева система використовує мережний канал), повідомлення про несправності, упорядкованої доставки блоків даних і керування потоком інформації. Фізичний рівень визначає електротехнічні, механічні, процедурні і функціональні характеристики активації, підтримки і дезактивації фізичного каналу між кінцевими системами. Специфікації фізичного рівня визначають такі характеристики, як рівні напруги, синхронізацію зміни напруги, швидкість передачі фізичної інформації, максимальні відстані передачі інформації, фізичні з'єднувачі та інші аналогічні характеристики. Для різних рівнів моделі потрібно реалізувати відповідні протоколи. Список літератури
Контрольні питання1. Що таке комп'ютерна мережа? 2. На які групи поділяються комп’ютери, підключені до мережі? 3. На які типи поділяються комп’ютерні мережі? 4. На які групи за своїми функціями поділяються сервери? 5. Для чого потрібні комунікаційні вузли? 6. За якими показниками оцінюють якість функціонування мереж? 7. З яких рівнів складається розробила еталонна модель взаємодії відкритих систем OSI/ISO? 8. Які принципи лежать в основі еталонної моделі взаємодії відкритих систем OSI/ISO? ГЛАВА 8. Інформаційні ресурси глобальної мережі Інтернет. Подання знань про предметну область на основі онтологійІнформаційні ресурси глобальної мережі ІнтернетІнтернет об’єднує в глобальну мережу величезну кількість локальних мереж. Важлива складова Інтернет WWW (World Wide Web) - це мережа інформаційних ресурсів, призначена для подання розподіленої гетерогенної інформації на базі архітектури “клієнт-сервер”. WWW забезпечує доступ до інформації за допомогою трьох механізмів:
Для упорядкування інформації, поданої у WWW, постійно ведеться робота з виявлення закономірностей і розробки певних стандартів, що потім реалізуються в готових програмних продуктах. Це дозволяє сподіватися, що незабаром Інтернет перетвориться на мережу семантично пов'язаних ресурсів, а через якийсь час - і в розподілене сховище знань. Засоби подання текстової інформаціїПоняття гіпертексту було уведено В.Бушем ще в 1945 році, однак сплеск активності навколо цієї технології відбувся лише тоді, коли з розвитком Інтернет виникла реальна необхідність у механізмі об'єднання великих обсягів інформаційних ресурсів, що подані у вигляді нелінійного тексту. З використанням гіпертекстової моделі документа спосіб подання різноманітних інформаційних ресурсів у мережі став більш упорядкований, а користувачі одержали зручний механізм пошуку і перегляду потрібної інформації. Зараз серед інформаційних ресурсів, потенційно доступних користувачам Інтернет, як і раніше, переважає гіпертестова інформація, в основному, у форматі HTML і XML (хоча частка цієї інформації постійно зменшується). Найпопулярніша на сьогоднішній день мова гіпертекстової розмітки HTML була створена спеціально для організації інформації, розподіленої в мережі Інтернет, і є однією з ключових складових технології WWW. З використанням гіпертекстової моделі документа спосіб подання різноманітних інформаційних ресурсів у мережі став більш упорядкований, а користувачі одержали зручний механізм пошуку і перегляду потрібної інформації. HTML є спрощеною версією мови розмітки SGML (Standart Generalised Markup Language, ISO 8879), яка була прийнята Комітетом ISO у 1986 році як міжнародний стандарт для визначення незалежних від пристроїв вводу/виводу, обчислювального середовища методів подання текстів в електронній формі. SGML призначається для опису формальних специфікацій мов опису документів, структур документів і інших метаданих. HTML припускає, що документ складається зі стандартних елементів розмітки, що відображаються стандартним образом. Набір цих елементів – це типізація компонентів звичайного документа: заголовок, автори, параграфи, таблиці, цитування тощо. Інструкції HTML, у першу чергу, призначені для управління процесом виводу вмісту документа на екран програми-клієнта і визначають цим самим спосіб подання документа, але не його структуру. HTML-документ складається зі стандартних елементів розмітки, що відображаються стандартним образом. Збільшення кількості інформації в гіпертекстових документах та ускладнення їхньої структури перетворило простоту технології HTML з переваги на недолік. Мову XML (eXtensible Markup Language) розроблено Всесвітнім консорціумом W3C для забезпечення інтероперабельності між SGML і HTML. На відміну від HTML, що створювався для гіпертекстових документів з фіксованою структурою, XML призначений для розмітки документів довільної структури. XML являє собою простий і в той же час потужний та гнучкий текстовий формат опису документів. У форматі XML можна зберігати дані практично будь-якого ступеня структуризації і будь-якого призначення. XML-документ за своєю структурою є деревом, яке можна інтерпретувати і як граф. Перехід на специфікації XML дозволяє описувати структуру даних без прив'язки до форми їх відображення, визначати форму подання даних незалежно від конкретного змісту, створювати метадані та керувати доступом до даних тощо. Зараз існує кілька мов запитів до XML-джерел даних: XQL та XML QL. Пошук в XML-документі полягає у встановленні елементів, що відповідають умовам запиту, з наступним перетворенням знайдених елементів у структуру, задану в запиті. Технології XML забезпечують стандартне подання даних для використання різними застосуваннями без спеціальної додаткової обробки інформації. Різні логічні схеми різних документів можуть використовувати ті самі імена елементів у різних значеннях. Для інтерпретації цих значень необхідно вказати простір імен – колекцію імен, які ідентифиікуються за посиланням URI ( (URI – ідентифікатор ресурсів, що дозволяє описувати й ідентифікувати не тільки інформаційні ресурси Інтернет, але і предмети реального світу і загальні поняття предметної області), що використовуються документами XML як імена типів, елементів і атрибутів. Простір імен можна розглядати як ІР, з якого здобувають необхідні визначення. Існують й інші формати для подання текстової інформації. Наприклад, PDF-файли звичайно розглядаються як частина «невидимої» Web-інформації, схованої в БД, що звичайно не індексуються пошуковими системами. Тим часом великий обсяг важливої інформації (у тому числі технічні статті і наукові звіти) зберігається тільки у форматі PDF. В Інтернет досить часто зустрічаються і матеріали у форматі MS Word чи у форматі rtf, у яких поряд з текстовою інформацією містяться малюнки, таблиці, графіки і формули. Мультимедійна інформаціяБудь-яка інформація, що не є текстовою, вважається мультимедійною. Це можуть бути зображення, музика, цифрове відео, цифрове аудіо. Для публікації та поширення через Інтернет такої інформації використовують стандарти форматів подання мультимедійної інформації MPEG, розроблені спеціальною експертною групою з питань рухомих зображень Moving Picture Experts Group, створеною в 1988 р. з ініціативи Об'єднаного Комітету Міжнародної Організації по Стандартизації (ISO) і Міжнародної Електротехнічної Комісії (IEC): MPEG-1 (ISO/IEC 11172), MPEG-2 (ISO/IEC 13818), MPEG-4 (ISO/IEC 14496), MPEG7 (ISO/IEC JTC1/SC29/WG11) та MPEG21 (ISO/IEC JTC1/SC29/WG11/N4801). Стандарт ущільнення зображення і звуку, призначений для використання при записі на CD-ROM і Video CD MPEG-1, був прийнятий у 1993 р. MPEG-2 - стандарт ущільнення рухомого зображення і звуку, остаточно затверджений як міжнародний стандарт у 1994 р. MPEG-4 - стандарт ущільнення рухомого зображення і звуку, призначений для передачі даних з низькою швидкістю, приміром, по телефонних лініях. Стандарти MPEG-1 і MPEG-2 визначили розвиток відео-CD, MP3, DVD, цифрового телебачення тощо. Вони описують принципи подання аудіовізуальної інформації з використанням методів компресії. Стандарт MPEG-4 пропонує об'єктно-орієнтоване подання мультимедійних даних. Перша версія цього стандарту була розроблена в 1999 році, надалі робота над ним була продовжена. Основне призначення MPEG-7 - це пошук мультимедійної інформації. MPEG-7 забезпечує стандартизацію опису різних типів мультимедійної інформації (а не для її кодування). Його офіційна назва - "Multimedia Content Description Interface" (інтерфейс опису мультимедійних даних). MPEG-7 призначений як для користувачів-людей, так і для автоматичних систем, що обробляють аудіовізуальний матеріал. Основні засоби, що використовуються в описах MPEG-7, - це мова DDL (Description Definition Language), схеми описів (DS) і дескриптори (D). DDL – це не мова моделювання, подібна до UML (Unified Modeling Language), а мова схем для подання результатів моделювання аудіовізуальних даних. За основу DDL обрано XML. Графічні формати ІнтернетДля подання графічної інформації зараз широко застосовують такі формати, як SMIL (Synchronized Multimedia Integration Language), SVG (Scalable Vector Graphics), VML (Vector Markup Language, Microsoft), VRML (Virtual Realty Modelling Languagy), PGML (Precision Graphics Markup Language, Adobe). Специфікація SVG 1.0, розроблена консорціумом W3C базується на мові XML. SVG дозволяє створювати двомірні векторні зображення й обмінюватися ними між різними платформами. На відміну від растрової графіки, що зараз застосовується в більшості Web-застосувань, векторна графіка дозволяє зберігати зображення у вигляді точок, відрізків і фігур. Звідси її масштабуємість, що дозволяє змінювати розміри зображень без утрати якості. Мова VRML призначена для опису тривимірних зображень і оперує об'єктами, що описують геометричні фігури і їхнє розташування в просторі. Vrml-файл являє собою звичайний текстовий файл, що ынтерпретуэться браузером. Оскільки більшість браузерів не має убудованих засобів підтримки vrml, для перегляду Vrml-документів необхідно підключати допоміжну програму - Vrml-браузер. SMIL - це рекомендований консорціумом W3С механізм створення документів, що містять синхронізовану мультимедійну інформацію. Такі документи називаються SMIL-презентаціями і являють собою набір інструкцій, що описують текстові, відео- і аудіодані. За допомогою SMIL можна стандартним способом пов’язувати і синхронізувати різні елементи - текст, графіку, звук, відео тощо. SMIL застосовують у мережному телебаченні і дистанційній освіті. Фрагменти SMIL-презентацій можна вставляти в HTML-сторінки. Їх інтерпретують спеціальні модулі розширення браузерів. Для використання SMIL досвід програмування не обов'язковий. Метаінформація про ресурси ІнтернетМетадані (metadata) - це інформація про документ, яку можна автоматично інтерпретувати. На сьогоднішній день найбільш перспективною і загальновживаною моделлю опису метаданих є стандарт опису ресурсів RDF (Resource Description Framework), створений в 1999 р. консорціумом W3C. Його підтримують багато виробників ПЗ і постачальників інформації. За допомогою RDF можна описувати структуру сайту та пов'язану з ним ПрО. RDF дозволяє обирати тезаурус документа з обмеженого списку для опису ПрО, що полегшує пошук інформації і поліпшує якість пошуку. RDF описує ресурси у вигляді орієнтованого розміченого графа – кожен ресурс може мати властивості, які в свою чергу також можуть бути ресурсами або їх колекціями. Ця мова також використовує XML-синтаксис. Стандарт RDF містить дві основні частини - власне спосіб опису ресурсів, а також спосіб завдання схем (RDF Schema), за якими описується ресурс. Базовий будівельний блок у RDF — це трійка «об'єкт — атрибут — значення», що часто записують у вигляді A(O,V), тобто «об'єкт O має атрибут A зі значенням V». Цей зв'язок можна також подати як ребро з міткою A, що з'єднує два вузли, O і V: [O]-A->[V]. Дана нотація дуже корисна, оскільки RDF дозволяє змінювати місцями об'єкти і значення. Таким чином, будь-який об'єкт може відігравати роль значення, що в графічному поданні відповідає ланцюжку з двох ребер з мітками. RDF допускає форму подання, у якій будь-який вираз RDF у трійці може бути об'єктом або значенням, тобто графи можуть бути як вкладеними, так і лінійними. RDF Schema дозволяє розроблювачам визначати конкретний словник для даних RDF (такий, як authorOf) і указувати види об'єктів, до яких можуть застосовуватися ці атрибути. Іншими словами, механізм RDF Schema надає базову систему типів для моделей RDF. Для того, щоб практично описати хоча б найпростіші атрибути документа, потрібно дати цим атрибутам назви, які потім будуть скрізь використовуватися. Зараз найбільш поширений набір елементів для створення метаданих, розроблений міжнародною групою "Dublin Core Metadata Elements". Він складається з 15 елементів, які можна умовно розбити на три групи:
Цей набір елементів можна розширювати. Метадані можуть бути або вмонтовані безпосередньо в сам ІР, приміром, у HTML-сторінку, або зберігається й поновлюватися незалежно від ІР. Перший підхід простіший, а другий - більш універсальний. Для створення RDF-описів документів розроблено відповідне ПЗ - RDFEdit. ОнтологіїФілософський термін “онтології” зараз активно використовують в ІТ. Множина об'єктів і відношення між ними відображаються в словнику, в якому система, заснована на знаннях, подає ці знання. У найбільш загальному випадку онтологія – це угода про спільне використання понять, що містить засоби подання предметних знань і домовленості про методи міркувань. Неформально онтологія являє собою певний опис погляду на світ у конкретній сфері інтересів. Цей опис складається з набору термінів і правил використання цих термінів, що обмежують їх значення в рамках конкретної ПрО. На формальному рівні онтологія - це система, що складається з наборів понять і тверджень про ці поняття, на основі яких можна будувати класи, об'єкти, відношення, функції та теорії. Онтологія, як зразок загальної угоди про семантику ПрО, сприяє встановленню коректних зв'язків між значеннями елементів ПрО, створюючи умови для їх спільного використання. Онтології можна застосовувати як будівельні блоки компонентів БЗ, словник для зв'язку між агентами, визначення класів для програмних систем тощо. Онтології – це бази знань спеціального виду, які містять семантичну інформацію з певної ПрО. Основні завдання, що можуть успішно вирішуватися за допомогою онтологій:
Онтології використовуються в електронній комерції для підтримки автоматизованого обміну даними між покупцями і продавцями, для вертикальної інтеграції ринків, а також для повторного використання описів різними електронними торговельними точками. Механізми пошуку також застосовують онтології для знаходження сторінок із синтаксично різними, але семантично однаковими словами. Онтологія (від др.-грец. “онтос” — “буття”, “логос” — “вчення”, “поняття”) — термін, що визначає вчення про буття, на відміну від гносеології — вчення про пізнання. Предметом онтології як частини метафізики було вивчення абстрактних і загальних філософських категорій, таких як буття, субстанція, причина, дія, явище тощо, а сама онтологія як наука претендувала на повне пояснення причин усіх явищ. Для практичного використання краще застосовувати визначення онтології, запропоноване FIPA (Foundation for Intelligent Physical Agents): онтологія - це система категорій, що є наслідком певного погляду на навколишнє середовище. При цьому сама система категорій не залежить від конкретної мови: онтологія завжди та ж сама незалежно від мови, що використовується для її опису. У ШІ звичайно використовують таке визначення: Онтологія - це знання, формально подані на основі концептуалізації, що припускає опис множини об'єктів і понять, знань про них та зв'язків між ними. Формально онтологія складається з термінів, організованих у таксономію, їх визначень і атрибутів, а також пов'язаних з ними аксіом і правил виведення. У найпростішому випадку онтологія описує тільки ієрархію концептів, зв'язаних відношеннями категоризації. У більш складних випадках до неї додаються певні аксіоми для відображення інших відношень між концептами і для того, щоб обмежити їх інтерпретацію. Онтологія являє собою БЗ, що описує факти, які вважаються завжди істинними в рамках визначеного угруповання на основі загальновживаного значення словника, що використовується. Формальна модель онтології О - це упорядкована трійка Х - скінченна множина термінів (понять) ПрО, яку описує онтологія O; - скінченна множина відношень між термінами заданої ПрО; - скінченна множина функцій інтерпретації, заданих на термінах і/або відношеннях онтології O. Якщо і , тоді онтологія О трансформується в простий словник: . Така вироджена онтологія може бути корисна для підтримки словників ПрО, але через те, що вона не дозволяє експліцитно вводити значення термінів, її застосовують, якщо терміни належать дуже вузькому (приміром, технічному) словнику і їхні значення вже заздалегідь добре узгоджені в межах певного (приміром, наукового) співтовариства. Відомими прикладами онтології цього типу є індекси пошукових машин в Інтернет. Якщо , але , тоді кожному елементу множин термінів із Х може бути поставлена у відповідність функція інтерпретації f із . Спеціальний підклас онтології - проста таксономія: . Цеієрархічна система понять, пов'язаних між собою відношенням«бути елементом класу», яке має фіксовану семантику і дозволяє організовувати структуру понять онтології у вигляді дерева. Такий підхід має свої переваги і недоліки, але в загальному випадку є адекватним і зручним для представлення ієрархії понять. Залежно від призначення, розрізняють такі онтології:
Основні характеристики онтології: Чіткість — онтологія має ефективно відображати зміст термінів. Визначення мають бути об'єктивними, хоч мотивація використання термінів може визначатися ситуацією або вимогами обчислювальної ефективності. Для об'єктивізації визначень використовують чітко фіксований формалізм, при цьому доцільно задавати визначення у вигляді логічних аксіом. Узгодженість — всі визначення мають бути логічно не суперечливими, а усі твердження, що виводяться в онтології, мають не суперечити аксіомам. Розширюваність — онтологія має бути спроектована так, щоб забезпечувати використання словників термінів, що припускають можливість монотонного розширення та спеціалізації без необхідності ревізії вже існуючих понять. Мінімум впливу кодування — концептуалізація, що лежить в основі створюваної онтології, має бути специфікована на рівні подання, а не символьного кодування. Мінімум онтологічних зобов'язань - онтологія має містити тільки найбільш істотні припущення про ПрО, що вона моделює, щоб залишати простір для розширення і спеціалізації. Методологія побудови онтологій потребує, у першу чергу, позначення цілей і області застосування онтології. В процесі побудови онтології фіксують знання про ПрО, а саме:
На етапі кодування сукупності основних термінів, що використовують в онтології, поділяють на окремі класи понять; обирають мову подання онтології та безпосередньо задають фіксовану концептуалізацію обраною мовою подання знань. Процес побудови онтології, відповідно до методології стандарту онтологічних досліджень IDEF5 (INTEGRATED DEFintion), складається з п'яти основних дій: 1) Вивчення і систематизування початкових умов для встановлення основних цілей і контексту проекту розробки онтології. 2) Збір та накопичення необхідних початкових даних для побудови онтології. 3) Аналіз та групування зібраних даних для полегшення побудови термінології. 4) Початковий розвиток онтології. 5) Уточнення та затвердження онтології - заключна стадія процесу. Зараз існує багато проектів, в основу яких покладені онтології: TOVE (Toronto Virtual Enterprise), Ontolingua, KACTUS (в складі проекту ESPIRIT), SHOE (Simple HTML Ontology Extensions), Plinus, Сyc (MCC), (КА)2 , Semantic Web (консорціум W3C) тощо. Онтології здатні зіграти важливу роль в організації обробки інформаційних ресурсів Інтернет, їхнього спільного використання й та семантичної інтерпретації. Онтологія DAML+OIL являє собою колекцію RDF–трійок. DAML Ontology Library пропонує власну класифікацію онтологій за різними ознаками (приміром, за ключовими словами або за просторами імен, які вони використовують). Для рішення задачі семантичної інтероперабельності Web у складі проекту Semantic Web розробляється мова подання онтологій OWL (OWL Web Ontology Language), що походить від DAML+OIL Web Ontology Language та також базується на RDF (Resource Description Framework). База знань OWL – це набір трійок, яким призначаються певні значення. Онтологія OWL містить кілька компонентів: заголовків (headers), елементів класів (class elements), елементів властивостей (property elements) та прикладів (instances), що можуть повторюватися. Онтологія - це послідовність аксіом та фактів, яка може також містити посилання на інші онтології. Крім того, до онтології може входити допоміжна інформація – приміром, про її розробника. Основні й істотні відмінності від DAML+OIL полягають у наступному:
Існує також кілька розходжень, що включають у себе деякі зміни імен деяких конструкцій, однак основна мета, переслідувана при створенні OWL була максимально коректно зберегти імена DAML+OIL. Онтологія OWL є послідовністю аксіом і фактів, а також посилань на інші онтології, що вважається включеними в онтологію. Онтології OWL є документами Web і на них можна посилатися через URI. Онтології також мають компоненти для запису авторства і іншої не зв'язаною з логікою інформації, яка асоційована з онтологією. ВисновкиВикористання онтологій та інших метаописів для опису інформаційних ресурсів Інтернет дозволяє формалізувати відомості про ПрО, до якої вони відносяться, що спрощує пошук потрібних користувачеві ресурсів. Список літератури
Контрольні питання 1. Які засоби використовують для подання гіпертексту?
ГЛАВА 9. Інтелектуальні програмні агенти. Мультиагентні системи.Один з найперспективніших напрямків у ШІ пов’язаний зі створенням інтелектуальних програмних агентів та мультиагентних систем. Агентно-орієнтовані системи поєднують об’єктно-орієнтовану технологію програмування з технологіями штучного інтелекту. Поширення використання агентної парадигми в ІТ призводить до якісно нового рівня взаємодії користувача з ПЗ. Програмний агент - це сутність, яка здатна до формулювання цілей, навчання, планування та прийняття рішень в оточенні, що динамічно змінюється. Вперше агенти були використані при створенні каталогів сторінок Інтернет для виконання рутинної роботи з перегляду інформаційних ресурсів мережі. Зараз агенти широко використовуються для вирішення широкого спектра задач – від управління підприємством до пошуку інформації, від диспетчеризації перевезень і логістики – до управляння космічними роботами. Призначення агентів – спростити та покращити взаємодію користувачів зі складними програмними системами у слабоструктурованому, розподіленому середовищі, що динамічно змінюється, шляхом адаптації до особливостей конкретного користувача. Агент, на відміну від традиційних програм, здатний взаємодіяти з цим середовищем, отримуючи від нього інформацію через свої сенсори і впливаючи на середовище за допомогою своїх ефекторів, та змінювати свою поведінку, навчаючись на власному досвіді. Основні властивості програмного агентаДля реалізації своїх функцій агент має володіти, принаймні, чотирма можливостями:
Інтелектуальні агенти здатні аналізувати інформацію, яку вони отримують від інших агентів. Вони можуть приймати рішення в умовах невизначеності ситуації. Як правило, агентів не програмують для виконання конкретної роботи, а навчають на прикладах. Агенти, які мають високий рівень інтелектуальності, здатні самостійно вчитися на власному досвіді. Властивості інтелектуальних агентівАвтономність - агент виконує значну частину своєї роботи автономно, не взаємодіючи з людиною або іншими агентами. Комунікабельність - агент уміє спілкуватися з користувачем, одержуючи від нього завдання і надаючи результати. Адаптивність поведінки - в процесі спілкування з користувачем агент уміє настроюватися на його особисті звички і методи роботи. Раціональність поведінки - агент своїми діями має просуватися до рішення поставленої задачі і не виконувати дії, які цьому процесові перешкоджають. Якщо агент на основі своїх знань вважає, що певна дія наблизить його до поставленої перед ним цілі, то він може виконати цю дію. Але ця дія може і не привести його до цілі, якщо інформація, на основі якої агент прийняв рішення, була невірною, тобто рішення агента про доцільність виконання дій залежать від наявної інформації та засобів її обробки. Сприйнятливість - агент, що перебуває в інформаційному середовищі, сприймає певним чином зміни навколишнього середовища і може реагувати на ці зміни. Проактивність - агент має не тільки виконувати поточну задачу, але і збирати при цьому потенційно корисну для користувача інформацію та накопичувати її у своїй БД. Інтелектуальність агента відображає ступінь його спроможності до міркування та навчання. Інтелектуальний агент може сприймати певні переваги, які користувач надає різним ситуаціям, та має механізм міркувань, щоб діяти відповідно до цих переваг. Більш високий рівень інтелектуальності припускає наявність в агента моделі потреб користувача і механізму пошуку засобів їх задоволення. Важливою складовою інтелектуальних програмних агентів є механізми виведення нових знань на основі наявних. Більш того, інтелектуальність програмного агента визначається не стільки інформацією, яку він має, скільки його здатністю здійснювати коректне виведення на основі своїх знань. БЗ агента містить таку інформацію:
Інтелектуальний програмний агент має модель ПрО, модель користувача, засоби сприйняття, засоби виконання дій, цілі і планувальник дій на підставі цілей, моделі інших агентів і засоби взаємодії з ними Модель ПрО, в якій функціонує агент, має відображати структуру та ієрархію об’єктів (приміром, у формі онтології), з якими він взаємодіє для досягнення цілей. Інтелектуальний агент має явно задану символьну модель світу, у якій рішення (приміром, вибір дії) приймаються через логічні або псевдологічні міркування. Модель користувача потрібна агенту для того, щоб правильно інтерпретувати завдання користувача та сповіщати його про отримані результати у зручній та зрозумілій формі. В процесі роботи агент може поповнювати модель користувача, накопичуючи досвід взаємодії з конкретним користувачем (або класом користувачів) для підвищення ефективності своєї роботи. Засоби сприйняття та засоби виконання дій агента залежать від функцій, які агент має виконувати. Цілі агента визначають його дії відповідно до принципу раціональності. Обирає такі дії та визначає їх послідовність планувальник дій агента. Моделі інших агентів потрібні агенту для того, щоб успішно взаємодіяти з ними і обмінюватися інформацією в процесі досягнення спільних цілей. Для взаємодії агентів звичайно використовується мова KQML. Переконання, бажання і наміри агентівПрограмний агент як система найбільш адекватно описується за допомогою інтенсіональних відношень - інформаційних (переконання, знання) та передвідношень (бажання, намір, зобов'язання тощо). Інформаційні відношення - це відомості, які агент має про середовище, у якому він існує, тоді як передвідношення - це те, що певним чином керує діями агента. Переконання (Belief) агента відображають його думки про поточний стан світу і про правдоподібність образу дії, що призводить до певного ефекту. Переконання агента підрозділяються на:
Бажання (Desire) – це ситуації, в які прагне потрапити агент шляхом виконання певних дій. Важливою властивістю множини бажань є те, що агент може мати несумісні і недосяжні бажання. Приміром, агент може бажати виконати певні дії за найменший час та витратити на це найменше ресурсів. Ціль - це несуперечлива підмножина бажань агента. Наміри (Intention) - несуперечлива підмножина цілей, які може досягти обмежений у ресурсах агент, і засіб їх досягнення. Передвідношення та інформаційні відношення тісно пов'язані, оскільки агенти формують свої наміри на основі наявної в них інформації про світ. Переконання, як і деякі інші інтенсіональні відношення, - референційно непрозорі, тобто істинність висловлення “А вважає Х“ залежить не лише від істинності значення Х, але і від А, і через це класична логіка в її стандартній формі непридатна для їхнього опису. Приміром, істинність висловлення “студент вважає, що вивчив матеріал” визначаються не тим, чи насправді він його вивчив, а його власними переконаннями. Розроблено багато досить складних способів формалізації переконань. Приміром, теорія можливих світів, запропонована Хинтіккою, дозволяє визначити семантику мови, що містить інтенсіональні оператори переконання. Як загальнозначущий критерій відмінності знання від переконання береться фіксована точка зору, представлена базовою системою можливих світів. Повні знання про навколишнє середовище в загальному випадку недоступні. Але агент здатний серед усіх взагалі можливих ситуацій виділити та відкинути ті ситуації, які суперечать наявній в нього інформації (приміром, якщо агент отримав дані від своїх сенсорів і вважає, що сенсори працюють правильно, то він переконаний в цих даних). Кожна з ситуацій, яка не була відкинута, називається світом і є можливою, виходячи зі знань агента. При цьому переконання агентів можуть бути охарактеризовані як множини можливих світів. Висловлення, істинне в усіх можливих світах агента, - це його переконання. Модель агента, що базується на інтенсіональних відношеннях, звичайно називають BDI-моделлю (переконання - Belief, бажання – Desire, намір - Intention). Для моделювання поведінки інтелектуальних агентів використовують різні комбінації інтенсіональних відношень. Приміром, Кохен і Левескьє обрали як базові відношення переконання і цілі, визначаючи інші відношення через них, Рао і Джоржеф - переконання, бажання і наміри, тоді як Братман замість переконань, бажань та намірів використовує більш практичні відношення - цілі і плани. Вибір комбінації інтенсіональних відношень значною мірою визначається специфікою інтересів розробників моделі. Мультиагентні системиДля вирішення складних проблем досить часто використовують мультиагентні системи, що складаються з набору агентів, які виконують окремі функції та взаємодіють в процесі цього з іншими агентами. Переваги мультиагентної системи – це відносна простота розроблення окремих агентів; інтероперабельність, що дозволяє розширювати систему агентами, створеними незалежно різними розробниками, а також більша здатність системи до адаптації. Агенти, що входять до складу мультиагентної системи, можуть взаємодіяти один з одним не тільки в тих випадках, коли вони створені одним розробником чи групою розробників. Міжнародна асоціація FIPA розробила стандарти, що підтримують одну з визначальних характеристик агентів - інтероперабельність. Програма є агентом тільки в тому разі, якщо вона спроможна до коректних комунікацій на мові комунікацій агентів. Для конструктивної та інтелектуальної взаємодії між програмними агентами необхідні:
Спільне розуміння знань поділяється на дві підзадачі: 1) переклад з однієї мови подання знань на іншу; 2) пошук семантичного контексту подання знань для різноманітних програм. Комунікації викликають проблеми, пов'язані з: 1) протоколом взаємодії, 2) мовою комунікацій, 3) транспортним протоколом. Протокол взаємодії базується на високорівневій стратегії, яку здійснює агент у процесі взаємодії з іншими агентами. Такий протокол може знаходитися в діапазоні від схеми переговорів і протоколів теорії ігор до простих протоколів типу “кожного разу, якщо я чогось не знаю, я знаходжу кого-небудь, хто знає, і запитую“. Мова комунікацій вказує, що саме пропонується для комунікації, - твердження, запит або питання. Транспортний протокол - це діючий транспортний механізм, що використовується для комунікацій (приміром, TCP, SMTP, HTTP). Вибір конкретного транспортного протоколу залежить від специфіки конкретної програми. Агенти звичайно взаємодіють на рівні знань і тому не можуть задовільно обслуговуватися звичайними мовами і протоколами, призначеними для розподілених обчислень. KSE - це ініціативний проект розвитку технічної інфраструктури для підтримки пошуку знань між системами. У його рамках розробляється мова подання змісту KIF (формат обміну знаннями - Knowledge Intrchange Format), яка може бути використана для забезпечення перекладу з однієї мови на іншу або як загальна мова подання змісту для двох агентів, що використовують різні мови подання знань. KIF являє собою потужний засіб подання знань і метазнань. Існує дві передумови для розроблення подібної мови: 1) створення мови для розроблення інтелектуальних програм з акцентом на інтероперабельність, 2) створення загального формату обміну знаннями, при якому замість перекладу з мови А на мову Б виконується спочатку переклад із мови А на KIF, а потім - переклад із KIF на мову Б (при цьому за наявності n різноманітних мов потрібно 2n перекладачів замість n*(n-1), що були б необхідні при відсутності загальної мови) . Мова KIF містить різноманітні оператори, що допомагають подавати логічну інформацію (заперечення, диз'юнкції, квантифіковані формули тощо). KIF дозволяє кодувати знання про знання, використовуючи спеціальні символи. Семантика KIF (без правил і визначень) подібна до логіки першого порядку. Вона розширюється за рахунок використання нестандартних операторів і обмежується різноманітними аксіомами моделювання. Вимоги до мов комунікації агентів можна підрозділити на такі групи: форма, зміст, робота в мережі, середовище, надійність. Ці вимоги можуть конфліктувати одна з одною. Приміром, проста для людини мова може бути не такою стислою, як можливо. Вибір удалого співвідношення усіх вимог становить собою завдання для розроблювачів мови. Для рішення проблеми комунікацій між інтелектуальними агентами необхідна спільна мова, тобто спільні синтаксис, семантика і прагматика. Одержання загального синтаксису для програмних агентів є основною проблемою. Не існує загальновживаної мови подання інформації і запитів. Такі мови, як KIF і SQL, досить поширені, але цього недостатньо, щоб прийняти одну із них за стандарт. Два агенти можуть спілкуватися, якщо вони мають спільну мову подання знань або якщо вони використовують мови, для яких існують засоби перекладу. Для рішення цих проблем в рамках проекту KSE розроблена мова KQML (Knowledge Query and Manipulation Language). KQML - це мова і набір протоколів, що забезпечують програмним агентам ідентифікацію, зв'язок і обмін інформацією з іншими подібними агентами. KQML - це одночасно і формат повідомлень, і протокол обробки повідомлень для підтримки пошуку знань між агентами. Основні риси KQML :
KQML складається з трьох рівнів: рівня вмісту, рівня комунікацій і рівня повідомлень. Рівень умісту - це фактичний зміст повідомлення власною мовою подання (KQML може переносити висловлювання будь-якою мовою подання, в тому числі у вигляді рядків ASCII). Деякі агенти, що використовують KQML (приміром, програми маршрутизації, узагальнені посередники), можуть ігнорувати вміст повідомлення і тільки визначати, якщо воно закінчується. Рівень комунікацій містить набір властивостей, що описують низькорівневі параметри комунікації (такі, як ідентифікація відправника й одержувача, ідентифікатор комунікації тощо). Рівень повідомлень використовується для кодування того, що одна програма бажає передати іншій. Цей рівень формує ядро мови KQML і визначає вид взаємодії з агентом, що використовує KQML. Основною функцією рівня повідомлень є ідентифікація протоколу, що використовується для передачі повідомлення і забезпечення виконання певної дії, яку відправник зв'язує з повідомленням (запиту, команди тощо). Крім того, на цьому рівні можуть бути описані властивості мови вмісту, визначатися його тематика. Це дозволяє KQML виконувати аналіз, маршрутизацію і доставку повідомлень навіть у тому випадку, якщо їхній уміст недоступний. Список літератури
Контрольні питання 1. Які засоби використовують для подання гіпертексту?
ГЛАВА 10. Пошук інформації в Інтернет. Засоби інтелектуалізації пошуку інформаціїЗа останні роки Інтернет перетворився в один з основних засобів публікації інформації. Всесвітня павутина Інтернет розповсюджується стрімкими темпами та вплітається буквально в усі сфери життя. Вважається, що кожні 6-12 місяців розмір Інтернет подвоюється. Порівняно з БД, що використовуються у традиційних системах здобуття інформації, Web набагато різноманітніше як за вмістом, так і за структурою. Це розподілене середовище, що динамічно змінюється, а подані у ньому інформаційні ресурси вкрай різнорідні. Засобам обробки даних в мережі все складніше та складніше справлятись з масами інформації, вже існуючої і що додається в мережу щодня. Крім того, дані в Інтернет організовані вкрай стихійно і не систематично. Окрім серверів, що підтримуються компаніями, фірмами, університетами і іншими офіційними організаціями, на яких, в основному, представлена тематична інформація що більш-менш структурована, Web "населяють" домашні сторінки, що з'єднають в собі все, що завгодно.Ефективний пошук інформації в Інтернет у міру збільшення обсягу і розосередження джерел стає усе складнішим. При цьому критичним є не стільки час пошуку, скільки добір релевантної інформації. Це призводить до необхідності розробки нових технологій інформаційного пошуку. За даними дослідження, проведеного фахівцями Міжнародної фінансової корпорації (МФК) у березні 2003 р., більш 80% українських компаній, де є хоча б один комп'ютер, вважають Інтернет корисним джерелом отримання бізнес-інформації. При цьому 56% компаній, підключених до Інтернет, користаються ними щодня, а 31% - кілька разів на тиждень. Пошук потрібної інформації в Інтернет - суттєва проблема в зв'язку з:
Процес інформаційного пошуку являє собою зіставлення інформаційного запиту користувача з інформаційними ресурсами, що доступні системі, яка здійснює пошук. Ефективне виконання пошуку залежить як від засобів подання запиту, так і від засобів подання знань про інформаційні ресурси, а також від способів їхнього співставлення. Основні критерії оцінки ефективності інформаційно-пошукових систем (ІПС) - це швидкість, точність і повнота відповідей. Точність визначається тим, яка частина інформації, що надається у відповідь на запит, є релевантною, тобто стосується цього запиту. Повнота характеризується співвідношенням між усією релевантною інформацією, що є в базі, і тією її частиною, що включена у відповідь. Крім цього, при оцінці пошукових систем враховується, з якими типами даних може працювати та або інша система, у якій формі представляються результати пошуку і який рівень підготовки користувачів необхідний для роботи в цій системі. Найбільше розвинені можливості пошуку надають сьогодні системи пошуку за ключовими словами. Сучасні механізми пошуку в Web аналогічні за своєю дією традиційним системам здобуття інформації. Вони поділяються на дві групи - пошукові машини та каталоги. Пошукові машини звичайно містять три компоненти:
При цьому кожна пошукова система намагається самостійно проіндексувати всю мережу. Чим більше вузлів покриває пошукова машина, тим вище частка помилкових посилань, що у деяких випадках може досягати навіть 10%. Деякі пошукові служби відносяться до повнотекстових - вони шукають ключові слова не тільки в заголовку (і в метатегах), але й у тілі сторінки. Інші обмежуються пошуком тільки в заголовках і метатегах. Те ж саме відноситься і до глибини дослідження вузлів: одні обробляють тільки заголовну сторінку, інші - усі посилання до певного рівня, треті - Web-вузол цілком. Крім того, деякі служби мають спеціалізацію (явну або неявну) і приділяють більше уваги вузлам, присвяченим певної темі. До пошукових машин відносяться AltaVista, HotBot, Яndex і Rambler. У каталогах замість індексів обробляються описи ресурсів, що створюються не автоматично, а людьми-експертами. Нові вузли вивчаються експертами і відносяться ними до відповідних тематичних категорій. Багато каталогів також забезпечують пошук у своїй базі даних. Перевагою каталогів є більш висока якість опису інформаційних ресурсів, а недоліками – менша кількість доступних інформаційних ресурсів і неможливість автоматичного відновлення інформації про них. Найбільше відомими прикладами подібних каталогів є Yahoo! і російськомовний “Ау! “. Зараз широко розповсюджені як локальні пошукові машини і каталоги, що забезпечують пошук у рамках одного сайту, так і глобальні, що забезпечують пошук у всьому Web. Суттєвим недоліком таких систем є низька точність інформації, що видається. Машини пошуку та здобуття інформації, такі як "Yahoo!", "Lycos", "Infoseek", використовують механізм пошуку по ключовим словам і не враховують контекст, в якому існує інформація. Ось чому результатом роботи таких систем можуть бути сотні тисяч посилань. Сучасні версії пошукових систем ("Metacrawler", "WebSeek" і. т.п.) адресують запит користувача відразу до багатьох машин пошуку, і складають індексні мета-каталоги і бази даних. Але вони залишаються в рамках пошуку, основаного на ключових словах, то отримані індекси зв'язують інформацію з термінами, враховуючи тільки актуальний для даного запиту лексичний або синтаксичний контекст. Аналогічні претензії можна адресувати і до тематичних каталогів, що складені вручну. Крім того, що для їхнього створення і супроводу необхідно занадто багато часу, існує дисонанс між критеріями класифікації понять автора і користувачів. Розвиток можливостей цих систем, спрямований на підвищення точності інформації, призводить до ускладнення мови запитів цих систем. Крім того, у кожній із систем є свій синтаксис мови запитів. Тому більшість користувачів просто ігнорують розвинені можливості систем пошуку і використовують тільки базові можливості, що призводять до низької якості результатів пошуку). Це призводить до того, що користувач змушений самостійно опрацьовувати (прочитувати й відсортовувати) велику кількість документів (причому більша частина яких йому не потрібна). Для постійної роботи користувача (як в Інтернет, так і на окремому комп'ютері або в локальній мережі) характерна довгострокова зацікавленість користувача в інформації з однієї або декількох вузьким областей. Тому доцільно надати користувачу персонального інформаційного агента, що, з одного боку, дозволило б автоматизувати задачу збору і накопичення тематичної інформації, з огляду на як специфіку цих областей (і формуючи відповідні бази знань), так і преваги конкретного користувача, а з іншого - підвищило б релевантність пошуку інформації в цих областях. Механізми пошуку в Web, як правило, розглядають запити на пошук ізольовано один від одного. Результати, отримані у відповідь на даний запит, не залежать від користувача або контексту, у якому користувач створював запит. Часто вони пропонують застарілу інформацію, індексують лише частину доступної в Web інформації, не індексують документи, для доступу до яких необхідна аутентифікація, і тому багато документів залишаються за рамками пошуку. Крім того, різні сайти індексуються неоднаково. Нові технології інформаційного пошуку враховують реакцію користувача на результати, отримані ними під час попередніх звертань до механізму пошуку, передбачають обробку запитів природною мовою, явне або автоматизоване додавання контекстної інформації тощо. Однак очевидно, що універсального рішення, однаково зручного для всіх категорій користувачів, просто не існує. Запит користувача являє собою опис того інформаційного ресурсу, доступ до якого хоче отримати користувач. Він може містити ключові слова, пов'язані логічними операторами; документ-зразок; тип документа (текстовий документ, зображення, відеоролик тощо); тему документа за класифікатором; списки рекомендованих або заборонених інформаційних джерел; обмеження часу або обсягу пошуку; параметри документа - обсяг, час створення, мова, автори, інші специфічні параметри даного типу документа, тип запиту - постійний або одноразовий. Традиційні підходи до організації пошуку інформації можна розділити на три групи: методи індексного пошуку, статистичні методи і методи, засновані на базах знань. Індексний пошук застосовується головним чином для роботи зі структурованими базами даних. У таких методах слова інтерпретуються як послідовності закодованих символів. Використовуючи формальний синтаксис мови запитів, система вибирає точну відповідність для окремих слів або словосполучень, що пов'язані логічними операторами. Застосування штучної мови запитів призводить до необхідності навчання користувачів. Такі системи не враховують різні форми і значення слів; користувачу непросто угадати точні слова і фрази, що були використані авторами в документах. Крім того, вони не можуть також впорядковувати документи за ступенем відповідності запиту, тому користувач змушений читати кожен документ, щоб визначити, наскільки він відповідає запиту. Статистичні методи ґрунтуються на розрахунку різних частотних характеристик: частоти входження слова в документ, зваженої частоти входження і частоти спільного входження кількох слів. При цьому передбачається, що чим частіше зустрічається те або інше слово запиту в документі, тим у більшому ступені даний документ відповідає наданому запиту. Основною одиницею інформації, якою оперують статистичні методи, є окреме слово, однак зв'язки між словами розглядаються винятково з математичної, а не з лінгвістичної точки зору. На відміну від методів бінарного пошуку, статистичні методи не вимагають застосування формальної мови запитів. Вони дозволяють проводити ранжирування документів за ступенем відповідності запиту, що істотно підвищує ефективність роботи з пошуковими системами. Однак такі методи не завжди дозволяють одержати бажані точність і повноту відповідей, оскільки важливість того або іншого терміна не завжди безпосередньо зв'язана з частотою його використання в документі. Системи, що базуються на базі знань, використовують для пошуку інформації певні зовнішні знання (метазнання). Вони використовують концептуальні відносини, що не застосовуються при статистичному пошуку. Одним з досить розповсюджених способів подання знань є використання синонімів, що дозволяє при відповіді на запит враховувати не тільки ті терміни, що безпосередньо зазначені в запиті, але і інші слова, близькі до них за значеннями. Інший підхід до систем, заснованим на базі знань, використовує ієрархію термінів і понять, яка створюється самими користувачами. Третій підхід базується на лінгвістичних правилах. Розроблювач створює систему лінгвістичних правил, що використовуються для аналізу або граматичного розбору текстової бази . Цей метод аналізу визначає ключові слова і поняття, що поєднуються в БЗ, яка відображає зміст конкретної бази даних. Потім база знань використовується для пошуку і ранжирування груп документів. Процес граматичного розбору і створення бази знань має проводитися для кожної ПрО. І нарешті, ще один підхід - використання посилань на інші документи, у тому числі на звичайні словників і словники термінів. Значення слів, найбільш придатні для даного пошуку, можуть бути обрані самим користувачем з метою підвищення точності цього пошуку. Цей підхід поєднує статистичний пошук і пошук на основі бази знань. При цьому використовуються зміст слів для визначення і класифікації відносин, які статистичний пошук не відслідковує. Переважна більшість ІПС, які широко використовуються, є не спеціалізованими, а універсальними. Звичайно вони не враховують інформацію про конкретного користувача, його специфічні інформаційні інтереси, передісторію його звертань з запитами до цієї ІПС. Спеціалізовані ж ІПС мають досить обмежену інформаційну базу і, хоч і дають звичайно високо релевантні результати пошуку у певній ПрО, не можуть гарантувати виявлення усіх (або хоча б значної частини) навіть тих інформаційних джерел, що відносяться до області їхньої спеціалізації і можуть бути виявлені універсальними ІПС (правда, серед великої кількості слабко релевантних посилань). Індексування за ключовими словами - це найбільш проста й економічна у відношенні дискового простору технологія. Суть її полягає в тім, що для кожного документа, що індексується, заповнюються відповідні поля в індексному файлі. Заповнення здійснюється вручну або автоматизовано. Ця технологія дозволяє індексувати як текстові документи (у ручному й автоматичному режимах), так і зображення (у ручному режимі). У найпростішому випадку ключовими словами служать назва та ім'я автора документа. У більш складних ситуаціях необхідно використовувати незалежного експерта для читання документа і виділення ключових слів. Серйозні обмеження при використанні цих систем пов'язані з наступними обставинами:
Визначення контексту пошукових запитівПідвищити ефективність пошуку дозволяє його персоніфікація, тобто використання відомостей про попередні запити конкретного користувача і сфері його інформаційних інтересів. Традиційні механізми пошуку в Інтернет, як правило, розглядають інформаційні запити користувача ізольовано один від одного і не враховують отримані раніше результати. Враховуючи інформацію про користувача, про Про, яка його цікавить, і про виконані раніше запити цього користувача, можна одержувати більш релевантні результати і підвищити ефективність пошуку. На сьогоднішній день існує кілька різних підходів до формалізованого завдання таких зведень. Наприклад, у проекті Inquirus контекстна інформація задається явно у вигляді категорії даних, яку запитує користувач. Контекстна інформація використовується для вибору тих механізмів пошуку, яким передається запит, для модифікації запитів і для визначення принципів упорядкування отриманих документів. Деякі засоби дозволяють визначити контекст пошуку автоматично. Наприклад, система Watson моделює контекст на основі вмісту документів, що користувач раніше редагував засобами Microsoft Word або переглядав у Internet Explorer. Ці документи аналізуються за допомогою алгоритму, що виявляє слова, характерні для документів. Потім ці слова автоматично додаються до запиту. Крім того, Watson у фоновому режимі шукає в Web документи, зв'язані з матеріалами, що редагує або переглядає користувач. Недоліком системи є непрозорість алгоритмів, використовуваних системою, для кінцевого користувача. Аналогічно працює Remembrance Agent, що індексує файли (повідомлення електронної пошти, наукові статті і т.п.), з якими працює користувач, і веде пошук документів, зв'язаних з ними. Autonomy’s Kenjin автоматично аналізує файли, які користувач чи переглядає редагує. До аналогічних рішень можна віднести агентів Fab, Letizia і WebWatcher, що вивчають область інтересів користувача для того, щоб запропонувати йому відповідні Web-сторінки. Інший підхід до персоніфікації пошуку базується на використанні онтологій для формалізованого опису області інформаційних інтересів певного користувача. Користувач може обрати одну з існуючих онтологій або створити власну. У процесі виконання пошукового запиту будуть використовуватися терміни з цієї онтології. Ще один перспективний засіб інтелектуалізації інформаційного пошуку базується на індуктивнім узагальненні історії виконання інших запитів конкретного користувача з метою здобуття знань про його інформаційні інтереси, які містяться у цих відомостях неявним чином (приміром, користувач завжди відкидає інформаційні ресурси певної категорії або певного обсягу, цікавиться інформацією лише певною мовою, проте не вказує це у своїх запитах). Забезпечити ефективне використання ресурсів мережі, часу, що витрачає користувач, та підвищити якість здійснюваного пошуку потрібних знань, дозволяє використання інформаційно-пошукових агентів та мультиагентних інформаційно-пошукових систем. Інформаційно-пошукові агентиІнформаційно-пошуковий агент (ІПА) - це агент, мета функціонування якого полягає в ефективній взаємодії користувача з інформаційним середовищем і перетворенні цього середовища в персоналізовані знання для конкретних користувачів. Кожний ІПА має доступ принаймні до одного, а потенційно - до багатьох інформаційних джерел, він здатний маніпулювати інформацією, яку отримує з цих джерел, для того, щоб відповідати на запити, надані користувачем або іншими агентами. Використання ІПА забезпечує користувачеві значні переваги порівняно з використанням традиційних засобів пошуку інформації - пошуковими машинами:
Мультиагентні інформаційно-пошукові системиЧерез досить високу складність проблеми інформаційного пошуку у відкритому динамічному гетерогенному середовищі у багатьох випадках доцільно замість єдиного універсального агента використовувати мультиагентні системи. Процес інформаційного пошуку полягає у взаємодії між користувачами та постачальниками інформації: у відповідь на інформаційний запит користувача постачальник інформації надсилає йому певні відомості, релевантні цьому запиту (слід зауважити, що в різних ситуаціях одні й ті ж самі об’єкти можуть виступати і як постачальники інформації, і як її користувачі). Проте встановлення безпосередньої взаємодії всіх потенційних користувачів з усіма потенційними постачальниками призводить до ряду проблем, пов’язаних з різноманіттям засобів подання інформаційних запитів та відповідей на них. У загальному випадку для m користувачів інформації та n її постачальників потрібно мати засобів перетворення подання інформації. Крім того, з появою нового постачальника треба поновлювати такі засоби для всіх користувачів. Для ефективного обміну інформацією між споживачами інформації та її постачальниками необхідні посередники, які спрощують взаємодію між постачальниками й користувачами інформації. Основна перевага моделі пошуку інформації, що складається з трьох рівнів - рівня користувачів (тих, хто шукає інформацію), рівня постачальників (тих, хто надає інформацію) і проміжного рівня, який забезпечує зв'язок між першим і другим рівнями - полягає у відсутності прямих зв’язків між користувачами та постачальниками інформації, що значно спрощує взаємодію між агентами, створеними різними розробниками (див.рис.10.2). На всіх цих рівнях доцільно використовувати агентів: Для рівня користувачів задача агентів полягає в тому, щоб точно визначити, що саме шукає користувач, чи є в нього які-небудь переваги відносно цієї інформації, яка інформація в нього вже є, які документи не задовольняють його інформаційні потреби, в який час та за яким розкладом краще здійснювати пошук, в якій формі подати результати пошуку користувачеві тощо. Для рівня постачальників задача агентів - перетворення певного стандартизованого подання інформаційних запитів користувачів у форму, зрозумілу відповідному інформаційному ресурсу (приміром, у формат подання запиту до пошукової машини сайту – з відповідними символами для позначення логічних операцій та визначеними параметрами документа, який треба знайти), упорядкування інформації, яку надає цей постачальник, і відновлення її в разі змін. Для рівня посередників агенти потрібні для виконання сервісних функцій, що забезпечують ефективну взаємодію між агентами користувачів і постачальників інформації – перетворення інформаційних запитів та відповідей на них у певну стандартизовану форму, збереження пошукового досвіду, а також відомостей про користувачів та постачальників у відповідних БД. У мультиагентній інформаційно-пошуковій системі використовуються:
Як приклади мультиагентних інформаційно-пошукових систем можна навести Autonomy, Webcompass, Marri, OntoSeek. ВисновкиЕфективне використання інформаційних ресурсів Інтернет - складна проблема через його динамічність, гетерогеннність та великий обсяг. Наявність засобів інтелектуалізації інформаційного пошуку забезпечує користувачам задоволення іх інформаційних потреб. Список літератури
Контрольні питання
З повагою ІЦ "KURSOVIKS"! |