Роздрукувати сторінку
Главная \ Методичні вказівки \ Методичні вказівки \ 2363 Лекція 5 на тему Інформаційний синтез у ІС, що навчається, Основи проектування інтелектуальних систем

Лекція 5 на тему Інформаційний синтез у ІС, що навчається, Основи проектування інтелектуальних систем

« Назад

Лекція 5 на тему Інформаційний синтез у ІС, що навчається

Задача інформаційного синтезу полягає в максимізації найважливішої складової загальної ефективності - функціональної ефективності здатної навчатися ІС, яка характеризується інформаційною спроможністю системи. При цьому її розв’язання здійснюється шляхом оптимізації параметрів функціонування, які впливають на функціональну ефективність навчання системи.  Розглянемо формалізовану постановку задачі інформаційного синтезу ІС, що навчається.

Нехай задано алфавіт класів розпізнавання , які характеризують можливі функціональні стани керованого процесу, і відома багатовимірна навчальна матриця типу «об’єкт-властивість»

де   – значення -ї ознаки розпізнавання, одержане при -му спостереженні функціонального стану керованого процесу класу.

Таким чином, матриця (5.1) складається з оцінок ознак розпізнавання, отриманих при спостережені функціональних станів класів розпізнавання, в якій рядок є структурованим вектором-реалізацією образу , де  N - кількість ознак розпізнавання, а стовпчик - випадковою навчальою вибірклю  ,  де  n - обсяг вибірки.

Крім того, дано структурований вектор просторово-часових параметрів функціонування

g=<g1, …, gx , …, >,                  (5.2) 

які впливають на функціональну ефективність ІС, що навчається, і задано відповідно їх області допустимих обмежень .

Необхідно в процесі навчання ІС визначити  оптимальні значення параметрів функціонування  , які забезпечують максимум усередненого за алфавітом класів розпізнавання інформаційного критерію функціональної ефективності (КФЕ)

де   -інформаційний  КФЕ навчання ІС розпізнавати реалізації класу  , обчислений на -му кроці навчання;  робоча (допустима) область визначення функції КФЕ; – множина кроків навчання ІС.  

Специфіка обчислення інформаційних КФЕ полягає в тому, що їх функції не є взаємо-однозначними і це потребує визначення робочої (допустимої) області, в якій аргументи функції задовольняють прийнятним з практичних міркувань обмеженням.

Таким чином,  процес навчання ІС  полягає в оптимізації параметрів функціонування ІС, які в науково-технічній літературі часто називають параметрами навчання. У загальному випадку вектор параметрів функціонування ІС може мати таку структуру,

де  – генотипні параметри функціонування ІС, які впливають на параметри розподілу реалізацій образу; – фенотипні параметри функціонування ІС, які визначають геометрію контейнерів класів розпізнавання.

При функціонуванні ІС в режимі екзамену, тобто безпосередньо в робочому режимі, необхідно прийняти за побудованими на етапі навання виріщальними правилами рішення про належність екзаменаційної реалізації  образу, що розпізнається,  одному із класів розпізнавання із заданого алфавіту.

Таким чином, головною задачею машинного навчання ІС є побудова безпомилкових за навчальною матрицею вирішальних правил, які забезпечують при функціонуванні ІС в режимі екзамену прийняття правильних рішень з повною достовірністю, наближеною до максимальної асимптотичної.

Оскільки загальним критерієм функціональної ефективності системи є інформаційний критерій, то інформаційний синтез  ІС природно здійснювати в рамках теоретико-інформаційного підходу. Крім того, розв’язання задач  аналізу і синтезу ІС може здійснюватися в рамках інших підходів подання та виведення знань, серед яких можна відмітити;

  • алгебраїчний;

  • геометричний;

  • теоретико-статистичний;

  • структурний (лінгвістичний);

  • біонічний (нейромережний);

  • мережний;

  • нечіткий;

  • теоретико-ігровий та інші.

Незважаючи на те, що наведені підходи відрізняються один від одного рівнем і видом математичної формалізації слабо формалізованих процесів прийняття рішень, між ними не існує чіткої межі, а самі підходи часто доповнюють один одного. Оскільки всі основні підходи, окрім алгебраїчного, перетинаються з геометричним, то саме в рамках геометричного та теоретико інформаційного підходів формування загальної теорії проектування ІС є найбільш виправданим.

Метод інформаційного синтезу ІС, що навчається, повинен відповідати таким основним вимогам:

  • прямо та об’єктивно характеризувати функціональну ефективність системи;

  • бути в рамках методології аналізу даних об’єктно-орієнтованим методом проектування;

  • у рамках детерміновано-статистичного підходу в процесі навчання ІС корегувати її вхідний математичний опис  з метою побудови класифікатора, який забезпечує на екзамені повну достовірність рішень, наближену до максимальної граничної;

  • забезпечувати високу функціональну ефективність навчання ІС при прийнятті гіпотези нечіткої компактності реалізацій образу, яка допускає перетин класів розпізнавання, що має місце на практиці;

  • оптимізувати просторово-часові параметри функціонування ІС, що навчається, за інформаційним КФЕ;

  • розв’язувати задачі прогнозування зміни функціональної ефективності та надійності ІС;

  • бути універсальним для здатних навчатися ІС різної природи та призначення.

Таким чином, задача загального інформаційного синтезу ІС, що навчається, потребує для її розв’язання оптимізації за КФЕ всіх параметрів функціонування системи, які впливають на її ефективність. Такі параметри можуть задаватися як тактико-технічним завданням на проектування системи (наприклад, параметри якості перехідного процесу, точності, надійності та інші директивні параметри), так і визначатися безпосередньо розробником ІС при пошуку інформаційно-технічних рішень забезпечення виконання системою поставленої задачі.

Виходячи із загальної постановки задачі, інформаційний аналіз і синтез ІС, що навчається, поділяють на ряд самостійних задач, основні з яких наведено на рис. 5.1 

Рисунок 5.1 – Основні задачі інформаційного аналізу і синтезу ІС, що навчається    

Перша і друга задачі є типовими задачами математичної статистики. Специфіка другої задачі полягає в тому, що для аналізу результатів спостережень за множиною об’єктів   з метою виявлення емпіричних закономірностей даних розглядаються тільки такі багатовимірні  структури,  які може бути  подано або у вигляді матриць типу (5.1), або у вигляді матриць відношень (попарних порівнянь) між об’єктами. У матриці відношень    елемент    визначає результат зіставлення об’єктів    i    у розумінні деякого заданого відношення: схожості (відмінності), взаємозв’язку, переваги, відстані та інше.

Поряд з такими видами взаємозв’язків між компонентами багатовимірної структури даних, як кількісні, якісні, змішані (різновидові) і порядкові, які досліджуються класичними методами статистичного аналізу, об’єктом дослідження класифікаційного аналізу даних є насамперед класифікаційний взаємозв’язок. Саме цей тип взаємозв’язку дозволяє розбивати досліджувану множину об’єктів на підмножини, в яких вони знаходяться між собою у відношенні еквівалентності.

Третя задача оцінки функціональної ефективності ІС, що навчається, пов'язана з проблемою вибору та обчислення КФЕ. Оскільки класифікація здійснюється за критерієм схожості, а мірою відображеної різноманітності є кількість інформації, то застосування інформаційного КФЕ навчання системи є природним.

Четверта задача є центральною при розв'язанні задачі інформаційного синтезу ІС, що навчається. Як параметри функціонування ІС виступають її просторово-часові характеристики, які прямо або непрямо впливають на точнісні характеристики системи. Як параметри, що регулюються, слід розглядати, в першу чергу, параметри навчання системи, які впливають безпосередньо на максимальну ефективність її функціонування. Взагалі, визначення параметрів, які впливають на ефективність функціонування ІС, потребує ретельного системного аналізу на етапі апріорного моделювання.

Розв’язок п’ятої задачі пониження розмірності ознакового простору, що аналізується, дозволяє підвищити оперативність алгоритмів класифікації і повну ймовірність правильного прийняття рішень за рахунок виключення неінформативних і «заважаючих» ознак.

Зниження розмірності ознакового простору  Ω  може здійснюватися з  такою метою:

  • суттєве стиснення обсягів інформації для підвищення оперативності її оброблення;

  • відбір інформативних, вилучення неінформативних і «заважаючих» ознак  та визначення латентних ознак розпізнавання, що впливають на функціональну ефективність  ІС.

Шоста задача інформаційного синтезу ІС, що навчається, полягає в проведенні розвідувального аналізу, суть якого полягає у перевірці статистичної сталості та статистичної однорідності вхідних даних. Крім того, аналізуються конфігурації розподілів багатовимірних векторі-реалізацій образів, ступінь перетину класів розпізнавання, міжцентрові відстані тощо. При цьому сучасна комп’ютерна графіка надає можливість візуалізації даних, у тому числі і в інтерактивному режимі та з високою оперативністю.

Важливість сьомої задачі полягає в тому, що вона спрямована на побудову на етапі навчання безпомилкових за навчальною матрицею вирішальних правил, які на екзамені, тобто безпосередньо в робочому режимі, гарантують, що повна достовірність правильного прийняття рішень буде наближена до максимальної асимптотичної, яка дорівнює одиниці.

Розв’язання восьмої задачі спрямовано на підтримку функціональної ефективності ІС за умови зміни в часі параметрів розподілу реалізацій образу..

З повагою ІЦ "KURSOVIKS"!