Лекція 10 на тему Базовий Інформаційно-екстремальний алгоритм навчання ІС, Основи проектування інтелектуальних систем
« НазадЛекція 10 на тему Базовий Інформаційно-екстремальний алгоритм навчання ІСПроцес навчання системи в рамках ІЕІ-технології полягає в реалізації багатоциклічної ітераційної процедури пошуку глобального максимуму інформаційного КФЕ навчання в робочій (допустимій) області визначення його функції. У загальному випадку така процедура має вигляд де – усереднене значення інформаційного КФЕ навчання системи, обчислене на -му кроці навчання; – область допустимих значень -го параметра навчання; – область допустимих значень контрольних допусків на ознаки розпізнавання; – робоча (допустима) область визначення функції інформаційного критерію; – множина кроків навчання – ітерацій пошуку глобального максимуму інформаційного критерію. Згідно з принципом відкладених рішень Івахненка О.Г. кількість параметрів, що оптимізуються, а відповідно і циклів ітераційного пошуку глобального максимуму інформаційного КФЕ в методах ІЕІ-технолгії залежить від досягнення мети машинного навчання – побудови безпомилкових за навчальною матрицею вирішальних правил. При цьому внутрішній цикл структурованої ітераційної процедури навчання (10.1) реалізує так званий базовий інформаційно-екстремальний алгоритм, який оптимізує безпосередньо геометричні параметри контейнерів класів розпізнавання, що відновлюються в радіальному базисі простору ознак розпізнавання. Основними функціями базового алгоритму навчання є:
Категорійну модель навчання системи за базовим інформаційно-екстремальним алгоритмом у вигляді структурної схеми відображень множин, задіяних в процесі навчання, показано на рис. 10.1. Рисунок 10.1 – Категорійна модель машинного навчання за базовим інформаційно-екстремальним алгоритмом Показана на рис. 10.1 вхідна навчальна матриця формується оператором де -множина вхіднихсигналів (факторів); T - множина моментів часу зняття інформації; - простір ознак розпізнавання;Z– простір можливих станів ІС. Оператор перетворює вхідну навчальну матрицю в бінарну матрицю , а оператор будує розбиття простору ознак на класи розпізнавання При обґрунтуванні гіпотези нечіткої компактності, яка має місце на практиці, розбиття Ì є нечітким ів рамках ІЕІ-технології відповідає умовам(6.1) і (6.3). Оператор класифікації y: ®I|l| , де l - кількість статистичних гіпотез, перевіряє основну статистичну гіпотезу про належність реалізацій {|j=} класу . .Оператор g: I| l | ®Á | q | шляхом оцінки статистичних гіпотез формує множину точнісних характеристик Á | q |, де q=l2 – кількість точнісних характеристик. Оператор Á|q| ® E обчислює множину значень інформаційного КФЕ, який є функціоналом точнісних характеристик. Контур операторів оптимізації геометричних параметрів нечіткого розбиття шляхом пошуку максимуму КФЕ навчання розпізнаванню реалізацій класу замикається оператором r: E®, який цілєспрямовано змінює радіуси гіперсферичних контейнерів класів розпізнавання. При цьому можуть застосовуватися різні схеми зміни радіусів контейнерів: від послідовного перебору значень радіусів як із сталими, так і до випадкового пошуку Оператор U: E®GTZ регламентує процес навчання і дозволяє оптимізувати параметри його плану, які визначають, наприклад, обсяг і структуру випробувань, черговість розгляду класів розпізнавання та інше. Вхідною інформацією для навчання за базовим алгоритмом є дійсний в загальному випадку масив реалізацій образів ; система полів контрольних допусків на ознаки розпізнавання і рівні селекції координат еталонних двійкових векторів-реалізацій, які за замовчуванням дорівнюють 0,5 для всіх класів розпізнавання. Розглянемо етапи реалізації алгоритму: 1. Формування бінарної навчальної матриці , яке здійснюється за правилом (8.3). 2. Формування масиву еталонних двійкових векторів-реалізацій, елементи яких визначаються за правилом де rm - рівень селекції координат двійкового еталонного вектора. Визначення 10.1. Рівнем селекції називається рівень квантування частот знаходження значень ознак розпізнавання в своїх контрольних полях допусків. Наприклад, якщо частота знаходження значень -ї ознаки розпізнавання в своєму контрольному полі допусків більше заданого рівня селекції , то ця ознака кодується як “1”, інакше – “0”. 3. Розбиття множини еталонних векторів на пари найближчих ²сусідів²: =<xm , xl >, де xl - еталонний вектор сусіднього класу , за такою схемою алгоритму: а) структурується множина еталонних векторів, починаючи з вектора x1 базового класу , який характеризує найбільшу функціональну ефективність ІС; б) будується матриця кодових відстаней між еталонними векторами розмірності M ´M; в) для кожного рядка матриці кодових відстаней знаходиться мінімальний елемент, який належить стовпчику вектора, найближчого до вектора, що визначає рядок. За наявності декількох однакових мінімальних елементів вибирається з них будь-який, оскільки вони є рівноправними; г) формується структурована множина елементів попарного розбиття , яка задає план навчання. 4. Оптимізація кодової відстані dm відбувається за рекурентною процедурою (8.3). При цьому береться . 5. Процедура закінчується при знаходженні максимуму КФЕ в робочій області його визначення: де - множина радіусів концентрованих гіперсфер, центр яких визначається вершиною еталонного вектора . При цьому множина є так само множиною кроків навчання ІС. Таким чином, базовий алгоритм навчання є ітераційною процедурою пошуку глобального максимуму інформаційного КФЕ в робочій області визначення його функції: Параметри навчання ІС за базовим алгоритмом – оптимальні кодові відстані і оптимальні еталонні вектори-реалізації для заданого алфавіту є вхідними даними для функціонування ІС в режимі екзамену, тобто безпосереднього прийняття рішень. При створенні інформаційного та програмного забезпечення здатної навчатися системи необхідно розуміти, що реалізація навчання системи за базовим алгоритмом не дозволяє побудувати безпомилкові за навчальною матрицею вирішальні правила, оскільки система контрольних допусків на ознаки розпізнавання, як правило, є неоптимальною. Тому згідно з принципом відкладених рішень необхідно оптимізувати інші параметри функціонування системи, які впливають на функціональну ефективність її навчання. Таким чином, основною функцією базового алгоритму навчання у рамках ІЕІ-технології є обчислення на кожному кроці навчання інформаційного КФЕ і організація пошуку його глобального максимуму в робочій області визначення функції критерію з метою визначення оптимальних геометричних параметрів розбиття простору ознак на класи розпізнавання.
Контрольні запитання до лекції №10
З повагою ІЦ "KURSOVIKS"! |