Лекція 7 на тему Формування вхідного математичного опису, Основи проектування інтелектуальних систем

« Назад

Лекція 7 на тему Формування вхідного математичного опису

Основною задачею формування вхідного математичного опису ІС є створення багатовимірної навчальної матриці .

При цьому необхідно розв’язувати такі задачі:

формування словника ознак та алфавіту класів розпізнавання;
визначення мінімального обсягу репрезентативної навчальної матриці;
визначення нормованих допусків на ознаки розпізнавання;
перевірка навчальної вибірки на статистичну стійкість і однорідність.

Визначення 7.1. Вхідним математичним описом називаються вхідні дані, що аналізуються, та алгоритми їх перетворення для подальшого оброблення ІС.

Таким чином, формування вхідного математичного опису ІС потребує детального вивчення та аналізу особливостей функціонування джерела інформації, яким, наприклад, у задачах керування може бути розподілений у просторі і часі технологічний процес, космічний корабель тощо.

Вхідний математичний опис подамо у вигляді теоретико-множинної структури

D_В=<G, T, , Z, Y; П, Ф>, (7.1)

де G -простір вхіднихсигналів (факторів), які діють на ІС; T - множина моментів часу зняття інформації; - простір ознак розпізнавання;Z– простір можливих станів ІС; Y - вибіркова множина, яка формує вхідну навчальну матрицю; П: GTZ - оператор переходів, що відбиває механізм зміни станів ІС під впливом внутрішніх і зовнішніх факторів; Ф: GTZY - оператор формування вибіркової множини Y на вході ІС. На практиці спосіб формування вхідної багатовимірнох навчальної матриці

Таким чином, як універсум випробувань W розглядається декартовий добуток наведених в структурі (7.1) множин:

W = GTZ.

Словник ознак розпізнавання, де, складається з первинних ознак, які є безпосередньо характеристиками процесу, що досліджується, і з вторинних ознак, які є похідними від первинних. Обов’язковою вимогою до словника ознак є його структурованість. На практиці первинними ознаками можуть бути значення параметрів, що зчитуються з датчиків інформації, або експериментальні дані, одержані безпосередньо при дослідженні процесу, включаючи умови його реалізації. Найбільш поширеними вторинними ознаками є статистичні характеристики векторів-реалізацій класів , навчальних вибірок або всієї навчальної матриці окремого ласу розпізнавання.

Формування алфавіту класів розпізнавання може здійснюватися як розробником інформаційного забезпечення, так і безпосередньо ІС, що здатна функціонувати в режимі кластер-аналізу.

Визначення 7.2. Кластер-аналізом називається автоматичне розбиття системою вхідних даних на класи розпізнавання (кластери), елементи яких знаходяться у відношенні еквівалентності.

При цьому варто враховувати, що збільшення потужності алфавіту при незмінному словнику ознак розпізнавання погіршує через збільшення ступеню перетину класів розпізнавання асимптотичні точнісні характеристики ІС, що характеризують функціональну ефективність навчання системи. Один із імовірнісних критеріїв ступеню перетину класів для заданого алфавіту може бути подано як відношення усереднених для всіх класів розпізнавання точнісних характеристик, обчислених на -му кроці навчання системи при двохальтернативній системі рішень:

– усереднена помилка першого роду;

– усереднена помилка другого роду;

– усереднена перша достовірність;

– усереднена друга достовірність.

У виразах (7.3) – (7.6) , – помилки першого і другого роду відповідно, обчислені на -му кроці навчання системи розпізнавати реалізації класу ; , – перша і друга достовірності, обчислені на -му кроці навчання системи розпізнавати реалізації класу . При цьому для двохальтернативної системи оцінок рішень існують такі співвідношення між точнісними характеристиками:

Аналіз виразу (7.2) показує, що умовою відсутності перетину класів розпізнавання є нульова сума помилок і . Така умова виконується у випадку побудови в процесі машинного навчання безпомилкових за навчальною матрицею вирішальних правил

Одним з ефективних шляхів корекції точнісних характеристик при збільшенні потужності алфавіту класів є формування ієрархічних алгоритмів навчання ІС, що дозволяє кількість класів розбити на групи меншої потужності і здійснювати навчання для кожної із них, або створення штучної надлишковості словника ознак, наприклад, із застосуванням методів завадозахищеного кодування.

Навчальна вибірка має на практиці скінченний обсяг n, що обумовлює наявність статистичної похибки e між імовірністю p_i та емпіричною частотою k_in знаходження значення i-ї ознаки розпізнавання у своєму контрольному полі допусків . Верхня оцінка похибки e =|p_i- | залежить від кількості випробувань n і визначається за теоремою Муавра-Лапласа:

де k_i - кількість подій, при яких значення i-ї ознаки знаходиться в полі допусків ; q_i=1- p_i- імовірність того, що значення i-ї ознаки не належить полю допусків ; Ф(...) - функція Лапласа.

Визначення мінімального обсягу n_min репрезентативної навчальної вибірки здійснимо за умови отримання прийнятних з практичних міркувань статистичної похибки та оперативності алгоритму його обчислення. Ці вимоги є суперечливими, що обумовлює компромісний характер розв’язання задачі. Скористаємося методом динамічного довірчого інтервального оцінювання. Суть методу полягає в побудові після кожного випробування довірчого інтервалу, який оцінює ймовірність р_і знаходження i-ї ознаки в полі контрольних допусків з імовірністю довіри 1-Q:

де Q - рівень значущості (будь-яке наближене до нуля додатне число).

Визначення максимальної похибки e_Q при заданому рівні значущості Q здійснюється із співвідношення

З урахуванням властивості функції Лапласа Ф(х)=1-Ф(-х) перетворимо (7.9) до вигляду

Наприклад, для Q=0.05 за таблицею значень функції Лапласа з урахуванням виразу (7.10) для Ф(х)=1-Q/2= =0.975 знайдемо значення аргументу функції . Тоді похибка e_Q змінюється залежно від обсягу навчальної вибірки n за гіперболічним законом

На рис. 2. 1 наведено графік функції e_Q= f(n) (крива 1) і умовно виділено три області значень аргументу, які відрізняються крутизною цієї функції.

Рисунок 7.1-До визначення обсягу навчальної вибірки:

1- графік функції e_Q = f(n); 2-графік емпіричної частоти ; 3 - верхня межа довірчого інтервалу; 4 - нижня межа довірчого інтервалу

На рис. 7.1 область І є забороненою областю, оскільки похибка перебільшує допустиму. Область ІІІ характеризується значними економічними втратами при відносно малій швидкості зменшення похибки e_Q. Область II є компромісною і охоплює інтервал приблизно від 40 до 90 випробувань. Легко довести, що при різних значеннях Q графік функції e_Q = f(n) буде переміщуватися паралельно по вертикалі, не змінюючи свого вигляду.

Графічно довірчий інтервал можна побудувати за формулою (8.2), обчислюючи для кожного випробування за виразом (8.5) похибку e_Q i відкладаючи її зверху та знизу від графіка частоти k_in (крива 2). При цьому верхня (крива 3) та нижня (крива 4) межі довірчого інтервалу при збільшенні числа випробувань мають тенденцію до зближення з емпіричною частотою.

Для знаходження мінімального числа випробувань n_min, яке гарантує прийнятні з практичних міркувань величину похибки і оперативність реалізації алгоритму обчислювання, необхідно задати критерій зупинення випробувань.

Таким моментом можна вважати випробування, при якому поточний довірчий інтервал накривається заданим інтервалом [0,5±D], де ½D½< 0,5. Для багатьох практичних задач значення D визначається з інтервалу [0,3;0,4]. Останній (правий) перетин заданого інтервалу з однією з меж довірчого інтервалу визначає випробування n_min, яке гарантує з імовірністю 1-Q, що максимальна похибка e_Q не перебільшує значення функції ε_Q=f(n) при n=n_m_i_n.

У загальному випадку треба будувати довірчі інтервали для всіх N ознак і вибирати n_min за умови

n_m_i_n=(n_m_i_n₁, ..., n_m_i_n_i, ..., n_m_i_n_N).

Таким чином, вибір n_min доцільно здійснювати в компромісній області ІІ (на рис. 7.1 n_min=54), де відсутні аномальні викиди значень емпіричної частоти до значень, близьких до нуля або одиниці.

З повагою ІЦ "KURSOVIKS"!