Лекцiя 8 на тему Перевірка навчальної вибірки на випадковість, статистичну стійкість та однорідність, Основи проектування інтелектуальних систем
« НазадЛекцiя 8 на тему Перевірка навчальної вибірки на випадковість, статистичну стійкість та однорідністьПри оптимізації процесу навчання ІС в рамках ІЕІ-технології важливим питанням є визначення системи нормованих допусків, яка задає області значень відповідних контрольних допусків на ознаки розпізнавання. Визначення 8.1. Нормованим (експлуатаційним) називається поле допусків , в якому значення і–ї ознаки знаходиться з імовірністю рі =1 або pi=0 за умови, що функціональний стан ІС належить до найбільш бажаного для особи, що приймає рішення, класу , який називається базовим. Визначення 8.2. Контрольним називається поле допусків , в якому значення і-ї ознаки знаходиться з імовірністю 0<рі <1 за умови, що функціональний стан ІС належить до базового класу . У методах ІЕІ-технології контрольні допуски на ознаки розпізнавання вводяться з метою рандомізації процесу прийняття рішень, оскільки для повного дослідження процесу необхідно використовувати як детерміновані, так і статистичні характеристики. Зрозуміло, що , а система контрольних допусків на ознаки розпізнавання, яка “прив’язується” до базового класу розпізнавання, є сталою для всіх класів розпізнавання алфавіту . При цьому основні обмеження зверху (справа) на значення полів контрольних допусків повинні забезпечувати:
Відомі параметричні методи оцінки випадковості реалізацій образу [2] обумовлюють наявність навчальної вибірки великого обсягу, що не завжди є здійсненним на практиці. Один із шляхів вирішення цієї проблеми ґрунтується на такій гіпотезі: чим більша середня кодова відстань між реалізаціями одного образу, тим більше вони будуть мати відмінних ознак розпізнавання, що свідчить про їх випадковість. Розглянемо постановку задачі оптимізації системи нормованих допусків на ознаки розпізнавання за дистанційно-максимальним критерієм. Нехай – множина реалізацій базового класу розпізнавання , який є найбільш бажаним для особи, що приймає рішення, і відносно якого встановлюється система нормованих допусків на ознаки розпізнавання. Розіб’ємо множину на пари сусідніх векторів і визначимо кодові відстані між ними за правилом де – і-та координата реалізації, яка є найближчою (сусідньою) до реалізації. Необхідно вибрати таку систему допусків , щоб середнє вибіркове сусідніх реалізацій класу було максимальним. Тобто систему нормованих допусків на ознаки розпізнавання можна вважати оптимальною , якщо виконується умова Таким чином, параметром, що оптимізується, є величина симетричного поля допусків, центром якого є вершина еталонного вектора . Алгоритм складається із послідовного проведення етапів оптимізації, на кожному з яких формується при поточній СКД множина двійкових векторів , здійснюється її розбиття на пари сусідніх реалізацій за умови мінімальної кодової відстані між ними, обчислюється за формулою (8.2) середня кодова відстань для сусідніх реалізацій і здійснюється наступний крок ітераційної процедури пошуку максимуму середнього вибіркового реалізацій класу . При цьому вхідними даними є: |– масив дискрет реалізацій, що аналізуються, де nmin – мінімальний обсяг репрезентативної навчальної вибірки; - змінна поля допусків; h – крок зміни поля допусків; – змінна кроків ітерації. Результатом алгоритму оптимізації є поля нормованих допусків , які задають допустиму область значень контрольних допусків і цим забезпечують випадковість ознак розпізнавання. Розглянемо схему реалізації алгоритму паралельної оптимізації нормованих допусків за критерієм (8.2), який полягає в одночасній зміні поля допусків на ознаки розпізнавання.
Таким чином, нульовим діагональним елементам матриці штучно присвоюється значення – максимальна кодова відстань у матриці. 4. Формуються пари найближчих сусідніх реалізацій за умови, що де – найближча до вектора реалізація, отримана на -му кроці оптимізації. 5. Обчислюється за формулою (8.2) вибіркова середня відстань для розбиття. 6. Порівнюється поточне середнє значення з попереднім . Якщо , то , і виконується крок 1, інакше і 7. Формується система нормованих допусків на ознаки розпізнавання , де нижні допуски дорівнюють і верхні допуски - . На рис. 8.1 наведено для прикладу графік залежності середньої кодової відстані від параметра поля допусків, наведений в праці [1] при визначенні системи нормованих допусків на ознаки розпізнавання словника системи розпізнавання спектрограм, отриманих на мас-спектрометрі МІ-12-01 АТ виробництва ВАТ “Selmi” (Суми, Україна). Рисунок 8.1 – Графік залежності середньої кодової відстані між реалізаціями базового класу розпізнавання від параметра поля допусків Аналіз рис. 8.1 показує, що область значення контрольних допусків на ознаки розпізнавання задається оптимальним значенням відповідних полів нормованих допусків , де , які гарантують випадковість реалізацій образу згідно із принципом рандомізації вхідних даних для ІЕІ-технології. При цьому система нормованих допусків знизу обмежується вимогою виключення переходу реалізацій образу в нульові. З іншого боку, при збільшенні параметра реалізації починають збігатися, що робить подальше збільшення нормованого поля недоцільним через втрату ІС властивості спостережуваності. Таким чином, оцінка випадковості навчальної вибірки у рамках ІЕІ-технології набуває важливого значення, оскільки інформаційно-екстремальні алгоритми машинного навчання ґрунтуються на оптимізації параметрів навчання за статистичними інформаційними критеріями. Важливим етапом формування навчальної вибірки є оцінка її статистичної стійкості та однорідності, оскільки ці властивості суттєво впливають на величину повної ймовірності прийняття правильних рішень. Основним способом недопущення зниження достовірності рішень у випадках невиконання умов статистичної стійкості або статистичної однорідності навчальних вибірок є блокування функціонування системи як в режимах навчання, так і екзамену. У загальному випадку ІС блокує режими навчання й екзамену за таких причин:
Як критерії статистичної стійкості використовуються відомі в математичній статистиці вибіркові критерії оцінки параметрів імовірнісних розподілів. Наприклад, як критерії статистичної однорідності доцільно використовувати критерій згоди Пірсона (критерій c2) [2], серійний критерій Вальда-Вольфсона [4], критерій Колмогорова-Смірнова (критерій l) [2], критерій серій [2-4] та інші. Як критерії інформативності ознак можуть використовуватися коефіцієнти парної та множинної кореляції [5] і прямі статистичні інформаційні критерії [23,43]. Одну із можливих ієрархічних структур алгоритму прийняття рішень при оцінці статистичних стійкості та однорідності навчальної вибірки за статистичними критеріями наведено на рис. 8.2. Аналіз рис. 8.2 показує, що невиконання основної гіпотези навіть за будь-яким критерієм призводить до заблокування процесу формування навчальної матриці , а тим самим і навчання ІС. Рисунок 8.2 – Ієрархічна структура алгоритму оцінки статистичних стійкості та однорідності навчальної вибірки Таким чином, архітектура програмного забезпечення ІС, що навчається, крім інформаційних агентів «Навчання» і «Екзамен», повинна включати агента «Розвідувальний аналіз», який за результатами перевірок статистичних гіпотез дає дозвіл на функціонування системи у відповідному режимі. З повагою ІЦ "KURSOVIKS"! |