М Олексів, В Пуйда - Дослідження алгоритмів навчання нейронної мережі прямого поширення для ідентифікації літаків - страница 1

Страницы:
1 

УДК 004.032.26

М. Олексів, В. Пуйда

Національний університет "Львівська політехніка", кафедра електронних обчислювальних машин

ДОСЛІДЖЕННЯ АЛГОРИТМІВ НАВЧАННЯ НЕЙРОННОЇ МЕРЕЖІ ПРЯМОГО ПОШИРЕННЯ ДЛЯ ІДЕНТИФІКАЦІЇ ЛІТАКІВ

© Олексів М., Пуйда В., 2008

Розглянуто результати дослідження алгоритмів навчання штучної нейронної мережі для ідентифікації літаків за їх силуетами. Отриману навчену нейронну мережу можна використовувати для ідентифікації літаків у системі технічного зору для контролю повітряного простору в зоні аеропорту. Під час навчання і тестування використовували літаки АНТК ім. О.К. Антонова.

The research results of artificial neural network learning algorithms for airplane identification after their silhouettes are described in the paper. The resulting taught neural network can be used for airplane identification in computer vision control system for airport. Antonov ASTC airplanes were used in learning and test processes.

Вступ. Одним із варіантів підвищення безпеки польотів літальних апаратів є використання систем технічного зору для автоматизованого контролю повітряного простору в зоні аеропорту. З метою зниження навантаження на диспетчера можна використовувати технічні засоби для автоматичного виявлення та ідентифікацій об'єктів в повітряному просторі аеропорту. Задля розв'язання такої задачі можна використовувати нейронні мережі [1, 2].

Розв'язуючи цю задачу ідентифікації в режимі реального часу, розглядають нейронну мережу прямого поширення. Вона дозволяє розпаралелити роботу та досягнути необхідної швидкодії. Крім того, такі мережі прості в реалізації, доволі просто адаптуються до нових об'єктів, забезпечують високу якість ідентифікації (близьку до 100%). Важливим фактором, що впливає на якість роботи нейронної мережі, є алгоритм її навчання.

Огляд літературних джерел. Одним зі способів розв'язання задачі ідентифікації є вико­ристання навчених нейронних мереж прямого поширення [2]. Для навчання нейронних мереж існує велика кількість алгоритмів. Причому одні показують хороші результати під час розв'язання задач, таких, як апроксимація функцій, а інші - розпізнавання та ідентифікація образів. При огляді існуючих алгоритмів навчання [3] було вибрано для подальшого дослідження три алгоритми, що, за твердженням авторів, показують хороші результати під час розв' язання задачі розпізнавання образів. Це алгоритми навчання зі змінним коефіцієнтом, еластичного зворотного зв'язку, та градуйованого спряженого градієнту.

Постановка задачі. Метою статті є дослідження алгоритмів навчання мережі прямого поширення для ефективної ідентифікації силуетів літаків у повітряному просторі. Навчальна множина. Навчання відбувається на такій навчальній множині:

1) вхідне зображення приведене до розміру 60х40 пікселів (2400 точок);

2) використовується 8-розрядна гама інтенсивності (256 градацій сірого);

3) архітектура досліджуваної мережі (топологія) 2400 - 2 (рис. 2);

4) літаки  в  навчальній  множині  представлені  модельним  рядом  літаків  АНТК ім. O.K. Антонова;

5) навчальна множина складена з 743 навчальних прикладів. Приклади зображень навчальної множини відображено на рис. 1.

а) б) в)

Рис. 1. Приклади зображень навчальної вибірки. а), б) зображення з літаком, в) типове зображення, де не зображено літака

Вхідний Вихідний Вихід

шар шар мережі

Рис. 2. Топологія досліджуваної нейронної мережі

Критерії припинення навчання. Критерієм припинення навчання було досягнення однієї з трьох умов:

1) досягнення максимальної кількості навчальних епох;

2) досягнення мінімального значення градієнта;

3) досягнення очікуваного значення середньоквадратичної похибки.

Цим критеріям були встановлені такі значення:

1) максимальна кількість навчальних епох - 150000;

2) мінімальне значення градієнта - 1*10-6;

3) очікуване значення середньоквадратичної похибки - 10-10.

Вибір значення критерію 1 здійснюється з метою обмеження часу навчання нейронної мережі.

Вибір значень критеріїв 2,3 здійснюється так, щоб у разі їх досягнення нейронна мережа, що навчалася за допомогою використаних алгоритмів, матиме мінімальне відхилення між очікуваним і отриманим результатом, і не буде ефекту перенавчання.

Основна частина. Нижче наводяться результати досліджень. На першому виході нейронної мережі встановлюється 1, якщо на вхідному зображені присутнє зображення літака і 0 у протилежному випадку. На другому виході - навпаки, 1 встановлюється, якщо на вхідному зображені нема літака і 0 у протилежному випадку (рис. 2).

Дослідження нейронної мережі, що навчалася за алгоритмом зі змінним коефіцієнтом (параметром), навчання [2] показали результати на кожному з виходів, що наведені на рис. 3. Загальний результат навчання зображено на рис. 4.

а)

б)

Рис. 3. Лінійна регресія між одним з відгуків мережі, що навчалася за алгоритмом зі змінним коефіцієнтом (параметром) навчання, і відповідним очікуваним відгуком. а), б) відповідають відгукам на виходах 1 і 2 відповідно

Отримані результати свідчать про непридатність цього алгоритму навчання для розв'язання цього класу задач, оскільки нейронна мережа за результатами навчання неправильно класифікує отримані на вході зображення.

Дослідження нейронної мережі, що навчалася за алгоритмом еластичного зворотного зв'язку [2], показали результати на кожному з виходів, що наведені на рис. 5. Загальний результат навчання зображено на рис.6.

Performance is 0.0588234, Goal is 1 e-010

Рис. 4. Ілюстрація результату навчання за алгоритмом зі змінним коефіцієнтом (параметром) навчання

Отримані результати свідчать про те, що цей алгоритм навчання також непридатний для розв'язання цього класу задач. Оскільки нейронна мережа за результатами навчання хоч і показала дещо кращі результати, ніж при попередньому алгоритмі, проте всеодно не правильно класифікує отримані на вході зображення.

а)

б)

Рис. 5. Лінійна регресія між одним з відгуків мережі, що навчалася за алгоритмом еластичного зворотного зв'язку, і відповідним очікуваним відгуком. а), б) відповідають відгукам на виходах 1 і 2 відповідно

Рис. 6. Ілюстрація результату навчання за алгоритмом еластичного зворотного зв'язку

Дослідження нейронної мережі, що навчалася за алгоритмом градуйованого спряженого градієнта [2] показали результати на кожному з виходів, що наведені на рис. 7. Загальний результат навчання зображено на рис.8.

Ілюстрація навчання на рис. 8 показує, що середньоквадратична похибка між очікуваним значенням на кожному з виходів і отриманим відгуком мережі за 1625 епох зупинилася на позначці 4,420*10-8. Зупинення навчання відбулося в результаті досягнення мережею мінімального значення градієнта.

Отримані результати свідчать про те, що цей алгоритм навчання придатний для розв'язання цього класу задач, оскільки навчена нейронна мережа показала здатність правильно класифікувати отримані на вході зображення.

У результаті навчання за алгоритмом градуйованого спряженого градієнта на цій навчальній множині нейронна мережа правильно ідентифікувала навчальну множину і на 80% ідентифікувала контрольну множину.

а) б)

Рис. 7. Лінійна регресія між одним з відгуків мережі, що навчалася за алгоритмом градуйованого спряженого градієнта, і відповідним очікуваним відгуком. а), б) відповідають відгукам на виходах 1 і 2 відповідно

0        200      400      600      800      1000     1200     1400 1600 1625 Epochs

Рис. 8. Ілюстрація результату навчання за алгоритмом градуйованого спряженого градієнта

Результати дослідження використані під час створеня підсистеми, що описана в статті [4].

Висновки. У результаті виконаних досліджень алгоритм градуйованого спряженого градієнта показав найкращі результати ідентифікації силуетів літаків. Зокрема на навчальній множині точність розпізнавання нейронної мережі, навченої за його допомогою, становила 100%. Про це свідчить і відсутність відхилення отриманих значень на виходах мережі від очікуваних під час перевірки на навчальній множині.

1. Стокман Дж., Шапиро Л. Компьютерное зрение. - М.: БИНОМ, 2006. 2. Haykin S. Neural networks: a comprehensive foundation, second edition. - Prentice Hall, 1999. 3. www.mathworks. com/access/helpdesk/help/pdf_doc/nnet/nnet.pdf. 4. Олексів М., Пуйда В. Підсистема ідентифікації силуетів літаків АНТК ім. О. К. Антонова і номерів їх бортів // Вісн. Нац. ун-ту "Львівська політехніка". "Комп 'ютерні науки та інформаційні технології". 2007. - № 604.

Страницы:
1 


Похожие статьи

М Олексів, В Пуйда - Дослідження алгоритмів навчання нейронної мережі прямого поширення для ідентифікації літаків