ПЕРЕЛІК ДИСЦИПЛІН:
  • Адміністративне право
  • Арбітражний процес
  • Архітектура
  • Астрологія
  • Астрономія
  • Банківська справа
  • Безпека життєдіяльності
  • Біографії
  • Біологія
  • Біологія і хімія
  • Ботаніка та сільське гос-во
  • Бухгалтерський облік і аудит
  • Валютні відносини
  • Ветеринарія
  • Військова кафедра
  • Географія
  • Геодезія
  • Геологія
  • Етика
  • Держава і право
  • Цивільне право і процес
  • Діловодство
  • Гроші та кредит
  • Природничі науки
  • Журналістика
  • Екологія
  • Видавнича справа та поліграфія
  • Інвестиції
  • Іноземна мова
  • Інформатика
  • Інформатика, програмування
  • Юрист по наследству
  • Історичні особистості
  • Історія
  • Історія техніки
  • Кибернетика
  • Комунікації і зв'язок
  • Комп'ютерні науки
  • Косметологія
  • Короткий зміст творів
  • Криміналістика
  • Кримінологія
  • Криптология
  • Кулінарія
  • Культура і мистецтво
  • Культурологія
  • Російська література
  • Література і російська мова
  • Логіка
  • Логістика
  • Маркетинг
  • Математика
  • Медицина, здоров'я
  • Медичні науки
  • Міжнародне публічне право
  • Міжнародне приватне право
  • Міжнародні відносини
  • Менеджмент
  • Металургія
  • Москвоведение
  • Мовознавство
  • Музика
  • Муніципальне право
  • Податки, оподаткування
  •  
    Бесплатные рефераты
     

     

     

     

     

     

         
     
    Оптимізація відбору оптимальних ознак на основі застосу-вання методів моделювання еволюції для завдання розпізнаванням-вання тексту
         

     

    Інформатика, програмування

    Оптимізація відбору оптимальних ознак на основі застосування методів моделювання еволюції для задачі розпізнавання тексту

    В.В. Хашковскій, А. Н. Толкачев

    1. Введення

    За останні майже 40 років, що минули після появи перших робіт, присвячених проблемі розпізнавання образів, були досягнуті значні успіхи. Науково-технічний прогрес привів до появи нових як вузькоспеціалізованих методів, так і методів, призначених для вирішення широкого кола завдань. Методи розпізнавання образів застосовуються для ідентифікації різних візуальних і слухових образів, а також для вироблення оптимальних рішень в управлінні різними технологічними процесами.

    Круг завдань, які можуть вирішуватися за допомогою розпізнають систем, дуже широкий. Сюди відносяться не тільки задачі розпізнавання зорових і слухових образів, але і завдання розпізнавання складних процесів і явищ, що виникають, наприклад, при виборі доцільних дій керівником підприємства або вибору оптимального управління технологічними, економічними або транспортними операціями.

    2. Розпізнавання образів

    В цілому завдання розпізнавання образів складається з 2-х частин: навчання та розпізнавання. Навчання здійснюється шляхом показу окремих об'єктів або явищ, у результаті чого розпізнає система повинна набути здатність реагувати однаковими реакціями на зображення однакових образів і різними на зображення різних образів. Розпізнавання характеризує дії вже навченої системи. Автоматизація цих процедур і становить проблему навчання розпізнавання образів. У тих випадках, коли людина вигадує і нав'язує машині правило класифікації, проблема розпізнавання вирішується лише частково, тому що основну і головну частину проблеми людина бере на себе.

    Крім того, характерне властивість образу полягає в тому, що об'єкти, що входять в образ, можуть зазнавати істотні зміни і водночас залишатися об'єктами одного і того ж образу. Однак, володіючи цією властивістю, образи в деякому розумінні невизначені, розпливчасті. Часто важко визначити до якого образу належить об'єкт. Прикладом може служити перетворення пуголовка в жабу. Так що не всі образи мають чіткі межі, то людина, а тим більше машина, не завжди може гарантувати безпомилкове розпізнавання. Проте були визначені основні підходи до вирішення задачі розпізнавання, і значне число розроблених методів було створено в рамках цих підходів. Розглянемо коротко ці підходи.

    У своїй роботі Селфрідж (1959) запропонував здійснювати розпізнавання образів обчисленням зваженої суми ряду «рекомендованих» класифікацій, кожна з яких заснована на різних характеристиках розпізнається об'єкта (ознаки). Хоча індивідуальні рекомендації можуть носити майже випадковий характер, система в цілому може бути досить точною. Можна вважати, що кожен об'єкт має простий опис, представляється вектором, елементи якого служать аргументами для ряду функцій, і значення цих функцій у свою чергу служать аргументами для деякої вирішальної функції, яка визначає остаточну класифікацію.

    Інший підхід до проблеми розпізнавання образів полягає в аналогії з біологічними процесами. Оскільки розпізнавання образів має бути функцією нейронів, можна шукати ключ до біологічного розпізнавання образів у властивостях самого нейрона. Мак-Каллок і Піттс (1943) довели, що будь-яку вичіслімую функцію можна реалізувати за допомогою належним чином організованої мережі ідеальних нейронів - порогових елементів, логічні властивості яких з достатньою підставою можна приписати реальному нейрону. Проблема полягає в тому, чи можна знайти якийсь розумний принцип реорганізації мережі, що дозволяє випадково об'єднаної спочатку групі ідеальних нейронів самоорганізуватися в «обчислювальний пристрій», здатне вирішувати довільну задачу розпізнавання образів. До теперішнього часу розроблено досить велике число архітектур штучних нейронних мереж (ІНС), але розгляд їх виходить за рамки цієї статті.

    нейрологічні теорія навчання, висунута канадським психологом Хеббом (1948), хоча і була спочатку розрахована на використання в галузі психології, зробила великий вплив на штучний інтелект. Її модифікація застосовувалася при визначенні принципів системи розпізнавання образів, що отримала назву персептрон (Розенблатта 1958, 1962).

    3. Постановка завдання

    В даний час існує велика кількість методів, які дозволяють з меншою або більшою точністю вирішувати задачу розпізнавання тексту. Створено багато систем, що реалізують ті чи інші методи, так звані OCR-системи. Крім того, що ці системи різняться по якості розпізнавання, існують серйозні обмеження на межі застосовності тих чи інших методів. Так, наприклад, абсолютно очевидно, наскільки різні вимоги будуть пред'являтися до настільної системи розпізнавання тексту і до системи автоматичного визначення індексу на поштовому конверті.

    Кілька слів слід сказати про розходження в текстах, що підлягають розпізнавання. Вони можуть бути друкованими і рукописними. Різниця досить суттєва - під час розпізнавання рукописного тексту потрібно вирішити додатково завдання поділу зображень, складність якої не менше, ніж складність завдання безпосередньо розпізнавання. Якщо абстрагуватися від приватних проблем, пов'язаних з виділенням зображення, нормалізацією його за розмірами і положенням на растру, має сенс ввести в розгляд задачу розпізнавання нормалізованих растрових зображень. Прикладом такої задачі може бути задача розпізнавання поштового індексу.

    Однак, внаслідок того, що питання нормалізації можуть бути успішно вирішені для друкованого тексту, складові елементи якого (далі - ізольовані зображення) можуть бути виділені без застосування складних спеціальних алгоритмів, задачу розпізнавання поштового індексу можна вважати окремим випадком завдання розпізнавання друкованого тексту.

    В [1], [2], [3] запропонований метод розпізнавання ізольованих зображень, головними характеристиками якого є:

    досить тривалий навчання.

    малий час розпізнавання.

    Для даного методу покладається, що підлягають розпізнавання зображення X = xn ... x1, де компоненти x

         
     
         
    Реферат Банк
     
    Рефераты
     
    Бесплатные рефераты
     

     

     

     

     

     

     

     
     
     
      Все права защищены. Reff.net.ua - українські реферати ! DMCA.com Protection Status