ПЕРЕЛІК ДИСЦИПЛІН:
  • Адміністративне право
  • Арбітражний процес
  • Архітектура
  • Астрологія
  • Астрономія
  • Банківська справа
  • Безпека життєдіяльності
  • Біографії
  • Біологія
  • Біологія і хімія
  • Ботаніка та сільське гос-во
  • Бухгалтерський облік і аудит
  • Валютні відносини
  • Ветеринарія
  • Військова кафедра
  • Географія
  • Геодезія
  • Геологія
  • Етика
  • Держава і право
  • Цивільне право і процес
  • Діловодство
  • Гроші та кредит
  • Природничі науки
  • Журналістика
  • Екологія
  • Видавнича справа та поліграфія
  • Інвестиції
  • Іноземна мова
  • Інформатика
  • Інформатика, програмування
  • Юрист по наследству
  • Історичні особистості
  • Історія
  • Історія техніки
  • Кибернетика
  • Комунікації і зв'язок
  • Комп'ютерні науки
  • Косметологія
  • Короткий зміст творів
  • Криміналістика
  • Кримінологія
  • Криптология
  • Кулінарія
  • Культура і мистецтво
  • Культурологія
  • Російська література
  • Література і російська мова
  • Логіка
  • Логістика
  • Маркетинг
  • Математика
  • Медицина, здоров'я
  • Медичні науки
  • Міжнародне публічне право
  • Міжнародне приватне право
  • Міжнародні відносини
  • Менеджмент
  • Металургія
  • Москвоведение
  • Мовознавство
  • Музика
  • Муніципальне право
  • Податки, оподаткування
  •  
    Бесплатные рефераты
     

     

     

     

     

     

         
     
    Розпізнавання мови в Office XP
         

     

    Інформатика, програмування

    Розпізнавання мови в Office XP

    Андрій Колесов

    В версію Microsoft Office XP корпорація вперше включила модуль під назвою "Альтернативний введення", що передбачає введення мовної інформації і рукописних текстів. Все це поки працює для англійської, японської та китайської мов в відповідних версіях пакету. Тим не менше познайомитися з можливостями модуля на прикладі міжнародної англійської версії корисно, тому що, цілком імовірно, щось подібне буде доступно для російської мови.

    Рис. 4. Вікно Майстра налаштування мови

    Як це все працює

    Програмні модулі альтернативного введення являють собою автономні компоненти, безпосередньо пов'язані з мовною панеллю інструментів Language Bar, яка після установки Office XP прописується в Windows і автоматично змінює раніше існував блок перемикання клавіатури. Так що тепер, клацнувши по значку Мова на панелі завдань, ви можете вибрати команду "Показати панель мови" і побачити кнопки даної панелі (рис. 1). Відповідно кошти "Альтернативного введення "стають доступні не тільки офісних додатків, але і інших програм, що підтримує дану технологію (наприклад, Internet Explorer 5.0 і Outlook Express 5.0).

    Для використання функцій альтернативного вводу потрібно вказати підключення відповідного компоненту в програмі установки Office XP (Alternative User Input). У російській версії він відсутній, але вся довідкова інформація мається на локалізованому вигляді, тому, звернувшись до неї через кнопку Help на мовній панелі, можна прочитати опис технології (рис. 2).

    Тепер подивимося, як працюють функції розпізнавання рукописного тексту. Для введення служать планшети з пір'яним введенням і звичайна миша. Скористаємося другим варіантом. Через меню Handwriting на мовній панелі викличемо вікно Writing Pad, нагадує Блокнот, введемо в ньому за допомогою миші - це дуже нелегко з незвички - Текст (рис. 3). Не знаю, як ви, а Office XP зміг зрозуміти в цих каракулі фразу "Hello frоm Andy!" і вставив її в поточне місце документа. Є також режим введення Write Anywhere, при якому писати мишею можна в будь-якій області екрану.

    Для розпізнавання є два режими виконання дій: автоматично після відриву пера від паперу або по команді після введення всього тексту. Представники Microsoft відзначають, що їх механізм дозволяє працювати з злитим текстом, а не з окремо написаними літерами, проте насправді скоріше мова йде про реалізації одного з варіантів розпізнавання. Як відомо, існує два способу розпізнавання, засновані на представленні образу рукопису у вигляді векторної та растрової моделі. Для першого потрібно знати, як писався текст, тобто схему руху пера, для другого - лише результат у вигляді графічного образу. Другий є більш складним (хоча б тому, що з векторної моделі отримати растровий образ дуже легко, а навпаки - складно).

    Так ось в Microsoft Office реалізовано перший варіант, тому введення може виконуватися тільки пером. А розпізнати текст, написаний на папері (після сканування образу і копіювання через буфер обміну в Writing Pad), поки в принципі не можна.

    Для розпізнавання мовлення звичайно ж потрібно підключити до комп'ютера мікрофон. Даний механізм має на увазі необхідність установки на конкретного користувача. Тому при першому ж зверненні до засобів розпізнавання мовлення вам знадобиться навчити комп'ютер розуміти ваше вимову. Для цього потрібно спочатку ввести деякі дані про себе - вік (до 12 років або старше) і стать (рис. 4), а потім читати протягом 10 хвилин запропонований текст. За допомогою виділення автоматично показуються розпізнані слова, тобто фактично виконується перевірка вашого вимови (движок налаштований на північноамериканське вимова). У майбутньому можна пройти додаткові рівні навчання, а також зробити кілька профайлів для різних користувачів. Процес навчання включає можливість розширення мовної бази шляхом введення слова і запису його вимови.        

      

    Рис. 1. Мовна панель     

    Для поточної роботи є два режими - введення команд і диктування (вони запускаються натисканням відповідних кнопок на мовній панелі). З першим все досить просто -- замість вибору команд меню і кнопок панелі інструментів ви послідовно називаєте потрібні слова: File, Print, OK. Точно так само за допомогою голосу виконуються встановлення прапорців і перемикачів, вибір позицій списків і введення текстових полів що з'являються в діалогових вікнах. Мені з моїм далеким від досконалості вимовою англійських слів вдалося "покомандувати" без особливих проблем.

    В режимі диктування вимовний вами текст розпізнається і виводиться на екран. Деякі терміни зарезервовані у вигляді команд, що дозволяє вам управляти розстановкою знаків пунктуації та форматуванням тексту. У будь-який момент (після кожного слова, фрази тощо) ви можете перейти в режим корекції тексту. При це, виділивши невірно розпізнане слово або фрагмент, ви можете прослухати звуковий запис вашого голосу (тут знову виконується певна навчання).

    Звичайно ж даний режим набагато складніше для розпізнавання і результат сильно залежить від вимови. Незважаючи на наявність механізму налаштування на індивідуального диктора, цей варіант движка орієнтований (що підкреслюється в документах Microsoft) на північноамериканське вимову. За оцінками Microsoft, проходження першого тесту забезпечує распознаваемость мови для жителів США приблизно на 80%, після проходження ще декількох рівнів навчання - до 90-95%.

    Я не можу похвалитися великими успіхами у введенні довільного англійського тексту, але після початкового навчання фраза "I am writing this document" в моєму виконанні розпізнавалися без проблем. Потрібно відзначити, що обидва механізму розпізнавання (для рукописного тексту й мови) використовують перевірку граматики. Наприклад, при рукописному введенні Розпізнавач вперто не хотів розуміти правильно останню літеру в англійському написанні мого прізвища - Kolesov. Проблеми зникли після додавання її в словник. При мовному введенні ситуація ще складніше - Розпізнавач явно намагається побудувати правильну з точки зору граматики фразу. В усякому разі, в інструкції підкреслюється, що бажано говорити разом, а не окремими словами.

    Оцінюючи кошти "Альтернативного введення" в Office XP в цілому, слід зазначити, що їх можливості поки ще далекі від досконалості. Більш того, це не найкращі досягнення в галузі розпізнавання мовлення та рукописного тексту. Але сама їх поява в масовому продукті є додатковим стимулом для розробників форсувати дослідження в даній області.

    Рис. 2. Довідка "Альтернативного введення"

    Коли з'явиться підтримка російської мови

    Короткий відповідь така: коли відповідні модулі для Office зроблять місцеві компанії. Адже загальна стратегія розробки подібних засобів для національних ринків у Microsoft виглядає наступним чином. З цілком очевидних причин нововведення спочатку реалізуються для користувачів у США: це величезний ринок (близько 50% світового), для якого потрібно зробити одне рішення (а не десять, як для Європи, що займає не більше 30% ринку). При цьому "американське" рішення, як правило, буває і найдешевшим по відношенню до інших в силу наявності величезного технологічного доробку, та й користувач в Америці найбільш підготовлений до сприйняття інновацій. Наприклад, за експертними оцінками, понад 60% досліджень в області мовних технологій припадає на США (один діалект однієї мови) і лише 30% на Європу (чотири-п'ять основних мов).

    Після апробації нової технології на американському ринку з урахуванням реакції користувачів Microsoft приступає до просування на національні ринки з допомогою місцевих незалежних розробників. При цьому зазвичай використовуються два варіанти: або береться готове рішення, яке інтегрується до складу пакету (як це зроблено з перевіркою російської граматики у виконанні компанії "Информатик"), або надається відкритий програмний інтерфейс для підключення розширень усіма бажаючими. Не хотілося б зараз обговорювати очевидний прагматизм такого підходу, відзначимо лише, що саме наявність національних розробок відображає реальний попит користувачів на ці технології.

    В випадку з "Альтернативним введенням" Microsoft дотримується другого підходу. Власне цей блок складається з двох модулів. Перший - модуль сполучення додатки з конкретним "движком" (включаючи візуальний інтерфейс, довідку і пр.). Він входить в усі національні версії Office XP, у чому можна переконатися, відкривши мовну панель і викликавши відповідну довідку.

    Другий - Сам програмний "движок", що реалізує певний функціонал (в даному випадку розпізнавання мови та ін.) Сьогодні він представлений, як уже говорилося, трьома варіантами для трьох мов, які включені до складу відповідних національних версій. При це є автономний продукт Microsoft Office Proofing Tools (ціна близько $ 100, докладніше про нього - www.microsoft.com/ rus/officexp/information/proofing_tools_faq.htm), що містить повний набір засобів Microsoft для національних мов: перевірку граматики (кілька десятків мов, у тому числі і російська), автоматичний переклад для ряду мов, розпізнавання мови (три мови). Встановивши цей продукт з російським Office XP, ви зможете, наприклад, перевіряти італійську граматику, розпізнавати американську мова і вводити китайські ієрогліфи ...

    Крім того, на сайті Microsoft (http://msdn.Microsoft.com/downloads/) опублікований безкоштовний набір Speech API 5.1, за допомогою якого всі бажаючі можуть підключити свої засоби розпізнавання мовлення до Office XP, в тому числі і на російською мовою. Відзначимо, що наявність мовного "движка" в міжнародній (англійською) версії Office XP зовсім не виключає необхідності використання альтернативних засобів (наприклад, з урахуванням професійної області, віку, місця проживання тощо). Зараз Microsoft розглядає питання про публікацію аналогічного пакета API для застосування рукописного тексту. До речі, у жовтні корпорація анонсувала набір. NET Speech SDK Technical Preview 1.0 для використання мовних технологій в додатках незалежних розробників.

    З реалізацією альтернативного вводу для англійської мови все зрозуміло. А чому ж така честь випала ще й японської та китайської мов? Тут справа не тільки в те, що це також дуже великі сегменти ринку - для них проблема вводу інформації має особливу актуальність.        

      

    Рис. 3. Рукописне введення за допомогою миші     

    Як відомо, ці мови використовують ієрогліфи, рахунок яких йде на тисячі. Зрозуміло, що жодна клавіатура не може впоратися з подібним завданням. Для її вирішення використовується метод IME (Input Method Editor), суть його полягає в наступному. У спрощеній трактування в традиційних мовах (у тому числі російською) кожна літера відповідає певному звуку (згадаємо, що писемність вторинна по відношенню до мови), а ієрогліфу - якась комбінація фонетичних елементів. Тому можна провести паралель між ієрогліфом і словом (хоча деколи один ієрогліф включає ціле речення).

    При введення китайського тексту (користувачі Windows 2000 можуть спробувати це, включивши підтримку мови) на моніторі зображується аналог клавіатури, але тільки для відповідного набору фонетичних звуків (він досить великий, але це вже не десятки тисяч ієрогліфів), за допомогою яких набираються слова.

    Чому ж мовної введення особливо необхідний для цих мов? Справа в тому, що для російської мови швидкості мови і клавіатурного введення (для досвідченого користувача) взагалі-то відповідні. А для китайської та японської мов клавіатурний введення повільніше принаймні на порядок. Тому мовної введення - це дуже значне підвищення продуктивності роботи користувача.

    Проблеми з перемиканням клавіатури

    Отже, нововведень "Альтернативного введення" і додаткових функцій мовної панелі інструментів ще немає в українському варіанті Office XP, а ось деякі проблеми вже з'явилися.

    Відразу після установки Office XP під час тривіального набору тексту в Outlook Express у мене несподівано перестало працювати перемикання мови за допомогою клавіатури. З тих пір ця помилка проявляється випадковим чином (причому за активної перемиканні мови досить часто) і вимагає перезавантаження програми. До жаль, повернутися до початкового варіанту управління перемиканням клавіатури, який був у моєму Windows 98 до установки Office XP, вже не вдається.

    Друга проблема - якщо зробити мовну панель невидимої (вибрати команду Close), то вивести її знову на екран за допомогою засобів Панелі управління не можна, тому що відповідна кнопка Language Bar у вікні Text Services недоступна. Єдиний вихід: безпосередньо відредагувати системний Реєстру, встановивши в ньому HKEY_CURRENT_USERSoftwareMicrosoft CTFLangBarShowStatus = 2

    Microsoft визнає ці помилки в російському Office XP і обіцяє їх виправити ...

    Список літератури

    Для підготовки даної роботи були використані матеріали з сайту http://ecosoft.iatp.org.ua/

         
     
         
    Реферат Банк
     
    Рефераты
     
    Бесплатные рефераты
     

     

     

     

     

     

     

     
     
     
      Все права защищены. Reff.net.ua - українські реферати ! DMCA.com Protection Status