Історія
машинного перекладу h2>
Е. М. Фiлiнов p>
Вперше думка про
можливості машинного перекладу висловив Чарльз Беббідж (1791-1871),
який розробив у 1836-1848 рр.. проект цифрової аналітичної машини --
механічного прототипу електронних цифрових обчислювальних машин, що з'явилися
через 100 років. Ідея Ч. Беббіджа полягала в тому, що пам'ять об'ємом 1000
50-розрядних десяткових чисел (по 50 зубчастих коліс у кожному регістрі) можна
використовувати для збереження словників. Ч. Беббідж привів цю ідею як
обгрунтування для запиту в англійського уряду коштів, необхідних для
фізичного втілення аналітичної машини, яку йому так і не вдалося
побудувати (див. Апокін та ін Чарльз Беббідж. М., Наука, 1981). p>
Фактично
історія машинного перекладу починається з "Джорджтаунського
експерименту ". У січні 1954 р. відбулася перша публічна демонстрація
машинного перекладу з російської на англійську, здійсненого на машині
ІБМ-701. Повідомлення про цю подію було опубліковано в журналі Computers and
Automation, 1954, № 2. А реферат цього повідомлення, зроблений Д. Ю. Пановим,
з'явився в РЖ ВИНИТИ "Математика", 1954, № 10: "Переклад з одного
мови на іншу за допомогою машини: звіт про перше успішне випробування ". p>
Це повідомлення
стало поштовхом для початку робіт з машинного перекладу в СРСР. Д. Ю. Панов,
що був тоді директором ВИНИТИ (у той час Інституту наукової інформації - ІНІ)
залучив до робіт з машинного перекладу І. К. Бєльський, яка потім
очолила групу машинного перекладу в ІТМ та ОТ АН СРСР. Перший досвід перекладу з
англійської мови на російську за допомогою машини БЕСМ був отриманий вже до кінця 1955
м. Програми для БЕСМ становили Н. П. Трифонов і Л. Н. Корольов, кандидатська
дисертація якого була присвячена методам побудови словників для машинного
перекладу. p>
Інше
напрямок робіт виникло у Відділенні прикладної математики Математичного
інституту АН СРСР (нині ІПМ ім. М. В. Келдиша РАН) за ініціативою А. А.
Ляпунова. До робіт з машинного перекладу математичних текстів з французької
мови на російську він залучив О. С. Кулагіну, аспірантку МІАН, своїх учениць Т. Д.
Вентцель і Н. Н. Рікко. З кінця 1955 р. у цих роботах брала участь Т. Н.
Молошная, яка потім приступила до самостійної роботи над алгоритмом
англо-російського перекладу. А. А. Ляпунов та О. С. Кулагіна свої уявлення про
використанні обчислювальних машин для перекладу з однієї мови на іншу
опублікували в журналі "Природа", 1955, № 8. Перші програми
машинного перекладу, розроблені цим колективом, були реалізовані на машині
"Стріла". P>
Перше
покоління систем машинного перекладу базувалося на алгоритмах
послідовного перекладу "слово за словом", "фраза за
фразою ". Можливості таких систем визначалися доступними розмірами словників,
прямо залежать від обсягу пам'яті комп'ютера. Переклад тексту здійснювався
окремими пропозиціями, смислові зв'язки між ними ніяк не враховувалися.
Такі системи називають системами прямого перекладу. На зміну їм з часом
прийшли системи наступних поколінь, в яких переклад від мови до мови
здійснювався на рівні синтаксичних структур. В алгоритмах перекладу
використовувався набір операцій, що дозволяє шляхом аналізу перекладного
пропозиції побудувати його синтаксичну структуру за правилами граматики мови
вхідного пропозиції (так само, як навчають дітей мові в середній школі), а потім
перетворити її в синтаксичну структуру вихідного пропозиції і
синтезувати вихідну пропозицію, підставляючи потрібні слова зі словника. Такі
системи називаються Т-системами (Т - від англійського слова "transfer --
перетворення "). p>
Найбільш
досконалим вважається підхід до побудови систем машинного перекладу на основі
отримання деякого, незалежного від мов, смислового представлення вхідного
пропозиції шляхом його семантичного аналізу. Потім проводиться синтез
вихідного пропозиції за отриманим смисловому поданням. Такі системи
називають І-системами (І - від слова "інтерлінгва"). Вважається, що
наступні покоління систем машинного перекладу будуть відноситися до класу
І-систем. P>
Як велика
вчений, якій властиво бачити всю проблему в цілому, А. А. Ляпунов з
самого початку робіт з машинного перекладу говорив про переведення шляхом вилучення
сенсу тексту, що перекладається і його представлення на іншій мові. Однак така
постановка проблеми перекладу виявилася в той час передчасною. Більш того,
вона не вирішена в загальному вигляді світової інформатикою і в даний час, не дивлячись
на зусилля, що вживали Міжнародною федерацією IFIP - світовим
спільнотою вчених в області обробки інформації. Однак багато приватних
результати, пов'язані з семантичним аналізом текстів, були отримані і
опубліковані в працях IFIP. p>
Перший досвід
створення програм машинного перекладу показав, що необхідно вирішувати ці завдання
поступово і по частинах. p>
Занадто багато
труднощів і неясностей було в тому, як треба формалізувати і будувати алгоритми
для роботи з текстами, які словники треба вводити в машину, які
лінгвістичні закономірності слід використовувати при машинному перекладі і
які взагалі ці закономірності. p>
З'ясувалося, що
традиційна лінгвістика не має в своєму розпорядженні ні фактичним матеріалом, ні ідеями і
уявленнями, потрібними для побудови систем машинного перекладу, які
використовували б сенс тексту, що перекладається. p>
Традиційна
лінгвістика не могла дати початкові уявлення не тільки в частині семантики,
але й у частині синтаксису. Ні для однієї мови на той час не існувало
переліків синтаксичних конструкцій, не були вивчені умови їх сполучуваності і
взаємозамінності, не були розроблені правила побудови великих одиниць
синтаксичної структури з більш дрібних. По суті на жодне з питань,
поставлений у зв'язку з побудовою систем машинного перекладу, традиційна
лінгвістика в 50-х роках не могла дати відповіді. p>
Потреба в
створення теоретичних основ машинного перекладу призвела до формування нового
напряму в лінгвістиці, званого структурної, прикладної, математичної
лінгвістикою. Формування цього напрямку в СРСР відноситься до другої
половині 50-х років. Провідну роль у ньому зіграли математики А. А. Ляпунов, В. А.
Успенський, (учень А. Н. Колмогорова), О. С. Кулагіна, лінгвісти В. Ю.
Розенцвейг, П. С. Кузнєцов, А. А. Реформатський, І. А. Мельчук, В. В. Іванов. P>
6 травня 1960
була прийнята Постанова Президії АН СРСР "Про розвиток структурних і
математичних методів дослідження мови ", на виконання якого були
створено підрозділи по структурної лінгвістики в Інституті мовознавства,
Інституті російської мови АН СРСР. У Постанові Президії АН СРСР
зазначалося, що "недостатній розвиток теоретичних досліджень в
області структурних і математичних методів в лінгвістичних установах
гальмує практично важливі роботи з теорії і практиці машинного перекладу,
побудови інформаційних мов та інформаційних машин, логічною семантикою та
інші застосування мовознавства, які розробляються в даний час в ряді
технічних і математичних науково-дослідних інститутів ". З 1960
р. почалася підготовка кадрів в галузі автоматичної переробки текстів на
філологічному факультеті МГУ, в Ленінградському та Новосибірському університетах,
МГПИ. Під математичної лінгвістикою розумілося вивчення мови як
абстрактної знакової системи з метою побудови теоретичної основи машинного
перекладу і створення конкретних алгоритмів перекладу. У такому розумінні
математична лінгвістика становила частина семіотики - загальної теорії знакових
систем. p>
Завдання
аксіоматизації лінгвістики була висунута одним з найвидатніших лінгвістів
московської школи П. С. Кузнєцовим як завдання формалізації граматики,
висхідна до ідей видатного російського мовознавця Ф. Ф. Фортунатова
(1848-1914). P>
Дослідженню
формальної теорії граматик, була присвячена дисертація О. С. Кулагіної,
виконана під керівництвом А. А. Ляпунова. p>
Зауважимо, що в
ті ж роки формальна теорія граматик розвивалася в США в працях Н. Хомського,
які стали класичними для області штучних мов, зокрема мов
програмування. p>
двадцятиріччя
(1956-1976) один із засновників напрямку математик В. А. Успенський у своїх
спогадах назвав "срібним століттям" структурної, прикладної і
математичної лінгвістики в СРСР (мабуть, за аналогією з "срібним
століттям "російської поезії). p>
У 70-х роках
розробку основ технології машинного перекладу продовжила група фахівців у
ВИНИТИ під керівництвом професора Г. Г. Белоногова. У результаті в 1993 р.
була створена промислова версія системи RETRANS фразеологічного машинного
перекладу з російської на англійську і назад, яка застосовувалася в
міністерствах оборони, шляхів сполучення, науки і технологій, а також під ВНТІЦ. p>
Практичне
застосування принципів смислового аналізу текстів треба було при створенні
систем машинного перекладу з ієрогліфічних мов (китайської, японської і
ін). Питання створення таких систем були розроблені в дисертації В. М. Зелко
у 80-х роках. p>
Перші
комерційні продукти машинного перекладу, що знайшли практичне використання,
з'явилися в середині 80-х років. Вони були реалізовані на персональних
комп'ютерах і були системами прямого перекладу, можливості яких
базувалися на величезних (в порівнянні з першими системами) словниках, а не на
вміння аналізувати і синтезувати тексти. p>
Сучасні
комерційні продукти машинного перекладу пропонують вітчизняні фірми: p>
"Віста
Текнолоджіз "і" Адвентіс ", утворені в 1991 р. колективом
розробників, що виділилися з ВИНИТИ; p>
ПРОМТ,
заснована в 1991 р.; p>
"Медіа
Лінгва ". P>
для одного
"коробочна" версія продукту Retrans Vista фірми "Віста
текнолоджіз "призначена для автоматизованого перекладу текстів з
російської мови на англійську і назад. У ній використані оригінальні
алгоритми стиснення словникових баз і пошуку перекладних еквівалентів, що дозволяють
транслювати "на льоту" не тільки фрагменти тексту, що імпортуються з
текстового редактора MS Word, але і Web-сторінки. p>
У словниках
Retrans Vista зберігаються мільйони понять, до яких належать не тільки
традиційні стійкі фразеологічні звороти, але, перш за все,
словосполучення, що використовуються в повсякденному мови. Крім того, є програма
концептуального аналізу, автоматично виділяє з тексту нові
словосполучення і включає їх до словника. Основні словники системи Retrans
Vista містять терміни і фразеологічні одиниці із природничих і технічних
наук, економіки, бізнесу і політики. Обсяг політематичної машинного
словника - близько 3,4 млн. слів (1,8 млн. у російсько-англійської частини, 1,6 млн. - у
англо-російської), причому 20% з них є словами, а 80% - стійкими
словосполученнями із середньою "довжиною" в 2,2 слова. p>
Продукт Retrans
Vista реалізований на ПК з процесором, що мають частоту від 166 МГц і ОЗУ від 32 Мб
і вище і жорстким диском від 170 Мб. Продукт працює під управлінням ОС Windows
98/NT/2000. P>
Фірма ПРОМТ (http://www.promt.ru/rus1/news/news.htm
)
розробила і постачає Інтернет-перекладач PROMT Internet Translation Server,
забезпечує переклад "на льоту" Web-сторінок, запитів до пошукових
системам або до баз даних, представлених в Інтернеті. p>
Для
корпоративних мереж багатонаціональних корпорацій фірма ПРОМТ пропонує
аналогічний продукт PROMT Intranet Server. p>
Модуль перекладу
PROMT Internet вбудовується в браузер Microsoft Internet Explorer, утворюючи
засіб для синхронного перекладу Web-сторінок Web View. При цьому можна
встановлювати для перекладу різні мови: англійська - російська;
англійська - німецька, англійська - іспанська, французька - англійська;
французька - німецька. Безкоштовний онлайновий перекладач PROMT доступний у
Інтернеті за адресою: http://www.translate.ru
. p>
PROMT Internet
Translator Server встановлений на пошуковій системі Voila, що належить
оператору France Telecom. p>
Для систем
офісної автоматизації пропонується комерційний пакет PROMT Lingvo OFFICE --
результат співпраці двох лідерів російського ринку лінгвістичного
програмного забезпечення - ПРОМТ і ABBYY. p>
Компанія
"Медіа Лінгва" випустила електронні словники серії "МультиЛекс
3.5. Новий великий англо-російський словник "і" МультіЛекс3.5.
Англійська. Економіка і право ". Такі словники, що працюють під управлінням
операційних систем Windows CE або PalnOS, можуть бути розміщені на кишенькових
комп'ютерах. p>
З практичної
точки зору, маючи на увазі якість результуючого тексту і його відповідність
вихідного, програми машинного перекладу поділяють на три категорії: p>
повністю
автоматичний переклад; p>
автоматизований
машинний переклад за участю людини; p>
переклад,
здійснюваний людиною з використанням комп'ютера. p>
Програми
машинного перекладу першого з названих категорій є справою далекого
майбутнього, оскільки в загальному вигляді не вирішені проблеми автоматичного розуміння,
перекладу та синтезу текстів. p>
Програми
другої категорії розробники називають МТ-програми (від Machine translation --
машинний переклад). Реально автоматизований (за участю людини) машинний
переклад можливий тільки в умовах штучно обмеженого, як по
словникового запасу, так і з граматики, мови. p>
Як
реального успішного проекту МТ-програми завжди називають німецьку систему
Meteo, що виконує переклад метеопрогнозів з французької мови на англійську і
назад. p>
До МТ-програмами
відносяться і продукти машинного перекладу фірми ПРОМТ, згадані вище, у тому
числі програми для перегляду вмісту Web-сторінок в мережі Інтернет з метою
пошуку потрібного документа. p>
Програми
третьої категорії розробники називають ТМ-програми (від translation memory --
пам'ять перекладу). Цю категорію програм застосовують професійні
перекладачі, які усвідомили виграш від автоматизації їх роботи за допомогою
комп'ютерів. Основу ТМ-програм становлять спеціалізовані словники,
відповідають тематиці тексту, що перекладається. При перекладі використовуються
конструкції та значення слів і стійких словосполучень, обрані
професійним перекладачем і занесені до словників системи, а отриманий
текст піддається інтенсивному редагування. Словники і вже переведені
фрагменти текстів, що запам'ятовуються в ТМ-системі, можуть бути повторно використані
у великих колективних проектах, ними можна обмінюватися. Тому ТМ-системи
являють собою важливий засіб автоматизації праці професійних
перекладачів. p>
Часто
ТМ-програми використовують у поєднанні з МТ-програмами. Найбільш популярним в
Світ ТМ-інструментарієм є Translation's Workbench фірми Trados (для
стислості часто також званий Trados). p>
За 17 років
свого існування фірма Trados продала 45 тис. ліцензій на свою систему. Всі
вони придбані професійними перекладачами. Наприкінці 2001 р. Російський
фірма ПРОМТ, відома своїми продуктами машинного перекладу категорії МТ, оголосила
про одержання статусу ексклюзивного дистриб'ютора системи Trados в Росії і
інших країнах СНД. Для спільного використання своїх МТ-програм і продуктів
Trados фірма ПРОМТ пропонує спеціальні засоби їх сполучення. P>
Історія
машинного перекладу нараховує трохи більше 50 років. За цей час змінилося
кілька поколінь систем машинного перекладу - від перших програм,
використовували обмежені ресурси універсальних комп'ютерів першого покоління
до сучасних комерційних продуктів, що використовують потужні ресурси серверів і
персональних комп'ютерів, включаючи ПК, в яких можна розміщувати кишенькові
словники, а також комп'ютерні мережі. p>
У міру зняття
технічних обмежень, що накладаються можливостями комп'ютерів по
продуктивності і пам'яті, ставало ясно, що проблема перекладу тексту з
одного природної мови на іншій принципово не зводиться тільки до
перекодуванні слів. Для подолання основних труднощів проблеми машинного
перекладу повинні бути вирішені завдання автоматизованого представлення контексту,
смислового змісту тексту, що перекладається, знань про поняття предметної
області, до якої належить перекладається текст. p>
Разом з тим
сучасні досягнення в галузі обчислювальної техніки, інформаційних
технологій та технологій телекомунікацій дозволяють висувати на перспективу
практичні завдання пошуку та вибору необхідної інформації, представленої на
різними мовами, з різнорідних джерел, що знаходяться в корпоративних і
глобальних інформаційно-телекомунікаційних мережах. p>
Як
приклад такої перспективної задачі можна навести системи запросів до
інформаційних ресурсів мереж, наприклад до баз даних, з можливістю
формування відповідей по телефону у вигляді усного мовлення. Для цього потрібно
поєднання систем машинного перекладу з системами розпізнавання та синтезу мови. p>
Список
літератури h2>
Ляпунов А. А., Кулагіна О. С. Використання обчислювальних машин
для перекладу з однієї мови на іншу. Природа, 1955, № 8. p>
Кузнєцов П. С., Ляпунов А. А., Реформатський А. А. Основні проблеми
машинного перекладу. Питання мовознавства, 1956, № 5. p>
Панов Д. Ю., Ляпунов А. А., Мухін І. С. Автоматизація
перекладу з однієї мови на іншу. В сб: Сесія з наукових проблем
автоматизації виробництва. М., Изд. АН СРСР, 1956. p>
Кулагіна О. С. Про роль А. А. Ляпунова в розвитку робіт з
машинного перекладу в СРСР. Проблеми кібернетики, 1977, вип. 32 (в
переробленому і доповненому варіанті - у книзі "Нариси історії
інформатики в Росії ". Новосибірськ, ОІГГМ СО РАН, 1998) p>
Кулагіна О. С. Дослідження по машинному перекладу.
М., Наука, 1979. p>
Молошная Т. Н. Алгоритм перекладу з англійської мови на
російська. Проблеми кібернетики, 1960, вип. 3. p>
Багриновський Г. П., Кулагіна О. С., Ляпунов А. А. Про деякі
методологічних питаннях, що відносяться до машинного перекладу. В сб: Про
деякі питання теоретичної кібернетики і алгоритмах програмування.
Новосибирск, Изд. СВ АН СРСР, 1971. p>
Успенський В. А. Срібний вік структурної, прикладної і
математичної лінгвістики в СРСР і В. Ю.
Розенцвейг Як все починалося (нотатки очевидця)
у кн.: Нариси історії інформатики в Росії. Новосибірськ, НДЦ ОІГГМ СО РАН,
1998. p>
Панов Д. Ю.
Автоматичний переклад. М., Изд. АН СРСР, 1958
(перше видання - 1956.) p>
Стеблин-Каменський М. І. Значення машинного перекладу для
мовознавства. В сб: Матеріали по машинному перекладу. Сб 1. Л., Изд.
ЛДУ, 1958 p>
Зелко В. І.
Автореферат кандидатської дисертації. p>
MacDonald N. Language translation by machine - a report of the first
successful trial. Computors and automation. 1954, v. 3, № 2, p. 6-10. p>
Машинний переклад. Сб статей. М., АН СРСР, 1958. p>
Кулагіна О. С. Машинний переклад: сучасний стан.
В сб: Семіотика та інформатика. Вип. 29. М., ВИНИТИ, 1989. p>
Іванов В. В. Деякі питання машинного перекладу в
СРСР. Доповіді Конференції з обробки інформації, машинного перекладу та
автоматичного читання тексту. М., ВИНИТИ АН СРСР, 1961. Вип. 10. p>
Компьютерра,
2002, № 21. Тема номера: "Ти мене розумієш?" Проблеми машинного
перекладу, с. 26-37. Статті: Жигалов В. Тестер Тьюрінга; Жигалов В.
Відкладений розмова; ножове
І. Синтаксичний аналіз; Сокурко А. Майбутнє машинного
перекладу. p>