ПЕРЕЛІК ДИСЦИПЛІН:
  • Адміністративне право
  • Арбітражний процес
  • Архітектура
  • Астрологія
  • Астрономія
  • Банківська справа
  • Безпека життєдіяльності
  • Біографії
  • Біологія
  • Біологія і хімія
  • Ботаніка та сільське гос-во
  • Бухгалтерський облік і аудит
  • Валютні відносини
  • Ветеринарія
  • Військова кафедра
  • Географія
  • Геодезія
  • Геологія
  • Етика
  • Держава і право
  • Цивільне право і процес
  • Діловодство
  • Гроші та кредит
  • Природничі науки
  • Журналістика
  • Екологія
  • Видавнича справа та поліграфія
  • Інвестиції
  • Іноземна мова
  • Інформатика
  • Інформатика, програмування
  • Історичні особистості
  • Історія
  • Історія техніки
  • Кибернетика
  • Комунікації і зв'язок
  • Комп'ютерні науки
  • Косметологія
  • Короткий зміст творів
  • Криміналістика
  • Кримінологія
  • Криптология
  • Кулінарія
  • Культура і мистецтво
  • Культурологія
  • Російська література
  • Література і російська мова
  • Логіка
  • Логістика
  • Маркетинг
  • Математика
  • Медицина, здоров'я
  • Медичні науки
  • Міжнародне публічне право
  • Міжнародне приватне право
  • Міжнародні відносини
  • Менеджмент
  • Металургія
  • Москвоведение
  • Мовознавство
  • Музика
  • Муніципальне право
  • Податки, оподаткування
  •  
    Бесплатные рефераты
     

     

     

     

     

     

         
     
    Машинний переклад
         

     

    Іноземна мова

    О Г Л А В Л Е Н Н Я

    ВСТУП ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .... 3
    МАШИННИЙ ПЕРЕКЛАД ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .... 6
    1. Історія розвитку машинного перекладу ... ... ... ... ... ... ... ... ... ... ... 6
    2. Електронні словники ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. 8
    3. Комп'ютер на місці перекладача ... ... ... ... ... ... ... ... ... ... ... ... ... ... 10
    4. Як переводить комп'ютер ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. 12

    1. Словник ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... 12

    2. Граматика ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .... 13

    5. Відповідь критикам машинного перекладу

    (або Чому популярні программми-перводчікі) ... ... ... .. 15
    6. Машинний переклад - це інструмент ... ... ... ... ... ... ... ... ... ... ... ... 16
    7. Перекладач для офісу ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. 19
    8. Хто в домі перекладач? ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... 22
    9. Машинний переклад в Інтернеті ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. 25
    10. Як покращити якість перекладу (Практичні поради) ... ... 27

    ВИСНОВОК ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... 30
    Література ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .... 32

    В В Е Д Е Н Н Я

    Переклад має довгу історію. Своїм корінням він сходить до тих далекихчасів, коли прамова почав розпадатися на окремі мови і виникланеобхідність в людях, які знали кілька мов і здатних виступати вролі посередників при спілкуванні представників різних мовних громад.
    Перекладом називається процес і результат створення на основі вихідноготексту на одній мові рівноцінного йому в комунікативному відношенні текстуна іншій мові. При цьому комунікативна рівноцінність, абоеквівалентність, розуміється як таке якість тексту перекладу, щодозволяє йому виступати в процесі спілкування носіїв різних мов вяк повноправною заміни вихідного тексту (оригіналу) у сфері діїмови перекладу [1].
    Комунікативна еквівалентність нового тексту по відношенню до оригіналузабезпечується виконанням трьох основних вимог:

    . текст перекладу повинен у можливо більш повному обсязі передавати зміст оригіналу, що перш за все означає неприпустимість довільного опущення або додавання інформації;

    . текст перекладу повинен відповідати нормам мови перекладу, так як їх порушення, щонайменше, створює перешкоди для сприйняття інформації, а іноді призводить і до її спотворення;

    . текст перекладу повинен бути приблизно можна порівняти з оригіналом за своїм обсягом, чим забезпечується схожість стилістичного ефекту з точки зору лаконічності або розгорнення вирази.
    Однак виконання зазначених вимог до тексту перекладу часто пов'язане зподоланням різного роду об'єктивно існуючих труднощів. У данійроботі ми розглянемо ті з них, з якими ми можемо зіткнутися примашинний переклад. Зрозуміло, що в даному випадку, якщо переклад невідповідає цим нормам, звинувачувати нема кого, оскільки машинний переклад ще непризначений для самостійного перекладу, він вимагає редагування. Щож до інших видів цієї діяльності, і письмовий, і уснийперекладачі повинні віддавати собі звіт в тому, що «їхню роботу помічаютьшвидше тоді, коли вони зазнають невдачі, ніж коли переклад йденормально »[2].
    Коло діяльності, що регулюється поняттям" переклад ", дуже широкий.
    Переводяться з однієї мови на іншу вірші, художня проза, наукові танауково-популярні книги з найрізноманітніших галузей знань, дипломатичнідокументи, ділові папери, статті політичних діячів і мови ораторів,газетні матеріали, бесіди осіб, які розмовляють на різних мовах ізмушені вдаватися до допомоги посередника - «тлумача», дублюютьсякінофільми.
    Переказ може здійснюватися:
    1. з однієї мови на іншу - нерідний, споріднений, близькоспоріднених;
    2. з літературної мови на його діалект і навпаки, або діалекту з однієї мови на іншу літературну мову;
    3. з мови давнього періоду на дану мову в її сучасному стані

    (наприклад, з давньоруської мови на сучасну російську, з староанглійського на сучасну англійську і т.д.).
    Слід зауважити, що для машинного перекладу характерний лише пункт 1,оскільки, як ми знаємо з економіки, попит породжує пропозиції. Я думаю,ніхто не буде заперечувати, що попит на програму-перекладач, скажімо, занглійської або німецької мови на російську набагато перевищує попит напереклад з якого-небудь прамови.

    Отже, розвиток кібернетики зробило можливим машинний переклад, тобтопереклад, що будується на використанні машиною визначених і постійних дляданого виду матеріалу відповідностей між словами й граматичнимиявищами різних мов. В даний час є досить широкий вибірпакетів програм, що полегшують працю перекладача, які умовно можнапідрозділити на дві основні групи [3]: електронні словники (electronicdictionary) та системи машинного перекладу (machine translation system). Тимне менше, цю роботу мені хотілося б більше присвятити саме системаммашинного перекладу, ніж електронних словників (хоча справедливості радислід буде згадати хоча б про їх класифікації), оскільки робота зелектронними словниками практично нічим не відрізняється від використаннязвичайного словника, так як вони надають користувачеві можливістьшвидкого пошуку лише 1 окремого слова (терміну) або фразеологізму;системи ж машинного перекладу забезпечують зв'язний переклад текстів,враховує морфологічні, синтаксичні і семантичні зв'язки членівпропозиції. Сьогодні програми-перекладачі вміють будувати осмислені фрази,і за останні кілька років якість перекладу покращився. Однак комп'ютерще погано розбирається в граматичних нюансах і жаргоні, тому йогоголовне призначення - переклади ділових паперів, інструкцій, листів зелектронної пошти, сторінок з Інтернету (Web-сторінок). Це якщо вамдостатньо лише загального розуміння тексту. Інше застосування систем --полегшення рутинної роботи перекладачів, виконання за них підрядковогоперекладу, який можна легко підправити. Про найбільш вдалих системах ми іпоговоримо в цій роботі.
    Я також розповім про те, як здійснюється машинний переклад, хтозаймається складанням програм-перекладачів і як вони працюють. Особливеувагу мені хотілося б приділити проблематики машинного перекладу, оскількимашинний переклад для нас поки що нововведення, область мало в літературіосвітлена, тому й поле для роботи величезна. До того ж я ні за що неповірю, щоб Ви жодного разу не задавали собі питання: «А може дуже скоро врезультаті нових комп'ютерних технологій попит на перекладачів впаде домінімуму? », але тут же заспокоювали себе:« Ні, комп'ютер ніколи невитіснить професію перекладача, адже будь-яка комп'ютерна програма --результат діяльності людини, а головне, ми можемо відчувати, на відмінувід машини, а отже, краще підбирати слова і еквіваленти ». Тодічи потрібен взагалі машинний переклад? Що ж, не будемо забігати вперед, ірозглянемо все по порядку.

    М А Ш И Н Н И Й П Е Р Е В О Д

    Останнім часом знання іноземних мов може знадобитися не тількив подорожі або на прийомі гостей з-за кордону, але й у власному будинку,наприклад, при перегляді популярних голлівудських кінострічок, при читанніінструкції з використання заморських товарів або Web-сторінок, якірозшукує по всьому світу невтомний броузер. Таким чином, виявляється,що навіть не покидаючи рідних стін, ми маємо потребу в послугах перекладача. Однакнеобхідну допомогу нам цілком може надати домашній комп'ютер.
    Системи машинного перекладу (МП) давно перестали бути дивиною. Вонипоступово виходять з дитячого віку і замість незв'язного дитячогобелькоту починають висловлюватися цілком зрозумілою, "людському" мовою. Доостаннього часу такі програми були не тільки дуже дорогі, поступаючись вціні хіба що потужним графічним і видавничим системам, але і вельмискладні і примхливі в роботі. І от з'явилися перші перекладачі, придатнідля використання на домашньому ПК. Давайте познайомимося з ними ближче ідізнаємося, на що вони здатні. Але почнемо, звичайно ж, з історії розвитку МП.

    1. ІСТОРІЯ розвитку машинного ПЕРЕКЛАДУ
    За свідченням біографів, ще видатний математик XIX століття Чарльз
    Беббідж намагався переконати британський уряд в необхідностіфінансувати його дослідження по розробці "обчислювальної машини". Учислі інших благ він обіцяв, що коли-небудь ця машина зможеавтоматично переводити розмовну мову. Але, хоча сьогодні Беббідж івважається визнаним автором безлічі ідей, що лежать в основі роботикомп'ютера, він так і не зумів ані побудувати свою машину, ні виконатиобіцянки з приводу МП. І сьогодні ця ідея як і раніше залишається взначній мірі нереалізованою. Проте останнім часом завдякипояви Інтернет як платформи глобального зв'язку вона знову почалазалучати широку увагу і інвестиції.
    Взагалі, перші програми МП з'явилися в 50-х роках, всього кілька роківпісля народження комп'ютера, але до широкого розповсюдження ПК МП бувшвидше за цікавим об'єктом наукових досліджень, ніж важливою сфероювикористання обчислювальної техніки, з двох причин: дорожнеча часуроботи комп'ютера та колективне користування його ресурсами. Останняобставина часто не дозволяло негайно звернутися до електронногопомічнику, зводячи нанівець найважливіша перевага МП перед звичайним - йогооперативність.
    Датою народження МП (як галузі досліджень) прийнято вважати 1947 р., івсе почалося з листа Уоррена Вівера, директора відділення природничих наук
    Рокфеллерівського фонду, до Норберт Вінер у березні того ж року, в якомузавдання переведення порівнювалася з завданням дешифрування текстів. Остання в точас уже стала виконуватися на електромеханічних пристроях. За цимлистом ішла безліч дискусій, з'явився меморандум про цілі, інарешті, були виділені кошти на дослідження. І в 1952 р. відбуласяперша конференція, організована відомим математиком Бар-Хілелом, наякої дослідники обмінялися думками щодо організації безлічісинтаксичних правил мови, способів опису семантики, морфологічнихструктур, структури словників для систем переказу. Досягнення вакадемічних дослідженнях стимулювали комерційний інтерес до проблеми
    МП, і фірма IBM спільно з Джорджтаунський університет в США в 1954 р.зуміла показати першу систему, що базується на словнику з 250 слів і 6синтаксичних правил і забезпечує переклад 49 заздалегідь відібранихпропозицій. Цей експеримент започаткував дослідному бум: внаступні 10 років уряд і військові відомства США витратили надослідження в галузі МП близько 40 млн. доларів.
    Від ейфорії, пов'язаної з першими результатами, до практично повногозаперечення здійсненності МП минуло лише вісім років. До подібного висновкуприйшли на підставі огляду, виконаного спеціальним комітетом зприкладної лінгвістики (ALPAC) Національної Академії наук США. У ньомуконстатувалося, що системи автоматичного перекладу не зможуть забезпечитиприйнятну якість в доступному для огляду майбутньому. Цей звіт драматично вплинув нарозвиток МП, тому що були практично припинені які б то не булодослідження через відсутність фінансування, по крайней мере, в США і
    Європі. І лише наприкінці 70-х років заняття МП поновилися разом ззростанням інтересу з боку проектувальників і дослідників долінгвістичним проблем штучного інтелекту та комп'ютерного пошукуінформації.
    І тільки з початку 80-х років, коли ПК впевнено і потужно почализавойовувати світ, час їх роботи, звичайно, подешевшало і доступ до нихможна було отримати в будь-яку хвилину. А значить, МП нарешті ставекономічно вигідним. До того ж в ці та наступні роки вдосконаленняпрограм дозволило досить точно перекладати багато видів текстів, однакдеякі проблеми МП залишилися невирішеними і до цього дня.
    90-і роки можна вважати справжньою епохою відродження в розвитку МП, щопов'язано не лише з високим рівнем можливостей персональних комп'ютерів,появою сканерів [4] і програм OCR [5], але і з поширенням
    Інтернет/інтранет (Internet/intranet), що зумовили реальний попит на МП.
    Він знову став привабливою областю вкладення капіталів як для приватнихінвесторів, так і для державних структур.
    І хоча технології МП як і раніше, страждають безліччю недоліків, багатоорганізації знову стали серйозно ставитися до обіцянки Беббіджа. "Машиннийпереклад все ще далекий від досконалості, але будь-хто з його допомогоюзможе, принаймні, зрозуміти основний зміст документа ", - вважає Луї
    Моньє, технологічний директор Alta Vista, великого пошукового Web-сайту,який почав експеримент з МП в онлайновому режимі [6].
    Країни Європейського Союзу витратили за останні 15 років більше 70 млн.дол на дослідження з цієї проблеми, а японські державніорганізації - більше 200 млн. дол За словами T. Р. Педтке (представникауряду США), яка зробила дуже цікаву доповідь на MT SUMMIT VI простратегічної важливості МП для його країни, одну з головних ролей у розвиткуцього напрямку продовжує відігравати уряд. Проблема МПрозглядається як ключова в питаннях просування високих технологій ізабезпечення конкурентоспроможності США в глобальному інформаційномупросторі.

    2. ЕЛЕКТРОННІ СЛОВАРИ

    Електронні словники (ЕС) почали розроблятися значно раніше, ніжальтернативні їм системи МП, тому в даний час на ринкупрограмного забезпечення є надзвичайно широкий вибір словників - віднайпростіших (наприклад, DIC) до потужних систем, які об'єднують в однійпрограмної оболонки кілька лексичних баз даних - спеціалізованихтематичних словників, послідовність підключення яких визначаєтьсякористувачем (LINGVO). Вибір того чи іншого програмного продукту залежитьвиключно oт апаратних можливостей комп'ютера, який маєкористувач, фінансових міркувань і конкретних умов, в якихпрацює перекладач.

    Потенційну аудиторію цих програм можна визначити абсолютно точно --це учні та студенти, які використовують словник як один із посібників прививченні іноземної мови, а також домашні та бізнес-користувачі,яким потрібен універсальний і простий у застосуванні словник-довідник дляепізодичного перекладу ділових паперів та кореспонденції.
    Нижче представлена класифікація електронних словників по їх основнимтехнічними й експлуатаційними характеристиками. Всю сукупність ЕС можнапідрозділити за такими критеріями.

    1. За операційної системи. Найбільш прості електроннісловники (DIC) працюють під управлінням ОС MS-DOS, починаючи з версій 2.21 та
    3.30, що дозволяє їх використовувати практично на будь-яких IBM-суміснихперсональних комп'ютерах, включаючи XT, АТ-286. Найбільш складні багатовіконнийі багатофункціональні ЕС, що дозволяють в одній оболонці підключати різнітематичні бази даних, що працюють під управлінням ОС WINDOWS 3.11, WINDOWS
    NT, WINDOWS 95 і т.д. Природно, що для їх успішного функціонуваннянеобхідний більш потужний компьтер (типу AT-486DX) з оперативною пам'яттю неменше 8 МБ.

    2. За способом завантаження. Чи можна підрозділити на нерезидентні ірезидентні. До перших відносяться найпростіші програми (наприклад,подстрочечний словник DIC), які працюють тільки у власному середовищі іне викликаються з інших оболонок, наприклад з текстових редакторів. Убільшості випадків вони функціонують у режимі автоматичного
    ( "пакетного") перекладу. Другі завантажують своє ядро в оперативну пам'ятькомп'ютера (наприклад, "LINGVO for DOS") і можуть викликатися у будь-який моментроботи комп'ютера, наприклад з будь-якого текстового редактора, за допомогоюнатискання комбінації "гарячих клавіш" - клавіш оперативного виклику. Цісловники забезпечують роботу перекладача в інтерактивному режимі.

    3. За кількістю підключаються словникових баз (словників). Ранні версії ЕСдозволяли підключати тільки один словник. Сучасні програми, наприклад
    "Система електронних словників LINGVO", незалежно від того, в якій ОС вонипрацюють, дозволяють підключати до декількох десятків словникових баз івстановлювати пріоритет останніх.

    4. По можливостях розширення словникової бази. Застарілі ЕС не малиможливості розширення словникових баз користувачем, сучасні версії,наприклад LINGVO 4.6 і вище, мають спеціальні утиліти для створення користувачемвачем власних і розширення існуючих словників.

    5. По режиму перекладу. Можна виділити два основних режими перекладу:автоматичний пакетний (подстрочечний) та інтерактивний (режим "запит --відповідь ").

    У першому сл?? чаї програма викликається з зазначенням імені текстового файла,який необхідно перевести, або маски для цілої групи текстових файлів,призначених для перекладу. Далі автоматично, без участі перекладача,проводиться прямий переклад кожного окремого слова з виводом на екранмонітора або на друкуючий пристрій тільки перекладених слів абовихідного тексту, під кожним словом переведеним якого буде стояти йогозначення українською мовою, під тими словами, яких не виявилося в ЕСзазвичай ставиться знак "?". Такий режим називається подстрочечним. Словниковібази подібних ЕС вельми обмежені, якість перекладу залишає бажатикращого. Подібні про граммние продукти навряд чи зможуть надати допомогупрофесій онального перекладачеві.

    У другому випадку програма працює таким чином. Після завантаженнярезидентної частини програми в оперативну пам'ять комп'ютера, користувач,працюючи, наприклад, в текстовому редакторі або безпосередньо в оболонцісловника, вводить з клавіатури невідоме слово на мові оригіналу, а потім,виділивши його, частіше за допомогою "миші", натисканням комбінації "гарячих клавіш"активізує ЕС, який замінює текст оригіналу на російськомовний переклад.
    Час доступу до перекладу складає приблизно 0,2 секунди, що значноприскорює роботу перекладача. Саме такі електронні словники, з урахуваннямможливості розширення та одночасного підключення кількох словниковихбаз, можуть значно полегшити і прискорити роботу перекладача будь-якогорівня професіоналізму.
    У будь-якому випадку, бум, пов'язаний з появою найпростіших електроннихсловників, що дозволяють відносно швидко зробити пошук того чи іншогослова, які вже в минулому. З розвитком технології систем OCR, про які я вжезгадувала, стали розроблятися автоматизовані системи машинногоперекладу. Про них і піде мова.

    3. КОМП'ЮТЕР НА МІСЦІ ПЕРЕКЛАДАЧА.

    Обчислювальна техніка, як відомо, гарна підмога людині врутинної роботи. Чи належить до таких занять переклад текстів? І так, інемає. З одного боку, праця перекладача багато в чому формальний, а з іншого --переклад не може бути виконаний суто формально. Є, наприклад, технічнийпереклад, де важливо знати прийняті за кордоном стандарти позначень тих чиінших понять. І є літературний переклад, коли потрібно отримати текст,з художньої цінності максимально близький до оригіналу. Чи можливодоручити таку роботу комп'ютера?
    Говорячи про МП, слід перш за все пам'ятати, що комп'ютер - створеннябездушне. Він не розуміє мовних нюансів, натяків у тексті, того, щоназивається тонкою грою слів. Та й, власне, зрозуміти зміст тексту вповною мірою йому не під силу. Мислення як такого при МП не відбувається:пропозиція розчленовується на частини мови, в ньому виділяються стандартніконструкції, слова і словосполучення переводяться за що знаходяться в пам'ятімашини словників. Потім перекладені частини мови збираються за правиламиіншої мови.
    Але цього, погодьтеся, недостатньо для повноцінного перекладу. Узалежно від того чи іншого стилю і призначення тексту одне й те ж словонерідко має різні значення. Певною мірою ця особливість враховуєтьсяв системах МП: передбачені змінні словники, іноді для кожного видутексту передбачений свій словник. Якщо лексики одного машинного словника невистачає і застосовуються кілька словників одночасно, можна вказатисистемі, з якого словника потрібно брати слово, якщо є кілька варіантівйого перекладу. Нарешті, програма сама може пропонувати на вибіркористувачеві кілька варіантів перекладу, і він вибирає підходящийваріант, так би мовити, вручну. Можуть виникнути і проблеми з перекладом слівв стійких словосполученнях і фразеологізмів, але це цілком під силукомп'ютера.
    Поряд з встановленими правилами побудови пропозиції в кожній мовііснують і свої неписані закони, які іноді називаються красоюмови. Наприклад, пропозиція англійською мовою «This is my book» дослівноперекладається «Це є моя книга», і формально це буде правильним, але по -русски так не говорять. У даному випадку можна сказати, що пропозиція
    «Написано так, ніби його склав іноземець». Звичайно, наведений прикладє найпростішим, і можливість виключення слова «is» дуже простовідображається в програмі МП. Але на практиці отриманий переклад схожий натекст, написаний іноземцем.
    Текст також може містити слова, які треба розуміти в контекстіспособу життя людей в конкретній країні. Наприклад, під словом «демократ» в
    США маються на увазі політики, які виступають за більшу втручаннядержави в економіку, а в Росії ті, хто виступає за більшу свободуринку. Це різні поняття.
    Заголовні букви і скорочення таять у собі й інші каверзи. Коли словопочинається з великої літери, його переклад буде починатися теж з великоюлітери. Слово, цілком складається з таких літер, також буде в перекладізаписано великими. В англомовній літературі досить часто зустрічаютьсязовні ефектні абревіатури, які можуть бути прочитані як одне слово.
    Така абревіатура і буде переведена єдиним словом.
    Таким чином, результати МП часто вимагають редагування. Наскількиадекватними можна вважати результати перекладу на комп'ютері? Цевизначається не тільки якістю системи МП, а й якістю подальшогоредагування. Нерідко систему МП використовує як підмогафахівець, якому потрібно швидко перевести, наприклад, технічнудокументацію. Тоді проблема коректного вживання термінів вирішуєтьсясама собою.
    Однак МП - це така специфічна область застосування комп'ютерів, упроблеми якої майже кожен відчуває себе більш-менш фахівцем.
    Давайте розглянемо, яким чином здійснюється переказ.

    4. ЯК переводить комп'ютер

    По-перше, всім ясно, що чим більше словник, тим краще переклад, значить,перша проблема - проблема створення великих словників для систем.
    По-друге, ясно, що система повинна перекладати такі пропозиції:
    «Привіт, як справи?». Це ще одна проблема - навчити системурозпізнавати стійкі обертів.
    По-третє, зрозуміло, що пропозиція для перекладу пишеться з певнихправилами, за певними правилами перекладається, а значить, є ще одинпроблема: записати всі ці правила у вигляді програми. Ось, власне, івсе.
    Найцікавіше, що ці проблеми дійсно є основними прирозробці систем МП, інша справа, що методи їх вирішення відомі далеко невсім і аж ніяк не такі прості, як може здатися.
    Системи МП сімейства PROMT (PROgrammer's Machine Translation) [7] - дужегарний об'єкт, щоб продемонструвати, яким чином ці проблеми можутьвирішуватися ефективно.

    4. 1. СЛОВНИК

    Для якісного перекладу дуже важливо, щоб практично всі словавихідного тексту легко було знайти і в словнику системи. А ті з них, якихв ньому немає, переносяться в текст неперекладеним вже на виході з системи, таїх згодом переводять вручну при редагуванні результатів перекладу.
    Такі слова можуть вплинути на якість перекладу пропозиції. Справа в тому,що для визначення, до якої частини мови відноситься розглянуте слово,система проводить аналіз усього пропозиції в цілому. При цьому імітуєтьсярозумова діяльність людини (таку систему прийнято називати системоюз елементами штучного інтелекту). Якщо значення хоча б одного словав пропозиції не визначено, то це може спотворити аналіз усьогопропозиції, а іноді і результати всього перекладу.
    Методи організації великих баз даних досить добре розроблені, аледля переказу не менш, а може бути, і більш важливо правильноструктурувати інформацію, яка приписується елементу бази, правильновибрати цей самий елемент. Скільки, наприклад, записів у словнику маєвідповідати звичайному російському слову "програма"? І, взагалі,великий словник - це словник, який містить багато словникових статей, абословник, що дозволяє розпізнати багато слів з тексту?
    При найближчому розгляді виявляється, що, наприклад, іменники вросійською мовою змінюються за відмінками і по числах, тобто для одногоіменника може існувати до 12 різних форм, а для дієслів іприкметників, як правило, існує ще більша кількість різнихформ (понад тридцять). Отже, щоб перекладати пропозиції,що містять слова "програму", "програмі", "програми" і т.д., добре булоб мати спосіб співвіднесення словникової статті з автоматичного словника дляслова "програма" з відповідною словоформи з тексту. Тому дляопису та вхідного, і вихідного мови в системі повинен існуватидеякий формальний метод опису морфології, на якому грунтуєтьсявибір одиниці словника.
    У системах сімейства PROMT розроблено практично унікальне по повнотіморфологічний опис для всіх мов, з якими системи вміютьзвертатися. Воно містить 800 типів словозміни для російської мови, більш
    300 типів як для німецької, так і для французької мови, і навіть дляанглійської, який не належить до флективною мовам, виділено понад 250типів словозміни. Безліч закінчень для кожної мови зберігається у виглядідеревних структур, що забезпечує не тільки ефективний спосіб зберігання,але і ефективний алгоритм морфологічного аналізу.
    Крім того, використовувана модель морфології дозволила розробитиекспертну систему для користувача - творця словника. Ця системафактично автоматизує процедуру виділення основи і визначення типусловозміни при введенні нових словникових статей.
    Однак розробка опису морфології дозволяє вирішити тільки проблемутого, що є заголовком словникової статті, за яким відбуваєтьсяідентифікація одиниці тексту і одиниці словника. Але ж ідентифікація словаз тексту зі словникової статті відбувається не заради ідентифікації, як цепотрібно в електронних словниках, вона необхідна для виконання програмоювласне процедур перекладу. Яка ж потрібна інформація в словникової статтіі як мають бути описані правила перекладу для того, щоб програмаперекладала?

    4. 2. ГРАМАТИКА

    З розвитком МП як галузі прикладної лінгвістики з'явилося безлічлінгвістичних робіт, які пропонували структуру опису властивостей живого словав словникової статті машинного словника. При цьому абсолютно окремоз'являлися дослідження, що описують, наприклад, "структуру іменний групи"або "способи вираження прямого доповнення для дієслів говоріння".
    Наприклад, на основі ознаки "приналежність до частини мови" описуваласяграматика такого типу:

    • іменна група - це іменник

    • іменна група - це прикметник + іменна група

    • дієслівна група - це дієслово + іменна група "/p>

    • пропозиція - це іменна група + дієслівна група
    Зрозуміло, що деяка частина пропозицій природної мови описуєтьсятакий граматикою, але ця частина дуже незначна, і на її основі не можнаправильно аналізувати і переводити хоч скільки-небудь реальний текст. Алезате можна використовувати ефективні методи побудови перетворювача позаданої граматики або, на худий кінець, написати програму, яка шляхомперебору побудує дерева залежностей для обмеженої множинипропозицій.
    Стало прийнятим ділити системи перекладу на системи типу TRANSFER і системитипу INTERLINGUA. Це розділення засноване на особливостях архітектурнихрішень для лінгвістичних алгоритмів.
    Алгоритми перекладу для систем типу TRANSFER будуються як композиція трьохпроцесів: аналіз вхідного пропозиції в термінах структур вхідного мови,перетворення цієї структури в аналогічну структуру вихідної мови
    (TRANSFER) і потім синтез вихідного пропозиції щодо отриманої структурі.
    Системи типу INTERLINGUA припускають апріорі наявність деякогометамови структур (INTERLINGUA), на якому можна описати всі структурияк вхідного, так і вихідного мов в загальному випадку, тому алгоритмпереказу в системі типу INTERLINGUA передбачається як більш простий:аналіз вхідного пропозиції в термінах метамови і потім синтез зметаструктури відповідної пропозиції вихідного мови. "Единственная"складність у цьому випадку - розробити сам метамова і описати природниймова у відповідних термінах.
    Незважаючи на те, що ця класифікація існує, і в середовищі розробників
    МП вважається гарним тоном запитати, до якого типу відноситься ваша система,не було розроблено ще не однієї реальної системи, заснованої на принципі
    INTERLINGUA.
    Тому аналіз простих речень як структур, що складаються зсинтаксичних одиниць, відбувається на основі фреймових предикативнихструктур, які дозволяють ефективно виконувати перетворення. Дієслововважається для простих пропозицій головним елементом і його валентностівизначають заповнення відповідного фрейму. Для кожного типу фреймівіснує деякий закон перетворення у вихідний фрейм і оформленняактантов. Таким чином, здійснюється TRANSFER на рівні пропозицій.
    Аналіз складних речень потрібно в разі формування узгодженнячасів і правильного перекладу спілок.
    Хотілося б сподіватися, що ці відомості дозволять потенційнимкористувачам систем переказу зрозуміти, що створення системи МП - завдання нетака й проста, і, що називається, наукомістка. А, отже,кількість дійсно придатних до використання систем перекладу, щоможе з'являтися в одиницю часу, принципово обмежена.
    У будь-якому випадку, стилістичні і граматичні огріхи машинного перекладукомпенсуються приголомшливою швидкістю отримання його чорновий варіант.

    5. Відповідь критикам МАШИННОЇ ПЕРЕКЛАДУ

    або Чому популярні програми-перекладачі

    Перш ніж розповісти докладніше про безліч програм-перекладачів, меніхотілося б відповісти на самий, на мій погляд, поширений питання,який піднімається, як тільки заходить мова про МП:
    «Переклади з російської на англійську та з англійської на російський невитримують жодної критики. Невже повноцінний машинний переклад залишаєтьсявсе ще справою майбутнього? »
    Можна, звичайно, було б проігнорувати це питання, хоча б тому щосам рівень організації, що проводила тестування поза підозрою, та йпопулярність як систем, так і сервісу в Інтернеті, організованому на сайтіhttp://www.translate.ru (понад 200.000 переказів за місяць!) демонструютькорисність і затребуваність МП. Однак саме зараз, в першу чергу взв'язку з розвитком Інтернет, коли МП стає все більше і більшенеобхідною суспільству, нам представляється корисним обговорити ще раз темупотрібні або не потрібні системи МП.
    У нашій країні розробка систем МП ведеться вже понад 35 років, афахівці компанії ПРОМТ займаються цією проблемою понад 20 років, протедо цих пір ця сфера комп'ютерної індустрії викликає багато різнихдискусій. Часто доводиться чути від критиків систем МП: «Програми -перекладачі перекладають погано, незрозуміло кому вони взагалі потрібні. Набагато простішевіддати текст "живому" перекладачеві або вивчити мову самому ». Причому, дожаль, різкість критики часто буває обернено пропорційна знаннюмови. Компанія, безумовно, не намагається звинуватити в цьому критиків івважає, що особисто їм рухає прагнення до досконалості.
    Отже, комп'ютер поки що багато в чому не може замінити перекладача. Чи вартотоді взагалі застосовувати системи машинного перекладу? Звичайно, варто. Якщокомп'ютер використовується для перекладу літературних текстів, то виходитьчорновий варіант тексту, так званий підрядник, який перетворюється натвір мистецтва людиною, слабо володіють мовою оригіналу, алещо є хорошим літературним редактором. Якщо ж мова йде про переведеннятехнічних текстів, то тут при правильному виборі словника поспеціальності, в рамках якої написаний текст, виходить цілкомзадовільний результат, іноді не вимагає подальшоговтручання. Взагалі необхідність редагування комп'ютерного перекладудуже часто виникає у зв'язку з проблем, що вказані вище. Для цьогосистеми машинного перекладу обов'язково мають засоби редагуваннятекстів.
    Для деяких замовників такий рівень перекладу просто неприйнятний.
    "Машинний переклад - це міф, - вважає Лінн Сешедрі, консультант однієї зслужб корпорації Electronic Data Systems (Плейно, шт. Техас), який бравучасть у створенні глобальної інтрамережі компанії. - Можливо, він годитьсядля технічної документації, але у всіх інших випадках ви отримуєте 15%глузду і 85% нісенітниці ". Дляперекладу змісту своєї інтрамережі EDSкористується послугами професійних перекладачів на контрактній основі.
    Проте інших машинний переклад цілком влаштовує, в значній мірітому, що часто йому просто немає реальних альтернатив. Паризький фонд "Зарозвиток гуманізму "(FPH) в свій час також стояв перед вибором: витрачатиЧи істотну частину свого бюджету на перекладачів або випробуватизасоби машинного перекладу. Ця організація, що фінансується з приватнихджерел, випускає доповіді з екології, економіці та ряду іншихобластей, залучаючи для їх створення інтернаціональні колективи вчених. Їївибір впав на технологію машинного перекладу, а точніше, на продукт фірми
    Globalink, що є цілком якісне та недороге додатокдля ПК. FPH встановив його на сервер електронної пошти, щоб спілкуванняфахівців, які говорять різними мовами, було простіше й ефективніше.
    "Це хороше рішення, - вважає Марина Урквіді, консультант з FPH. -
    Багато людей воліли б працювати не на англійській, а на своєму рідномумовою. Тепер у них є така можливість ". Вона не заперечує, що машиннийпереклад має свої недоліки, однак переконана, що якщо людина захоче,він зможе зрозуміти переклад, зроблений машиною. "Якщо ви трохи подумаєте, тозумієте зрозуміти, про що йде мова ". Таким чином, якщо не вимагати від МПзанадто багато чого, то, можливо, обіцянка Беббіджа про машинний переклад все ж такивиповниться.

    6. МАШИННИЙ ПЕРЕКЛАД - ЦЕ ... ІНСТРУМЕНТ
    Всім добре відомо, що гарний переклад тексту - це не тількитворча, а й досить трудомістка робота. Причому навіть самий гарнийпереклад, як правило, потребує редакторської правки. Що стосуєтьсятворчої частини, то в доступному для огляду майбутньому в змаганні комп'ютер-людиназавжди переможе "живий" перекладач. Однак для вирішення проблем,обумовлених трудомісткістю процесу перекладу, системи МП можуть виявитисягарною підмогою. Для того щоб це краще зрозуміти, перерахуємо гідностіпрограм машинного перекладу (загальні для всіх систем МП взагалі і систем PROMTзокрема):
    1. Висока швидкість. Усього кілька секунд і Ви отримуєте перекладбагатосторінкового тексту. Це дозволяє швидко зрозуміти зміст тексту, а якщосистема налаштована на переклад текстів цієї тематики, потрібна мінімальнаредакторська правка.
    2. Низька вартість. Це дуже легко оцінити: якщо ви звертатись допрофесійним перекладачам, доводиться платити за кожну сторінкуперекладеного тексту (залежно від регіону і рівня кваліфікаціїперекладача сторінка перекладу буде коштувати від 5 до 20 доларів), або винаймаєте штатного перекладача, якому доводиться платити зарплату. Увипадку з системою машинного перекладу, ви платите гроші тільки один раз --при покупці програми. Що ви віддасте перевагу - разове капіталовкладення аборегулярні витрати? За даними користувачів компанії ПРОМТ при перекладі від
    50 сторінок тексту на місяць програма-перекладач PROMT 98 окупається приблизноза місяць.
    3. Доступ до послуги. Важливий фактор, який багато критиків систем

         
     
         
    Реферат Банк
     
    Рефераты
     
    Бесплатные рефераты
     

     

     

     

     

     

     

     
     
     
      Все права защищены. Reff.net.ua - українські реферати !