ПЕРЕЛІК ДИСЦИПЛІН:
  • Адміністративне право
  • Арбітражний процес
  • Архітектура
  • Астрологія
  • Астрономія
  • Банківська справа
  • Безпека життєдіяльності
  • Біографії
  • Біологія
  • Біологія і хімія
  • Ботаніка та сільське гос-во
  • Бухгалтерський облік і аудит
  • Валютні відносини
  • Ветеринарія
  • Військова кафедра
  • Географія
  • Геодезія
  • Геологія
  • Етика
  • Держава і право
  • Цивільне право і процес
  • Діловодство
  • Гроші та кредит
  • Природничі науки
  • Журналістика
  • Екологія
  • Видавнича справа та поліграфія
  • Інвестиції
  • Іноземна мова
  • Інформатика
  • Інформатика, програмування
  • Юрист по наследству
  • Історичні особистості
  • Історія
  • Історія техніки
  • Кибернетика
  • Комунікації і зв'язок
  • Комп'ютерні науки
  • Косметологія
  • Короткий зміст творів
  • Криміналістика
  • Кримінологія
  • Криптология
  • Кулінарія
  • Культура і мистецтво
  • Культурологія
  • Російська література
  • Література і російська мова
  • Логіка
  • Логістика
  • Маркетинг
  • Математика
  • Медицина, здоров'я
  • Медичні науки
  • Міжнародне публічне право
  • Міжнародне приватне право
  • Міжнародні відносини
  • Менеджмент
  • Металургія
  • Москвоведение
  • Мовознавство
  • Музика
  • Муніципальне право
  • Податки, оподаткування
  •  
    Бесплатные рефераты
     

     

     

     

     

     

         
     
    Логічна граматика
         

     

    Культура і мистецтво

    Логічна граматика

    Логіка граматики перетворилися з плином років у інструментарій високого рівня, і тепер вони дозволяють користувачеві сконцентруватися на лінгвістичних феномени. Граматики, побудовані на певних пропозиціях, підтримують використання логіки для обробки даних природної мови, і вони підготували грунт для практичної роботи лінгвістів мовою програмування PROLOG.

    ГРАМАТИКА, Побудований на певні пропозиції (DEFINITE-CLAUSE GRAMMAR або DCG)

    Проведення робіт з дослідження побудови граматик для розуміння природної мови (далі ЕЯ) набула великої популярності після введення Колмеройером в 1975 році граматичних формалізмів, заснованих на пропозиціях Хорна. Так звані метаморфозне граматики (metamorphosis grammars або MGs) визначили зростання зацікавленості в області вирази лінгвістичних понять в логіці (qv) і заклали основу для створення якісних блоків попередньої обробки даних (процесорів введення-виведення) і інтерфейсів. Основне застосування результати цих дослідних робіт знайшли в консультуванні та створення баз даних на основі ЕЯ, виробленню питань і відповідей, перекладі текстів і синтезі текстів, виходячи з належним чином оформлених специфікацій.

    Поняття граматик, побудованих на певних пропозиціях (DCGs), як особливого випадку метаморфозне граматик, було введено в 1978 році Перейра і Уорреном як граматичного формалізму, для якого PROLOG має ефективний механізм синтаксичного аналізу. Одні практичні системи були створені для одночасного використання синтаксичного і семантичного знання для привнесення логіки в структуру, утримуючи в собі інформацію для семантичної інтерпретації. Інші системи були побудовані більш як на одному рівні трансляції; використання синтаксичного і семантичного знання здійснювалося окремо один від одного, і кінцевим результатом було в PROLOGе пропозицію Хорна, виконання якого здійснювалося механізмом планування (qv).

    Техніка екстрапозіціонних граматик (extraposition grammars або XGs) була запропонована Перейра для опису певних глобальних відносин або екстрапозіцій, таких як зв'язок між відносним займенником та його записом. Зрештою розробки зразок граматик структури визначень (modifier structure grammars або MSGs) Даля і МакКорд, деревовидних граматик (tree grammars або TGs) Колмеройера і ускладнених граматик (puzzle grammars або PGs) Сабатьє збільшили силу вираження лінгвістичних понять.

    Всі ці дослідні роботи за граматичними формалізму, які замішані на логіці, стали можливі і простіше у здійсненні після вибору PROLOGа, мови програмування заснованого на підмножині логіки першого порядку.

    ЛОГІЧНИХ ГРАМАТИКА

    Граматики описують структуру (синтаксис) мов безліччю продукцій (правил, переробних текст). Наприклад, правилом

    sentence -> noun-phrase verb-phrase

    встановлюється зв'язок між трьома нетермінальнимі символами: пропозиція може складатися з іменної групи і наступної за нею дієслівної групи.

    Такі правила можуть бути відображені в PROLOGе наступним чином:

    sentence (S1, S3): - noun-phrase (S1, S2), verb-phrase (S2, S3).

    verb-phrase (S1, S2): - connects (S1, writes, S2).

    connects (1, each, 2).

    connects (2, author, 3).

    connects (3, writes, 4).

    (Примітка: предикати (тобто вислову з невизначеними термінами, або змінними, які перетворюються на справжні або помилкові висловлювання при виборі конкретних значень для цих самих термінів) заносяться в PROLOG через кому. Змінні відрізняються від констант перше великою літерою.)

    У нижченаведеної запису числа позначають початок і кінець кожного слова:

    1each2 author3 writes4

    Для перевірки правильність побудови пропозиції, необхідно вказати мету

    ? - Sentence (1, 4).

    (де? -- бінарне позначення структури (або бінарний функторів), що міститься в будь-якій системі PROLOG) і продемонструвати, що вона підтверджується попередніми умовами. Використовуючи список як інформаційної структури для подання пропозиції, числа більше не потрібні, тому що PROLOG має пристрій синтаксичного аналізу, здатного перевести:

    ? - Sentence ([each, author, writes]. []).

    Граматики, побудовані на певних пропозиціях, є обсягом поняття контекстно-вільних граматик, які також можуть бути трансльовані на мову PROLOG. Граматики, побудовані на певних пропозиціях, дозволяють будь-якому логічного виразу стати нетермінальним, вони побудовані на логічних символах: константах, змінних, вирази, - а не тільки на одних константах. Також вони мають тільки один нетермінальний символ в лівій частині кожного правила. Контекстні залежності (контекстні відносини підпорядкування) описуються логічними змінними в рамках параметрів (або незалежних змінних) граматичних символів.

    У правила граматики, побудованої на певних пропозиціях, наступна форма:

    nonterminal symbol -> body (основна частина програми).

    де "body" ( "Основна частина") є послідовністю одного або більше елементів даних, відокремлених один від одного комами. Кожен елемент даних є або нетермінальним символом, або послідовністю термінальних символів. Значення правила полягає в тому, що "основна частина" - це можлива форма для групи типу "нетермінальний символ". У PROLOGе нетермінальний символ записується як вираз (а не як список), а послідовність термінальних символів - у вигляді списку.

    У правій частині правила поряд з нетермінальнимі символами і списком термінальних символів можуть перебувати послідовності викликів процедур, записуваних в фігурних дужках ((and)). Вони використовуються для вираження додаткових умов, які в обов'язковому порядку повинні виконуватися, щоб правило діяло. Нетермінальний символ перетворюється в (N + 2)-місцевий предикат (що має ідентичне назва), чиї перший N параметри повністю описані в нетермінальном символі і чиї останні два параметри є такими ж, як і при трансляції контекстно-вільного нетермінального символу. Виклики процедур в правій частині правила транслюються так, як вони є.

    Кожне граматичне правило, типу

    p (X) -> q (X).

    отримує групу вхідних даних, аналізує певну вихідну частину і генерує залишок для подальшого аналізу. Це приватне правило транслюється системою PROLOG як

    p (X, S0, S): - q (X, S0, S).

    Отже, система граматичної індексації в PROLOGе забезпечує більш стислу запис, коли параметри для груп входять і виходять даних неявно виражені.

    Коли в правилі містяться термінальні символи, вони транслюються з присудком "connects". Наприклад,

    connects (S1, X, S2)

    означає, що суть S1 пов'язана через X із суттю S2.

    Правило

    p (X) -> (older), q (X), (high).

    перетвориться в        

    p (X, S0, S): -         

    connects (S0,   older, S1),                      

    q (X,   S1, S2),                      

    connects (S2,   high, S).     

    АНАЛІЗ ЕЯ

    У 1977 році Колмеройер ввів загальну схему аналізу ЕЯ, що стало вирішальним кроком вперед і викликало величезний інтерес у галузі використання логічних граматик як альтернативи міцно утвердженим граматика розширених мереж переходів (augmented transition network grammars). З історичної точки зору, це можна визнати поворотним пунктом, тому що був зазначений метод перетворення пропозицій ЕЯ у логічні структури. Метод полягав у розгляді найпростіших висловлювань, що містять власні імена іменники, якою б то не було артикль у вигляді квантора (кванторного слова) з трьома операціями переходу і чотири пріоритетних правила, для вирішення проблеми ієрархії квантування (кількісного вимірювання якісних ознак).

    Короткий огляд загальної схеми спонукає до подальшого розвитку прийомів складання логічних граматик. Наприклад, пропозиція

    Chomsky is (a) writer

    містить ім'я власне, і дієслово "to be" перетворюється в формулу

    writer (chomsky)

    Головним чином дієслова, прикметники, іменники вводять характеристики з n параметрами. Для дієслів, n може дорівнювати 1 [непереходние дієслова] або N 1 [перехідні дієслова, де N - кількість комплементов (доповнень, наступних за дієсловом у складеному присудком і описують його підмет)]. Для прикметників і іменників n дорівнює або більше 1 (відносини, де n - це n-місце його параметрів). Параметри представляють в пропозиції доповнення при імені іменник, дієслово або прикметник.

    Наприклад, пропозиція

    Chomsky writes a book

    містить дієслово "Write", іменник "book" та артикль "a" і може бути замінено наступної формою:

    for a

    B

    such that

    B is (a) book (1)

    it is true that

    Chomsky writes B (2)

    де (1) і (2) є простими висловлюваннями.

    Ця ж логічна структура може бути записана в стенографічних індексах:

    a (B, book (B), writes (Chomsky), B )).

    Зверніть увагу, що висловлювання (1) і (2) перетворюються у формули "book (B)" і "Writes (Chomsky, B)," відповідно.

    Логічна структура відображає суть пропозиції, і кожна з її складових частин відповідає змістом відокремлених слів згідно з принципом Фреже. Записи, передавальні значення, вказуються як логічні структури, тому що єдиним з області значення, що люди навчилися точним чином представляти у вигляді записи в ЕОМ, є логічні відносини.

    Всякий артикль a представляє квантор q (кванторное слово) з трьома операціями переходу, що створює нову формулу з змінної x і двох формул f1 і f2,

    q (x, f1, f2).

    Ця формула відповідає висловом

    for a x such that e1, it is true that e2

    де e1 та e2 є простими висловлюваннями відповідними f1 і f2.

    Наприклад, пропозиція

    Chomsky writes a book for each publisher

    містить дієслово "Write", два іменників ( "book" та "publisher") і два артикля ( "a" і "Each") і може бути замінено наступною формою:

    for each P such that P is a publisher it is true that for a B such that B is a book, it is true that Chomsky writes B for P

    Пропозиція перетвориться в логічну структуру

    each (P,

    publisher (P),

    a (B,

    book (B),

    writes-for (Chomsky, B, P ))).

    Ця логічна структура відображає наступне пріоритетне правило: в конструкції з використанням імені іменника (book) і його додатки (publisher), квантування, представлене артиклем при додаток, впливає на квантування, представлене артиклем при іменника. Крім цього правила Колмеройер запропонував ще 3 пріоритетних правила для організації можливості квантування.

    АНАЛІЗ КОЛМЕРОЙЕРА ПЕВНІЙ ЕЯ

    Загальна схема аналізу була спочатку запропонована Колмеройером для французької та англійської мов. Пізніше Даль адаптував її для іспанського, Коелхо - для португальської, а Пік запропонував іншу семантику для артиклів французької мови.

    ЗАГАЛЬНА СХЕМА АНАЛІЗУ КОЛМЕРОЙЕРА ЯК Граматика, Побудований на ВИДУ ПРОПОЗИЦІЇ (DCG)

    DCGs підтримують процеси синтаксичного аналізу і транслювання завдяки взятим ними на озброєння з підмножини ЕЯ, необхідних елементів синтаксису і семантики. Процес синтаксичного аналізу складається з докази, що ланцюжок слів є законним і правильно побудованим пропозицією (з точки зору обраного синтаксису). Процедура докази здійснюється через дослідницьку стратегію (з кінця на початок, зверху вниз, зліва направо) і через правило умовиводу (логічного висновку), де висновком є qv, вже після відпрацювання системи PROLOG. Трансляція полягає в зображенні кожної пропозиції у вигляді логічної структури. Ця структура складається з правильно побудованих формул певної логічної системи, яка грунтується на обсязі поняття логіки предикатів (qv).

    Механізм транслювання виражається як безліч певних пропозицій логіки через граматичні правила PROLOGа. Він (механізм) може містити, як разом, так і окремо синтаксичні і семантичні знання з підмножини розглянутого ЕЯ. Механізм синтаксичного аналізу залежить від системи PROLOG, і він може бути розкритий включенням відслідковує пристрою. Трансляція і синтаксичний аналіз - незалежні один від одного процеси, їх незалежність дозволяє легше проводити зміни у граматиці.

    Спрощена граматика, що позначається через G, розглядається в такий спосіб. Вона виробляє синтаксичний аналіз англійських пропозицій, одночасно породжуючи відповідні їм логічні структури. Граматика визначається 2 модулями:

    синтаксис + семантика

    морфологія

    і має справу з пропозиціями типу: Hodges writes for Penguin.

    СИНТАКСИС + СЕМАНТИКОЮ

    sentences (S) ->-noun phrase (NP, S2, O),

    verb ([subject-X | L], O1),

    complements (L, O1, O2).

    complements ([], O, O) -> [].

    complements ([KN | L], O1, O3) -> complements (L, O1, O2),

    case (K),

    noun-phrase (N, O2, O3).

    noun-phrase (N, O2, O4) -> article (N, O1, O2, O3),

    common-noun ([subject-N | L], O1),

    complements (L, O3, O4).

    noun-phrase (PN, O, O) -> [PN], (proper-noun (PN )}.

    article [A, O1, O2 and (O1, O2)] -> [a].

    case (for) -> [for].

    case (direct) -> [].

    МОРФОЛОГІЯ

    verb ([subject-A, for-P], is-published-by (A, P)) -> [writes].

    common-noun ([subject-P], publisher (P)) -> [publisher].

    proper-noun (hodges).

    proper-noun (penguin).

    Наприклад, правило:

    noun-phrase (PN, O, O) -> [PN], (proper-noun (PN )}.

    представляє собою структуру:

    noun-phrase (PN, O, O, S0, S): - connects (S0, PN, S),

    proper-noun (PN).

    Перше правило граматики G, по ідеї, визнається справедливим лише для пропозицій, в яких за іменний групою слід дієслово можливо з деякими доповненнями. Перше граматичне правило для додатків допускає їх відсутність (термінальний символ [] виступає в ролі порожнього списку), друге правило для додатків визначає послідовність додатків як групу даних, складену з доповнення, відмінка та іменний групи.

    Різні параметри відмінних один від одного нетермінальних символів пов'язані однієї і тієї ж логічної змінної. Це дозволяє будувати структури в процесі об "єднання.

    Іменна група "A publisher" аналізується і транслюється граматичним правилом як:

    noun-phrase (N, Oa, Ob) -> article (N, Oc, Od, Oe),

    common-noun (N, of),

    (constraints (Oa, Ob, Oc, Od, Oe, Of )}.

    Зауважте, що це правило - спрощена версія четвертого правила представленої граматики G. Нетермінальний символ для іменної групи має 3 параметри. Інтерпретація останнього параметра Ob буде залежати від характеристики Oa індивідуума N, так як у загальному іменна група містить артикль, такий як "a".

    Тепер дивися на праву частину правила. Слово "a" має інтерпретацію Oe,

    and (Oc, Od)

    в контексті двох характеристик Oc і Od індивідуума N. Характеристика Oc буде відповідати, що залишилася, іменний групи, яка містить слово "a", а характеристика Od випливає із залишку пропозиції. Значить, Oe буде містити всеосяжну інтерпретацію і зв'язуватися з Ob через одну і ту ж змінну. Так як Of є характеристикою номінальною іменника, вона зв'язується з Oc однієї і тієї ж змінної. Oa має опис характеристик N, а також залежить від функцій, що залишилася, пропозиції. Тому Oa зв'язується з Od через одну і ту ж змінну.

    Кожне слово асоціюється з характеристикою. Наприклад, значення дієслова "writes" вводиться ставленням "is-published-by (A, P)". Дієслівні правило також містить інформацію про характеристики відносини, а саме те, що "A" грає роль підлягає пропозиції а "P" "нав'язує" використання прийменника "for". Значення невизначеного артикля "a" вводиться кон'юнкція "and (O1, O2)" згідно визначення, прийнятого в класичній логіці.

    Більше просунута в порівнянні з G граматика мала б більш скрупульозно розроблені дефініції іменників, дієслів, прикметників, артиклів:

    noun ([A-[] & author & type-X], pr (author (X))) -> No (author, A).

    no (Type, GN) -> [Noun], (no1 (Noun, Type, GN )}.

    no1 (author, author, mas-sin).

    verb ([(G-N)-V & type-X, dir-A-W & title-Y], pr (author (X, Y))) -> ve (writes, N).

    ve (Type, N) -> [Verb], (ve1 (Verb, Type, N )}.

    ve1 (writes, writes, sin).

    adjective ([A-() & author & type-X, prep (by )-_-[ ] & pub & type-Y], pr (published (Y, X))) -> ad (pub, A).

    ad (Type, GN) -> [Adj], (ad1 (Adj, Type, GN )}.

    ad1 (published, pub, mas-sin).

    article (G-sin)-DX, O1, O2, for ([X, D] and (O1, O2)), cardinality (X, greater, 0))) art-ind (G-sin).

    art-ind (mas-sin) -> [a]; [some].

    (Зауваження: безіменні змінні записуються в PROLOG як "_".)

    Ці дефініції включають синтаксичні і семантичні перевірки, такі як граматичний рід, число, семантичні типи. Значення артикля також відрізняється. Замість квантора з двома операціями переходу воно було введено квантором з трьома операціями переходу. Перша операція переходу - квантування змінної X, другий - для основної характеристики "and" змінної X, третій - для точного визначення характеристики (потужності множини) і обмеження області змінної X.

    ОБЛАСТЬ ПОНЯТЬ граматик, Побудований на?? ПРЕДЕЛЕННИХ пропозиції

    Екстрапозіціонние граматики (XGs) збільшують потужність DCGs при перерахуванні контекстних залежностей. Правила XG можуть мати у своїй лівій частині більше одного нетермінального символу і символ пробілу "", що виражає випадкову ланцюжок логічних символів (термінальних і нетермінальних). Наприклад, правило екстрапозіціонной граматики

    Relative-marker. . . complement -> [that].

    стверджує, що відносний займенник "that" може бути проаналізовано як відносний показник, за яким слідують якісь невідомі фрази, а потім доповнення.

    XGs спрощують вираз синтаксичних уявлень і отже дозволяють спростити трактування семантичних і логічних описів. Параметри для нетермінальних символів використовуються (як і в DCGs) для перевірок узгодження, виробництва дерева синтаксичного аналізу і обмеження можливості приєднання постмодіфікаторов.

    Граматики структури визначень (MSGs) збільшують ймовірність точного опису несінтаксіческіх репрезентацій. Вони спрощують автоматичне моделювання таких репрезентацій при одночасно відбувається аналізі.

    Деревоподібні (або деревні) граматики (TGs) дозволяють краще орієнтувати лінгвістичні конструкції.

    ускладнені граматики (PGs) є засобом, розробленим спеціально для потреб лінгвістів. Правила їх стратегії описують порядок і режим трансляції, і описуються ці правила незалежно один від одного.

    Список літератури

    Для підготовки даної роботи були використані матеріали з сайту http://www.ed.vseved.ru/

         
     
         
    Реферат Банк
     
    Рефераты
     
    Бесплатные рефераты
     

     

     

     

     

     

     

     
     
     
      Все права защищены. Reff.net.ua - українські реферати ! DMCA.com Protection Status