ПЕРЕЛІК ДИСЦИПЛІН:
  • Адміністративне право
  • Арбітражний процес
  • Архітектура
  • Астрологія
  • Астрономія
  • Банківська справа
  • Безпека життєдіяльності
  • Біографії
  • Біологія
  • Біологія і хімія
  • Ботаніка та сільське гос-во
  • Бухгалтерський облік і аудит
  • Валютні відносини
  • Ветеринарія
  • Військова кафедра
  • Географія
  • Геодезія
  • Геологія
  • Етика
  • Держава і право
  • Цивільне право і процес
  • Діловодство
  • Гроші та кредит
  • Природничі науки
  • Журналістика
  • Екологія
  • Видавнича справа та поліграфія
  • Інвестиції
  • Іноземна мова
  • Інформатика
  • Інформатика, програмування
  • Юрист по наследству
  • Історичні особистості
  • Історія
  • Історія техніки
  • Кибернетика
  • Комунікації і зв'язок
  • Комп'ютерні науки
  • Косметологія
  • Короткий зміст творів
  • Криміналістика
  • Кримінологія
  • Криптология
  • Кулінарія
  • Культура і мистецтво
  • Культурологія
  • Російська література
  • Література і російська мова
  • Логіка
  • Логістика
  • Маркетинг
  • Математика
  • Медицина, здоров'я
  • Медичні науки
  • Міжнародне публічне право
  • Міжнародне приватне право
  • Міжнародні відносини
  • Менеджмент
  • Металургія
  • Москвоведение
  • Мовознавство
  • Музика
  • Муніципальне право
  • Податки, оподаткування
  •  
    Бесплатные рефераты
     

     

     

     

     

     

         
     
    Семантична мережа
         

     

    Інформатика, програмування
    Семантичної Мережі.

    Семантична мережа - структура для представлення знань у вигляді вузлів, сполучених дугами. Найперші семантичні мережі були розроблені в якості мови-посередника для систем машинного перекладу, а багато сучасних версії до цих пір подібні за своїми характеристиками з природною мовою. Однак останні версії семантичних мереж стали більш потужними і гнучкими і складають конкуренцію фреймових системам, логічного програмування й інших мов подання.

    Починаючи з кінця 50-х років було створено та застосовано на практиці десятки варіантів семантичних мереж. Незважаючи на те, що термінологія і їх структура розрізняються, існують подібності, притаманні практично всім семантичним мережам:

    1. вузли семантичних мереж являють собою концепти предметів, подій, станів;

    2. різні вузли одного концепту відносяться до різних значень, якщо вони не помічене, що вони належать до одного концепту;

    3. дуги семантичних мереж створюють відносини між вузлами-концептами (позначки над дугами вказують на тип відношення);

    4. деякі відносини між концептами являють собою лінгвістичні відмінки, такі як агент, об'єкт, реципієнт та інструмент (інші означають тимчасові, просторові, логічні відносини і відносини між окремими пропозиціями;

    5. концепти організовані по рівнях відповідно до ступеня узагальненості так як, наприклад, сутність, жива істота, тварина, м'ясоїдна,;

    Однак існують і відмінності: поняття значення з точки зору філософії; підходи щодо подання кванторів спільності та існування і логічних операторів; способи маніпулювання мережами і правила виводу, термінологія. Все це варіюється від автора до автора. Попри деякі відмінності, мережі зручні для читання й обробки комп'ютером, а також досить потужні, щоб представити семантику природної мови.

    ІСТОРИЧНА ДОВІДКА.

    Фреге представив логічні формули у вигляді дерев, які однак мало нагадують сучасні семантичні мережі. Ще одним піонером став Чарльз Сандерз Прис, який використовував графічні записи в органічної хімії.

    Він сформулював правила висновки з використанням екзистенційних графів.

    У психології Зельц використовував графи для представлення спадковості деяких характеристик в ієрархії концептів. Наукові дослідження Зельци мали величезний вплив на вивчення тактики в шахах, який у свою чергу вплинув на таких теоретиків, як Саймон і Ньюелл.

    Що стосується лінгвістики, то першим вченим, що займається розробкою графічних описів, став Теньєр. Він використав графічну запис для своєї граматики залежностей. Теньєр зробив величезний вплив на розвиток лінгвістики в Європі.

    Вперше семантичні мережі були використані в системах машинного перекладу в кінці 50-х - початку 60-х років. Перша така система, яку створила Мастерман, включала в себе 100 примітивних концептів таких, як, наприклад, НАРОД, РЕЧІ, РОБИТИ, БУТИ. За допомогою цих концептів вона описала словник обсягом 15000 одиниць, в якому також був механізм переносу характеристик з гіпертіпа на підтип. Деякі системи машинного перекладу базувалися на кореляційних мережах Цеккато, які представляли собою набір 56 різних відносин, деякі з яких - відмінкові відносини, відносини підтипу, члена, частини і цілого. Він використовував мережі, що складаються з концептів та відносин для керівництва діями парсера та дозволи неоднозначностей.

    У системах штучного інтелекту семантичні мережі використовуються для відповіді на різні питання, вивчення процесів навчання, запам'ятовування і міркувань. Наприкінці 70-х мережі отримали широке розповсюдження. У 80-х роках кордону між мережами, фреймових структурами та лінійними формами запису поступово стиралися. Виразна сила більше не є вирішальним аргументом на користь вибору мереж або лінійних форм запису, оскільки ідеї записані за допомогою однієї форми запису можуть бути легко переведені в іншу. І навпаки, особливо важливе значення одержали другорядні чинники, як чіткість, ефективність, неіскусственность і теоретична елегантність, також враховуються легкість введення в комп'ютер, редагування та друк.

    Реляційна Граф.

    Найпростіші мережі, які використовуються в системах штучного інтелекту, - реляційні графи. Вони складаються з вузлів, сполучених дугами. Кожен вузол представляє собою поняття, а кожна дуга - відносини між різними поняттями. На малюнку 1 представлено пропозицію "Собака жадібно гризе кістку". Чотири прямокутника представляють поняття собаки, процесу гложенія, кістки і такої характеристики, як жадібність. Написи над дугами означають, що собака є агентів гложенія, кістка є об'єктом гложенія, а жадібність - це манера гложенія.

    Термінологія, що використовується в цій області різна. Щоб домогтися деякої однорідності, вузли, з'єднані дугами, прийнято називати графами, а структуру, де є ціле гніздо з вузлів або де існують відносини різного порядку між графами, називається мережею. Крім термінології, що використовується для пояснення, також різняться способи зображення. Деякі використовують гуртки замість прямокутників; деякі пишуть типи відносин прямо над дугами, не укладаючи їх в овали; деякі використовують абревіатури, наприклад Про або А для позначення агента або об'єкта; деякі використовують різні типи стрілок. На малюнку 2 зображено граф концептуальних залежностей Шенка. <=> означає агента. INGEST (поглинати) - один з примітивів Шенка: Є - поглинає твердий об'єкт; ПИТИ - поглинає рідкий об'єкт; ДИХАТИ - поглинає газоподібний об'єкт. Додаткова скла зліва показує, що кістка перехід з невказаним місця до собаки.

    Оскільки досить складно ввести в комп'ютер деякі діаграми і при цьому вони займають багато місця при друку, багато вчених записують свої графи в більш компактному варіанті. Наприклад, те ж речення Сова запропонував записати в лінійному вигляді з використанням деяких елементів з малюнка 1:

    [Є] --

    (AGNT) -> [СОБАКА]

    (OBJ) -> [КОСТЬ]

    (MANR) -> [ЖАДНОСТЬ]

    У цьому варіанті запису квадратні дужки позначають поняття, а круглі дужки містять в собі назви відносин. Всі лінійні форми запису дуже схожі на фреймових структури.

    Графу з ЦЕНТРОМ в дієсловах.

    Дієслова з'єднуються з групою іменника з використанням відмінкових відносин. Наприклад, з пропозиції "Mary gave a book to Fred", Mary агент давання, book об'єкт цього процесу, а Fred реципієнт дієслова "давати". Крім відмінкових відносин в реченні в природній мові також є засоби для зв'язку окремих пропозицій. Такі відносини необхідні для наступного:

    Спілки. Найпростіший спосіб поєднати пропозиції - це поставити між ними союз. Деякі спілки, як наприклад "і", "або", "якщо" позначають логічний зв'язок; деякі, такі як "після того, як", "коли", "поки", "з тих пір, як" і "тому що ", висловлюють тимчасові відносини та причину.

    Дієслова, що вимагають підпорядковане пропозицію. Відмінкові фрейми багатьох дієслів вимагають підлеглого пропозиції, що є зазвичай прямим доповненням. До такого типу належать дієслова "говорити", "вважати", "думати", "знати", "бути переконаним", "загрожувати", "намагатися" та ін

    Визначники, що відносяться до цілого пропозиції. Багато прислівники і пропозіціонние фрази відносяться тільки до дієслова, але деякі визначають ціле речення. Такі прислівники, як "звичайно", "ймовірно", у більшості випадків ставляться на початку речення. А наприклад, слово "одного разу" визначає весь розповідь, наступний після нього.

    Модальні дієслова і часи. Такі дієслова, як "may", "can", "must", "should", "would" і "could" мають модальне значення і відносяться до всього пропозицією, де вони зустрічаються. Тимчасове відношення може бути виражено як формою минулого часу дієслів, так і обставинами "зараз", "завтра" або "одного разу" та іншими.

    Зв'язаний дискурс. Крім відносин, виражених в одній пропозиції, існують також відносини більш високого порядку між окремими пропозиціями оповідання чи будь-якої іншої розповіді. Багато хто з них не виражені експліцитно: тимчасові відносини і проходження аргументів може бути, наприклад, імпліцитно виражено порядком проходження пропозиції один за одним у тексті.

    Саме тому, що дієслово відводиться така важлива роль в пропозиції, багато теорія роблять його своїм центральним сполучною ланкою. Цей підхід бере свій початок з Індо-Європейської мовної сім'ї, де модальність і тимчасові відносини виражаються зміною дієслівної форми. Розглянемо наступний приклад: "While a dog was eating a bone, a cat passed by unnoticed". У цій пропозиції повідомлено, що, коли пропозиція "While a dog was eating a bone" було істинним, друге речення "A cat passed unnoticed" також є неправдою. На малюнку 3 зображено граф з центром в дієслові. Союз "while" (WHL) з'єднує вузол PASS-BY з вузлом EAT. На малюнку 3 показано, що собака є агентом непомічання (not noticing).

    Графи з центром в дієслові - це реляційні графи, де дієслово вважається центральною ланкою будь-якої пропозиції. Маркери часу і відносини пишуться прямо поруч із концептами, які представляють дієслова. Графи концептуальних залежностей Роджера Шенка також використовують цей підхід.

    Незважаючи на те, що графи з центром в дієслові досить гнучкі за своєю структурою, вони мають ряд обмежень. Одне з них полягає в тому, що вони не проводять розмежування між визначниками, які відносяться тільки до дієслова, і визначниками, що відносяться до пропозиції цілком. Розглянемо наступні приклади:

    The dog greedily ate the bone.

    Greedily, the dog ate the bone.

    Ці графи також погано справляються з пропозиціями, що знаходяться всередині інших пропозицій.

    При роботі з реляційними графами виникають проблеми з передачею всього різноманіття часових відносин і відносин модальності. Незважаючи на те, що багато вчення використовують ці графи для вирішення складних проблем, вони так до цих пір і не розробили загального методу для їх вирішення. У наведеному вище прикладі позначка PAST повинна відноситься до всього пропозицією, що говорить про те, що собака їсть кістку, а не тільки до дієслова EAT, оскільки очевидно, що кістка пізніше було з'їдено собакою цілком. Також має бути зазначено, що процес проходження кішки і процес не зауваження її собакою відбувалися в один і той же час.

    ПРОПОЗІЦІОННИЕ МЕРЕЖІ.

    У пропозіціонних мережах вузли представляють цілі пропозиції. Ці вузли є точками дотику для відносин між окремими пропозиціями пов'язаного тексту. З іншого боку вони визначають час і модальність для всього контексту. Представлені нижче приклади ілюструють відносини, для запису яких необхідні пропозіціонние вузли:

    Sue thinks that Bob believes that a dog is eating a bone.

    If a dog is eating a bone, it is unwise to try to take it away from him.

    У першому реченні для дієслів "think" і "believe" ціле пропозиція є доповненням: Боб вважає, що "А dog is eating a bone", те, що думає Сью являє собою більш складне пропозицію-"Bob believes that a dog is eating a bone ". Таке гніздування пропозицій всередині інших пропозицій може повторяться як завгодно велику кількість разів. Щоб зобразити таку пропозицію, необхідно використовувати пропозіціонние вузли, які містять кубляться графи. На малюнку 4 зображено пропозіціонная мережу для цієї пропозиції. Відзначимо, що (EXP) - experiencer, тобто той хто відчуває, з'єднує THINK з Сью, а BELIEVE з Бобом, однак EAT і DOG з'єднані між собою агентивно відношенням (AGNT). Причиною різного типу відносин є той факт, що думати і вважати-це стани, які відчувають людьми, а поїдання-ця дія здійснюється агентом.

    У другому прикладі представлені дві пропозиції, які перебувають у відношенні умови. Антецедентом є пропозиція "А dog is eating a bone", а консеквентом пропозицію "It is unwise to try to take it away from him". Інфінітивом "to try" і "to take" вказують на інші, що кубляться пропозиції. На кубляться пропозиції також вказує оборот "it is unwise". Для цієї пропозиції також необхідно вказати відповідність між "it", "him" та "bone" і "dog". Зв'язки відповідності позначені пунктиром. Для формального запису цієї пропозиції також використовуються квантори спільності та існування і деякі елементи логіки.

    Всі реляційні графи і графи з центром в дієслові мають багато спільного. Однак серед них існують також і відмінності:

    1. Включення контексту або всього лише його умовне позначення з відсиланням на схемі.

    2. Суворе гніздування: один і той же концепт може чи не може зустрічатися в двох різних контекстах, жоден з яких не гніздитися в іншому.

    3. Вказівка зв'язків відповідності. При перехрещуються контексті, тобто коли вони один і той же концепт зустрічається в двох різних контекстах, ці зв'язки не вказуються.

    Однак це всього лише стилістичні розбіжності, які не впливають істотно на логіку побудови.

    ІЄРАРХІЯ ТИПІВ.

    Ієрархія типів і підтипів є стандартною характеристикою семантичних мереж. Ієрархія може включати суті: ТАКСА <СОБАКА <М'ясоїдні <ТВАРИНА <жива істота <ФІЗИЧНИЙ ОБ'ЄКТ <СУТНІСТЬ. Вони також можуть включати в себе події: Жертвував <ДАВАТИ <ДІЯ <ПОДІЯ або стану: ЕКСТАЗ <ЩАСТЯ <емоційної сотоянии <СТАН. Ієрархія Аристотеля включала в себе 10 основних категорій: субстанція, кількість, якість, відношення, місце, час, стан, активність і пасивність. Деякі вчення доповнили його своїми категоріями.

    Символ <між більш загальним і більш приватним символом читається як: "Х-тіп/подтіп У".

    Термін "ієрархія" зазвичай позначає часткове впорядкування, де одні типи є більш загальними, ніж інші. Впорядкування є частковим, тому, що багато типів просто не підлягають порівнянні між собою. Порівняємо HOUSE

    Аціклічний граф. Будь-яке часткове впорядкування може бути зображено, як граф без циклів. Такий граф має гілки, що розходяться і сходяться разом знову, що дозволяє деяким сайтам мати декілька вузлів-батьків. Іноді такий тип графа називають плутані.

    Дерева. Найпоширенішим видом ієрархії є граф з однією вершиною. У такого роду графах накладаються обмеження на аціклічние графи: вершина графа являє собою один загальний тип, і кожен інший тип Х має лише одного батька У.

    Решітка. На відміну від дерев вузли в решітці можуть мати декілька вузлів батьків. Однак тут накладаються інші обмеження: будь-яка пара типів Х та У як мінімум повинна мати загальний гіпертіп ХІУ і підтип ХіліУ. Внаслідок цього обмеження решітка виглядає, як дерево, що має по головній вершині з кожного кінця. Замість всього однієї вершини решітка має одну вершину, що є гіпертіпом всіх категорій, і іншу вершину, що є підтипом всіх типів.

    успадкування.

    Основною властивістю ієрархії є можливість успадкування підтипами якостей гіпертіпов: всі характеристики, які властиві тварин, також притаманні ссавців, риби та птиці. В основі теорії наслідування лежить теорія силогізмів Арістотеля: Якщо А - характеристика В, а В - х-ка С, то А хар-ка всіх С.

    Переваги ієрархії і успадкування:

    Ієрархія типів є відмінною структурою для індексування бази знань і її ефективної організації.

    Дотримання з якої-небудь гілки за допомогою ієрархії здійснюється набагато швидше.

    Перегляд Аналіз МОВИ ТА ЙОГО породження.

    Семантичні мережі можуть допомогти парсер дозволити семантичну неоднозначність. Без такого роду уявлення вся тяжкість аналіз мови падає на синтаксичні правила і семантичні тести. Структура ж семантичної мережі ясно показує, як окремі концепти з'єднані між собою. Коли парсер зустрічає будь-яку неоднозначність, він може використовувати семантичну мережу для того, щоб вибрати той чи інший варіант. При роботі із семантичними мережами використовується декілька техніки парсінгу.

    парсінгу, в основі якого лежить синтаксис. Робота парсера контролюється граматикою безпосередніх складових і операторами побудови структур та їх тестування. У той час, як дані на вході аналізуються, оператори побудови структур створюють семантичну мережу, а оператори тестування перевіряють обмеження на частково побудованої мережі. ЕсЧи ніякі обмеження не знайдені, то що використовується при цьому граматичне правило відкидається і парсер перевіряє іншу можливість. Це найпоширеніший підхід.

    Синтаксичний аналізатор із використанням семантики. Синтаксичний аналізатор із використанням семантики оперує також як і парсер, в основі якого лежить синтаксис. Однак він оперує не з синтаксичними категоріями типу група підлягає і група присудка, а з концептами високого рівня типу КОРАБЕЛЬ і ПЕРЕВОЗИТИ.

    Концептуальний парсинг. Семантична мережа передбачає можливі обмеження, які можуть зустрінеться у відносинах між словами, а також прогнозувати слова, які пізніше можуть зустрітися в пропозиції. Наприклад, дієслово давати вимагає одушевленого агента і а також прогнозує можливість реципієнта і об'єкта, що буде дано. Шенк був одним з найактивніших прихильників концептуального парсінгу.

    парсінгу, заснований на експертизі слів. Внаслідок існування великої кількості неправильних утворень в природній мові, багато людей замість того, щоб звертатися до будь-яких універсальних узагальнень, використовують спеціальні словники, що представляють собою сукупність деяких незалежних процедур, які називаються експертами слів. Аналіз пропозиції розглядається як процес, що здійснюється спільно різними словарними експертами. Головним прихильником цього підходу був Смол.

    Аргументи за і проти різних технік парсінгу часто грунтувався не на конкретні дані, а більше на вже усталеному думці. І лише один проект на практиці порівняв декілька видів парсінгу - це Мова Семантичні репрезентації, проект розроблений в Університеті Берліна. Протягом декількох років вони створили чотири різних види парсерів для аналізу німецької мови та його запису на Мова Семантичні репрезентації, який являє собою мережу.

    Першим парсерів був парсер, створений за подобою концептуального парсера Шенка. Було відзначено, що хоча додавання в його лексикон нових слів було досить легко, аналіз однак міг проводитися тільки на простих пропозиціях і тільки відносних придаткових. Розширити область синтаксичної обробки цього парсера виявилося складним завданням.

    Другий парсер був семантично орієнтовані розширені мережі переходу. У ньому було легше узагальнити синтаксис, однак апарат синтаксису працював повільніше, ніж у першому розглянутого парсера.

    Потім робота велася з парсерів словникових експертів. Тут легко велася обробка особливих випадків, однак розкиданість граматики між окремими складовими робила практично неможливим її загальне розуміння, підтримку та модифікування.

    Парсер, який був створений відносно недавно, - це синтаксично орієнтований парсер, заснований на загальній граматиці фразова структури. Він найбільш сістематічен і узагальнений і відносно швидкий.

    Ці результати в принципі відповідають думку інших лінгвістів: синтаксично орієнтовані парсер найбільш цілісні, однак для них необхідний певний набір мережних операторів для плавного взаємодії між граматикою і семантичними мережами.

    Породження мови за семантичної мережі являє собою зворотний парсинг. Замість синтаксичного аналізу деяких ланцюжки з метою породження мережі генератор мови виробляє парсинг мережі для отримання деякої ланцюжка. Існує два варіанти породження мови з семантичної мережі.

    1. Генератор мови просто слід по мережі, перетворюючи концепти в слова, а відносини, зазначені поряд з дугами, у відносини природної мови. Цей метод має багато обмежень.

    2. Підходи, орієнтовані на синтаксис контролюють породження мови за допомогою граматичних правил, які використовують мережу для того, щоб визначити, яке наступне правило потрібно застосувати.

    Однак на практиці обидва методи мають багато подібностей: наприклад, перший спосіб являє собою послідовність вузлів, які обробляються генератором мови, орієнтованим на синтаксис.

    НАВЧАННЯ МАШИН.

    Графи і мережі являють собою прості поняття для програм, які вивчають нові структури. Їх перевага при навчанні полягає в легкості додавання та видалення, а також порівняння дуг і вузлів. Нижче представлені програми, які для навчання використовували семантичні мережі.

    Вінстон використовував реляційні графи для опису таких структур, як арки і вежі. Машині пропонувалися приклади вірного і невірного опису цих структур, а програма створювала графи, які вказували всі необхідні умови для того, щоб ця структура була саме аркою або вежею.

    Салветер використовував графи з центром в дієслові для представлення відмінкових відносин, які вимагають різні дієслова. Його програма MORAN для кожного дієслова виведе відмінкові фрейм, порівнюючи одні й ті ж ситуації до і після їх опису з використанням цього дієслова.

    Шенк розробив теорію Memory-Organization Packets для пояснення того, як люди дізнаються нову інформацію з конкретних життєвих ситуацій. При цьому MOP-це це узагальнена абстрактна структура, що не мають відношення до жодної конкретної ситуації окремо.

    застосувати на практиці.

    Семантичні мережі можуть бути записані практично на будь-якій мові програмування на будь-якій машині. Найпопулярніші в цьому відношенні мови LISP і PROLOG. Однак багато версії були створені і на FORTRANе, PASCALе, C та іншими мовами програмування. Для зберігання всіх вузлів і дуг необхідна велика пам'ять, хоча перші системи були виконані в 60-х роках на машинах, які були набагато менше і повільніше сучасних комп'ютерів.

    Один з найпоширеніших мов, розроблених для запису природної мови у вигляді мереж, - це PLNLP (Programming Language for Natural Language Processing) Мова Програмування для обробки природної мови, створений Хайдерном. Ця мова використовується для роботи з великими граматиками з великим покриттям. PLNLP працює з двома видами правил:

    1. за допомогою правил декодування проводиться синтаксичний аналіз лінійної мовної ланцюжка і будується мережа.

    2. за допомогою правил кодування сканується мережа породжується мовна ланцюжок або інша трансформована мережу.

    Крім спеціальних мов для семантичних мереж було також розроблено спеціальну апаратне забезпечення. На звичайних комп'ютерах можуть бути успішно виконані операції з мовами синтаксичного аналізу та операції сканування мереж. Однак для великих баз знань знаходження потрібних правил або доступ до предзнаніям може знадобитися дуже багато часу. Щоб дозволити різним процесам пошуках проходити одночасно Фальман розробив систему NETL, яка являє собою семантичну мережу, яка може використовуватися з паралельним апаратним забезпеченням. Таким чином він хотів створити модель людського мозку, в якому сигнали можуть рухатися по різних каналах одночасно. Інші вчені розробили паралельне програмне забезпечення для пошуку найбільш вірогідною інтерпретації двозначних фраз природної мови.

         
     
         
    Реферат Банк
     
    Рефераты
     
    Бесплатные рефераты
     

     

     

     

     

     

     

     
     
     
      Все права защищены. Reff.net.ua - українські реферати ! DMCA.com Protection Status