0 p>
S (Di, Dj)> T, => 1 p>
Алгоритм: p>
1.В клас чи
кластер включаються підгрупи порядку 2, тобто ті елементи, які стосовно
подібності встановлені на парі. p>
2.Із підгрупи
порядку 2 отримують підгрупу порядку 3 за таким правилом: якщо є підгрупи
(Di, Dj), (Di, Dp), (Dj, Dp), то отримуємо: (Di, Dj, Dp) і підгрупи з початкового списку виключаються. p>
3.Із підгрупи
порядку p формують підгрупу порядку (p +1), тобто (Di, Dj, ..., Dp) => (Di, Dj, ..., p>
Питання
33 (продовження). P>
Послідовність.
p>
Ця властивість
гарантує, що користувач, що освоїв роботу в однієї частини системи не
заплутається, працюючи в іншій її частині. p>
виражено у
3-х явища: p>
Послідовність
в побудові фраз. Тобто вводяться коди або команди в системі завжди трактуються
однаково; p>
Послідовність
у використанні форматів даних - аналогічні поля завжди представляються в
одному форматі (суперечить вимозі гнучкості); p>
Послідовність
у розміщенні даних на екрані. p>
Рекомендується
наступний шаблон для оформлення екрану: p>
Праворуч в 2-х,
3-х рядках міститься заголовок і дані про стан системи; p>
Далі, під
заголовком розміщується область для виведення довідкових повідомлень; p>
Основна
область - для малювання або для введення даних; p>
Нижче - область
для виведення повідомлень про помилки; p>
Опис
функціональних клавіш. p>
Стислість. p>
Вимагає від
користувача введення мінімуму інформації. Це, з одного боку, прискорює роботу
системи, а, з іншого, призводить до появи помилок. p>
Рекомендації: p>
Не слід
запитувати інформацію, яку слід сформувати автоматично; p>
Інформація не
повинна виводиться відразу ж, тільки тому, що вона стала доступна системі. Вона
повинна виводиться тільки в тому обсязі, який потрібно користувачеві і в потрібному
для нього форматі. p>
Підтримка
користувача - міра допомоги, яку система надає користувачеві при роботі з
ній. p>
Ця підтримка виражається в 3-х видах: p>
Інструкції
користувача. Виводяться у вигляді підказок або довідкової інформації. При цьому
довідкова інформація повинна бути контекстної, своєчасною та доступною в
будь-якій точці діалогу. Крім внутрішньосистемної існує зовнішня довідкова
інформація, яка супроводжує текст у вигляді паперового носія. Там
вказується 5 моментів: p>
Загальний огляд, у
якому описується призначення системи, основні поняття предметної області, необхідні для оцінки
системи, пов'язані з цими поняттями принципи роботи системи; p>
Як розпочати
роботу з системою; p>
Відомості про
поведінці користувача при виході системи або окремих частин з ладу; p>
Приклад роботи з
системою; p>
Обмеження на
систему. p>
Повідомлення про
помилках. Гарне повідомлення про помилку повинно відповідати наступним вимогам: p>
Мабуть
викладено в термінах, зрозумілих користувачеві; p>
Потрібно точно
визначити причину помилки; p>
Повинно
пояснювати, як виправити помилку; p>
Мабуть
своєчасним, поки не виконані речі, які незворотні. p>
Підтвердження
будь-яких дій системи. p>
Гнучкість - міра
того, наскільки добре діалог відповідає різним рівням підготовки і
продуктивності праці користувача. Гнучкість називають властивістю адаптивності
системи. p>
системи, які характеризують її гнучкість: p>
37.Тіпи діалогів. b> p>
4 типу діалогу: p>
питання - відповідь; p>
меню; p>
командний мова; p>
екранні форми. p>
Запитання - відповідь.
Сама стара форма ведення діалогу. Використовується в експертних системах, в
інформаційно - пошукових системах до фактографічних або документальним баз
даних. p>
3 види діалогу
в режимі "запитання - відповідь": p>
Діалог з
обмеженнями на предметну область. Форма запиту - довільна (обмежень
немає), а лексика запиту будується на базі 2-х словників. 1-й містить
функціональні слова, які або означають характер завдання, яке потрібно
вирішити, або носять допоміжний характер, тобто ті запити з якими
користувач звертається до БД. Ці функціональні слова є ключовими,
сенс їх жорстко регламентований. p>
2-й словник містить специфічні терміни,
які характеризують дану предметну область і, як правило, є
іменами полів із записами бази даних. 1-е обмеження: якщо існують надійні
закінчення, то кожне слово із запиту потрібно спроектувати на слова зі словника(де максимальне перехід, то і брати). 2-е обмеження в рамках діалогу --
обмеження на мову. p>
Вимоги: p>
Запит або
завдання формується за допомогою фраз природної мови, кожна з яких
описує елемент, операцію, яку треба виконати. p>
Кожне
пропозиція повинна починатися з функціонального слова, що визначає потрібне
дію. p>
При
формулюванні умов пошуку кожне значення поля БД повинно передувати
назвою цього поля. p>
3-я форма --
природно мовна без обмежень. p>
Цей діалог
застосовується тоді, коли діапазон або занадто великий, або взагалі не визначений. p>
Подальший
запит залежить від попереднього, тобто цей діалог не можна заздалегідь описати
деяким сценарієм. p>
Меню --
орієнтований діалог. p>
Тут у користувача
є список варіантів відповіді і він вибирає потрібний номер. p>
Види меню: p>
1. p>
2. З
використанням мнемонічних позначень опцій (Norton Commander); p>
3. Блокової; p>
4. Рядкове
меню; p>
5. Меню у вигляді
піктограм. p>
Вимоги до
меню: p>
Кожне меню
повинно містити 5-6 опцій; p>
При великому
числі різних варіантів їх треба групувати (підменю); p>
Пункти меню
повинні слідувати в природному порядку або за алфавітом. p>
Застосування
меню: p>
Діапазон
можливих відповідей невеликий і вони всі відомі заздалегідь і можуть бути представлені
явно; p>
Коли
користувачеві необхідно бачити відразу всі опції для вибору оптимальної, щоб
оцінити всі можливі варіанти; p>
Коли
користувач недосвідчений. p>
40.Метод спадного синтаксичного
аналізу (СА). b> p>
Спадний СА
(розгорнення) - дерево розбору будується від коренів до листів. p>
СА методом
розгорнення. Тут робиться припущення, що вихідна пропозиція вже
належить мові, а отже до
ній застосовується 1-а продукція граматики, в якій ліва частина є
початковим символом граматики. Цей крок є 1-м кроком алгоритму розгортки.
Введемо тут поняття елемента розгортки, роль якого на 1-му кроці права частина
продукції. p>
2-й крок: з
елемента розгортки вибирається крайній ліворуч нетермінальний символ.
Нетермінальний символ замінюється правою частиною продукції з відповідною
лівою частиною того ж списку продукції. Управління передається початку 2-го кроку
цього алгоритму. Якщо ланцюжок не містить нетермінальних символів, вона
порівнюється з вихідною аналізованої ланцюжком. Якщо вони співпадають, то кінець
алгоритму, інакше перехід до кроку 3. p>
Крок 3: розбір
виконується заново і при альтернативних варіантах продукції вибираються ті,
які раніше не використовувалися. Тобто виконується розбір пропозиції
фактично, по трохи іншій схемі. p>
Якщо в
граматичних правилах переважають правила з однаковими лівими частинами,
оптимальніше вибирати висхідний розбір пропозиції і навпаки, якщо превалюють
правила з альтернативними правими частинами потрібно вибирати спадний розбір. p>
41.Метод
висхідного синтаксичного аналізу (СА) h2>
Висхідний
синтаксичний аналіз СА (згортка) - дерево розбору будується від листя до
кореня. p>
Алгоритм
висхідного лівостороннього СА: p>
Зліва у фразі
виділяється слово з морфологічними ознаками (елемент згортки). Якщо фраза
порожня, по виконується крок 4, інакше наступний крок; p>
Елемент згортки
порівнюється з правими частинами продукцій. Якщо його збіг, то елемент
згортки заміняється на ліву частину продукції і виконується передача на початок
кроку 2. Якщо збігів немає виконується наступний крок. P>
Вибирається
елемент з стека. Якщо при цьому стек порожній, то елемент згортки поміщається в стек
і виконується крок 1, інакше елемент зі стека і елемент згортки замінюються на
поняття елемент згортки і виконується крок 2. p>
Виконується
коли фраза оброблене повністю. Тут вибирається елемент з стека. Це має
бути початковий символ граматики. У цьому випадку, якщо, до того ж, стек порожній,
2 робимо висновки: p>
Пропозиція
належить мові. p>
Збудували його
структуру, яка використовується на етапі СЕА. p>
Якщо умова не
виконується (стек не порожній), то або пропозицію побудовано синтаксично
невірно, або при пакунку були використані не ті продукції. У цьому випадку
повертаються на той крок СА, де була можливість вибору альтернативної
продукції. p>
45.Задача управління доступом . b> p>
При вирішенні
цього завдання виділяють 3 поняття: p>
Суб'єкт --
користувач, який виконує деякі операції над даними; p>
Об'єкт операції
доступу - ті дані, до яких виконується доступ; p>
Вид операції
доступу. p>
У загальному випадку
розрізняють 3 види доступу: p>
Необмежений
доступ до всіх даних; p>
Необмежений
доступ до групи даних; p>
Обмежений
доступ до групи даних. З обмеженням як у суб'єкта, так і за видами операцій. P>
Підхід до
управління доступом. p>
Використання
ключів і замків (ідентифікація та аутентифікація користувача). Ідентифікація --
характеристики користувача, які його визначають. Ідентифікація дозволяє
визначити себе користувачеві, повідомивши своє ім'я. Замок (засіб аутентифікації)
дозволяє 2-йстороне (ПК) переконатися що суб'єкт - той, за кого себе видає. p>
Способи
ідентифікації: p>
Пароль, особистий
ідентифікаційний номер або криптографічний ключ і т.д.; p>
Публічний
картка; p>
Голос або
відбитки пальців; p>
Щось,
асоційоване із суб'єктом. p>
Найбільш
розповсюджений спосіб - використання паролів, коли аутентифікація
реалізується в програмному забезпеченні. Символічно алгоритм аутентифікації
можна уявити: p>
Вихід у
залежно від p>
кількості користувачів p>
Перевага
цього методу - гнучкість, доступність і простота реалізації. p>
Недоліки: p>
Потрібно
багаторазово вводити пароль; p>
Зміна замку
впливає на велику кількість користувачів; p>
Замок
управління може реалізувати тільки та особа, яка розробляє ці програми. p>
Підвищення
надійності парольного захисту здійснюється: p>
Пароль повинен
бути не дуже коротким і використовувати різні символи; p>
Періодично
міняти паролі; p>
Якщо паролі не
вбудовані в програму, а реалізовані у вигляді файлу, то обмежити доступ до файлу
паролями; p>
Якщо можливі
помилки в паролі, то потрібно обмежити число повторних введень пароля; p>
Використання
генераторів паролів, які дозволяють формувати благозвучні (добре
запам'ятовуються) паролі. p>
Якщо як
ідентифікатора використовується особиста картка, для аутентифікації використовується
пристрій, який називається токенів - пристрій, володіння яким дозволяє
визначити справжність користувача. p>
2 види токенів: p>
Пасивні
(токени з пам'яттю); p>
Активні
(інтелектуальні) токени. p>
Найбільш
поширеними з огляду на дешевизну є токени 1-го класу. Це пристрої
з клавіатурою і процесором, а особиста картка забезпечена магнітною смугою. При
використанні цього токена користувач із клавіатури вводить свій
ідентифікаційний номер, який перевіряється процесором на збіг з
карткою і далі перевіряється справжність самої картки. Недоліки:
дорожнеча, використання спеціальних пристроїв читання, незручність
використання. 22.Кластерние текстові
файли. p>
Документи
розбиваються на родинні групи, які називають кластерами або класами.
Кожен клас описується Центроїд (профілем) і вектор запиту перш за все
порівнюється з Центроїд класу. p>
Переваги: p>
Можливий
швидкий пошук, тому що число класів, як правило, невелика; p>
Можливо
інтерактивне звуження (розширення) пошуку за рахунок виключення або додавання
додаткових кластерів. p>
Недоліки: p>
Необхідність
формувати кластери; p>
Необхідність
введення файлу Центроїд; p>
Додатковий
витрата пам'яті для файлу Центроїд або профілів. p>
23.Основние
способи визначення Центроїд. h2>
1. Логічний
профіль (позначається Р1). p>
задає вектор
документів у наступному вигляді: p>
VDi = (d1, d2, d3, ..., dt), де t - число індексаціонних термінів,
виділених у всіх документах нашого масиву. Тоді логічний профіль
визначається як результат з логічною "або": p>
Р1 = VD1
v VD2 v VD3 v ... p>
1, якщо термін tk входить у вектор документа Di; p>
dk (k =
1, t) = 0, в іншому випадку. p>
2.Профіль
частотного документа (Р2). p>
Вихідні дані
також вектора документів. Вихідна інформація задана минулого матрицею, а в
формулі використовуються не логічне додавання, а арифметичне: p>
3.Профіль
частотності терміна (Р3). p>
Тут
використовуються ваги термінів у документах: p>
VDi = (w1, w2, w3, ..., wt), де wi - ваги термінів входять у вектор
документа VDi. p>
У обчисленні Р3
беруть участь ваги. p>
Р3 (k = 1, t) = сум (j = 1, N) wik, де j - порядковий номер документа; N - число документів кластеру; t - число індексаціонних термінів у
масиві; k --
порядковий номер терміну. p>
24.
Логічний спосіб визначення Центроїд. H2>
Логічний
профіль (позначається Р1). p>
задає вектор
документів у наступному вигляді: p>
VDi = (d1, d2, d3, ..., dt), де t - число індексаціонних термінів,
виділених у всіх документах нашого масиву. Тоді логічний профіль
визначається як результат з логічною "або": p>
Р1 = VD1
v VD2 v VD3 v ... p>
1, якщо термін tk входить у вектор документа Di; p>
dk (k =
1, t) = 0, в іншому випадку. p>
25.Профіль
частотності документа. h2>
Вихідні дані
також вектора документів. Вихідна інформація задана матрицею, а у формулі використовуються
НЕ логічне додавання, а арифметичне: p>
26.Профіль
частотності терміна. h2>
Тут
використовуються ваги термінів у документах: p>
VDi = (w1, w2, w3, ..., wt), де wi - ваги термінів входять у вектор
документа VDi. p>
У обчисленні Р3
беруть участь ваги. p>
Р3 (k = 1, t) = сум (j = 1, N) wik, де j - порядковий номер документа; N - число документів кластеру; t - число індексаціонних термінів у
масиві; k --
порядковий номер терміну. p>
Питання
28 (закінчення). H2>
Dp +1), якщо
існують пари: (Di, Dp 1), (Dj, Dp 1), ..., (Dp, Dp 1). p>
Алгоритм
закінчується, коли подальше злиття неможливо. p>
Недолік
методу: утворюється велика кількість кластерів. p>
29.Метод
одного зв'язку. h2>
Тут класи
представляються документами, між якими встановлені відносини подібності,
які підпорядковуються наступного вимогу: між двома документами
встановлюється зв'язок при виконанні одного з наступних умов: існують Di, Dj, p>
S (Di, Dk), S (Dk, Dj); p>
S (Di, Dk), S (Dk, Dm)
, S (Dm, Dj); p>
Найсильніше
вимога: S (Di, Dk) - якщо в матриці подібності вже
існує подібність. p>
Якщо одне з
умов виконується, то документи в одному класі. p>
30.Кластерізація
навколо вибіркових документів. h2>
Замість
побудови матриці подібності використовують щільність простору деяких
документів. Як можливі центрів кластеру виступають ті документи,
які за результатами розрахунків виявилися розташованими в щільних зонах
простору. Всі документи в цьому методі поділяються на 3 класи: p>
Документи, що вже
включені у кластери; p>
Документи, ще
що не піддався дослідженню (не включені в кластери); p>
Вільні
документи. Ті документи, щодо яких робилася спроба включення до
кластер, але вона закінчилася невдачею. p>
Беремо документ,
пробуємо включити його в кластер. Якщо не виходить, то заносимо його в безліч
вільних документів. Далі з вільного безлічі намагаємося підключити
документи до кластеру. p>
Алгоритм: p>
Вибирається
черговий, не включений в кластери документ і вважається можливим центром
кластеру; p>
Розраховуються
коефіцієнти подібності між цим документом, документами вільного типу і
документами, не включеними в класи; p>
Щільність
вважається достатньою, якщо: p>
існує по
щонайменше n1
документів, коефіцієнти подібності яких по відношенню до вибраного документу
перевищує деяке граничне значення T1; p>
Існує по
Принаймні n2
документів, коефіцієнти подібності (КП) яких, по відношенню до досліджуваного
документу перевищують граничне значення T2; p>
Якщо між n2 і T2
існує деякий співвідношення: n2> = n1; T2 0 p>
S (Di, Dj)> T, => 1 p>
2.Метод однієї
зв'язку. p>
Тут класи
представляються документами, між якими встановлені відносини подібності,
які підпорядковуються наступного вимогу: між двома документами
встановлюється зв'язок при виконанні одного з наступних умов: існують Di, Dj, p>
S (Di, Dk), S (Dk, Dj); p>
S (Di, Dk), S (Dk, Dm)
, S (Dm, Dj); p>
Найсильніше
вимога: S (Di, Dk) - якщо в матриці подібності вже
існує подібність. p>
Якщо одне з
умов виконується, то документи в одному класі. p>
3.Кластерізація
навколо вибіркових документів. p>
Замість
побудови матриці подібності використовують щільність простору деяких
документів. Як можливі центрів кластеру виступають ті документи,
які виявилися розрахунків за результатами розташованими в щільних зонах
простору. Всі документи в цьому методі поділяються на 3 класи: p>
Документи, що вже
включені у кластери; p>
Документи, ще
що не піддався дослідженню (не включені в кластери); p>
Вільні
документи. Ті документи, щодо яких робилася спроба включення до
кластер, але вона закінчилася невдачею. p>
Беремо документ,
пробуємо включити його в кластер. Якщо не виходить, то заносимо його в безліч
вільних документів. Далі з вільного безлічі намагаємося підключити
документи до кластеру. p>
Питання
30 (закінчення). H2>
Документи, КП
яких перевищує граничне значення T3, включаються до складу нового кластеру; p>
Документи, КП
яких менше або дорівнює T3, але більше деякого порогового значення T4, включаються до безліч вільних
документів; p>
Документи, КП
яких не більше T4,
називаються не включеними в кластери. p>
Цей процес
повторюється до тих пір, поки всі документи не будуть віднесені до розряду
вільних або не будуть включені в будь-якій кластер. p>
Розраховується
КП всіх вільних документів з усіма Центроїд кластерів і там, де подібність
виявиться максимальним і відносять кожен вільний документ. p>
31.Коррекція
кластерів зверху вниз. h2>
На початку будуються один або кілька дуже
великих кластерів, які потім розбиваються на більш дрібні. p>
Способи вибору
початкових класів: p>
Як
центрів класів використовуються випадкові документи; p>
Класом з
ім'ям i можна вважати
безліч документів, у векторах яких знаходиться термін i; p>
Як
початкових класів приймаються всі документи, визнані доречними деякого
запиту за результатами попередніх пошукових операцій. p>
Процес
корекції кластерів: p>
Обчислюється КП
між кожним документом і кожним Центроїд кластеру; p>
Кластери
перевизначаються шляхом віднесення документів до тих з них, по відношенню до
яким, вони мають найбільшу подібність; p>
Формуються
Центроїд нових кластерів. p>
Ці 3 кроки
виконуються до тих пір, поки: p>
Буде
необхідність у змінах; p>
Щоб процес
не був нескінченним, він виконується в задане число ітерацій. p>
32.Однократная
кластеризація. h2>
Документи
розглядаються в довільному порядку і кожен документ або відноситься до
існуючого класу, якщо КП достатній, або утворює новий кластер. p>
"+": кожен
документ обробляється тільки 1 раз, => потребує мало часу. p>
"-": склад і
структура класів суттєво залежить від порядку розгляду документів. p>
33.Основние
критерії хорошого діалогу. p>
Природність; p>
Послідовність; p>
Стислість; p>
Підтримка
користувача; p>
Гнучкість. p>
Природність
- Властивості діалогу, відповідно до якого користувачеві не потрібно міняти свої
традиційні способи вирішення завдання. p>
Властивість
включає наступні аспекти: p>
Діалог повинен
вестися рідною мовою користувача; p>
Стиль ведення
діалогу має бути розмовною, тобто мається на увазі стислість; p>
Фрази не повинні
вимагати додаткових пояснень; p>
Допускається
використання жаргону користувача; p>
Порядок ведення
діалогу має відповідати порядку, яким зазвичай користувач
обробляє інформацію; p>
Повинна бути
виключена попередня обробка даних
перед їх введенням в систему. p>
35.Краткость
і підтримка користувача як критерії хорошого діалогу. h2>
Стислість. p>
Вимагає від
користувача введення мінімуму інформації. Це, з одного боку, прискорює роботу
системи, а, з іншого, призводить до появи помилок. p>
Рекомендації: p>
Н?? слід
запитувати інформацію, яку слід сформувати автоматично; p>
Інформація не
повинна виводиться відразу ж, тільки тому, що вона стала доступна системі. Вона
повинна виводиться тільки в тому обсязі, який потрібно користувачеві і в потрібному
для нього форматі. p>
Підтримка користувача
- Міра допомоги, яку система надає користувачеві при роботі з нею. P>
Ця підтримка виражається в 3-х видах: p>
Інструкції
користувача. Виводяться у вигляді підказок або довідкової інформації. При цьому
довідкова інформація повинна бути контекстної, своєчасною та доступною в
будь-якій точці діалогу. Крім внутрішньосистемної існує зовнішня довідкова
інформація, яка супроводжує текст у вигляді паперового носія. Там
вказується 5 моментів: p>
Загальний огляд, у
якому описується призначення системи, основні поняття предметної області, необхідні для оцінки
системи, пов'язані з цими поняттями принципи роботи системи; p>
Як розпочати
роботу з системою; p>
Відомості про
поведінці користувача при виході системи або окремих частин з ладу; p>
Приклад роботи з
системою; p>
Обмеження на
систему. p>
Повідомлення про
помилках. Гарне повідомлення про помилку повинно відповідати наступним вимогам: p>
Мабуть
викладено в термінах, зрозумілих користувачеві; p>
Потрібно точно
визначити причину помилки; p>
Повинно
пояснювати, як виправити помилку; p>
Мабуть
своєчасним, поки не виконані речі, які незворотні. p>
будь-яких дій системи. p>
36.Гібкость
як критерій хорошого діалогу. h2>
Гнучкість - міра
того, наскільки добре діалог відповідає різним рівням підготовки і
продуктивності праці користувача. Гнучкість називають властивістю адаптивності
системи. p>
Існує 3
системи, які характеризують її гнучкість: p>
Фіксована
адаптація. При цьому користувач сам явно вибирає свій рівень підготовки; p>
Повна
адаптивність. Тут діалогова система будує модель користувача, яка
змінюється автоматично в процесі роботи системи. p>
Косметична.
Займає проміжне місце між фіксованого повної і досягається
використанням спеціальних прийомів: p>
Прийом
використання скорочень (md - mkdir
, Cd - chdir, *. bak); p>
Синоніми --
користувач вибирає те, що йому ближче; p>
Використання
об'єктів за замовчуванням і макроси. p>
Питання
Алгоритм
висхідного лівостороннього СА: p>
Зліва у фразі
виділяється слово з морфологічними ознаками (елемент згортки). Якщо фраза
порожня, по виконується крок 4, інакше наступний крок; p>
Елемент згортки
порівнюється з правими частинами продукцій. Якщо його збіг, то елемент
згортки заміняється на ліву частину продукції і виконується передача на початок
кроку 2. Якщо збігів немає виконується наступний крок. P>
Вибирається
елемент з стека. Якщо при цьому стек порожній, то елемент згортки поміщається в стек
і виконується крок 1, інакше елемент зі стека і елемент згортки замінюються на
поняття елемент згортки і виконується крок 2. p>
Виконується
коли фраза оброблене повністю. Тут вибирається елемент з стека. Це має
бути початковий символ граматики. У цьому випадку, якщо, до того ж, стек порожній,
2 робимо висновки: p>
Пропозиція
принади