2. Пошукові системи та машини в Internet. P>
Звернемося до історії виникнення мережі Internet, яка була створена взв'язку з такою необхідністю спільного використання інформаційнихресурсів, розподілених між різними комп'ютерними системами.
Більшість перших додатків, включаючи FTP і електронну пошту, булирозроблені виключно для обміну даними між хост-комп'ютерами
Internet. Інші програми, такі як Telnet, створювалися для того, щобкористувач отримав можливість доступу не тільки до інформації, але й доробочим ресурсів віддаленої системи. У міру розвитку Internet (збільшеннякористувачів і хост-комп'ютерів) колишні методи обміну даними пересталивідповідати зрослим потребам користувачів. Виникла необхідністьрозробки нових способів пошуку мережевих ресурсів і доступу до них, щодозволяли б використовувати інформацію незалежно від її формату ірозташування. Для задоволення таких потреб спочатку були створеніПошукова система Archie, яка вирішує задачу локалізації ресурсів на FTP -сервері, і система Gopher, що спрощує доступ до різних мережевих ресурсів.
Потім були розроблені мережеві інформаційні системи WWW і WAIS,що пропонують абсолютно нові методи отримання інформації. Принципи роботицих систем дозволяють легко орієнтуватися у величезній кількостіінформаційних ресурсів без необхідності надання механізмів роботисамої мережі Internet. Такий підхід дозволяє говорити вже не просто проресурсах взаємопов'язаних комп'ютерних систем, а про особливі інформаційнихпросторах мережі.
FTP (File Transfer Protocol, Протокол передачі файлів) регламентуєпроцедуру передачі файлів між комп'ютерами. Сервіс, що надається FTP,відрізняється необхідністю безпосереднього з'єднання між комп'ютерами,беруть участь у процесі обміну даними, і необхідністю ідентифікаціїкористувача для визначення її прав доступу до каталогів і файліввіддаленої системи. Однією з проблем доступу інформації за допомогою FTPє неможливість визначити, які файли можна знайти на FTP-сервербез попереднього встановлення з ним з'єднання з ним і переглядуструктури каталогів.
Система UseNet була розроблена для підтримки телеконференцій. Для їхведення організовуються спеціальні рубрики, назви яких відображають загальнийзміст телеконференції. Основною перевагою UseNet єможливість отримання практично будь-якої інформації за досить короткийтерміни. Єдина проблема, що виникає у користувача, полягає ввиборі телеконференції, в якій він може отримати відповідь на своє питання.
Це завдання допомагає вирішити ієрархічна система імен телеконференцій в
UseNet. Крім того, система UseNet була розроблена для обмінувиключно текстовою інформацією, тому для передачі бінарних файлів, спершу потрібно скористатися програмою, що конвертуєдані.
Система Archie являє собою комплекс програмних засобів, що працюютьзі спеціальними базами даних. У цих базах даних є постійнопоновлена інформація про файли, до яких можна отримати доступ черезсервіс FTP. Користуючись послугами системи Archie, можна здійснити пошукфайлу за шаблоном його імені. При цьому користувач отримає список файлів зточним зазначенням місця їх зберігання в мережі, а також з інформацією про тип,часу створення і розмір файлів. Доступ до інформаційно-пошукової системи
Archie може здійснюватися різними шляхами, починаючи від запитів поелектронною поштою та за допомогою сервісу Telnet і закінчуючи використаннямграфічних Archie-клієнтів.
Система Gopher була розроблена для спрощення процесу локалізації FTP -ресурсів Internet і для більш зручного подання відомостей про змістщо зберігаються на FTP-серверах файлів. Система Gopher дає можливість узручній формі (у вигляді меню) представляти користувачам про наявні файлахі їх зміст. Меню Gopher-серверів можуть містити посилання на інші
Gopher-і FTP-сервери. Посилання на FTP-сервер дозволяє як переглянути йогокаталоги, так і автоматично отримати файл. Таким чином, користувачотримує можливість "подорожувати" по Internet, не звертаючи уваги намісцезнаходження цікавлять його ресурсів, і отримувати доступ до цихресурсів.
Система Veronica використовується для пошуку інформації в Gopher-просторіза заголовками пунктів меню. Після введення ключового слова, система Veronicaз'ясовує, чи зустрічається воно в меню на будь-якому Gopher-сервер, і вякості результатів пошуку видає список заголовків пунктів меню,що містять ключове слово. Оскільки система Veronica не єавтономної пошукової програмою, а тісно пов'язана із системою Gopher, вонаволодіє тим же, що і система Gopher, недоліком: далеко не завжди зазаголовка можна сказати, що собою представляє той чи інший інформаційнийресурс. Переваги системи полягає в тому, що немає необхідностідізнаватися, де розташована знайдена інформація, досить вибратипотрібну запис зі списку.
Основою системи WAIS є комплекс глобальних баз даних, в якихміститься індексованих інформація про ресурси мережі. Система WAISзабезпечує розподілений пошук тексту в цих базах даних по ключовомусловом або рядку. Таким чином, сервіс WAIS перш за все орієнтований назміст текстових документів, а не на назви і формат файлів, вяких вони зберігаються. У системі також реалізовані зв'язку з різними базамиданих, що зберігаються на інших хост-комп'ютерах, і механізм отриманнянеобхідного документа. На додаток до цього в системі WAIS достатньопросто реалізований механізм додавання нових баз даних до вже існуючих.
Документи, в яких система WAIS здійснює пошук, зазвичай представляютьце текстові файли, які можуть мати будь-який розмір і містити будь-якуінформацію.
Самим новим і найбільш досконалим засобом пошуку, отримання тавідображення інформації в Internet є система World Wide Web (WWW).
Ця система надає користувачеві можливість, працюючи з графічнимінтерфейсом, переглядати документи, що зберігаються на хост-комп'ютерах в
Internet, причому для переміщення між документами використовуютьсягіпертекстові зв'язки (посилання). Ці посилання включаються до документів системи
WWW і можуть вказувати на будь-які інформаційні ресурси Internet. WWW -документи (WWW-сторінки) готуються на спеціально розробленому мовою
- HTML (Hypertext Markup Language, Мова розмітки гіпертексту), доступномузвичайним користувачам, і дозволяє включати до WWW-сторінки крім текстовоїінформації зображення, посилання на інші документи, інші додатковіелементи інтерфейсу, такі як інтерактивні форми для введення даних прироботі з документом, і багато іншого. Важливим достоїнством системи WWWє те, що графічний інтерфейс багатьох програм перегляду WWW (WWW -браузерів) робить роботу з цією системою досить легкою для початківцівкористувачів, що не мають досвіду роботи в Internet. Користувачі системи WWWтакож не зобов'язані знати, де і в якій формі зберігаються дані, оскільки WWW -браузер сам виконує більшу частину роботи.
У системі WWW є також доступ до спеціально розробленим пошуковимсистем (пошукових машин), які виконують пошук WWW-сторінок,містять інформацію на задану за допомогою ключових слів тему. Пошукпроводиться серед заздалегідь проіндексованих WWW-сторінок безлічісерверів Internet, і результатом пошуку є автоматичносгенерирована нова WWW-сторінка, що містить посилання на знайденідокументи. Це надзвичайно потужний засіб робить вельми легкій та зручнійдля користувачів процедуру пошуку інформації в Internet, а результатпошуку дозволяє представити в наочній формі. Найбільш потужними пошуковимимашинами на сьогоднішній день у світі є: Alta Vista
(www.altavista.digital.com), Yahoo! (www.yahoo.com), Infoseek
(www.infoseek.com), GoTo (www.goto.com), FTP search (ftpsearch.ntnu.no --пошук в системі FTP), а також вітчизняні: Rambler (www.rambler.ru),
Yandex (yandex.ru), АПОРТ! (www.aport.ru), Слідопит
(www.medialingua.ru/www/wwwsearc.htm), Compass (compass.tsu.ru), Russian
FTP search (ftpsearch.city.ru - пошук в системі FTP). Слід зазначити, щорезультатом пошуку можуть бути не тiльки HTML-документи, що зберігаються на WWW -серверах, але й інші типи файлів на інших типах серверів, якщо інформаціяпро цих документах міститься у відповідних базах даних пошуковихмашин. p>
p>