Мережеві
засоби пошуку інформації h2>
Каталоги h2>
Обсяг
інформації Інтернет переживає стрімке зростання: за оцінками експертів,
кількість Web-сторінок збільшилась від кількох десятків тисяч у 1996 р. до
декількох сотень тисяч до кінця 1998 р. У цих умовах ні одне окремо взяте
засіб пошуку інформації не зможе охопити всіх ресурсів Мережі. Тому для
ефективного вирішення завдання пошуку користувачеві необхідно вільно орієнтуватися
в складному і різноманітному світі пошукових інструментів. Правильний вибір
засоби пошуку інформації в кожному конкретному випадку є суттєвим,
якщо не визначальним, чинником успішного виконання завдання. p>
Каталоги
являють собою систематизовані групи адрес, об'єднані, як
правило, за тематикою. До зручності їх застосування можна віднести те, що, якщо
користувачеві відома тема шуканого документа, він буде досліджувати
відповідну гілку каталогу, не відволікаючись на сторонні, які не відносяться до
справи документи. Однак, обсяг каталозі обмежений фізичними можливостями
редакторської групи і її суб'єктивністю у виборі матеріалу. У них відсутні
інформація на вузькі, спеціальні теми, та й саму тематику шуканого документа не
завжди можна сформулювати в межах класифікації каталогу. p>
Назва p>
Опис p>
Yahoo! p>
Найпопулярніший каталог, що містить
обширну інформацію про десятки тисяч Web-сайтів. Перший рівень ієрархії
містить 14 тематичних категорій, які розгалужуються ще на 4 - 5 підрівнів.
Має власну машину пошуку, що дозволяє: 1) шукати по базі Yahoo!, За
Usenet або за адресами електронної пошти; 2) обмежити пошук матеріалами,
розміщеними за останній день, тиждень, місяць, рік або 3 роки; 3) видати
статті, що містять хоча б одне ключове слово або всі ключові слова; 4)
шукати за однокореневі словами або тільки за вказаними ключовим; 5) видати
результати по 10, 25, 50 або 100 на одній сторінці. p>
Excite Reviews p>
Містить огляди 60 тис. вузлів Інтернет,
систематизовані в ієрархічний каталог. p>
City.Net p>
Каталог відомостей про різні країни і
містах. p>
Galaxy p>
Ієрархічний каталог з докладним
описом тематичних категорій на першій сторінці. Здійснює пошук по категорії пошуку, по одному або
кількома ключовими словами, короткий і докладний висновок результатів пошуку,
перехід на сторінки Gopher і Telnet. p>
Yellow Pages p>
Пошук інформації про 16 млн. американських
компаніях в різних областях діяльності, а також персональні дані та
електронні адреси приватних осіб. p>
Пошукові
машини h2>
У розділі курсу
"Пошук
інформації в Інтернет "
ми розглянули принцип роботи пошукових
машин: частина машини, яка називається «павуком» (або «Спайдер»), постійно подорожує
по вузлах мережі, збираючи й оновлюючи інформацію, кодує її (індексація) і
записує в спеціалізовану базу даних. При надходженні від користувача
запиту у вигляді набору ключових слів машина досліджує свою базу даних і видає
список документів, що містять ключові слова, як правило, наведені в
залежно від частоти входження ключових слів та інших характеристик. p>
Позитивні
застосування пошукових машин можна віднести величезний обсяг інформації, що досліджується
ними, і її періодичну актуалізацію. Однак, при цьому не враховуються
документи, що не містять ключових слів, а, з іншого боку, у списку
міститься багато шумовий, не відноситься до справи, відсіювання якої
займає чималий час. p>
Назва p>
Опис p>
Lycos p>
Охоплює 68 млн. сторінок. Можна
вибрати параметри пошуку: одне, декілька ключових слів або фраза; усікання
термінів; обмеження на кількість збігів; ступінь відповідності результатів
пошуку ключовими словами; форму виведення результатів (коротку або детальну);
кількість знайдених термінів на кожній сторінці. Невисокі швидкодія і
оперативність оновлення інформації. p>
Alta Vista p>
Охоплює більше 30 млн. сторінок на
225000 серверах, забезпечує доступ до 3 млн. статей в 14000 телеконференціях
Usenet. Має два режими: Simple query і Advanced query.
У режимі Simple можна
вводити шаблони для пошуку не менш, ніж з трьома зазначеними символами в
початку слова. Якщо слово містить хоча б одну заголовну букву, ведеться пошук
з урахуванням регістра. Нижче рядка введення видаються поради по пошуку. В режимі
Advanced можна створювати складні запити, засновані на логічних операторів
AND, OR, NOT, NEAR і вказувати критерії сортування отриманих результатів.
Можна вказувати діапазон дат опублікування. Надає можливість пошуку
зображень. Зручний інтерфейс. Висока швидкодія, різноманітне
пошукове припис, можливість пошуку українською мовою з урахуванням
морфології. Система не впорядковує результати пошуку, тому її
доцільно застосовувати для специфічного або вичерпного пошуку. p>
Infoseek Guide p>
Охоплює 1,5 млн. сторінок. Мова
запитів дозволяє використовувати всі можливі варіанти логічних виразів.
Менш повні, ніж на інших серверах, результати пошуку, незручний інтерфейс. P>
Infoseek Ultra p>
50 млн. сторінок WWW, можливий пошук на
російською мовою, пошук зображень. p>
WebCrawler p>
Охоплює WWW, Usenet, Gopher, FTP,
Telnet. Можливий пошук російською мовою. Простота в обігу, швидкість.
Менш велика база вузлів, ніж на інших серверах. P>
HotBot p>
Охоплює 54 млн. сторінок. AdWords для
пошукове припис. Можливий пошук російською мовою. P>
Мета-кошти
пошуку h2>
Мета-кошти
пошуку дозволяють удосконалити процес шляхом запуску одночасно
декількох засобів пошуку. Цей спосіб значно підвищує якість пошуку, об'єднуючи
гідності і можливості всіх використовуваних коштів. p>
Однак, іноді
пошук із застосуванням мета-коштів може виявитися дуже повільним, тому що їм
приходиться координувати в часі надходження результатів обробки запиту
від декількох серверів і проблеми, що виникли в одного з них, можуть
призупинити роботу всієї системи. Ще одним недоліком мета-засобів є
те, що вони не дозволяють використовувати можливості мови запиту кожного з
застосовуваних пошукових засобів і не дають можливості заглянути в їх довідкові
керівництва. p>
Назва p>
Опис p>
MetaCrawler p>
Підключає 9 пошукових систем
одночасно. Перевіряється можливість доступу до знайденої інформації,
відповідність змісту заданому критерію. Можна сортувати інформацію по
територіальної близькості, за близькістю до певного вузла, по відношенню до
компанії і т.д. Можливий пошук російською мовою. Є можливість
персональної настройки інтерфейсу. p>
SavvySearch p>
Запускає одну з 4 груп, що складаються з
трьох пошукових систем: p>
- p>
WebCrawler,
Yahoo!, Lycos p>
- p>
Galaxy,
Excite, DejaNews p>
- p>
FTPSearch95,
Yellow Pages, Infoseek p>
- p>
Magellan,
NlightN, PointSearch p>
Пошукове припис з використанням
операторів AND і OR. Можливий пошук на багатьох мовах, у тому числі російською.
p>
All-in-One p>
Добре структурована мета-машина,
що має деревовидну класифікаційну структуру, на верхньому рівні якої
розміщені групи:, весь Internet, особисті інтереси, ПО, сторінки приватних
осіб, новини і погода, література та інше. Уточнюючи утримання кожної групи,
можна потрапити на наступний рівень. p>
Використовує близько 200 пошукових засобів. p>
Internet Sleuth p>
Охоплює 1500 баз даних. Можна
запустити одночасно до 10 пошукових систем з 24, наявних в меню.
Використовує оператори AND, OR, NOT, усікання термінів. Для кожної пошукової
машини можна задати свій критерій і своє обмеження часу пошуку. p>
Можливий пошук російською мовою.
Тематичний пошук ведеться по великій кількості періодичних видань і
інформаційних служб багатьох країн. Для групи "НОВИНИ"
використовується 39 джерел. p>
Російськомовні
засоби пошуку h2>
Каталоги b> p>
Назва p>
Опис p>
Павук p>
Широке охоплення російськомовного WWW.
Глибина пошуку: назва, перші рядки, електронна адреса документів.
Підтримує всі російські кодування, можливість усікання термінів. Великий
обсяг, розгалужена ієрархічна структура. Слабка оперативність оновлення
інформації. p>
Сузір'я Інтернет p>
Охоплює близько 400 серверів.
Можливість усікання термінів. Містить назви і короткі характеристики
серверів. Приваблива графіка. Невелика зона пошуку, слабка ієрархія. P>
Жовті сторінки Інтернет p>
Близько 1200 Web-серверів. Великий обсяг
інформації, добре продумана структура. p>
Russia
on the Net p>
Перший каталог російських ресурсів. p>
АУ! p>
Молодий, швидко розвивається каталог. p>
Скарби Інтернет p>
Каталог Web-ресурсів на сервері Relcom. p>
Пошукові машини b> p>
Назва p>
1. Зона пошуку p>
2. Глибина пошуку p>
3. Мова запиту p>
4. Висновок результату p>
5. Переваги і недоліки p>
Rambler p>
1. Близько 4000 Web-вузлів, тижневий архів
телеконференцій Relcom. p>
2. Всі слова в документі. P>
3. Оператори AND, OR, NOT. Можливість усікання термінів.
Обмеження за датою. Простий запит - 30 посилань, детальний - 1000. P>
4. Назва документа, резюме, розмір
файлу, адреса, дата останнього оновлення, ступінь відповідності, кодування. p>
5. Зручний інтерфейс, висока
швидкодію, повна інформація на виході. Слабка оперативність оновлення
інформації. p>
Апорт! p>
1. 16 серверів. P>
2. Всі слова в документі. P>
3.
AND та OR. Пошук по фразі (в подвійних лапках).
Можливість усікання термінів. Чутливість до рядковим і прописним
буквах. p>
4. Назва документа, резюме, розмір
файлу, адреса, дата останнього оновлення, ступінь відповідності запиту,
кодування. p>
5. Зручність для користувача, висока
швидкодію. p>
Русская Машина Пошуку p>
1. Більше 900 російськомовних сайтів. P>
2. Всі слова в документі. P>
3.
AND та OR. Пошук по окремій фразі. Обмеження
пошуку певними елементами Web-сторінок (назва, ключові слова, автор
і т.д.). користувач може встановити або скасувати чутливість до
рядкові і прописні букви і вказати кількість можливих помилок у шуканому
слові, якщо немає впевненості в його написанні. p>
4. Назва документа, резюме, адреса,
ступінь відповідності запиту. p>
5. Багатовариантність пошукового
приписи. Незвична форма видачі результату. P>
Яndex-Web p>
1. 5000 серверів - вся російська частина
Інтернет, включаючи домени "RU", "SU", а також
російськомовні ресурси в інших доменах. p>
2. Всі слова в документі. P>
3.
AND, OR, NOT. Дозволяє
здійснювати пошук усередині абзацу, документа, в заголовках та інших полях, а
також із зазначенням відстані між словами. Пошук по фразі. Облік морфології
російської мови. Чутливість до рядкові і прописні букви. Можливість
простого і складного запиту. Пошук у знайденому. P>
4. Заголовок, початок тексту документа,
розмір файлу, дата та адреса, ступінь відповідності запиту, кодування.
Можливість "підсвічування" слів у тексті, відповідних
пошуковому припису. p>
5. Індексація забезпечує нормалізацію
слів і унікальність документа. Широке охоплення, зручний інтерфейс, висока
швидкодія, висока оперативність оновлення інформації (раз на тиждень). p>
Дане
опис не претендує на вичерпний охоплення засобів пошуку. Більш докладну
інформацію можна отримати, вивчаючи інші варіанти списків пошукових засобів,
доступні в Інтернет. p>
Список
літератури h2>
Для підготовки
даної роботи були використані матеріали з сайту http://www.dist-cons.ru/
p>