Курського державного ПЕДАГОГІЧНИЙ УНІВЕРСИТЕТ p>
КАФЕДРА ІНФОРМАТИКИ І ТСО p>
Курсова робота p>
"ПОШУК ІНФОРМАЦІЇ У WWW" p>
виконав: ст -нт ФМФ-56 p>
Разіньков О.Н. p>
Керівник: Єжова Т.В. p>
курськ-2002 p>
Зміст: p>
1. Пошук інформації в www ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... 1 p>
1.1.Основи пошукових служб ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... 1 p>
Пошукові каталоги. Пошукові покажчики (індекси). Збір інформації пошуковими роботами. Індексація ресурсів. Виконання запиту клієнта. Порівняння пошукових каталогів і покажчиків. Від чого залежить якість пошуку. Гібридні системи. Метапоісковие системи. Портали.
Рейтингові служби. P>
1.2.Основние пошукові системи ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... 8 p>
AltaVista. Ask Jeeves. Direct Hit. Excite. FAST Search.
GO/Infoseek. GoTo. P>
Google. HotBot. Inktomi. LookSmart. Lycos. MSN Search.
Netscape Search. P>
Northern Light. Open Directory. RealNames. WebCrawler.
Yahoo. P>
1.3. Вітчизняні пошукові системи ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... 11 p>
Aport. Атрус (@ Rus). Rambler. Яndex. P>
4. Прийоми простого пошуку інформації в www ... ... ... ... ... ... ... ... ... ... ... ... ... 13 p>
Пастка для початківців. Додавання навпаки. Арифметика віднімання. P>
Застосуємо джокера. Контекстний пошук. Роль великих літер. P>
Пошук у заголовках. Пошук Web-вузлів. Пошук URL-адрес. Пошук посилань p>
5. Засоби розширеного пошуку ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... 18 p>
Команда OR. Команда AND. Команда NEAR. Вкладення команд. P>
6. Вибір пошукової служби ... ... ... ... ... ... ... .... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... 20 p>
Як перевірити незнайому пошукову службу. Реферативний пошук. P>
Поглиблений пошук. Спеціальний пошук. Висновки та рекомендації. P>
1. Технологія і результат пошуку ... ... ... ... ... ... ... ... .. ... ... ... ... ... ... ... ... ... ... 22 p>
Цілі пошуку: модель, кого навчають. модель навчання. нейромодель, кого навчають. нейромодель навчання. нейромережевих моделей, кого навчають. нейромережевих моделей навчання. p>
Пошук інформації в WWW p>
формацію чи послугу в WWW, їх треба, перш за все, розшукати, а пошук інформації - непросте завдання. Станом на початок 2000 р. ресурси Web оцінюються більш ніж в 850 мільйонів Web-сторінок.
Зрозуміло, зростання Web-простору в геометричній прогресії не буде тривати вічно. Колись настане момент насичення. Можна припустити, що темпи розвитку WWW сповільняться на рубежі 3-4 млрд. Web-сторінок. Однією з причин уповільнення, зокрема, стане обмеженість поля IP адрес. Втім, до того часу, напевно, вже запрацює Інтер-нет-2, і все буде по-іншому.
Для пошуку інформації в Мережі використовуються спеціальні пошукові служби.
Зазвичай пошукова служба - це компанія, що має свій сервер, на якому працює якась пошукова система. Послуги абсолютної більшості пошукових служб безкоштовні, але, тим не менш, за темпами зростання сьогодні це найбільш ефективний бізнес у світі. Усього за кілька років такі служби як Yahoo!,
Alta Vista, Inktomi і деякі інші розвинулися від лабораторних проектів з бюджетом в десяток-другий тисяч доларів до компаній, вартість яких становить 10-15 мільярдів доларів. Такого темпу приросту капіталу світ ще не знав, особливо для безкоштовних (для кінцевого користувача) послуг.
При цьому цікаво відзначити, що ніша бізнесу далеко не освоєна, і нижче ми побачимо, як буквально в лічені місяці з хорошої ідеї «з нуля »народжуються нові гіганти. p>
Основи пошукових служб p>
Сьогодні користувач World Wide Web виявляється в тій же ситуації, що ii читач великої бібліотеки. Чим більше фонди бібліотеки, тим важче знайти саме ту книгу, яка зараз потрібна. Для спрощення пошуку в бібліотеці існують каталоги: систематичний, алфавітний, предметний та інші.
Існують і спеціалізовані каталоги, наприклад каталоги нових надходжень.
У Мережі пошук забезпечують спеціальні пошукові служби. Уміння користуватисяними, власне кажучи, і становить вміння користуватися Інтернетом. Всіпошукові системи WWW засновані на гіперпосилання. Звертаючись до пошуковоїслужбі, ми формулюємо запит, в якому формально описуємо те, що хочемознайти. Провівши потрібні операції, служба формує Web-документ, що складається згіперпосилань, що ведуть до ресурсів WWW, відповідним наш запит. Якийз цих гіперпосилань м и скористаємося - справа наша.
Незважаючи на те, що результат завжди один (клієнт отримує списокрекомендованих гіперпосилань), принцип дії у різних пошукових службможе бути різним. Нижче ми розглянемо, як класифікуються пошуковіслужби за типами послуг, що надаються, а також за способами формуваннясвоїх ресурсів. Останнє дуже важливо для ефективної роботи не тількикористувачів, але і Web-майстрів. Користувачі повинні враховувати спосібформування баз даних, щоб знати, на що вони можуть розраховувати припошуку інформації, а Web-майстри повинні це знати, щоб добитисянайкращого представлення своїх ресурсів в основних пошукових службах світу. p>
Пошукові каталоги
Пошукові каталоги схожі на предметні каталоги громадських бібліотек. Напочатковій сторінці пошукового каталогу ми вибираємо тему, яка насцікавить, потім у рамках теми вибираємо категорію, потім підкатегорію, ітак далі, поки не отримаємо конкретний список Web-ресурсів, рекомендованихдля перегляду. Найбільшим пошуковим каталогом світу сьогодні вважаєтьсяПошукова система Yahoo! (www.yahoo.com) Вона надає приблизно 1 млн.посилань до ресурсів WWW, тобто охоплює трохи більше тисячної частки всього
Web-простору.
Основним недоліком і, в той же час, гідністю пошукових каталогівє «людський фактор». Дані, які заносяться в каталог,проходять «ручну обробку». Сьогодні на Yahoo! працюють до 150 редакторів,щоденно переглядають Web-простір у пошуках найбільш ціннихресурсів за темами, що викликають суспільний інтерес. Крім власнихредакторів служба використовує й інформацію, що поставляється Web-майстрами. Так,наприклад, теоретично будь-який власник Web-сторінки може самостійнопокладену заповнити анкету і направити її на адресу служби. Правда,гарантії, що сторінка буде включена в каталог Yahoo!, це не дає,оскільки служба не засмічувати свої каталоги посиланнями на сторінки -одноденки. Клієнтів служби завжди дратують посилання, що вказують на давнонеіснуючі ресурси. Щоб не мати особливого головного болю з перевіркиактуальності зберігаються посилань, служба Yahoo! воліє скрупульознопідходити до формування своїх каталогів. Ретельність в підборі інформаціїзабезпечує високу репутацію Yahoo!, незважаючи на те, що сукупний обсягїї ресурсів вкрай малий.
Інший підхід до формування каталозі демонструє пошукова служба Open
Directory (dmoz.org). У якості джерела для своїх ресурсів вонавражає користувачів WWW, які на добровільній основі можутьоглядати що сподобалися їм Web-сторінки, каталогізувати їх і розміщуватипосилання на них на центральному сервері служби. Оскільки число добровільнихпомічників може бути дуже великим, у цієї служби є всі шанси перекритиуспіх Yahoo!. Але принцип добровільності не гарантує якісностіроботи, тому каталоги, рівні Yahoo за якістю, мабуть, з'являтьсяще не скоро. Однак є й інші підходи, засновані, наприклад, на 5МАНГ -технології, і ми їх теж розглянемо. p>
Пошукові покажчики (індекси)
11рінціп дії пошукового покажчика схожий на принцип діїпредметного каталогу бібліотеки. Користувач формує запит за допомогоюключових слів, що виражають об'єкт його пошуку, а пошукова система видає йомусписок посилань на Web-сторінок, які містять дані ключові слова. КСЛІ михочемо знайти інформацію, присвячену взаєминам А. Вольта з Н.
Бонапартом, можна задати пошук документів, в яких одночаснозустрічаються слова Вольта і Бонапарт, наприклад так: p>
+ Вольта + Бонапарт або так: p>
Вольта AND Бонапарт
Основна відмінність пошукових покажчиків від пошукових каталогів складається isповної автоматизації всіх етапів роботи. Тут відсутній «людськийфактор », і тому кількість Web-сторінок, до яких веде пошуковийпокажчик, набагато більше. Улітку 1999 р. найбільші пошукові покажчикиподолали 200-мільйонний рубіж і, як повідомляють, наступний рубіж (300 --мільйонний) буде взятий в 2000 р. p>
Збір інформації пошуковими роботами
Пошукові покажчики працюють у три етапи. Створення пошукової системипочинається з розробки спеціальної агентської програми, яка здатнаподорожувати по Web-вузлам Інтернету, переглядати Web-сторінки ікопіювати їх вміст на центральний сервер пошукової системи. Такіагентські програми називають «черв'яками», «павуками», «пошуковими роботами»
(скорочено «ботами»), «пошуковими машинами», «краулерамі» і т. п.
Різноманіття назв пов'язано з тим, що кожна пошукова система створюєсвою власну, неповторну програму і дає їй своє ім'я, якезгодом стає загальним. Більшість сучасних пошуковихсистем починалися з того, що в 1993-94 роках в університетськихлабораторіях були розроблені експериментальні програми для моніторингу
Мережі.
Якщо при читанні Web-сторінки пошуковий робот знаходить на ній посилання на інші сторінки того ж Web-сайту, він переходить за цим посиланням, читає їх зміст і так далі. Як черв'як, він проникає в найвіддаленіші закутки WWW. P>
Індексація ресурсів
Другий етап роботи пошукової системи - індексація. Зібрати на центральному сервері образи сотень мільйонів Web-сторінок - це одна справа, а зуміти вибрати ті з них, які потрібні клієнтові, сформувало запит, - зовсім інше. Відповідати треба дуже швидко, а для цього дані треба зберігати не абияк, а у вигляді спеціальних структур. Процес перетворення даних з тієї форми, в якій вони зберігаються на Web-сторінках, в інші форми, зручні для швидкого перегляду, називається індексацією. У результаті індексації і утворюється база даних, яку називають пошуковим покажчиком (індексом).
У кожної пошукової системи свої прийоми і методи індексації. Зокрема,перед індексацією більшість систем очищають документ від зарезервованихслів (stop-words), до яких відносяться артиклі, прийменники, спілки,займенники і інші слова, що мають менше 4 символів. Однак не тількикороткі слова можуть бути зарезервованими. Дуже поширені слова,такі як Computer і Internet теж резервуються. Шукати щось з нимдаремно, тому що вони зустрічаються повсюдно.
Спеціалізовані пошукові служби можуть використовувати й інші слова вяк зарезервованих. Наприклад, якщо служба займається пошуком книг
(books), то слово book для неї може вважатися зарезервованим.
На етапі підготовки до індексації може відбуватися нормалізація слів
(stemming) за рахунок відкидання суфіксів і закінчень. Після такої
«Зачистки» фраза типу «Ми з братом любимо ловити рибу» перетворюється на 'щось схоже на «брат люб лов риби». Оригінальний документ може бути знайденийпри пошуку за ключовими словами «брат», «любов», «ловити», «риба», аленіколи за словами «ми» або «с».
Деякі системи виробляють нормалізацію завжди. Ряд систем, що базуютьсяна службі Inktomi (див. нижче) можуть діяти як в той спосіб, так ііншим. Служба Alta Vista не виробляє нормалізацію ніколи, і це їїунікальна особливість, яка, як буде показано нижче, активновикористовується для контекстного пошуку.
На основі «зачищеного» документа готується індекс. Індекс - це особливабаза даних, створена спеціальним чином, щоб прискорити пошук.
Існує безліч методів індексації. Зрозуміло, вони не розголошуються.
Як і пошуковий робот, алгоритм індексації становить комерційну таємницюпошукової служби, тому як приклад ми наведемо лише найпростішийтип індексу - так званий зворотний файл.
Суть зворотного файлу полягає в тому, що складається словник з усіх слів,зустрінутих в усіх документах, зібраних пошуковим роботом, а потім длякожного слова записується група чисел, що вказують на те, в якихдокументах воно зустрічається, наскільки часто, а також деяка службоваінформація. p>
Виконання запиту клієнта
Третій етап - відповідь на запит клієнта. Кращі пошукові системи у відповідь назапит дивляться свої індекси за десяті частки секунди і негайноповертають списки посилань, що ведуть до затребуваним ресурсів. Роботавідбувається таким чином.
Система аналізує ключові слова, що клієнт використовував у запиті. Зними здійснюються ті ж операції звільнення від зарезервованих слів інормалізації, після чого виконується пошук збігів з вмістомпошукових індексів. Ці операції в більшості пошукових систем відбуваютьсяприблизно однаково, але сама остання операція, коли за знайденимизбігам формується загальний список посилань, завжди розрізняються. Укожної пошукової системи своя політика формування результуючого списку.
Якщо знайдено дуже багато посилань на ресурси, що задовольняють запиту, топостає проблема їх упорядкування. Тут важливо, які посилання дати на початкусписку, а які - в кінці, тобто, треба вводити якийсь рейтинг. Різніпошукові системи мають різні рейтингові системи. При обчисленні рейтингувраховується багато параметрів. За деякі нараховуються позитивнібали, а за деякі - навпаки штрафні. Позитивний рейтингнараховується, зокрема, за таких обставин:
• якщо розшукувані слова зустрічаються на Web-сторінці неодноразово (але не надто часто, і не підряд);
• якщо вони розташовані близько до початку сторінки;
• якщо ці слова присутні в заголовку сторінки;
• якщо Web-сторінка має ілюстрацію, альтернативний текст якої теж містить слова, введені користувачем.
Кращі пошукові системи нещодавно ввели новий підхід до рейтингування. Вонивраховують кількість посилань в проіндексованої просторі Web, провіднихдо даного ресурсу. Це природно, адже чим більше публікацій посилаються надану сторінку, тим вона популярніше і тим вища ймовірність того, що вонабуде корисною автору запиту. У традиційному бібліотечну справу такийпідхід відомий. Наприклад, у США давно видається багатотомний щорічний
«Індекс цитування» (Citational Index), в якому каталогізують посиланнярізних авторів на першоджерела. Це непростий технічно, але дужекорисний для клієнтів метод індексації ресурсів.
До сучасних відносяться і комерційні хитрощі. Відносно недавнодеякі пошукові системи (в тому числі і така відома, як Alta Vista)почали підвищувати рейтинг тим, хто готовий за це платити. Такий підхідвиглядає не дуже красиво, але з точки зору власників пошукових системвиправданий одвічним тезою «турботи про споживача». Вони заявляють, що дляспоживача цінність інформації на сторінці солідної фірми, готової нестивитрати на свою рекламу в Мережі, все-таки вище, ніж цінність доморослоїсторінки нікому не відомого студента. Можливо, що вони і мають рацію. ПідПринаймні той, хто заплатив гроші за рейтингування своєї сторінки,напевно буде більше приділяти увагу її якості, ніж той, хто зробив їїпохапцем і пристроїв на першому-ліпшому безкоштовному сервері. p>
Порівняння пошукових каталогів і покажчиків
У кожного з двох основних типів пошукових служб є достоїнства інедоліки. Пошукові каталоги формуються вручну за допомогою живих людей.
Тому, як правило, якщо ми знаходимо в них потрібний нам ресурс, то цейресурс - один з кращих в Мережі. Він не обов'язково найкращий і, можеМожливо, лише входить до першої двадцятки, але він явно не випадковий і можерозглядатися як рекомендований. Відповідальні редактори пошуковогокаталогу, що мають солідну освіту в більшості галузей науки,техніки та культури, не будуть включати у свій каталог очевидну нісенітницю.
Пошукові каталоги зручніше і тим, що там не буває десятків посилань на одині той же ресурс, розміщений в різних місцях або проіндексований врізний час. Загалом, якщо треба швидко знайти найкраще джерело з якоїсьтемі, треба починати пошук з пошукового каталогу.
Недоліком пошукових каталогів є їх слабке знання про справжніхресурсах WWW, яке з кожним днем падає у відносному вимірі. Якми вже говорили, найбільший пошуковий каталог Yahoo! за шість років свогороботи довів кількість оброблених ресурсів до мільйона, у той час якщороку з'являються сотні мільйонів нових Web-сторінок.
Пошукові покажчики черпають свою вихідну інформацію від пошукових роботів,день і ніч плазунів по просторах WWW. Процес збору інформації повністюавтоматизований, тому обсяг проіндексованого простору набагатобільше, ніж у пошукових каталогів. Сьогодні цей показник перевищує 25%спільного простору Мережі. З іншого боку, відсутність людськогофактора позначається на доачестве того, що можна знайти через пошуковіпокажчики. Для робота абсолютно все одно, чи написана стаття з фізикиакадеміком або школярем. При рейтингова-ПІІ робот може навіть поставитисторінку школяра вище.
Тому пошукові каталоги краще використовувати для ознайомлювального пошуку,коли тема відома, а переваг немає, наприклад при підготовці шкільногореферату на тему «Теорія відносності». Каталог швидко виведе вас на
Web-сайт, на якому ви або знайдете те, що хотіли, або отримаєте посиланняна інші корисні ресурси. А пошукові покажчики варто використовувати длябільш глибоких або екзотичних розшуків. Наприклад, людині, якій протеорії відносності і так вже все відомо, навряд чи допоможе пошуковийкаталог, що має посилання на загальновідомі Web-ресурси. А пошуковийпокажчик, проіндексований 300 мільйонів Web-сторінок, може йомузапропонувати якийсь унікальний звіт про семінарі, проведеному в університетіштату Айдахо або в Новосибірську. p>
Від чого залежить якість пошуку
Як неважко здогадатися, гідності пошукових каталогів є недоліками пошукових покажчиків і навпаки. Основних параметрів, за допомогою яких оцінюють якість пошукових систем, всього два: коефіцієнт попадання і коефіцієнт охоплення.
Коефіцієнт попадання показує, який відсоток посилань, виданих пошуковою системою, дійсно відноситься до тієї теми, яка цікавить клієнта.
Для пошукових каталогів цей коефіцієнт дуже високий. Оскільки їх складають люди, поява «сміттєвої» заслання - рідкість. Зазвичай вона виникає тільки коли за час, що минув після реєстрації, Web-сторінка перестає існувати. Для каталогів цей коефіцієнт складає близько
70-80%, і вже у всякому разі не повинен бути менше 50%.
Для пошукових покажчиків цей коефіцієнт сумно низький. Якщо не вживати спеціальних заходів, він становить одиниці відсотків. Причина лежить, по-перше, в тому, що автоматичні кошти не можуть точно виявляти тематичну приналежність Web-сторінок на основі формальних ознак, а по-друге, в тому, що більшість клієнтів не вміють користуватися всіма можливостями пошукових систем і формують завдання на пошук далеко не оптимально.
Коефіцієнт охоплення показує, наскільки база даних пошукової системи відображає істинне кількість інформації, яка є по даній темі в світі.
Тут попереду пошукові покажчики. Найбільш довершені з hiix мають коефіцієнт охоплення порядку 25%. Пошукові каталоги, навпаки, не охоплюють і одного відсотка всіх наявних ресурсів.
З точки зору користувача якість пошуку означає прагнення отримати якомога більше посилань по цікавить його темі, але так, щоб у результуючому списку було якомога менше посилань, які не мають прямого відношення до об'єкта пошуку. Користувач бажає, щоб кожен із коефіцієнтів був близький до 100%. Його суб'єктивна оцінка якості пошукової системи нагадує твір коефіцієнта потрапляння на коефіцієнт охоплення. Сьогодні ж і для пошукових каталогів, і для пошукових покажчиків цей твір становить десяті частки відсотка. P>
Гібридні системи p>
У прагненні підвищити якість роботи пошукових служб є спроби поєднати обидва підходи. При цьому можливі два варіанти: пошукові каталоги залучають можливості пошукових покажчиків, переадресуємо їм запит.
Наприклад, до останнього часу пошуковий каталог Yahoo переадресовував особливо складні запити пошуковому вказівником Alta Vista.:
Сьогодні Yahoo! залучає кошти іншого партнера - Inktomi. '
З іншого боку, пошукові покажчики навчилися виконувати автоматичнукаталогізацію своїх ресурсів і надавати доступ до них так як цеприйнято в пошукових каталогах. Приклад такого підходу являє найпотужнішийсьогодні пошуковий покажчик Fast Search p>
Метапоісковие системи
До метапіісковим систем відноситься безліч пошукових служб другуешелону. Вони приймають від користувача запит і розміщують його відразу надекількох пошукових серверах. Потім вони збирають що надійшла від нихінформацію, узагальнюють її, структурують, рафинируются (очищають) і передаютьклієнтові. Збільшений час виконання запиту компенсується поліпшенимякістю результатів пошуку.
Перший час великі пошукові системи спокійно дивилися на суще-,наленню «під собою» метапоіскових систем. Проте останнім часом взв'язку з бурхливим розвитком ідеї порталів все частіше і частіше зустрічаються заборона!на метапоіск. А якщо говорити точніше, великі пошукові системи почализайматися ним самі, залучаючи ресурси колег на взаємовигідній основі. p>
Портали p>
Входячи в World Wide Web за допомогою броузера, ми потрапляємо на якусьсторінку, яка задана в настройках броузера в якості початкової.
Користувач може легко переналаштувати свій броузер на роботу з іншогопочаткової сторінки. Яку саме сторінку він буде використовувати - йогоособиста справа. Досвід показує, що дуже зручно мати як початковусторінки таку, на якій вже представлено кілька посилань на основніпошукові системи. Зручно тут же мати доступ до електронної пошти.
Непогано, якщо на цій сторінці завжди відображаються останні новини зсвіту політики, мистецтва, спорту, бізнесу і т. п. Такі «готові»початкові сторінки називаються порталами. У світі існує безлічпорталів - настройте свій броузер на той, який найкращим чиномвідповідає вашим особистим інтересам. Гарні портали надаютькористувачеві можливість персональної настройки «під себе». Треба тількивключити прапорці проти тих постачальників інформації, які вам цікаві, івимкнути у тих, які для вас неактуальні.
Борючись за клієнтів, багато пошукові системи перетворюються в портали. Цеозначає, що вони не тільки готові поставляти результати пошуку, але IIздатні виконувати інші послуги. Часто назву порталів починається зіслова My (Мій/Моя/Моє). Наприклад, якщо на пошукових системах Yahoo!, Alta
Vista або DejaNews вам пропонують підписатися на службу MyYahoo,
MyAltaVista або MyDejaNews, то, значить, мова йде про те, щоб статипостійним клієнтом зручного порталу.
Іншою причиною того, що пошукові системи поступово перетворюються на портали, став той факт, що їм стало важко одночасно і «копіювати» простір WWW, і індексувати гігантські бази даних, і "Услужівать запити клієнтів. Пошукові системи починають розподіляти обов'язки.
Завдання з контролю за Web-простором поступово передаються на партнерських підставах «третій» фірмам, а самі пошукові системи зосереджуються на обслуговуванні клієнтів і залучення рекламодавців, тобто перетворюються в портали. p>
Рейтингові служби
В останні три роки з'явився новий тип служб, що дозволяють швидко шукати інформацію в Мережі, - це так звані реітінговие служби. Вони займають проміжне положення між пошуковими службами і порталами і можуть використовуватися як в тому, так і в іншій якості. < br> Суть рейтингової служби полягає в тому, що на її сервері створюються тематичні СП1-1СКІ посилань на найбільш популярні Web-ресурси. Хоч ці списки і невеликі, наочність їх велика, оскільки саме ці посилання віддають перевагу більшість клієнтів Мережі.
Коли ми вибираємо одну з посилань, представлених на сервері служби, спрацьовує лічильник, і рейтинг цього ресурсу збільшується. Кожен наступний відвідувач бачить, скільки «нащелкалі» його попередники, і розуміє, який ресурс йому варто подивитися. Пошук за допомогою рейтингових служб можна розглядати як пошук « за рекомендаціями ». Зрозуміло, він не може претендувати на об'єктивність, але коли мова йде про теми, що мають суспільний інтерес, таких як новини, політика, спорт, кіно, музика, комп'ютерні ігри і т. п., цим« рекомендацій »можна довіряти . Найпопулярніша вітчизняна рейтингова служба - Rambler (www.rambler.ru).
Найбільш популярна зарубіжна рейтингова служба - Webside Story
(www.hitbox.com) p>
Основні пошукові системи p >
AltaVista (http://www.altavista.com/)
За кількістю індексованих Web-сторінок Alta-Vista - один з найбільших
(але не найбільша, як це іноді вважається) пошукових систем світу .
Величезний обсяг охоплення Web-простору та потужний набір пошукових команд роблять цю систему улюбленим засобом пошуку для більшості користувачів. Система була запущена в експлуатацію в грудні 1995 р. і довгий час вважалася молодий, але бурхливо розвивається. Для початківців система має спрощену службу, яка називається Ask Alta Vista. У своїй роботі ця служба залучає іншу пошукову службу - Ask Jeeves (див. нижче). Незважаючи на те, що сьогодні Alta Vista вже не є найбільш зручним засобом пошуку і володіє не найбільшим індексом, її популярність як і раніше вище, ніж у служб, які перевершили її за багатьма показниками, що пов'язано з усталеними звичками мільйонів користувачів. p>
Ask Jeeves (http://www.askjeeves.com/)
Ця система являє зразок людського (неавтоматизованому)підходу до індексації та зберігання інформації про Web-документах. Її мета не вте, щоб видати у відповідь на запит як можна більше можливих посилань, втому, щоб вони були найбільш точними. В ідеалі система повинна вас направитисаме до тієї Web-сторінці, яка вам саме й потрібна. Система булавведена в експлуатацію в червні 1997 р. Результати пошуку в цій системівикористовуються і при розміщенні запиту в Alta Vista. p>
Direct Hit (http://www.directhit.com/)
Систему Direct Hit можна назвати системою «рафінування» результатів пошуку, що видаються іншими пошуковими системами. Вона контролює, якими результатами пошуків клієнти користуються найчастіше і, тим самим, створює певний рейтинг популярності Web-сторінок. Цей рейтинг вона надає іншим пошуковим системам, і вони враховують його при видачі результатів. Технологія Direct Hit безпосередньо використовується пошуковою системою
HotBot. Вона також враховується системами Lycos, LookSmart і MSN Search. P>
Excite (http://www.exc1te.com/)
Excite - одна з найпопулярніших пошукових систем World Wide Web. Вона має покажчик середнього розміру і окрім пошуку Web-сторінок надає послуги з пошуку інших матеріалів, наприклад відомостей про компанії або результатів спортивних змагань. Система була створена наприкінці 1995 р., пройшла етап бурхливого розвитку і в 1996 р. поглинула двох найближчих конкурентів: систему Magellan і WebCrawler, хоча ті, як і раніше зберігають свої торгові марки і надають пошукові послуги як самостійні служби. P> < p> FAST Search (http://www.alltheweb.com/)
Ця система, що належить норвезькій компанії, раніше називалася All
TheWeb. Незважаючи на те, що вона була запущена зовсім недавно (у травні 1999 р.), перед нею ставиться завдання обігнати конкурентів у повноті колекцій засилаючи; на Web-сторінки. Здається, їй це вдається. Влітку 1999 FAST Search перший переступила 200-мільйонний рубіж проіндексованих Web-докумеатов. Крім системи FAST Search та ж компанія контролює підрозділ системи
Lycos, що займається пошуком музичних файлів у форматі МРЗ. л! p>
Go/Infoseek (http://www.go.com/)
Go/lhfoseek - це поєднання відомої в минулому пошукової системи Infoseek
(була заснована в 1995 р.) і сучасного порталу Go (створений в 1999 р. і належить відомій Walt Disney Co). Крім пошукових можливостей
Infoseek портал пре-| доставляє зареєстрованим користувачам можливість персональної настройки середовища, безкоштовну електронну пошту та інші корисні cepвіси. Користувачі цієї системи відзначають високу якість посилань, що повертаються системою, що пояснюється спеціальним
«фірмовим» алгоритмом! пошуку. Крім автоматизованого покажчика система має також великий каталог Web-сайтів, що складається вручну. P>
GoTo (http://www.goto.com/)
Пошукова служба GoTo не має відношення до порталу Go, і відома тим, щоформує результати пошуку на комерційній основі. Компанії, що володіють Web -вузлами, за певну плату можуть домовитися, щоб посилання на нихз'являлися на вищих місцях у списках підсумкових результатів.
Наскільки відомо, більше ніхто, крім Alta Vista, не займається такимимахінаціями. Втім, служба GoTo не вважає це махінацією, а вважає,що платоспроможність Web-видавця безпосередньо пов'язана з якістющо поставляється ним інформації, і тому для користувача такий підхід корисний.
При формуванні списку служба бере оплачені посилання з власної базиданих, а неоплачені черпає від пошукової системи Inktomi (див. нижче).
Служба була запущена в 1997 р. В її основу було покладено Web-краулер World
Wide Web Worm, придбаний у розробника - університету штату Колорадо.
З його допомогою збиралася первинна база покажчика. У 1998 р. служба перейшлана нинішню «комерційну» модель обслуговування і почала використовуватисистему Inktomi як генератор «некомерційних» посилань. p>
Google (http://www.google.com/)
Служба Google відома тим, що при генерації список посилань в першучергу видає посилання на те Web-сторінки, до яких з інших документівведе найбільшу кількість посилань. Це дає дуже цікавий ефект. Набільшості пошукових систем абсолютно марно шукати інформацію потаким тривіальним словами як Cars (Автомобілі), Internet, WWW, Games
(Ігри). Пошук за цими словами поверне стільки посилань, що серед нихнеможливо знайти найкорисніші. Служба Google при проведенні пошуку потривіальним словами дає гарні результати, оскільки керуєтьсядумкою інших користувачів, раніше здійснювали подібний пошук. p>
HotBot (http://hotbot.lycos.com/)
За популярністю серед мережевої громадськості HotBot наближається до Alta
Vista. Як і Alta Vista, ця служба має величезний пошуковий покажчик ібагато корисних функцій. При генерації першим "^ ^ S ^^^^^ сторінки посилань
HotBot використовує результати, що надходять від системи Direct Hit (див. вище).
При генерації наступних сторінок використовується система Inktomi (див. нижче),послугами якої користуються і інші пошукові служби. Крім пошуку поключовими словами служба надає також можливість пошуку затематичного каталогу. Дані для каталогу черпаються з проекту Open
Directory (див. нижче).
Служба HotBot була створена в травні 1996 р. компанією Wired Digitals, якув 1998 р. перекупила пошукова служба Lycos. Незважаючи на це, HotBotпродовжує функціонувати як самостійна пошукова служба,паралельно з Lycos. p>
Inktomi (http://www.inktorm.com/)
Ядро пошукової системи Inktomi було розроблено вуніверсітете Каліфорнії в
Берклі. Трохи пізніше творці системи заснували однойменну компанію ісформували покажчик посилань Inktomi, який був використаний в якостіоснови службою HotBot. Сьогодні цей покажчик використовують і деякі іншіпошукові служби. Незважаючи на те, що при відповіді на запит користувача всепідключені служби звертаються до одній і тій же базі даних, результативидаються різні. Це пов'язано з тим, що хоча Inktomi і забезпечуєпартнерам доступ до загальної бази покажчиків, система всетаки розрізняєпартнерів і застосовує системи рейтингування і фільтрації результатів увідповідно до їх ідеологією. p>
LookSmart (http://www.looksmart.com/)
Служба LookSmart - найближчий послідовник концепції Yahoo! в тому, що стосується «людського фактора» при складанні каталогів Web-ресурсів.
Вона надає доступ до свого каталогу службі Alta Vista і іншим партнерам. У тих випадках, коли пошук по архівах LookSmart не дає результату, їй допомагає своїми покажчиками Alta Vista. P>
Служба LookSmart була створена в 1996 р. за фінансової підтримки концерну
Reader's Digest, але приблизно через рік її засновники відкупили 'службу, ісьогодні вона незалежна. p>
Lycos (http://www.lycos.com/)
Спочатку служба Lycos була запущена як пошукова система, заснованана програмі-роботі, яка збирає інформацію з WWW. Запущена вексплуатацію ще в травні 1994 р., сьогодні вона вважається однією з найстарішихпошукових служб. Однак зовсім недавно, в 1999 р. служба перейшла на іншумодель, схожу на Yahoo! і засновану на каталогізації Web-вузлів. Своїосновні каталоги служба отримує від проекту Open Directory, адодаткові можливості пошуку спираються на моніторинг WWW за допомогоюпрограм-роботів. В якості альтернативної послуги Lycos веде ще однакаталог - каталог Web-сайтів Lycos Community Guides.
Назва компанії утворене з латинського словосполучення, яке можнаперекласти приблизно як волкопаук. У 1998 р. служба Lycos викупила акціїсвого найближчого конкурента HotBot, який продовжує автономну роботупід загальним управлінням Lycos.
MSN Search (http://search.msn.com/)
Служба MSN Search, що належить компанії Microsoft була створена в 1998 р.і є порталом, на якому представлені й інші пошукові служби. Уоснову результатів пошуку, які видаються службою, покладений покажчик,постачається системою Inktomi. p>
Netscape Search (http://search.netscape.com/)
Пошукова служба Netscape Search отримує первинні результати пошуку відпроекту Open Directory і власної бази Smart Browsing. Вториннірезультати Search постачають?? я службою Google. На порталі Netscape
NetCenter крім цієї власної служби присутні посилання і на іншіпошукові служби. p>
Yahoo! (http://www.yahoo.com/)
Yahoo'-один з найстаріших і найбільш популярних пошукових служб. Її каталогбуло запущено в експлуатацію ще в 1994 р. Секрет успіху Yahoo 'в <людському факкоре ». На службу працюють близько 150 редакторів, невпиннополіпшують і поповнюють безліч тематичних розділів величезний каталог.
У каталозі містяться дані по одному мільйону Web-вузлів. Якщо пошук завласним каталогом не дає результату, залучаються ресурси пошуковогопокажчика Inktomi. p>
Вітчизняні пошукові служби
З великим задоволенням ми повинні відзначити, що російський сектор
Інтернету розвивається дуже бурхливо. Сьогодні ситуація така, що навіть якщо західний сектор з яких-небудь причин «накаже довго жити», російський сектор досить автономний, щоб розвиватися самостійно і достойно обслуговувати вітчизняних клієнтів.
Важливу роль у становленні та розвитку вітчизняного сектора Інтернету зіграли вітчизняні пошукові служби (за що їм величезне спасибі). Не знаємо, чи змогли вони до сьогоднішнього дня підійти до самоокупності, але в перші роки без сумніву працювали на ентузіазмі, доброї волі своїх співробітників і віри в майбутнє. У Росії є як універсальні, так і спеціалізовані пошукові служби. Як і скрізь у світі, в першу чергу розвиваються пошукові покажчики та рейтингові системи, але є і повноцінний каталог - @ Rus, в минулому «Ау'». p>
Aport (http://www.aport.ru /)
«Апорт» - один з перших пошукових покажчиків російського Інтернету --дітище компанії «Агама» (http://www.agama.ru/). Минулого службанадавала традиційні загальноприйняті засоби пошуку, але в кінці 1999року запровадила нову систему ( «Апорт 2000») і зробила великий крок вперед,особливо в тому, що стосується представлення результатів пошуку. Вище ми вжевідзначали, що сьогодні володіння найбільшим проіндексованіпростором Web вже не є самоціллю. Головне - найкращим чиномзабезпечити потреби користувача, afl найпростіший шлях до цього лежить не вбезмірнім збільшенні індексу, а вs застосуванні нових технологій приобробці результатів. Перш за все слід зазначити, що системі «Апорт
2000 »вдається майстерно поєднати« машинний »і« людський »фактори. Цедосягнуто за рахунок тісної інтеграції з партнерським каталогом @ Rus. Так,наприклад, коли за результатами пошуку виводиться адреса Web-сторінки, вінможе супроводжуватися коротким описом Web-сайту, взятим з каталогу @ Rus.
Хоча користувач і не бачить глибинних процесів, але система «Апорт 2000»приділяє особливу увагу рейтингування результатів пошуку. Зокрема, вонавикористовує найбільш ефективну сьогодні систему рейтингування за кількістюпосилань, що ведуть до даного ресурсу (за індексом цитування). За способомпредставлення результатів пошуку служба «Апорт 2000" в даний часє однією з найбільш передових не тільки в Росії, але і в світі.
Сторінка результатів пошуку приносить справжнє естетичне задоволення,хоча і тре