Міністерство загальної та професійної освіти РФ p>
ДЕРЖАВНИЙ УНІВЕРСИТЕТ УПРАВЛІННЯ p>
Інститут заочного навчання p>
КУРСОВИЙ ПРОЕКТ p>
З дисципліни: «Інформаційні технології в управлінні » p>
На тему:« Технології пошуку документальної інформації в INTERNET » p>
Виконано: Єгорова А.С. p>
Студентський квиток № 3065 p >
Група 431 p>
МОСКВА, 2001 p>
ЗМІСТ (стор.): p>
1. ВСТУП. P>
1.1. Що таке Internet (3). P>
1.2. Коротка історія Internet (5). P>
2. Браузер: порівняльні характеристики Netscape Navigator і Microsoft
Internet Explorer (6). P>
3. ПОШУКОВІ СИСТЕМИ (10). P>
3.1. Механізми пошуку (12). P>
3.2. Порівняльний огляд пошукових систем. Структура запиту (15). P>
4. ВИСНОВОК (24). P>
5. Список використаних джерел (25). P>
1. ВСТУП. P>
1.1. Що таке Internet. P>
Internet - глобальна комп'ютерна мережа, що охоплює весь світ.
Сьогодні Internet має близько 30 мільйонів абонентів у більш ніж 180 країнахсвіту. Щомісяця розмір мережі збільшується на 5-7%. Internet утворює якби ядро, що забезпечує зв'язок різних інформаційних мереж, що належатьрізним установам в усьому світі, одна з іншою. p>
Сплеск інтересу до глобальної інформаційної мережі Internetспостерігається зараз повсюдно. У сформованих умовах потреба вінформації про мережу Internet стає особливо гострою. В даний час по
Internet розповсюджується безліч документів, що стосуються якфункціонування мережі та роботи в ній користувачів, так і пов'язаних зрізними сферами життя: наукою, культурою, економікою і т.д. При чомуоновлення інформації в Internet, великої розгалуженої мережі, якамістить у собі комп'ютерні вузли, розкидані по всьому світу, відбувається,практично, в режимі реального часу. p>
У дійсності Internet не просто мережа, - вона є структура,що об'єднує звичайні мережі. Internet - це «Мережа мереж». P>
Щоб описати сьогоднішню Internet, корисно скористатися суворимвизначенням. У своїй книзі "The Matrix: Computer Networks and Conferencing
Systems Worldwide "Джон Квотерман описує Internet як« метасеть,що складається з багатьох мереж, які працюють за протоколами сімейства
TCP/IP, об'єднані через шлюзи і використовують єдиний адресний простір іпростір імен ». p>
Для організації міжмережевих з'єднань необхідний відповіднийпротокол. p>
Протокол - це набір домовленостей, який визначає обмін данимиміж різними програмами. Протоколи задають засоби передачі повідомлень іобробки помилок в мережі, а також дозволяють розробляти стандарти, неприв'язані до конкретної апаратній платформі. Всі параметри - від швидкостіпередачі даних до методів адресації при транспортуванні окремихповідомлень - задаються протоколами, що використовуються в даній конкретній мережі. p>
У Internet базовим протоколом є TCP/IP (Transmission Control
Protocol/Internet Protocol). IP відповідає за адресацію вузлів мережі, а TCPзабезпечує доставку повідомлень за потрібною адресою. Ці потужні протоколибули запропоновані в 1974 р. Робертом Кеном, одним з основних розробників
ARPANET, і вченим-комп'ютерником Вінтон Серф, віце-президентом CNRI.
Слід мати на увазі, що TCP/IP не єдиний протокол, придатний дляоб'єднання різних мереж. Internet нині перетворилася на мультипротокольниймережа, інтегруючу інші стандарти. Основні серед них - стандартивзаємодії відкритих систем (OSI). p>
Запропоновані Міжнародною організацією зі стандартизації (ISO)протоколи OSI одержали широке розповсюдження в Європі. Системи,засновані на інших протоколах, також підключаються до Internet через шлюзи.
Наприклад, BITNET - це мережа, яка використовує для передачі даних своївласні стандарти, проте, принаймні, частково, вона доступначерез шлюзи з Internet. p>
У Internet немає єдиного пункту передплати або реєстрації, а замість цьогови контактуєте з постачальником послуг, який надає вам доступ домережі через місцевий комп'ютер. Наслідки такої децентралізації з точкизору доступності мережних ресурсів також дуже значні. Середупередачі даних в Internet не можна розглядати тільки як павутину проводівабо оптоволоконних ліній. Оцифровані дані пересилаються черезмаршрутизатори, що з'єднують мережі і за допомогою складних алгоритміввибирають найкращі маршрути для інформаційних потоків. p>
1.2. Коротка історія Internet. P>
Спочатку ніщо не віщувало, що Internet стане загальнодоступноюкомп'ютерною мережею. Як і багато хто інші великі ідеї, «Мережа мереж» виниклаз проекту, що призначався зовсім для інших цілей. Їїпрародителькою стала мережа АRPANET, розроблена і розгорнута в 1969р.компанією Bolt, Beranek, and Newman (BBN) на замовлення Агентства передовихдослідних проектів (ARPA) Міністерства оборони США. p>
ARPANET об'єднувала навчальні заклади, військові організації та їхпідрядників. Вона була створена з метою допомогти дослідникам в обмініінформацією, а також (що стало однією з головних цілей) для відпрацюванняметодів підтримки зв'язку в разі ядерного нападу. p>
Засновники ARPANET спочатку дозволяли вченим тільки увійти досистему і запустити програму на віддаленому комп'ютері. Скоро до цихможливостям додалися передача файлів, електронна пошта та спискирозсилки, що забезпечили спілкування дослідників, які цікавилися однієї і тієїж областю науки і техніки. Але в міру зростання ARPANET розвивались і іншімережі, і незабаром стала очевидною потреба у нових засобах зв'язку. p>
Порівняно недавно з'явилася нова технологія Internet названа
World Wide Web (WWW), що звичайно перекладається як «Всесвітня павутина». Цясистема була розроблена, в основному, в Європейській лабораторіїелементарних частинок у Швейцарії (CERN). Мережа призначалася спочаткудля фізиків, але потім отримала широке визнання. p>
WWW побудована за технологією, в основі якої лежить принцип створеннягіпертекстових документів (Web-сторінок). Гіпертекстовий документ укладаєв собі посилання на інші подібні документи, які, у свою чергу,містять посилання на такі, і т.д. Таким чином, вони виявляютьсяпов'язаними між собою. p>
Для роботи в WWW використовується протокол HTTP (Hyper Text Transmission
Protocol), а програми, що дозволяють працювати з відповідними документамив Internet, називають переглядачами або браузерами. p>
2. Браузер: порівняльні характеристики Netscape Navigator і
Microsoft Internet Explorer. P>
Документи Internet призначені для відображення в електронному вигляді,причому автор документа не знає можливостей комп'ютера, на якому будутьпроглядатися документи. Тому був створений стандарт для опису істворення документів, розташованих на Web-сторінках. Ця мова називається
HTML (HyperText Markup Language - мова гіпертекстової розмітки). Ця моваописує логічну структуру документа, керує форматуванням текстуі розміщенням вставних об'єктів. p>
Форматування і відображення документа, описаного за допомогою HTML, наконкретному комп'ютері виробляється спеціальною програмою - браузером.
Простіше кажучи, браузер призначений для перегляду вмісту Web-сторінок. P>
Основні функції браузерів наступні: p>
. встановлення зв'язку з Web-сервером, на якому зберігається документ, і завантаження всіх його компонентів; p>
. форматування і відображення Web-сторінок відповідно до можливостей комп'ютера, на якому браузер працює; p>
. надання коштів для відображення мультимедійних та інших об'єктів що входять до складу Web-сторінок, а так само механізму розширення, що дозволяє настроювати програму на роботу з новими типами об'єктів; p>
. забезпечення автоматизації пошуку Web-сторінок і спрощення доступу до сторінок, які відвідували раніше; p>
. надання доступу до вбудованим або автономним засобів для роботи з іншими службами Internet. p>
В даний час на цьому ринку домінують два браузера: Navigatorфірми Netscape і Internet Explorer фірми Microsoft. p>
Вони надають користувачам дуже схожий інтерфейс та набіросновних можливостей і ведуть на цьому ринку досить жорстку конкурентнуборотьбу, постійно оновлюючи попередні версії. p>
Нижче приводиться опис основних можливостей цих браузерів. p>
Браузер Internet Explorer забезпечує роботу з WWW, надаєідентичні засоби роботи з локальними папками комп'ютера і файловимиархівами FTP, дає доступ до засобів зв'язку з Internet. Для запускупрограми можна використовувати значок Internet Explorer на робочому столі або
Головного меню. Крім того, програма запускається автоматично при спробівідкрити документ Internet або локальний документ у форматі HTML. p>
Якщо з'єднання з Internet відсутня, то після запуску програмиз'явитися діалогове вікно установки з'єднання. При неможливості установкиз'єднання зберігається можливість перегляду в автономному режимі ранішезавантажених Web-документів. За наявності з'єднання після запуску програмина екрані з'явиться основна сторінка, вибрана під час налаштування програми. p>
Далі можна працювати з Web-сторінками, переглядаючи їх вміст,зберігаючи його на локальному диску і т.д. При цьому можна відкривати декількавікон, працюючи з декількома Web-сторінками. p>
Для більш ефективної роботи в Internet необхідна настройка Internet
Explorer. Параметри оптимальної настройки залежать від: p>
. властивостей відеосистеми комп'ютера; p>
. продуктивності діючого з'єднання з Internet; p>
. змісту поточного Web-документа; p>
. особистих уподобань користувача. p>
Налаштувати Internet Explorer можна як з самої програми, так і через
Панель керування. P>
Якщо браузер не здатен відображати файли певного типу (*. exe,
*. zip і т.д.) ініціюється процес завантаження даного файлу на комп'ютер.
Програма Internet Explorer 5.0 запускає майстер завантаження файлів, на першийетапі роботи якого потрібно вказати чи відкривати файл або зберегти йогона локальному диску. Найчастіше файл зберігається. Це дозволяєвикористовувати його в подальшій роботі, не виходячи в Internet. Цей процесназивається простіше - скачати файл. p>
Netscape Navigator - один з кращих Web-браузерів, головна програмапакету Netscape Communicator. З його допомогою можна переглядати вміст
Web-сторінок, копіювати файли, шукати різного роду інформацію, працюватиз текстом і мультимедійними файлами Internet. p>
Обидва браузера мають свої переваги. Наприклад: p>
. Internet Explorer поставляється безкоштовно у складі програмного забезпечення фірми Microsoft; p>
. Internet Explorer має більш широкі можливості при налаштуванні на конкретні смаки споживача і більшу кількість функцій, що виконуються; p>
. Netscape Navigator - має велику швидкість при роботі з Web-сторінками. P>
Але в принципі, обидва браузера виконують схожі завдання і повністюзадовольняють потреби користувачів при роботі з Internet. p>
Однією з основних архітектурних особливостей Explorer єзастосування ActiveX - технології, яка дозволяє зручно конфігурувати,наприклад, вид і можливості панелі інструментів, що робить комп'ютердоступним навіть для дітей. p>
Обидва браузера підтримують можливість створення HTML-документів, приніж Explorer дозволяє створювати темплайти, що так само спрощує створенняweb-сторінок. p>
Internet Explorer підтримує найбільш поширені мови,полегшуючи користувальницький інтерфейс, підтримує всі основні мережністандарти і передбачає інтерфейс без використання миші і можливістьзмінювати шрифт для зручності перегляду. p>
Що стосується швидкості перегляду Web-сторінок, то Microsoft стверджує,що Navigator програє у швидкості, принаймні, на 30 відсотків. p>
Netscape підкреслює Navigatora відміну від інших браузерів, а вособливо від Internet ExplОrer, кількістю необхідної для нього пам'яті,швидкістю роботи, значними зручностями для творців Web-документів,наявністю системи, що дозволяє комп'ютеру користуватися телефонними послугами
Internet в режимі реального часу. До того ж це дозволяє уникнутинезручностей звичайного телефонного зв'язку. p>
Коли Netscape несподівано з'явилася на ринку, Microsoft довелосянегайно відреагувати, щоб не втратити частину свого бізнесу. Без такоїзапеклої конкуренції між двома гігантами не було б ні такого широкоговикористання Web, ні комерційних Web-серверів, ні недорогих браузерів зграфічними інтерфейсами. Це суперництво породило недорогі продукти,які, завдяки використанню протоколів Internet, здатні довзаємодії. Подолати несумісність різних HTML простіше, ніж тітруднощі, які могли б виникнути, вважають оптимісти. p>
3. ПОШУКОВІ СИСТЕМИ. P>
Основне завдання Internet - надання необхідної інформації.
Щоб знайти потрібну інформацію необхідно знати адреса Web-сторінки, наякої ця інформація знаходиться. Краще за все шукати в Мережі необхіднуінформацію за допомогою пошукових систем. Пошукова система являє собоюспеціалізований Web-вузол. Пошукові системи класифікують за методамипошуку. p>
Пошукові каталоги призначені для пошуку по темам. Зазвичай вонипобудовані за ієрархічним принципом, тобто кожен крок пошуку це вибірпідрозділу з більш конкретною тематикою шуканої інформації. На нижньомурівні пошуку користувач отримує відносно невеликий список посилань нашукану інформацію. p>
Пошуковий індекс забезпечує пошук за заданими ключовими словами.
Зазвичай ключові слова вводяться під час заповнення спеціальної форми пошуку,після чого натискається кнопка «Пошук». В результаті пошуку формується набіргіперпосилань на Web-сторінки, який містить указані терміни. Звичайно пошуковііндекси видають величезну кількість потрібних сторінок. p>
У цьому списку представлені посилання на різноманітні Web-сторінки, причомупосилання розташовуються за ступенем убування зустрінутих на даних сторінкахслів, що співпадають з ключовими словами. При перегляді списку необхідновибрати ті сторінки, які потрібно переглянути. Деякі системискладають список посилань за ступенем свіжості сторінок, інші ж - заступінь вірогідності того, що дані сторінки виявляться шуканими. Обчисленняймовірності грунтується на даних про те, як скоро на сторінці зустрічаєтьсяшукане слово. Першими в такому списку йдуть посилання на ті сторінки, у якихключові слова зустрічаються вже в назві. p>
Пошукові каталоги надають доступ до меншого кількості сторінок,ніж пошукові індекси, але вони точніше вказують на основні ресурси Мережі.
Тому при первинному пошуку інформації доцільно використовуватипошукові каталоги. А кваліфікованим користувачам Internet більшкорисні пошукові індекси. Вони дозволяють розшукати маловідомі івузькоспеціалізовані ресурси. Багато сучасних пошукові системипоєднують в собі обидва зазначених методу. p>
Програма Internet Explorer 5.0 має спеціальні засобиорганізації пошуку без явного звернення до пошукових систем. Можнаотримати доступ до однієї з відомих пошукових систем, просто клацнувши накнопці «Пошук», ліворуч з'явиться вікно пошуку. Далі можна набрати ключовіслова для пошуку і вибрати пошукову систему. Результати пошуку будутьвідображені в правій частині вікна браузера. Якщо вибрати одне з посилань, то вправому вікні з'явиться вміст вибраної сторінки. Щоб приховати вікнопошуку, необхідно натиснути на кнопку «Пошук» ще раз. p>
При роботі з Internet ЕхрLorer можна проводити пошук прямо в полі
«Адреса». Для цього в адресному рядку вводиться слово або фраза для пошуку.
Під адресним рядком відкриється вікно зі словом «Пошук» і шуканої фразою.
Internet Explorer почне пошук з використанням заздалегідь визначеноїсистеми пошуку; при цьому кнопка «Пошук» на панелі інструментів натиснесама. p>
Можна здійснити пошук натиснувши кнопку «Пуск» і вибравши опцію меню
«Знайти». Вікно Internet Explorer відкриється саме з уже натиснутою кнопкою
«Пошук». P>
Якщо вдалося знайти те, що шукали, але все ж таки не зовсім те, то в цьомувипадку стане в нагоді механізм пов'язаних посилань. Для будь-якої Web-сторінки можнапереглянути список посилань, які мають до неї відношення, можливо, серед нихвиявиться саме те, що потрібно. Щоб переглянути пов'язані посилання, потрібнозробити наступне. Необхідно вибрати в меню «Сервіс» команду «Показатипов'язані посилання ». p>
Після цього на панелі інструментів натиснути кнопку« Пошук », і в лівійчастині екрана повниться вікно, що містить список посилань, пов'язаних з даноюсторінкою. Потрібно клацнути на одній з посилань, і переглянути в правому вікнівідповідну Web-сторінку. p>
Щоб приховати вікно пошуку, необхідно натиснути ще раз на кнопці
«Пошук». P>
3.1. Механізми пошуку. P>
Пошукові Системи зазвичай складаються з трьох компонентів: p>
. агент (павук або кроулер), що пересувається по Мережі і збирає інформацію; p>
. база даних, яка містить всю інформацію, яка збирається павуками; p>
. пошуковий механізм, який люди використовують як інтерфейс для взаємодії з базою даних. p>
Засоби пошуку та структуризації, іноді звані пошуковимимеханізмами, що використовуються для того, щоби допомогти людям знайти інформацію, вякої вони потребують. p>
Засоби пошуку типу агентів, павуків, кроулеров і роботів використовуютьсядля збору інформації про документи, що знаходяться в Мережі Інтернет. Цеспеціальні програми, які займаються пошуком сторінок в Мережі, витягаютьгіпертекстові посилання на цих сторінках і автоматично індексуютьінформацію, яку вони знаходять для побудови бази даних. p>
Кожен пошуковий механізм має власний набір правил,визначають, як cобірать документи. Деякі слідують за кожною посиланнямна кожній знайденої сторінці і потім, у свою чергу, досліджують кожнупосилання на кожній з нових сторінок, і так далі. Деякі ігноруютьпосилання, які ведуть до графічних і звукових файлів, файлівмультиплікації; інші ігнорують Посилання до ресурсів типу баз даних WAIS;інші проінструктірованни, що потрібно переглядати перш за все найбільшпопулярні сторінки. p>
Агенти - самі «інтелектуальні» з пошукових засобів. Вони можутьробити більше, ніж просто шукати: вони можуть виконувати навіть транзакції від
Вашого імені. Вже зараз вони можуть шукати Сайти специфічної тематики іповертати списки cайтов, відсортованих за їх відвідуваності. Агенти можутьобробляти вміст документів, знаходити та індексувати інші видиресурсів, не лише сторінки. Вони можуть також бути запрограмовані длядобування інформації з вже існуючих баз даних. Незалежно відінформації, яку агенти індексують, вони передають її назад базі данихпошукового механізму. p>
Агенти витягують і індексують різні види інформації. Деякі,наприклад, індексують кожне окреме слово зустрічається у документі,той час як інші індексують лише найбільш важливі 100 слів у кожному,індексують розмір документу і кількість слів у ньому, назву, заголовки іпідзаголовки і так далі. Вигляд побудованого індексу визначає, який пошукможе бути зроблений пошуковим механізмом та як отримана інформація будеінтерпретована. p>
Агенти можуть також переміщатися по Internet і знаходити інформацію,після чого поміщати її в базу даних пошукового механізму. Адміністраторипошукових систем можуть визначити, які сайти або типи сайтів агентиповинні відвідати і проіндексувати. Проіндексована інформаціянадсилається базі даних пошукового механізму так само, як було описано вище. p>
Загальний пошук інформації в Мережі здійснюють програми, відомі якпавуки. Павуки повідомляють про зміст знайденого документа, індексують його івитягують підсумкову інформацію. Також вони переглядають заголовки, деякіпосилання та посилають проіндексовану інформацію базі даних пошуковогомеханізму. p>
Кроулери переглядають заголовки та повертають лише перше посилання. p>
Роботи можуть бути запрограмовані так, щоб переходити по різнимвласний кореспондент різної глибини вкладеності, виконувати індексацію та навітьперевіряти посилання в документі. Через їх природи вони можуть застрявати вциклах, тому, проходячи за посиланнями, їм потрібні значні ресурси Мережі.
Проте, є методи, призначені для того, щоб заборонити роботампошук по сайтах, власники яких не бажають, щоб вони булипроіндексовані. p>
Люди можуть розміщувати інформацію прямо в індекс, заповнюючи особливу формудля того розділу, в який вони хотіли б розмістити свою інформацію. Цідані передаються базі даних. p>
Коли хто-небудь хоче знайти інформацію, доступну в INTERNET, вінвідвідує сторінку пошукової системи і заповнює форму, що деталізуєінформацію, яка йому необхідна. Тут можуть використовуватися ключовіслова, дати та інші критерії. Критерії в формі пошуку повиннівідповідати критеріям, які використовуються агентами при індексації інформації,яку вони знайшли при переміщенні по Мережі. p>
База даних відшукує предмет запиту, заснований на інформації,зазначеній у заповненій формі, і виводить відповідні документи,підготовлені базою даних. p>
Щоб визначити порядок, в якому список документів буде показано,база даних застосовує алгоритм ранжування. В ідеальному випадку, документи,найбільш релевантні для користувача запитом будуть поміщені першими всписку. Різні пошукові системи використовують різні алгоритмиранжирування, однак, основні принципи визначення релевантностінаступні: p>
1. Кількість слів запиту в текстовому вмісті документу. P>
2. Теги, в яких ці слова розташовуються. P>
3. Розташування шуканих слів у документі. P>
4. Питома вага слів, щодо яких визначається релевантність,в загальній кількості слів документа. p>
База даних виводить ранжируваних подібним чином список документів з
HTML і повертає його людині, яка зробила запит. P>
Різні пошукові механізми також вибирають різні способи показуотриманого списку - деякі показують тільки посилання, інші виводятьПосилання c першими кількома пропозиціями, що містяться в документі абозаголовок документа разом з ccылкой. p>
Коли Ви натискаєте на засланні до одного з документів, який васцікавить, цей документ запитується у того сервера, на якому вінзнаходиться. p>
3.2. Порівняльний огляд пошукових систем. Структура запиту. P>
У мережі існують різні способи пошуку інформації. Звичайно ж,якщо є довідник, в якому можна знайти місцезнаходженнящо цікавить вас джерела конкретної інформації, то, без всякогосумнівом, варто цим і скористатися. Проте, на жаль, таківидання далеко не завжди доступні. Крім того, мережа є постійнооновлюється системою і тому перебуває в курсі всього нового з допомогоюперіодики, а тим більше за допомогою літератури, не завжди представляєтьсяможливим. Для пошукових цілей в Internet існують спеціальні пошуковімашини, що користуються значними базами даних і мають зв'язок з себеподібними. p>
Істотно корисними можливостями у них є наявність системипошуку, яка будується за принципом: від загального - до конкретного. Ставлячизагальне поняття (у вигляді ключового слова, кількох слів або фрази, - узалежно від сервісних послуг конкретної машини), а потім, з кожним новимпошуком все більш і більш конкретизуючи його, можна отримати зацікавиврезультат. Тому далі будуть розглянуті кілька основних пошуковихсистем, використання яких вельми ефективно. p>
Історично склалося, що першу таку пошуковою машиною була
Alta Vista, тому з неї і почнемо розгляд. P>
AltaVista. Найбільш цікава можливість AltaVista - це розширенийпошук. AltaVista дозволяє пошук за ключовими фразами, при цьому вона маєдосить великий фразеологічний словник. Крім усього іншого, при пошукув AltaVista можна задати ім'я поля, де має зустрітися слово. Дожаль, детально процедура ранжирування в документації по системі неописана, але видно, що ранжування застосовується як при простому пошуку, такі при розширеному запиті. Реально цю систему можна віднести до системи збулеві розширеним пошуком. p>
Lycos. Як і більшість систем, Lycos дає можливість застосовуватипростий запит і більш витончений метод пошуку. У простому запиті вяк пошукового критерію вводиться пропозицію природною мовою,після чого Lycos робить нормалізацію запиту, видаляючи з нього такзвані stop-слова, і тільки після цього приступає до його виконання.
Майже відразу видається інформація про кількість документів на кожне слово, апізніше і список посилань на формально релевантні документи. У списку протикожного документа зазначається його міра близькості запиту, кількість слів ззапиту, що потрапили в документ, і оцінна міра близькості, яка може бутибільше або менше формально обчисленої. p>
Поки не можна вводити логічні оператори в рядку разом з термінами,але використовувати логіку через систему меню Lycos дозволяє. Такаможливість застосовується для побудови розширеної форми запиту,призначеної для досвідчених користувачів, вже навчилися працювати зцим механізмом. p>
Yahoo. Дана система з'явилася в Мережі однією з перших, і сьогодні
Yahoo співпрацює з багатьма виробниками засобів інформаційногопошуку, а на різних її серверах використовується різне програмнезабезпечення. Мова Yahoo досить проста: всі слова слід вводити черезпробіл, вони з'єднуються зв'язкою "and" або "or". p>
При видачі не вказується ступінь відповідності документа запиту, атільки підкреслюються слова з запиту, які зустрілися в документі.
При цьому не здійснюється нормалізація лексики та не проводиться аналіз на
«Загальні» слова. Гарні результати пошуку виходять тільки тоді, коликористувач знає, що в базі даних Yahoo інформація є напевно.
Ранжування здійснюється за кількістю термінів запиту в документі. P>
Yahoo відноситься до класу простих традиційних систем з обмеженимиможливостями пошуку. p>
OpenText. Інформаційна система OpenText являє собою самийкомерціалізованої інформаційний продукт у Мережі. Всі описи більшесхожі на рекламу, ніж на інформативне керівництво по роботі. Системадозволяє провести пошук з використанням логічних конекторів, однакрозмір запиту обмежений трьома термінами або фразами. У даному випадку мовайде про розширеному пошуку. При видачі результатів повідомляється ступіньвідповідності документа запиту та розмір документа. p>
Система дозволяє також поліпшити результати пошуку в стилітрадиційного булевого пошуку. OpenText можна було б віднести до розрядутрадиційних інформаційно-пошукових систем, якщо б не механізмранжирування. p>
Infoseek. Система Infoseek має досить розвиненим інформаційно -пошуковим мовою, що дозволяє не просто вказувати, які терміни повиннізустрічатися в документах, але й своєрідно зважувати їх. Досягається цеза допомогою спеціальних знаків «+» - термін зобов'язаний бути в документі, і «-» --термін повинен бути відсутнім в документі. p>
Крім цього, Infoseek дозволяє проводити те, що називаєтьсяконтекстним пошуком. Це означає, що, використовуючи спеціальну форму запиту,можна зажадати послідовної спільної зустрічальності слів. Такожможна зазначити, що деякі слова повинні спільно зустрічатися не тільки водному документі, а навіть в окремому параграфі або заголовку. p>
Є можливість вказівки ключових фраз, які представляють собоюєдине ціле, аж до порядку слів. Ранжування при видачіздійснюється за кількістю термінів запиту в документі, за кількістю фраз запитуза винятком загальних слів. Всі ці фактори використовуються як вкладеніпроцедури. Підводячи коротке резюме, можна сказати, що Infoseek відноситься дотрадиційним системам з елементом зважування термінів при пошуку. p>
WAIS. WAIS є однією з найбільш витончених пошукових систем
INTERNET. У ній не реалізовані лише пошук за нечітким множинам іімовірнісний пошук. На відміну від багатьох пошукових машин, система дозволяєбудувати не лише вкладені булеві запити, вважати формальнурелевантність по різних заходів близькості, зважувати терміни запиту тадокумента, але й здійснювати корекцію запиту за релевантністю. Систематакож дозволяє використовувати усікання термінів, розбиття документів наполя і ведення розподілених індексів. p>
Rambler. Пошукова система містить інформацію про більш ніж 12мільйони документів, розташованих на серверах Росії і країн СНД. p>
Rambler обробляє щодоби не менше 500 тисяч пошукових запитів
(в середньому - 5 запитів в секунду), скануючи 48 тисяч Web-серверів івикористовуючи кілька одночасно працюючих програм-роботів. p>
Запит може складатися з одного або декількох слів, розділенихпробілами. Можуть бути використані як російські, так і англійські слова ісловосполучення. За замовчуванням знаходяться тільки ті документи, в якихзустрілися всі введені Вами слова. p>
Щоб знайти документи, що містять хоча б одне слово із запиту,використовується логічна зв'язка "or" або вибирається на сторінці детальногозапиту: «Слова запиту: всі». Щоб виключити документи, що містять тіабо інші слова, треба вказати на сторінці детального запиту: «Виключитидокументи, що містять такі слова ...». p>
Все одно, з якої літери написані слова запиту: з великою або змаленькою. І при побудові індексу, і при пошуку за запитом усі великі
(великі) букви «знижуються». p>
Слова для пошуку можуть бути з'єднані логічними зв'язками "and", "or".
Замість зв'язок (або в поєднанні з ними) можуть використовуватися також символи
"&", "|". P>
Частини запиту можуть бути згруповані за допомогою круглих дужок.
Можлива багаторазова вкладеність дужок у поєднанні з логічнимиоператорами. p>
Rambler вміє шукати слова у всіх формах (наприклад, амінокислота,амінокислоти, амінокислотою і т. д.). Щоб слово знаходилося у всіхформах, перед ним треба поставити службовий символ "#". У меню детальногозапиту такий режим може бути включений для всіх слів: «Розширення запиту:всі форми слів ». Службовий символ "@" перед словом дозволяє знаходити нетільки саме це слово, але й однокореневі слова. У меню детального запитусимволу "@" відповідає режим «Розширення запиту: всі однокореневі». p>
За замовчуванням наша система шукає слова запиту так, як Ви їх ввели,щоб зменшити «шум» в знайдених документах. Якщо Ви не пам'ятаєте, якпишеться слово, чи хочете розширити запит, можна використовувати метасимволи
"*" І "?" Для позначення довільній частині слова і довільного символу. P>
Обмежити пошук частинами документів, такими як назва документа,його заголовок, URL і т.п., можна через меню детального запиту «Шукатив ...». p>
Можна обмежити пошук документами тільки російською або тільки наанглійською мовою. Для цього треба вибрати відповідний режим в менюдетального запиту «Мова документу ...». За умовчанням пошук виконується задокументів на всіх мовах. p>
За замовчуванням знайдені документи сортуються за релевантністю
(відповідності запиту). Однак, ви можете вимагати, щоб замість цього впочаток списку були поміщені найсвіжіші (або, навпаки, найстарішідокументи). Для цього треба вибрати відповідну установку в меню
«Сортувати по ...» на сторінці детального запиту. P>
Ви можете також обмежити пошук документами, створеними впевний період часу: для цього необхідно на сторінці детальногозапиту вказати «Від дати ... до дати ...». p>
Можна вимагати, щоб Rambler повертав лише ті документи, деслова будуть знаходяться на мінімальній відстані один від одного. p>
Режим «Обмежити відстань між словами» може бути включений додетальному запиті. Всі перераховані вище правила можуть бути використаніспільно один з одним у необхідної Вам послідовності. p>
За замовчуванням результати пошуку видаються порціями по 15 документів.
Меню «Видавати по ...» на сторінці детального запиту дозволяє збільшитице число до 30 або 50. Меню «Форма висновку ...» дозволяє отримувати описудокументів зі збільшеною або зменшеною подробицею. p>
Yandex. Yandex щоденно переглядає сотні тисяч Web-сторінок впошуках змін або нових посилань. Колекція посилань постійно зростає. P>
Yandex не вимагає від вас знання спеціальних команд для пошуку.
Досить набрати питання ( «де знайти дешеві комп'ютери» чи «потрібнітелефони Москви і Московської області »), і ви отримаєте результат - списоксторінок, де зустрічаються ці слова. p>
Незалежно від того, в якій формі ви вжили слово в запиті, пошуквраховує всі його форми за правилами російської мови. Наприклад, якщо заданозапит «йти», то в результаті пошуку будуть знайдені посилання на документи,що містять слова «йти», «іде», «йшов», «йшла» і т.д. На запит «вікно» будевидана інформація, що містить і слово «вікон», а на запит «відкликали» --документи, що містять слово «відкликали». p>
При цьому пошук не обмежений лише словами чи фразами. Yandex відшукає поназвою Web-сторінку компанії або файл з потрібною картинкою. p>
Aport. Зазвичай запит вдає із себе просто одне або кількаслів. p>
За таким запитом знаходяться документи, в яких зустрічаються всі словазапиту. Є, щоправда, обмежена кількість слів (сполучники, прийменники тощо),які в запиті ігноруються, так як не несуть самі по собі смисловийнавантаження. p>
Наприклад, за запитом: яблука на снігу будуть знайдені всі документи, вяких зустрічаються одночасно два слова: «яблуко» та «сніг». Де вмежах документа розташовані слова, в якій граматичній формі вонизнаходяться - не важливо. p>
Варто ще раз підкреслити важливе і дуже корисна властивість Апорт:незалежно від того, в якій граматичній формі ви пишете в запиті слово,воно знаходиться в документах підвсіх своїх формах. Наприклад, за запитом:чоловік ішов будуть знайдені серед інших і документи, що містять текст «людийдуть ». Розпізнавання всіх форм працює для звичайних слів російської мови.
Для екзотичних слів, неологізмів тощо воно не проходить. У цьому випадкуможе стати в нагоді оператор «*». p>
Наприклад, ви хочете знайти все, що стосується діяльності президента
Росії, в тому числі і документи, що містять слово «єльцинізм».
Скористайтеся запитом: Єльцин *. Він дозволить вам знайти те, що ви хочете
(а також документи зі словами Ельцініще, ельцінци, ельціненок і т.п),оскільки зірочка замінює собою будь-яке число будь-яких букв. p>
Ви можете шукати документи не тільки по всьому російськомовному INTERNET,але й за його частини. Найпростіший випадок - пошук по певному сервера.
Наприклад: url = www.intel.ru собака p>
За даним запитом будуть знайдені всі документи на серверіwww.intel.ru, що містять слово "собака". Можливо, вам цікаво, а щобуде, якщо написати просто: url = www.intel.ru p>
У цьому випадку ви отримаєте список всіх документів, розташованих назазначеному вами сервер p>
Ви можете обмежувати пошук і сильніше - одним з каталогів сервера.
Наприклад: url = www.intel.ru/sobaki/сенбернар p>
За даним запитом документи, що містять слово «сенбернар», будутьшукатиметься лише в каталозі/sobaki (і його підкаталогах) московського серверакорпорації Intel. p>
List. На головній сторінці в верхній її частині розташовані посилання нанайбільш популярні проекти. Нижче, під логотипом каталозі, пошукова форма.
У правій колонці і нижній частині сторінки - блоки найактуальніших новин.
Список посилань на основні категорії каталогу займає центральну частину.
Цифри поруч з назвою категорії показують кількість сайтів,містяться в ній. Записані дрібним шрифтом заголовки відсилають принатисканні на підкатегорії розділу.
Натиснувши на будь-якому з назв, Ви потрапите у відповідну рубрику і підлоготипом List.ru побачите повний шлях до неї, починаючи з головної сторінки.
Кожен проміжний рівень структури доступний за окремою посиланням. Пошукв каталозі реалізований таким чином, що в результаті запиту може бутизнайдені як окремі сайти, так і рубрики. p>
Допускається використанням мови запитів Yandex. Розташована поручз пошуковою формою посилання «Структура каталогу» відкриває в окремому вікніповний рубрикатор каталогу. Реалізована можливість переходу з рубрикаторав будь-яку обрану підкатегорію. Більш детальне тематичне поділпоточної рубрики представлено списком посилань. p>
Помічені символом "@" приведуть у підкатегорії, структурно входять доінші розділи, але містять близьку за змістом інформацію. Якщо Видобре уявляєте, в якій рубриці містяться потрібні ресурси, кращеперейти в потрібну підкатегорію, скориставшись будь-яким з надаванихзасобів навігації по каталогу. В іншому випадку можна шукати їх у повномусписку. p>
Каталог організований таким чином, що всі сайти, що містяться нанижніх рівнях структури, представлені і в рубриках. Показується нижчересурси уп