ПЕРЕЛІК ДИСЦИПЛІН:
  • Адміністративне право
  • Арбітражний процес
  • Архітектура
  • Астрологія
  • Астрономія
  • Банківська справа
  • Безпека життєдіяльності
  • Біографії
  • Біологія
  • Біологія і хімія
  • Ботаніка та сільське гос-во
  • Бухгалтерський облік і аудит
  • Валютні відносини
  • Ветеринарія
  • Військова кафедра
  • Географія
  • Геодезія
  • Геологія
  • Етика
  • Держава і право
  • Цивільне право і процес
  • Діловодство
  • Гроші та кредит
  • Природничі науки
  • Журналістика
  • Екологія
  • Видавнича справа та поліграфія
  • Інвестиції
  • Іноземна мова
  • Інформатика
  • Інформатика, програмування
  • Юрист по наследству
  • Історичні особистості
  • Історія
  • Історія техніки
  • Кибернетика
  • Комунікації і зв'язок
  • Комп'ютерні науки
  • Косметологія
  • Короткий зміст творів
  • Криміналістика
  • Кримінологія
  • Криптология
  • Кулінарія
  • Культура і мистецтво
  • Культурологія
  • Російська література
  • Література і російська мова
  • Логіка
  • Логістика
  • Маркетинг
  • Математика
  • Медицина, здоров'я
  • Медичні науки
  • Міжнародне публічне право
  • Міжнародне приватне право
  • Міжнародні відносини
  • Менеджмент
  • Металургія
  • Москвоведение
  • Мовознавство
  • Музика
  • Муніципальне право
  • Податки, оподаткування
  •  
    Бесплатные рефераты
     

     

     

     

     

     

         
     
    Що таке інтернет ?
         

     

    Інформатика, програмування

    МІНІСТЕРСТВО ОСВІТИ І

    ОСВІТИ І НАУКИ УКРАЇНИ

    Далекосхідного державного університету

    Кафедра інформатики

    Що таке інтернет

    Аспірант другого року навчання

    Незнановой С. Ю.

    03.00.10. (Іхтіологія)

    Науковий керівник

    професор , д.б.н.

    Іванків В. Н.

    Владивосток

    2002

    Зміст

    Введення

    1. Основні протоколи в Internet і пошук у них

    2. Інструменти пошуку

    1. Тематичні каталоги

    2. Автоматичні індекси

    3. Російські системи пошуку
    Список літератури

    Введення.

    Одне з головних відмінностей Інтернету від всього іншого, що пов'язане зкомп'ютерами, - це те, що для успішної роботи з ним, взагалі кажучи, непотрібно ніяких книг. Сам Інтернет може слугувати і довідником, і підручником,і енциклопедією самого себе. Однак на початковому етапі, як мені здається,користь від книги, чітко і доступно викладає основи, може бути вельмизначною. Саме таку книгу я і постарався написати. Але перш ніж випознайомитеся з нею ближче, давайте спробуємо відповісти на найголовнішепитання, яке, можливо, ви собі вже задавали:

    Інтернет: що ж це, нарешті, таке
    Більш-менш наукові (або просто наукоподібні) визначення Інтернету,якими заповнені книги і статті на цю тему, звичайно, мають своюцінність. Але для наших цілей поки достатньо самого простого пояснення:
    Інтернет - це безліч комп'ютерів, з'єднаних між собою каналамизв'язку, плюс набір стандартних правил, за якими вони обмінюютьсяінформацією. При цьому самі канали зв'язку, мабуть, навіть менш важливі, ніжправила передачі даних по них, звані в Інтернеті протоколами. Якщохоча б два комп'ютери взаємодіють по одному з таких протоколів - цевже справжній Інтернет.
    Винахід і вдосконалення модемів - спеціальних пристроїв,дозволяють комп'ютера надсилати інформацію по телефону, - відкрило двері в
    Інтернет величезній кількості людей, у яких немає. ніякого спеціальногомережевого обладнання, а є лише персональний комп'ютер і телефоннийрозетка поблизу.
    Як сам Інтернет, так і модеми для персональних комп'ютерів існують вжедосить довго. Проте лише зовсім недавно - близько 1990 року - Інтернетнабрав, нарешті критичну масу користувачів і ресурсів, необхідну длящо відбувається на наших очах мережної революції. Швидкісні модеми,дозволяють звичайним користувачам персональних комп'ютерів без обмеженьнасолоджуватися всіма благами Інтернету, з'явилися ще пізніше. А система
    World Wide Web (WWW, або «Всесвітня павутина»), винайдена в 1993 р. іколишня спочатку лише однією з багатьох складових частин мережі, зайняладомінуюче становище і стала визначати обличчя Інтернету буквально востанні рік-два. Так чи інакше, всесвітній інтернетівський бум зараз всамому розпалі - і вам дуже пощастило, що ви майже не спізнилися до початкуподання.
    Інтернет - це, перш за все величезна безліч комп'ютерів і програм.
    Серед останніх ви знайдете не тільки такі, які вміють добре вирішувативаші конкретні завдання, але й набагато більше таких, чиї здібності вам,ймовірно, спочатку буде складно навіть уявити. Вихід в Інтернет дає вамунікальну можливість, яким би недосконалим не був ваш комп'ютер,заглянути у двадцять перше століття і самостійно освоїтися з такимипоняттями, як «всесвітній кібер-соціум», «віртуальні гроші»,
    «Інформаційне середовище проживання» і т. п., - словом, з усім тим, про що таклюблять писати зараз журналісти.
    Однак це лише частина відповіді на запитання «що таке Інтернет». Інтернетсьогодні - це не тільки величезна кількість комп'ютерів, але ще йнеймовірну кількість людей, для яких мережа є принципово новимспособом спілкування, майже не має аналогів в матеріальному світі. Людина --істота соціальна, і спілкування з собі подібними - одна з найперших йогопотреб. Мабуть, до цього часу ще жодне технічний винахід (якщоне вважати телефону) не справляло такого перевороту в цьому древньому яксвіт занятті - спілкування людини з людиною.
    Звичайно, що саме зацікавить вас в Інтернеті в першу чергу - людиабо комп'ютери, - залежить тільки від вас. Стародавня метафора книги як моделісвітобудови, мабуть, заслуговує перегляду - тепер на роль такої моделінабагато краще підходить комп'ютер. Коли ж мова йде про мільйоникомп'ютерів і їх користувачів у всьому світі, пов'язаних в єдину мережу,метафора ця вже перестає бути просто метафорою. Ось чому не будеперебільшенням сказати, що, виходячи в Інтернет, ви робите для себедоступним цілий світ.

    1. Основні протоколи в Internet і пошук у них.

    Internet містить величезну кількість інформації, з цього в ньому важкознайти те що потрібно, якщо не знати де шукати. Місце знаходження (або адреси)кожного ресурсу визначає його URL. У URL міститься тип протоколу,вказує на який сервер здійснюється доступ: на WWW (на якийвказує запис: http), Gopher, ftp, telnet, або WAIS, це залежить від тогоякий тип інформації ви будете передавати. Мережевий протокол - сукупністьчітко визначених правил: як запитувати, оформляти і висилати по мережідану різновид інформації (Кент, 1996).telnet
    До мережі Internet приєднані мільйони комп'ютерів і багато хто з них маютьцікавими можливостями.
    Виявляється, цілком можливо дістатися до цих комп'ютерів щобподивитися наявні в них бази даних і програми. Спеціальна програмаtelnet дозволяє перетворити ваш комп'ютер в клієнта telnet для доступу доданими і програмами в численних серверах telnet. Наприкладдослідник регулярно може працювати на декількох комп'ютерах,адміністратори яких призначають йому спеціальне ім'я та пароль.
    Сам по собі telnet - просто засіб зв'язку; ні якогось власногоінтерфейсу, ні можливостей пошуку він не надає.
    Зв'язавшись за допомогою telnet з віддаленою машиною і ввівши в поле запиту своєвхідне ім'я (login) та пароль (password) ви далі спілкуєтеся саме з цієїмашиною і програмами на ній, а telnet дбає лише про підтримку зв'язкуміж вами (Левін, 1996).
    Зрозуміло, багато сховища інформації, які спочаткуобслуговувалися спеціальними програмами з доступом по telnet тепер можнаперевести на WWW, що не рідко і робиться. Однак залишилися і такі якіяк і раніше надають свої послуги лише за telnet (особливо середкаталогів та інформаційних служб бібліотек).
    Стандартизована посилання на telnet з'єднання з деяким вузлом Internet
    (тобто URL-адресу цього з'єднання) виглядає так:telnet:// <адреса сервера>

    FTP

    Практично вся інформація в комп'ютерному світі зберігається у вигляді файлів. Зацього ще на самій зорі Internet з'явився спеціальний засіб для обмінуфайлами по мережі - мережевий протокол FTP (File Transfer Protocol).
    Кількість файлів, доступних на вузлах всього світу по анонімному FTPвимірюється астрономічними цифрами і постійно зростає. До того ж Word Wide
    Web дозволяє без будь-якої переробки існуючих FTP архівів, постачатиїх описами будь-якого ступеня детальності і зручним гіпертекстовимінтерфейсом.
    Але як дізнатися куди звертатися у пошуках потрібного файлу?
    Archie.
    Пошук на ім'я файлу на всіх анонімних FTP-вузлах світу можна здійснити задопомогою системи Archie. Вона розроблена кількома програмістами зуніверситету Макгі в Канаді та здійснює індексування станцій FTP,показуючи доступні в кожній станції файли. Archie повідомляє про декількамільйони файлів що знаходяться у більш тисячі станцій FTP, і надаєдивно швидкий спосіб пошуку того місця, куди потрібно прямувати дляотримання цікавить вас файлу. Пошук в базі даних сервера Archieпроводиться за допомогою ключових слів, які в даному випадку представляютьсобою просто імена файлів або фрагменти імен.
    Зараз Archie доступний через WWW. Це WWW сторінка з бланком в якомувказуються ключові слова і опції пошуку.
    Хоча назва файлу майже завжди має якесь відношення до його вмісту,користуватися Archie для тематичного пошуку програм не варто. Ця системабуде корисна, якщо ви дійсно знаєте назву потрібного файлу або частинаімені. З іншого боку якщо ви шукаєте програму, яка має загальноприйнятескорочена назва, то є певна ймовірність що це скороченнябуде присутній і в імені файла, так що можна спробувати знайти такийфайл за допомогою Archie. Результати пошуку є список FTP -вузлів та повних імен файлів на цих сайтах. Файл служить посиланням на цейфайл, тому що клацання по імені дозволить відразу ж отримати файл з даноговузла. А доменну адресу FTP-архіву виділений великим жирним шрифтом,перенесе вас в вихідний каталог файлової системи на цьому архіві.
    Archie не ділить свій список на сторінки і його найзручніше переглядатипрямо в міру отримання (Хонікарт, 1996).
    URL-адреса, що вказує на FTP-з'єднання, повинен, як мінімум, включати всебе слово "ftp" як лівій частині і адресу сайту в правій:ftp:// <адреса сервера>.

    WAIS

    Майже всі інформаційні ресурси Internet надають можливістьавтоматичного пошуку, але лише в одній з них - в системі WAIS (Wide Area
    Information Server, глобальний інформаційний сервер) - пошук за ключовимисловами, є основним методом доступу до інформації.
    Система WAIS є величезною розподілену базу даних, тобтоокремі частини цієї бази даних розташовані на різних вузлах мережі по всьомусвіту. Програма-клієнт для роботи з серверами WAIS не тільки вміє спілкуватисяз ними зі спеціального протоколу, але й зберігає список всіх баз даних WAIS зїх адресами і назвами, а іноді і з короткими описами. Там можна знайтиархіви телеконференцій, всілякі каталоги, довідники, збірникинаукових статей і рефератів, індекси та словоуказателі і багато іншого.
    Практично будь-яка інформація, для якої база даних є зручноюформою уявленнями яка досить цікава для широкої аудиторії,може бути представлена в WAIS.
    База даних WAIS настільки велика, що просте "листання" записів - украйбезперспективний спосіб доступу до інформації. Тому в WAIS застосовуєтьсядосить складний метод пошуку за ключовими словами та фразами. Документи,отримані в результаті пошуку, сортуються WAIS-сервером за кількістювходження в них ключових слів і по тому, наскільки повно в кожному з нихпредставлений весь набір замовлених ключових слів. Така система здатнадавати гарні результати, особливо якщо розбити процес пошуку накілька етапів.
    Першим етапом пошуку зазвичай є запит спеціальної в базі даних підназвою "directory-of-servers", яка містить невеликі за обсягомопису (реферати) всіх інших баз WAIS. При цьому краще вказувати не тіключові слова, які вас в кінцевому рахунку цікавлять, а ті загальніпоняття, пов'язані з вашої області знань.
    Вибравши на першому етапі одну або декілька баз, можна приступити до пошукувласне документів - що також можна робити в декілька заходів,знайомлячись після кожного пошуку з результатами і змінюючи список ключовихслів, поки не буде знайдено потрібний документ. Крім того WAIS володіє однимкорисною властивістю: якщо на черговому етапі пошуку ви знайшли документ,вміст якого особливо близько до того, що ви шукаєте, то його можнадодати до списку релевантних документів. У результаті на наступному етапі
    WAIS знайде документи, не тільки містять набір ваших ключових слів, а йсхожі за своїм словниковим складом на ті тексти, які ви вказали якнайбільш відповідні.
    Хоча Netscape здатний працювати з серверами WAIS, для цього він повинензнати адресу особливого проксі-сервера для протоколу WAIS, якого вашогопровайдера може не виявитися. Спеціальні WAIS-клієнти, що працюють в томучислі і під Windows, не тільки зручні для інтерактивного пошуку в базахданих, але й дозволяє обходитися без послуг будь-якого серверу -посередника (Левін, 1996).
    URL-адреса для WAIS виглядає як:wais:// <адреса сервера>/

    Gopher

    Кожен з розглянутих досі інтернетівських протоколів цілком міг биіснувати сам по собі: telnet надає доступ до програм, FTP - дофайлів, WAIS - до баз даних. Всі ці системи створювалися й розвивалисямайже незалежно один від одного і ставили перед собою конкретну мету --побудувати механізм доступу до одного певного виду ресурсів.
    Однак у міру того, як Internet ріс і ускладнювався, він сам підштовхував людейдо думки, що інформація за природою своєю єдина і що не дуже розумноділити її на різні "види ресурсів" з несхожими методами доступу. До кінця
    80-их років ідея нового універсального засоби роботи з різнорідноїінформацією носилася в повітрі.
    Першою системою, покликаної втілити в життя ці мрії став Gopher,що з'явився на світ 1991 році в американському університеті штату Меннесота.
    Фундаментальним поняттям, закладеним в її основу була структуравкладених один в одного меню (Кірсанов, 1996).
    Зв'язавшись Gopher-клієнтом з одним з Gopher-серверів, ви в першу чергупотрапляєте в корневе, головне меню цього сервера. Зорієнтувавшись в йоговмісті і переходячи далі з одного підменю в інше, можна зайнятисявласне пошуком інформації. Інформація в системі Gopher організованастрого ієрархічно, "від загального до конкретного". На кожному кроці сервер посилаєвашому Gopher - клієнтові не тільки вміст чергового меню, але йслужбову інформацію про те, де знаходяться об'єкти, що відповідають пунктамцього меню. Клієнт виводить на екран тільки саме перерахування пунктів, алеколи ви виберете один з них, він, звірившись з наявною у ньогоінформацією, або пошле на якийсь із Gopher - серверів запит на видачунаступного меню, або спробує встановити FTP-або telnet-з'єднання здеяким вузлом Internet.
    Очевидно з усіх інформаційних інструментів Internet Gopher найбільшесхожий на WWW - обидві ці системи покликані служити оболонкою з різноріднимиресурсами. Однак Gopher позбавлений тих багатьох образотворчих засобів,які роблять WWW не тільки інформаційним каталогом, але й новим засобоммасової інформації і навіть новим жанром мистецтва. Можна сказати, що
    Gopher є "підмножиною" WWW - що дуже спрощує інтегруваннясамого Gopher як одного з видів ресурсів в WWW. Практично все, щосказано про роботу зі Gopher - клієнтом справедливо і для подорожі посистемі Gopher за допомогою броузера WWW (Хонікарт, 1996).
    URL одного з пунктів Gopher - меню складається з адреси Gopher-сервера іперерахованих тих пунктів меню, які приведуть вас до вихідного пункту:gopher:// <адреса сервера>/<пункт меню>

    WWW

    Незважаючи на те, що в перші роки свого існування Gopher завоюваввелику популярність, назрівала потреба в якийсь більш простий і в той жечас максимально універсальною системою, в якій зв'язки між ресурсамибули б більш вільними і асоціативними. Така система була розроблена в
    1993 році і названа World Wide Web (WWW). Система WWW будуватися на поняттігіпертексту, або, точніше гіпермедіа. Гіпертекст - це текст складові частиниякого пов'язані один з одним і з іншими текстами за допомогою посилань.
    Гіпермедіа - це те що вийде з гіпертексту, якщо замінити в йоговизначенні слово "текст" на "будь-які види інформації": графічнізображення, відео, звук і т.д.
    World Wide Web означає буквально "всесвітня павутина". Чому вона такназивається. Як зрозуміло з назви, вона глобальна. Ви не завжди знаєте вякій частині світу знаходиться комп'ютер, до якого ви підключаєтеся. Виможете починати читати сторінку Web в Далласі, потім перейти до Австралії, івсе це за одним натисканням кнопки миші. WWW схожа на павутиння. Це складнаінформаційна мережа, поєднана гіпермедіа зв'язками. WWW дозволяє невідмовлятися від інформаційних ресурсів уже накопичених в Internet,доступних за допомогою інших засобів - FTP, telnet і Gopher. Більше того,робота з цими ресурсами через WWW настільки зручна, що, скажімо, FTP -клієнти, що були колись окремим класом програм, тепер використовуютьсялише небагатьма.
    І все-таки головне в World Wide Web - це не зручності доступу до FTP-архівуі Gopher-меню. Більшість серверів системи WWW пропонують інформацію,яка без WWW навряд чи взагалі коли-небудь потрапила б у мережу. Швидкістьстворення та оновлення, багаті образотворчі можливості в поєднанні злегкістю доступу та величезною аудиторією зробили WWW новим засобоммасової інформації. Запуск WWW-серрверов і створення WWW-сторінок вжеперетворилося з повальною моди в новий бізнес - з усім що властивосучасного бізнесу: платою за квадратні сантиметри рекламної площі.
    З іншого боку, швидкому поширенню системи, так природнооб'єднує різнорідні ресурси, сприяло не в останню чергу їїзародження не в надрах комерційної фірми, а в науковій установі -
    Европейской лабораторії фізики частинок, співробітники якої не стали робитисекретів зі своєї розробки і навіть не спробували на ній розбагатіти.
    На щастя, сама природа WWW як перш за все засоби пошуку та організаціїінформації дозволяє сподіватися, що це чудовий винахід неперетворитися на інструмент однією лише комерції і реклами (Кірсанов, 1996).
    Сервери та клієнти WWW зв'язуються між собою по спеціальному протоколу
    HTTP (Hyper Transfer Protocol, протокол передачі гіпертексту). URL для WWWвиглядає як:http:// <адреса сервера>

    Переходити від однієї сторінці Web до іншої - цікавий спосіб дослідження
    World Wide Web, однак вам рано чи пізно знадобиться знайти щоськонкретне. Але в такий спосіб це зробити не вдасться. В Internet єспеціальні інструменти Web-пошуку.
    Інструменти пошуку в WWW.
    Інструментів пошуку інформації в Internet, побудованих на різних принципахі переслідують різні цілі, існує чимало. Але всіх їх поєднує те, щовони розташовуються на спеціально виділених мережних комп'ютерах з потужнимиканалами зв'язку, обслуговують щохвилини величезну кількість відвідувачів івимагають від своїх власників значних витрат на підтримку і оновлення.
    Тим не менше, майже всі вони відповідають на запити користувачів зовсімбезкорисливо, а платять за це задоволення спонсори та рекламодавці. Замасштабами впливу на мережеве співтовариство пошукові системи, без сумніву,є одним із наріжних каменів Internet.
    Класифікацію пошукових систем найзручніше будувати на підставі того, наскільки в них автоматизований збір і обробка інформації, що надаєтьсякористувачам, - інакше кажучи, хто набирає базу даних, у якійпроводиться пошук: люди або самі комп'ютери.

    2. Інструменти пошуку

    Умовно інструменти пошуку поділяються на пошукові засоби довідковоготипу (directories) та пошукові системи в чистому вигляді (search engines).

    2.1 Тематичні каталоги

    Пошукові інструменти першого типу найчастіше називають предметними, аботематичними каталогами. Компанія, що володіє таким каталогом, безперервноведе величезну роботу, досліджуючи, описуючи, каталогізіруя і розкладаючи пополичках вміст WWW-серверів і інших мережевих ресурсів, розкиданих повсьому світу. Результатом її титанічних зусиль є постійнооновлюється ієрархічний каталог, на верхньому рівні зібрані найзагальнішікатегорії, такі як "бізнес", "наука", "мистецтво" і т.п., а елементисамого нижнього рівня являють собою посилання на окремі WWW-сторінки ісервера разом з коротким описом їх вмісту.
    Гарантій того, що такий каталог дійсно охоплює весь вміст
    WWW, ніхто не дасть, проте можлива не повнота і навіть однобокість підборуматеріалів з лишком компенсується там, що поки що не під силу ніякомукомп'ютера - осмисленість відбору.
    Предметні каталоги надають і можливість пошуку за ключовими словами.
    Однак пошук цей відбувається не у вмісті самих WWW-серверів, а в їхкоротких описах, що зберігаються в каталозі.
    Предметні каталоги Internet можна перерахувати буквально на пальцях, такяк їх створення та підтримка вимагають величезних витрат. До найбільш відомихвідносяться Yahoo, WWW Virtual Library, Galaxy та деякі інші.
    Yahoo.
    Найбільш популярний у населення Internet каталог Yahoo. На першому жсторінці Yahoo, розташованої за адресою http://www.yahoo.com, ви отримуєтедоступ до двох основних методом роботи з каталогом - пошуку за ключовимисловами і ієрархічним древу розділів.
    Почавши спуск по розділам каталогу, ви побачите, що кожен розділ міститьточно таке ж поле для введення ключових слів і кнопку Search, яка запускаєпошук.
    Кожен розділ може містити в собі як перерахування що входять до ньогопідрозділів, так і власне посилання на сторінки, які відносяться відразу довсьому розділу, з їх короткими описами.
    Замість подорожі по дереву підрозділу ви можете відразу потрапити в потрібниймісце каталогу Yahoo за допомогою пошуку. Увівши одне або декілька ключовихслів, розділених пробілами, в рядок пошуку і натиснувши кнопку Search, виотримаєте список всього в Yahoo, що містить у собі зазначені ключовіслова. Цей список буде розділений на дві частини - "categories" і "sites".
    Якщо загальна кількість посилань, повернутих у процесі пошуку, перевищує
    25, список посилань буде розбито на кілька частин.
    Автоматичним пошуком можна скористатися не тільки з головної сторінки
    Yahoo, але і з будь-якого підрозділу; при цьому спеціальний перемикач,розташований під полем введення ключових слів, дозволяє або обмежитипошук поточним розділом та його підрозділами, або шукати у всьому каталозі
    (Черіл, 1998).
    Magellan.
    Але не рідко трапляється так, що видається машиною список дуже великий іпереглянути його просто не реально. Виходом з цієї ситуації може статибільш суворий відбір інформації, що заносяться до каталогу. Одна із самихвідомих систем такого роду - каталог Magellan за адресою:http://www.mckinley.com
    Ця база даних містить відомості про 80 тисяч WWW-сторінок - що дуже небагато в порівнянні з тими мільйонами, які існують у мережі. Однак якщо
    Yahoo як опис ресурсу використовує один-два рядки тексту, тоспівробітники системи Magellan на деякі з сторінок, що заносяться в їхню базуданих, самі пишуть невеликі рецензії, а також оцінюють якість цихінформаційних ресурсів за п'ятибальною шкалою. По мимо бази рецензій,
    Magellan володіє так само власним автоматичним індексом, для пошуку вякому потрібно перекинути перемикач під полем введення в положення entiredatabase.
    Як правило запит являє собою одне або декілька ключових слів,розділених пробілами (Кірсанов, 1996).
    Point.
    Схожа за своїми принципами служба фірми Point (http://www.pointcom.com)взагалі основний акцент робить не на пошук, а на роботу з тематичнимкаталогом.
    Служба Point відома в мережі тим, що її співробітники постійно зайнятіоцінюванням мережевих ресурсів і ведуть списки тих вузлів, які вони вважаютьналежать до "кращим п'яти відсоткам WWW".
    Сама фірма Point Веде загальнодоступну базу даних всіх "п'ятивідсотковий WWW -сторінок, де про кожну можна прочитати докладну ліцензію (Хонікарт, 1996).
    Virtual Library.
    Найстарішим предметним каталогом WWW є каталог Virtual Library:http://www.w3.org/hypertext/DataSources/bySubject/Overview.html
    Ця система досить повно охоплює наукову прошарок WWW - сервериуніверситетів, лабораторій та навчальних закладів.
    Russia-On-Line Subject Guide.
    Для користувачів у нашій країні певний інтерес може представлятитематичний каталог Russia-On-Line Subject Guide, розташований за адресоюhttp://www.online.ru/rmain. Цей каталог містить досить строкате зборипосилань на закордонні джерела плюс тематичний огляд російських іросійськомовних ресурсів WWW.

    2.2.Автоматіческіе індекси.

    До проблеми пошуку інформації в Internet можна підійти і з іншого боку.
    Існують програми в які завантажили кілька тисяч загальновідомих URL -адрес. Будучи запущена на комп'ютері з доступом до WWW, ця програмапочинає автоматично завантажувати з мережі документи з цих URL, причому зкожного нового документа вона витягує все що містяться в ньому посилання тадодає їх в свою базу адрес. Оскільки в кінцевому рахунку все WWWдокументи пов'язані між собою, рано чи пізно така програма обійде весь
    Internet.
    Зрозуміло, програма не може ні зрозуміти ні як або класифікувати те,що вона бачить в мережі. Програми такого типу називаються роботами. Вониобмежуються збором статистичної інформації та побудовоюсловоуказателей (індексів) по текстах документів. Зібрана роботом базаданих - індекс - зберігає в собі, просто кажучи, відомості про те в яких
    WWW-документах міститися ті чи інші слова.
    Саме такий автоматично збирає індекс і лежить в основі пошуковихсистем другого роду, які часто так і називають - автоматичні індекси.

    Автоматичний індекс складається з трьох частин: програми-робота, яка збираєтьсяцим роботом бази даних та інтерфейсу для пошуку в цій базі, з якимпрацює користувач. Всі ці компоненти цілком можуть функціонувати безвтручання людини.
    Оскільки будь-яка класифікація або оцінювання матеріалів у системахтакого роду відсутні, до них слід вдаватися лише тоді, коли виточно знаєте ключові слова, що відносяться до того, що вам потрібно, - скажімо,прізвище людини або декілька досить рідкісних термінів звідповідній галузі. якщо ж задати пошук по скільки-небудьпоширеним словами, то вам не вистачить життя, щоб обійти всіотримані в результаті пошуку URL-адреси, - наприклад, індекс системи Alta
    Vista містить 11 мільярдів слів, витягнутих з 30 мільйонів WWW-сторінок.
    Автоматичних індексів WWW-сторінок існує чимало: WebCrawler, Lycos,
    Excite, Inktomi, Open Text та інші. Деякі з них (наприклад, Lycos)являють собою більш-менш вдалий синтез предметного каталогу таавтоматичного індексу.
    Alta Vista.
    Її адреса http://altavista.digital.com. Ця система з'явилася в грудні
    1995 року. Вона одна з найбільших за обсягом індексів з усіх пошуковихсистем такого роду і самі потужні й гнучкі правила побудови запитів.
    Alta Vista розуміє два різні мови запитів, досить сильно відрізняютьсяодин від одного. На першій сторінці Alta Vista ви бачите бланк для простогозапиту (Simple Search), а панель заголовка вгорі сторінки містить кнопку
    Advanced Search, натиснувши яку, ви отримаєте бланк для ускладнення запиту.
    Крім WWW-сторінок, Alta Vista веде окремий індекс для статей з більшеніж 14000 конференцій Usenet (включаючи ієрархію груп relcom .*).< br>Пошук Alta Vista: щоб Alta Vista спрацьовувала на групі слів, тільки коливони стоять поруч, потрібно укласти цю групу в лапки. Якщо необхідновиключити з результату всі документи, які містять певне слово,необхідно приписати це слово зі знаком "мінус".
    Слово без жодного знаку діє в запиті точно так само, як і воно ж зізнаком "плюс".
    На відміну від Yahoo, за замовчуванням Alta Vista шукає входження цілих слів, т.тобто замовлені терміни повинні стояти в документі окремо, а не бутичастиною інших ланцюжків символів. Якщо ж вам потрібно знайти всі входженняслова, навіть коли воно входить до складу інших слів, користуйтеся символом *.зірочка може стояти тільки в кінці слова, а щоб запобігтиобвальний пошук, що дає дуже багато результатів, Alta Vista вимагає,щоб слово, що закінчується на *, полягало не менше ніж з 3 літер. Більшетого, символ * дозволяє знайти не будь-яке закінчення слова, а тільки неперевищує довжину п'яти символів і не містить великих літер або цифр.
    Результати пошуку Alta Vista, як і Yahoo, видає у вигляді списку посилань надокументи, але замість опису кожного документа поряд з його заголовком випобачите просто перші кілька рядків його тексту. Якщо буде знайдено більше
    10 документів, Alta Vista розіб'є їх список на сторінки по 10 посилань накожній. Alta Vista сортує посилання так, щоб на першому місці стояли
    "Найважливіші" документи з вашими ключовими словами при визначенні ступеняважливості з огляду на наступні фактори: чи входять ключові слова в заголовок документів; містяться ці слова в першу кількох рядках документів; наскільки близькі один до одного в тексті виявлені ключові слова
    (Кірсанов, 1996).

    Infoseek


    Infoseek, що вступив в експлуатацію наприкінці 19996 року, кільканагадує Alta Vista, однак обсяг обстежуваних їм повних текстівдокументів ще не перевищує 30 млн. Web-сторінок. Адреса:http://www.infoseek.com. Це досить потужна система, що володіє високоюшвидкістю і простий у зверненні. Можливості складання запиту майжетакі ж, як і в Alta Vista, але не настільки багаті. При майже повнійзбереженні значень знаків «плюс», «мінус» і «лапок», чутливості дорізниці великих і малих літер і можливості обмежувати пошукфрагментами Web-сторінок, Infoseek поки не має здатності визначатипоруч стоять терміни (немає оператора NEAR), обмежувати пошук за датоюоновлення джерела і, головне, усікаємо закінчення ключових термінів.

    Але дана пошукова система містить масу факультативних функцій. Дотаких відноситься, наприклад, можливість визначати кількість посилань у WWWна конкретну сторінку, тобто судити, наскільки вона популярна або ж,навпаки, з'ясувати, скільки посилань на зовнішні сторінки міститься на даномувузлі, вірніше, скільки з них відображені в індексних файлах Ultraseek.
    Використання спеціальної функції Imageseek дозволяє знаходити в Internetзображення (малюнки, фотографії) на певну тему. Infoseek маєтакож один з кращих довідників ресурсів Мережі.
    HotBot
    Одним з потужних пошукових засобів в World Wide Webможно віднести HotBot,що містить відомості про повних текстах 110 млн. сторінок. Адреса: http://www.hotbot.com. HotBot належить до новітніх систем, тому йогопоглиблений пошук дає вражаюче широкі можливості для деталізаціїзапиту. Це досягається за рахунок використання багатоступінчастого меню,що пропонує різні варіанти складання пошукового розпорядження. Можназдійснити пошук по наявності в документі одного або декількох термінів,пошук по окремій фазі, пошук конкретної особи чи посилання на певнийелектронну адресу. Для більшої деталізації запиту можливе застосуванняумов SHOULD (може містити), MUST (повинен обов'язково містити), MUST
    NOT (не повинен містити) по відношенню до будь-яких понять. Крім того,
    HotBot представляє возможностьогранічіть пошук за датою створення абоостаннього оновлення документа, за георафіческому положенню сервера.
    Верхи сервісних можливостей є пошук документів, що містятьпевні типи файлів, наприклад аудіо або видио. Для цього треба лишезробити відмітку в спеціальному пункті меню запиту (Купріянова, 1998).
    WebCrawler.
    Це ще один інструмент пошуку типу search-bot (пошуковий робот).
    Адреса: http://www.webcrawler.com. Пошук тут дуже простий. Введіть неякомога більше ключових слів у полі пошуку, натисніть Search.
    Lycos.
    Це велика база даних індексує вміст всіх знайдених нею сторінок
    Web. Адреса: http://www.lycos.com.
    World Wide Web Worm.
    Ви знайдете цей інструмент пошуку наhttp://www.cs.colorado.edu/home/mcbryan/wwww.html. Це ще один великийпокажчик ділянок Web.
    У кожному конкретному випадку доцільно використовувати свій інструментпошуку. Вам доведеться намагатися проводити пошук за допомогою одного інструментуі, якщо ви не отримали результатів, переходити до іншого. Але все ж якимінструментом користуватися? У першу чергу краще скористатисятематичним каталогом типу Yahoo, розмір у них порівняно невеликий,зате велика швидкість. Якщо знайти необхідну інформацію не вдалося, цеговорить про те, що ви цікавитеся занадто вузькою темою, або ж з вашоютемою погано співвідносяться обрані вами ключові слова. Це не означає, щопотрібної інформації в WWW немає - просто знайти її буде складніше. Для її пошукувам доведеться скористатися більш примітивними, більш автоматичними ітому більш всеосяжними системами типу Alta Vista (Кент, 1996).

    2.3.Россійскіе пошукові системи


    Пошукові системи глобального масштабу свою основну увагу концентруютьна англомовних ресурсах Мережі. Завдання пошуку інформації на серверах вмежах окремих країн виконують системи локального характеру, спеціальноадаптовані до особливостей конкретних мов. Існують подібніпошукові засоби і в Росії. Усіх їх об'єднує можливість обробкиматеріалів у всіх кириличних кодуваннях (. Однак за потужністю та рівнемпропонованого сервісу російськомовні пошукові системи значновідрізняються один від одного.
    До лідируючої групи в даний час відносяться системи Rambler, «Апорт» і
    «Яndex».

    Rambler

    Серед фаворитів виділяється Rambler (http://www.rambler.ru), що став першимпрофесійної вітчизняної пошуковою системою. Ця система забезпечуєповнотекстовий пошук на 3 млн. сторінок, розташованих на більш ніж 15 тис.
    Web-вузлах Росії і країн ближнього зарубіжжя. Крім Web-серверів,обстежується також тижневий архів телеконференцій ієрархії relcom.
    Rambler володіє близьким до оптимального виведенням результатів пошуку. Навіть унормальній формі посилання на знайдений об'ектвключает повну інформацію.
    Система сконструйована таким чином, що один і той же документ врізних кодуваннях показується в різних кодуваннях показуютьсятільки один раз, а його конкретні адреси додаються у списку, що йдуть зарезюме.ето скорочує час на аналмз отриманих результатів черезвідсутність дублювання одних і тих самих документів.
    Головний недолік Rambler полягає в неможливості здійснювати пошукпо цілій фазі або хоча б указувати в запитах граничне відстаньшуканих термінів один від одного. Випадкове поєднання зовсім непов'язанихслів призводить до видачі посилань на документи, зовсім не доречнізапиту.

    Апорт
    Пошукова система Апорт (http://www.апорт.ru) забезпечена масою різнихфункцій, які відносять її до числа найбільш зручних для користувача.
    Одне з головних достоїнств Апорт полягає в широкі можливості складаннязапиту. Крім традиційних операторів "і" і "або", пошуку по цілій фазі,система здатна виокремлювати поєднання термінів, розташованих у тексті поручодна з одною. Апарат пропонує можливість автоматичного перекладузапиту з російської на англійську мову і навпаки. І Rambler, і Апортздатні виділяти один і той же документ в різних кодуваннях і видаватипосилання на нього лише раз, перераховуючи конкретні адреси в списку URL. Дожаль, при цьому вчасно не видаляються відомості про застарілих версіяходнієї і тієї ж сторінки, які перераховуються як існуючі, маючирізницю лише в даті оновлення. Ще одним недоліком цієї системи єне завжди коректна обробка назв сторінок, через що в результатахпошуку часто вказується «документ без назви».

    Яndex
    Пошукова система Яndex (http://www.yandex.ru), де крім серверівдоменів «ru» і «su» Яndex індексує зміст зарубіжних російськомовних
    Web-вузлів.
    Головною рисою цієї системи є глибокий морфологічнийаналіз оброблюваних термінів. Найпотужніша лінгвістика дозволяє врахуватипрактично всі можливі відтінки вживання ключових слів і скластизапит максимально точно. Яndex має гарний механізмом розпізнаванняодного документа в кількох кодуваннях або на дзеркальних серверах.
    Слідом за провідною російською трійкою йдуть ще декілька пошуковихзасобів, серед яких "Російська машинапошуку "(http://search.interrussia.com),« TELA-пошук »(http://tela.dux.ru/)і Russian Internet Search (http://www.search.ru). Поки всі ці сервери невідрізняються ні широтою пошуку, ні комфортністю, і можуть бути використанілише як доповнення до провідних пошукових засобів.
    Пошуковий сервіс в російськомовному блоці Internet, також як і в усьому світі,розвивається стрімко. Немає сумніву, що в найближчому майбутньому показникиіснуючих систем підвищаться, з'являться нові покоління пошукових засобів,що надають користувачам ще більші можливості (Купріянова, 1998).

    Список літератури


    1. Дмитро Кірсанов Зрозумілий Internet /-М. Символ-Плюс, 1996

    2. Джері Хонікарт Internet без проблем/- М. 1996

    3. Пітер Кент Internet/М. 1996

    4. Джон Левін Секрети Internet/Київ 1996

    5. В. Степанов З комп'ютером на ти/- М., 1998

    6. Кірк Черіл Internet. Книга відповідей/М. 1998

    7. Г. І. Купріянова Інформаційні ресурси Internet/М., 1998


         
     
         
    Реферат Банк
     
    Рефераты
     
    Бесплатные рефераты
     

     

     

     

     

     

     

     
     
     
      Все права защищены. Reff.net.ua - українські реферати ! DMCA.com Protection Status