ПЕРЕЛІК ДИСЦИПЛІН:
  • Адміністративне право
  • Арбітражний процес
  • Архітектура
  • Астрологія
  • Астрономія
  • Банківська справа
  • Безпека життєдіяльності
  • Біографії
  • Біологія
  • Біологія і хімія
  • Ботаніка та сільське гос-во
  • Бухгалтерський облік і аудит
  • Валютні відносини
  • Ветеринарія
  • Військова кафедра
  • Географія
  • Геодезія
  • Геологія
  • Етика
  • Держава і право
  • Цивільне право і процес
  • Діловодство
  • Гроші та кредит
  • Природничі науки
  • Журналістика
  • Екологія
  • Видавнича справа та поліграфія
  • Інвестиції
  • Іноземна мова
  • Інформатика
  • Інформатика, програмування
  • Юрист по наследству
  • Історичні особистості
  • Історія
  • Історія техніки
  • Кибернетика
  • Комунікації і зв'язок
  • Комп'ютерні науки
  • Косметологія
  • Короткий зміст творів
  • Криміналістика
  • Кримінологія
  • Криптология
  • Кулінарія
  • Культура і мистецтво
  • Культурологія
  • Російська література
  • Література і російська мова
  • Логіка
  • Логістика
  • Маркетинг
  • Математика
  • Медицина, здоров'я
  • Медичні науки
  • Міжнародне публічне право
  • Міжнародне приватне право
  • Міжнародні відносини
  • Менеджмент
  • Металургія
  • Москвоведение
  • Мовознавство
  • Музика
  • Муніципальне право
  • Податки, оподаткування
  •  
    Бесплатные рефераты
     

     

     

     

     

     

         
     
    Характеристика системи WWW у мережі Internet
         

     

    Інформатика, програмування

    Характеристика системи WWW у мережі Internet

    Вступ

    Мережа Internet (Інтернет) можна описати як величезну цифрову магістраль - систему, зв'язує мільйони комп'ютерів, підключених до тисяч мереж по всьому світу. Її яскраве минуле сягає своїм корінням в епоху холодної війни, кінець 60-х початок 70-х років. Спочатку дані розробки фінансувалися урядом США, і мережа, що стала попередницею Internet, була спеціально спроектована таким чином, щоб забезпечити комунікації між урядовими вузлами в тому випадку, якщо частина її вийде з ладу в результаті ядерної атаки. Діючий ній протокол TCP/IP (Transmission Control Protocol/Internetwork Protocol - протокол управління передачею/міжмережевий протокол) розроблений з урахуванням того, щоб комп'ютери всіх видів могли спільно використовувати мережеві засоби і безпосередньо взаємодіяти один з одним як один ефективно інтегрована комп'ютерна мережа.

    Сьогодні Internet сильно розрослася і пов'язує вже десятки мільйонів користувачів комп'ютерів у всьому світі. Ця глобальна "мережа мереж" охоплює тисячі університетських, урядових і корпоративних мережевих систем, пов'язаних високошвидкісними приватними і загальнодоступними мережами, а також включає в себе такі популярні онлайнові служби як America Online, CompuServe і Prodigy.

    Ідея створення універсальної бази даних опрацьовувалася протягом тривалого періоду, і лише недавно були отримані кошти створення подібних баз даних. Багато хто розглядає Internet і Всесвітню павутину (WorldWideWeb, WWW) як експериментальний зразок такої бази даних. Технологія, розроблена для WWW, втілює ідею глобальної інформаційної бази даних, реалізовану в межах сучасних можливостей.

    Як правило, ці відомості сприймаються скоріше як ознака ерудиції, ніж як практично корисна річ. Справді, інформаційний обсяг Web-простору задовольняє багатьох користувачів. Однак, як тільки пошук ставиться на професійну основу і змушує нести відповідальність за виконану роботу контроль за повнотою охоплення ресурсів висувається на передній план.

    1. WEB-ТЕХНОЛОГІЯ

    Історія виникнення WWW

    Що ж пропонував Тім Бернерс-Лі в 1989 році і що з цього вийшло? У "World Wide Web: Proposal for HyperText Project", спрямованих керівництву CERN, він вважав, що інформаційна система, побудована на принципах гіпертексту, повинна об'єднати всю безліч інформаційних ресурсів CERN, яке складалося з бази даних звітів, комп'ютерної документації, списків поштових адрес, інформаційної реферативної системи, наборів даних результатів експериментів і т.п. Гіпертекстова технологія повинна була дозволити легко "перестрибувати" з одного документа в іншій.

    Проект ділився на дві фази, або, як у нас прийнято говорити, черги. Перша черга (тривалістю в три місяці) повинна була показати життєздатність ідеї проекту. Протягом цього етапу робіт передбачалося розробити програми-інтерфейси для роботи в алфавітно-цифровому режимі і програму-інтерфейс для Macintosh і NeXT, що працює в графічному режимі, сервер для доступу до ресурсів Usenet, сервер для доступу до інформаційно-пошукової системи CERN, гіпертекстовий сервер і програму-шлюз між Internet і DECnet.

    В наступні три місяці (друга черга) передбачалося розробити засоби підготовки гіпертекстових документів, повноекранну програму перегляду для VM/XA, X-Window-інтерфейс і систему автоматичної нотифікації переглядаються матеріалів.

    Крім програмного забезпечення передбачалося розробити спільний протокол обміну інформацією в мережі, метод відображення тексту на екрані комп'ютера, створити набір базових документів, які ілюструють роботу системи, який міг би поповнюватися за рахунок документів користувачів, забезпечити пошук за ключовими словами в цьому наборі документів.

    Цікаво, що з проекту в обов'язковому порядку виключалися всякі дослідження, пов'язані з конвертацією інформації з форматів будь-яких редакторів у формати даних системи, можливістю роботи з відео - і аудіоінформації, все роботи, пов'язані із захистом інформації від несанкціонованого доступу.

    На всю цю піврічну роботу автор просив 4-х розробників (software designers) і одного програміста, і для кожного з них окреме робоче місце (комп'ютер того типу, для якого розробник буде писати програмне забезпечення). Крім цього було потрібно придбати комерційне програмне забезпечення, яке було б корисно при розробці системи (Guide, KMS, FrameMaker).

    Як видно, запити були невеликі, і в жовтні 1990 року проект стартував. Вже в листопаді був реалізований прототип системи для NeXT, до різдва "задихав" line mode browser, розробці якого надавалося особливе значення, тому що він відкривав доступ до системи через telnet, а в березні його можна було вже демонструвати. Через рік в Internet був встановлений анонімний telnet для доступу в систему. Перше повідомлення про WWW було надіслано до телеконференції: alt.hypertext, com.sys.next, comp.text.sgml і comp.mail. multimedia, у серпні 1991 року.

    За сучасними мірками результати, яких досягли розробники до 1991 року виглядають досить скромно, якщо не вдаватися в суть роботи і обмежитися тільки зовнішнім її проявом. Спільнота Internet отримало ще одну програму, що працює в режимі командного рядка. Минуло ще цілих півтора роки до того моменту, коли програма Mosaic, розроблена Марком Андресеном (Mark Andressen) з Національного Центру суперкомп'ютерних Додатків (NCSA), і побудована на принципах WWW, забезпечили бурхливе зростання популярності "павутини" в Internet.

    NCSA розпочала проект з розробки інтерфейсу в World Wide Web через місяць після оголошення CERN. Одне із завдань NCSA - це розробка доступних некомерційних програм, з іншого боку NCSA вивчає нові технології на предмет їх комерційного застосування в майбутньому. World Wide Web, безумовно, підходила під ці два параметри. Крім того, специфікації WWW справляли враження добротно виконаної академічної роботи з оглядом літератури з даного питання, великою кількістю посилань та обгрунтованістю прийнятих рішень. Багатопротокольний переносимий інтерфейс у WWW, створення якого почала Група Розробки Програмного Забезпечення NCSA, був названий Mosaic. Пробна версія програми була закінчена в першій половині 1993 року, а в серпні 1993 була анонсована альфа-версія для Internet.

    Слід зазначити, що сам проект Mosaic зробив величезний внесок у розвиток специфікацій World Wide Web, суттєво збагативши різні компоненти системи. Розробники Mosaic ввели в стандарти WWW велика кількість нововведень. Агресивна політика команди NCSA призвела до того, що багато програм-інтерфейси, розроблені в рамках ранніх стандартів, поступово стали відмирати, не витримавши конкуренції. Для самого NCSA це закінчилося тим, що лідер команди, Марк Андресен, покинув в березні 1994 року NCSA і організував комерційну корпорацію Netscape. C цього моменту розпочався новий етап боротьби, але тепер між старими колегами. Netscape активно нав'язує свої стандарти, що призводить до того, що документи, підготовлені з розширеннями Netscape неправильно відображаються Mosaic, а документи з розширеними можливостями NCSA можуть взагалі не відображатися Netscape.

    Слід зазначити, що проект NCSA переслідував великі цілі, ніж просто програму-інтерфейс у WWW. З самого початку Mosaic розроблялася як програма з можливостями доступу до ресурсів Internet за допомогою різних протоколів, в число яких входили FTP, telnet, NNTP, SMTP. Однак спочатку передбачалося, що це буде робитися за рахунок виклику зовнішніх, щодо Mosaic, програм. У Нині Netscape сам підтримує, крім перерахованих, протоколи доступу в Gopher і Wais. Останнє дозволяє використовувати Netscape, втім, як і Mosaic, для роботи поза рамками World Wide Web.

    Mosaic на деякий час затьмарила розробки CERN. Однак ця група мала добре продуману стратегію розвитку системи, яка включала в себе наступні основні моменти: розробка та підтримка стандартів специфікацій системи, розробка бібліотеки вільно розповсюджуваних мобільних кодів системи, повного комплекту засобів, що забезпечують розробку і реалізацію компонентів системи на будь-якому типі комп'ютера в мережі, підготовка набору довідкових і демонстраційних документів про стан мережі та напрямки її розвитку. Дана стратегія дозволила поширювати програмне забезпечення, розроблене в рамках проекту в Internet, а наявність line mode broser'а дозволила відкрити можливості WWW для величезної аудиторії користувачів алфавітно-цифрових пристроїв, підключених до мережі. Деякий час NCSA лідирувала і за кількістю установок серверів, проте в даний час CERN забезпечив собі паритет і в цій галузі. Щоправда, і тут не обійшлося без "накладок". Так, формати файлів конфігурації програми imagemap, що забезпечує роботу з графічними гіпертекстовими посиланнями, у цих двох серверів різні.

    Іншим показником успішного розвитку робіт є утворення W3-консорціуму. Консорціум утворений після підписання угоди між Массачусетським Технологічним Інститутом (MIT, USA) та Національним Інститутом Інформатики і Автоматики (INRA, France) за згодою CERN. Якщо не вдаватися в подробиці, то сенс цієї угоди полягає в тому, що все програмне забезпечення акумулюється в MIT, учасники мають право copyright на всі розроблене програмне забезпечення і специфікації. Програмне забезпечення розповсюджується вільно. За представником MIT закріплюється посада директора, а за представником INRA - посада заст. директора. Внески повноправних учасників W3C становлять $ 50.000 на рік, а асоційованих членів - $ 5.000 на рік, угода укладена на три роки, починаючи з 1 жовтня 1994 року. Цікаво, що організації з річним оборотом, що перевищує $ 50 мільйонів, зобов'язані реєструватися як повноправні члени, і що консорціум сподівається отримувати прибуток, що перевищує $ 1,5 мільйона, тому що передбачено порядок використання коштів понад цю суму. Кошти до цієї межі використовуються на розвиток системи та дослідження.

    Освіта Netscape Corporation і W3C легко пояснити з точки зору зростання популярності WWW. У березні 1993 року трафік World Wide Web становив 0,1% від загального трафіку мережі NSF, вересні 1993 року він вже склав 1,0% від загального трафіку мережі NSF. У жовтні 1993 року кількість зареєстрованих серверів WWW дорівнювало 500, а до червня 1994 воно досягло 1500 і продовжує стрімко зростати.

    Слід відзначити, що поява технології WWW і її бурхливий прогрес не самотній. Приблизно в цей же час з'явилися й інші розподілені інформаційні технології в Internet. Це, в першу чергу, Gopher і Wais. Настільки бурхливе зростання цього сектора комп'ютерних технологій призвів до появи на світ дуже цікавого документа, підготовленого на замовлення Комісії Європейського Союзу до щорічної зустрічі керівників Союзу 24-25 червня 1994 року на Корфу. Документ прямо звертає увагу керівників країн Союзу на той факт, що відбувається бурхливе зростання ринку інформаційних технологій, і якщо Союз не хоче в черговий раз опинитися на других ролях, то повинен вжити енергійні зусилля з підтримки робіт у цій галузі. Автори доповіді стверджують, що відбувається чергова технічна революція, викликана можливостями сучасних телекомунікаційних систем та комп'ютерних мереж.

    Автори виділяють основні сфери застосування нових технологій:

    робота за допомогою мережі, тобто створення нових робочих місць;

    навчання по мережі;

    наукові комунікації;

    звичайні послуги з мережі;

    управління дорожнім рухом;

    управління повітряним рухом;

    швидке медичне обслуговування;

    створення єдиної системи захисту прав споживачів та виробників інформаційних послуг;

    створення єдиної європейської адміністративної мережі;

    створення інформаційної мережі загального користування для всіх громадян Союзу.

    В якомусь сенсі установа W3C є відповіддю на професіоналів повільність бюрократів з Комісії Євросоюзу. Серед засновників W3C один з авторів документа - Мартін Банжеманн (Martin Bangemann).

    Наступним важливим етапом розвитку технології World Wide Web стала поява навесні 1995 року мови програмування Java, анонсованого компанією Sun Microsystems. Якщо бути більш точним, то пряме відношення до World Wide Web має не сама мова, а мобільні коди і можливість їх інтерпретації програмами перегляду Web. Створивши свій браузер (програму перегляду) HotJava, Sun змогла продемонструвати, що ідеологія інтерпретації мови розмітки документів може бути розширена. В сторінки тепер можна стало вбудовувати фрагменти програм, які після передачі по мережі активувалися на комп'ютері користувача, розширюючи тим самим концепцію розподілених обчислень.

    До цього часу крім Java з'явилися ще й мови управління сценаріями перегляду документів, найвідомішим з яких став JavaScript. Тим самим, до середини 1996 технологія World Wide Web перетворилася на повноцінну гіпертекстове технологію, яка стала дозволяти вирішувати більшість з тих завдань, до яких доросли локальні гіпертекстові системи.

    Враховуючи все сказане вище, спробуємо детально зупинитися на особливостях World Wide Web та окремих її компонентах, специфікаціях і способах нарощування системи за рахунок зовнішнього програмного забезпечення, що існує на комп'ютері, і особливості його функціонування на різних комп'ютерних платформах. Цим питань і будуть присвячені наступні кілька розділів.

    1.2 Поняття гіпертексту

    В попередньому розділі мова йшла про історію та основні віхи розвитку World Wide Web. Останнім часом часто доводиться чути, що WWW - це дуже просто. Однак за цією уявною простотою ховається добре продумана складна система. При цьому слід зауважити, що система бурхливо розвивається. Для того, щоб більш точно описати цей розвиток, наші англомовні колеги використовують епітет "dramatic". Познайомимося більш докладно з WWW.

    В 1989 році, коли Т. Бернерс-Лі запропонував свою систему, у світі інформаційних технологій спостерігався підвищений інтерес до нового і модного у той час напрямку - гіпертекстових систем. Сама ідея, але не термін, що була введена В. Бушем (Vannevar Bush) у 1945 році в пропозиціях по створенню електромеханічної інформаційної системи Memex. Незважаючи на те, що Буш був радником з науки президента Рузвельта, ідея не була реалізована. У 1965 році Т. Нельсон (Ted Nelson) ввів в обіг сам термін "гіпертекст", розвинув і навіть реалізував деякі ідеї, пов'язані з роботою з "нелінійними" текстами. У 1968 році винахідник маніпулятора "миша" Д. Енжільбард (Doug Engelbart) продемонстрував роботу з системою, що має типовий гіпертекстовий інтерфейс, і, що цікаво, проведена ця демонстрація була з використанням системи телекомунікацій. Однак виразно описати свою систему він не зміг. У 1975 році ідея гіпертексту знайшла втілення в інформаційній системі внутрішнього розпорядку атомного авіаносця "Карл Вінстон", яка отримала назву ZOG. У комерційному варіанті система відома як KMS. Роботи в цьому напрямку тривали і, час від часу, з'являлися реалізації типу HyperCard фірми Apple або HyperNode фірми Xerox. У 1987 була проведена перша спеціалізована конференція Hypertext'87, матеріалами якої було присвячено спеціальний випуск журналу "Communication ACM".

    Ідея гіпертекстової інформаційної системи полягає в тому, що користувач має можливість переглядати документи (сторінки тексту) у тому порядку, в якому йому це більше подобається, а не послідовно, як це прийнято при читанні книг. Тому Т. Нельсон і визначив гіпертекст як нелінійний текст. Досягається це шляхом створення спеціального механізму зв'язку різних сторінок тексту за допомогою гіпертекстових посилань, тобто у звичайного тексту є посилання типу "наступний-попередній", а у гіпертексту можна побудувати ще скільки завгодно багато інших посилань. Улюбленими прикладами фахівців з гіпертексту є енциклопедії, Біблія, системи типу "help".

    Простий, на перший погляд, механізм побудови посилань виявляється досить складною завданням, тому що можна побудувати статичні посилання, динамічні посилання, асоційовані з документом у цілому або тільки з окремими його частинами, тобто контекстні посилання. подальший розвиток цього підходу призводить до розширення поняття гіпертексту за рахунок інших інформаційних ресурсів, включаючи графіку, аудіо-і відео-інформацію, до поняття гіпермедіа.

    1.3 Архітектура побудови WWW

    Від опису основних компонентів перейдемо до архітектури взаємодії програмного обидвіспікання в системі World Wide Web. WWW побудована за добре відомою схемою "клієнт-сервер". На малюнку 1 (див. додаток) показано, як розділені функції в цій схемі.

    Програма-клієнт виконує функції інтерфейсу користувача і забезпечує доступ практично до всіх інформаційних ресурсів Internet. У цьому сенсі вона виходить за звичайні рамки роботи клієнта тільки із сервером визначеного протоколу, як це відбувається в telnet, наприклад. Почасти, досить широко поширене думка, що Mosaic чи Netscape, які, безумовно, є WWW-клієнтами, це просто графічний інтерфейс у Internet, є вірним. Однак, як вже було відзначено, базові компоненти WWW-технології (HTML і URL) грають при доступі до інших ресурсів Mosaic не останню роль, і тому мультипротокольні клієнти повинні бути віднесені саме до World Wide Web, а не до інших інформаційних технологій Internet. Фактично, клієнт - це інтерпретатор HTML. І як типовий інтерпретатор, клієнт у залежності від команд (розмітки) виконує різні функції. У коло цих функцій входить не тільки розміщення тексту на екрані, але й обмін інформацією з сервером у міру аналізу отриманого HTML-тексту, що найбільш наочно відбувається при відображенні вбудованих в тексті графічних образів. При аналізі URL-специфікації або по командах сервера клієнт запускає додаткові зовнішні програми для роботи з документами у форматах, відмінних від HTML, наприклад GIF, JPEG, MPEG, Postscript і т.п. Взагалі кажучи, для запуску клієнтом програм незалежно від типу документа була розроблена програма Luncher, але в Останнім часом набагато більше поширення одержав механізм узгодження запускаються, через MIME-типи.

    Іншу частина програмного комплексу WWW становить сервер протоколу HTTP, бази даних документів у форматі HTML, керовані сервером, і програмне забезпечення, розроблене в стандарті специфікації CGI.

    До останнього часу (до утворення Netscape) реально використовувалося два HTTP-сервери: сервер CERN і сервер NCSA. Але в даний час кількість базових серверів розширилося. З'явився дуже непоганий сервер для MS-Windows і Apachie-сервер для Unix-платформ.

    Існують та інші, але два останніх можна виділити з міркувань доступності використання. Сервер для Windows - це shareware, але без вбудованого самоліквідатора, як у Netscape. З огляду на поширеність персоналок в нашій країні, таке програмне забезпечення дає можливість спробувати, що таке WWW. Другий сервер - це відповідь на погрозу комерціалізації. Netscape вже не поширює свій сервер Netsite вільно і пройшов слух, що NCSA-сервер також буде поширюватися на комерційній основі. В результаті був розроблений Apachie, який, за словами його авторів, буде freeware, і реалізує нові доповнення до протоколу HTTP, пов'язані із захистом від несанкціонованого доступу, які запропоновані групою по розробці цього протоколу і реалізуються практично у всіх комерційних серверах.

    База даних HTML-документів - це частина файлової системи, яка містить текстові файли у форматі HTML і зв'язані з ними графіку й інші ресурси. Особливе увагу хотілося б звернути на документи, що містять елементи екранних форм. Ці документи реально забезпечують доступ до зовнішнього програмного забезпечення.

    Прикладне програмне забезпечення, що працює із сервером, можна розділити на програми-шлюзи та інші. Шлюзи - це програми, що забезпечують взаємодію сервера із серверами інших протоколів, наприклад FTP, чи з розподіленими на мережі серверами Oracle. Інші програми - це програми, що приймають дані від сервера і виконують які-небудь дії: одержання поточної дати, реалізацію графічних посилань, доступ до локальних баз даних чи просто розрахунки.

    Все, що було сказано до цього моменту, можна віднести до класичної схеми World Wide Web. В даний час слід говорити про зміну загальної архітектури.

    Як видно з рисунку 2 (див. додаток), до середині 1996 року відбулися деякі зміни в архітектурі сервісу World Wide Web.

    Відбувся повернення до модульної структурі сервера World Wide Web. Цей повернення було реалізований у вигляді специфікації API. API - це специфікація розробки прикладних модулів, що вбудовуються в сервер, точніше редагуються спільно з модулями сервера. Застосування у всіх серверах багатопотокової технології виконання підзадач робить такий спосіб розширення можливостей сервера більш економічним з точки зору ресурсів обчислювальної установки, ніж розробка CGI-скриптів.

    В доповнення до HTML активно став застосовуватися ще одну мову розмітки - VRML (Virtual Reality Modeling Language). У даному випадку йдеться про опис тривимірних сцен і можливості "бродити" по цих світів. При цьому в VRML також, як і в HTML передбачені гіпертекстові посилання, що дозволяє створювати змішані бази даних, де інформаційний архів, наприклад, можна представити у вигляді книг у бібліотеці, серед яких може подорожувати автор, вибираючи потрібну йому тематику і джерело, які потім подаються у форматі документа HTML.

    Java-аплети - Це мобільні коди Java, посилання на які вмонтовані в тіло документа. При доступі до такого документу програма перегляду користувача попередньо аналізує документ на предмет наявності в ньому такого типу посилань, і, якщо вони існують, то підкачує мобільні коди в свою пам'ять. Коди можуть відразу виконуватися в міру розміщення їх на комп'ютері користувача, але можуть активуватися і за допомогою спеціальних команд.

    Як видно з малюнка, зміни торкнулися і клієнтської частини технології. У Нині відбувається поступовий перехід від простої класичної архітектури клієнт-сервер до архітектури з сервером додатків, в ролі якого виступає програма-клієнт. Зокрема, NCSA опублікувала специфікацію CCI (Common Client Interface) для розробки додатків для роботи з сервісами World Wide Web через програму Mosaic.

    Завершуючи обговорення архітектури World Wide Web хотілося б ще раз підкреслити, що її компоненти існують практично для всіх типів комп'ютерних платформ і вільно доступні в мережі. Будь-хто, хто має доступ в Internet, може створити свій WWW-сервер, або, принаймні, подивитися інформацію з інших серверів.

    2. WEB-ТЕХНОЛОГІЙ В ІНТЕРНЕТІ

    2.1 Типи ресурсів Internet

    Сьогодні інформація в Інтернеті виявляється доступною з джерел різного типу. Планувати пошук без повного уявлення про їх спектрі і особливості функціонування неможливо. Перелік основних типів ресурсів, який можна використовувати як карту при плануванні пошукової процедури. Фактично питання ставиться більш широко - про основні способи подання, передачі та обробки інформації в Мережі.

    Електронна пошта та поштові роботи. Адреса електронної пошти окремої особи або організації традиційно використовуються для ідентифікації власника. У комунікаційних ресурсах Мережі - онлайнових засобах комунікації користувачів і системі телеконференцій нерідко він виявляється необхідним атрибутом кожного учасника. Спеціальна URL-схема mailto дозволяє вставляти в Web-сторінку гіперпосилання на e-mail, автоматично відкриває поштового клієнта. У цьому виді вона широко застосовується в WWW. Самі адреси при цьому вільно індексуються пошуковими системами і доступні для пошуку через пошукові машини загального призначення. AltaVista, наприклад, показує, що адреси електронної пошти зустрічаються майже на 100 мільйонів Web-сторінок із 150 мільйонів заіндексувати їй документів.

    Адреса e-mail активно накопичуються і в спеціальних системах пошуку людей і організацій, про які піде мова нижче. Серйозне незручність для пошуку по e-mail складає те, що при отриманні адреси допускається реєстрації користувача під псевдонімом. Ця практика особливо широко поширена на серверах, що надають безкоштовні поштові скриньки.

    Поштові роботи - це спеціальні програми, здатні відповідати певними діями на команди, що надходять їм електронною поштою. Їх основне призначення -- пересилання даних по запиту у випадку, коли ті не доступні іншим способом, а також як альтернатива роботи в режимі on-line з будь-яким з відомих ресурсів, наприклад, FTP-архівами. Адреса поштового робота має звичайний формат, наприклад, [email protected] (файловий сервер Новосибірського вузла TURBO). Довідка про перелік допустимих команд зазвичай надсилається роботами на адресу користувача у відповідь на повідомлення з порожнім полем subject і єдиним словом help, набраному в тексті листа з першої позиції. При пошуку поштові роботи спочатку використовували лише як посередники при отриманні інформації. Іноді доводиться стикатися з тим, що вони виявляються єдиним засобом отримання потрібних відомостей.

    Глобальна система телеконференцій Usenet, регіональні та спеціалізовані телеконференції. Система побудована за принципом електронних дошок оголошень, коли користувач може розмістити свою інформацію в одній із тематичних груп новин. Потім ця інформація передається користувачам, які підписані на цю групу. Повне число груп новин Usenet перевищує 20 тисяч і відомості про них можна знайти, наприклад, на Yahoo. Всі вони одночасно не підтримуються жодним сервером, так що тр уднее буває відшукати не назва відповідної групи, а сервер телеконференцій, з якого її можна завантажити. Usenet - ключове слово саме для глобальної системи телеконференцій. Регіональні та спеціалізовані системи також мають поширення. Ресурс найбільш значущий для швидкого накопичення інформації по вузькому питання, а при пошуку - частіше для отримання приватної, неофіційної інформації. Списки розсилки мають на увазі більш-менш систематичну розсилку повідомлень інформації по електронній пошті. Якщо користувач сам може помістити інформацію в список розсилки, то це починає нагадувати систему телеконференції, однак не вимагає спеціального клієнта. Невеликий за охопленням адрес вузькоспеціальних або рекламних списків розсилки в Мережі налічується величезна кількість. Тут варто звернути увагу на те, авторитет яких отримав міжнародне визнання. Якщо не говорити про якихось спеціальних інтересах, то вони необхідні пошуковику, головним чином, для того, щоб бути в курсі останніх подій, що відбуваються в житті Інтернету. Володіння мережевий лексикою з широкого спектру тем і поінформованість про найбільших проектах, що реалізовуються в Мережі, які можна почерпнути зі списків розсилки, заохочують результативно будувати пошукові запити.

    Онлайнові засоби комунікації користувачів (chat, ICQ та інші) припускають можливість обміну інформацією між двома або більшою кількістю користувачів Мережі в режимі реального часу за посередництвом спеціального чат-сервера. Частиною такого обміну може ставати текстовий діалог, передача графіки прямо в процесі її створення, голосова та відео зв'язок, обмін файлами. Довгий час ресурси цього типу вкрай рідко використовувалися у вирішенні пошукових завдань, однак ситуацію змінило поява в 1996 році нового сервісу цього типу, а саме служби ICQ, відомої серед російських користувачів як "Аська" (http://www.icq.com).

    В відміну від існуючих раніше чатів, де реєстрація учасників, як правило, носила анонімний характер і діяла лише протягом сеансу зв'язку, розробники ICQ запропонували кожному користувачеві реєстраційний номер-ідентифікатор, який зберігався б за ним постійно. Це рішення мало грандіозні наслідки в галузі комп'ютерного спілкування людей. Унікальний ICQ номер загрожує з'явитися на візитних картках поруч із телефоном, адресою електронної пошти та домашньою сторінкою. При пошуку людей та організацій можна з успіхом використовувати пошукову службу ICQ, яка стає доступною відразу після установки ICQ-клієнта на комп'ютер.

    В реєстраційних списках чатів зазвичай присутні відомості про місце проживання учасників, і вони рідко вказуються невірно.

    Системи пошуку людей та організацій в сучасній Мережі характеризуються двома важливими моментами: більшість цих ресурсів вже перенесено на Web-сервера і все більш широка присутність отримує в них інформація про людей і організаціях, які не мають прямого або взагалі ніякого відношення до Інтернету. З останнім затвердженням пов'язані відомі факти появи в Мережі телефонних, адресних та інших баз даних, як окремих організацій, так і цілих регіонів. Тим не менше, такий суто мережний ідентифікатор користувача як адресу e-mail залишається домінуючим пошуковим атрибутом для багатьох сервісів цього типу. Джерелом поповнення їх баз даних стають матеріали телеконференцій, Web-сервера, а також самостійна реєстрація користувачів.

    Поряд c переорієнтування сервісів під WWW у Мережі продовжує працювати один із самих старих пошукових служб подібного типу - Whois, доступна по протоколу telnet з сервера whois.internic.net після входу по login: whois.

    Бази даних Hytelnet, з доступні по протоколу telnet в ряді випадків представляють собою абсолютно унікальну інформацію, перш за все по бібліотечним каталогам європейських та американських університетів, а також державних установ. Найбільш значний перелік баз даних цього типу, що перевищує 1600 одиниць можна знайти на Web-сервері за адресою http://www.lights.com/hytelnet/. Кожна з них володіє оригінальною системою навігації та пошуку, що реалізується через команди, які вводяться з клавіатури в алфавітно-цифровому режимі.

    Система файлових архівів FTP, системи пошуку в FTP-архівах глобального і регіонального досяжності. Ресурси цього типу не відступили так беззастережно під натиском Web-технологій, як більшість інших. Одна з причин у величезній кількості інформації, накопиченої в FTP-архівах за десятиліття експлуатації комп'ютерних систем, що як і раніше цінна для фахівців. Соціального замовлення на її перенесення в Web-простір в повному обсязі не існує. Інша причина криється в простоті доступу, навігації і передачі файлів FTP. Так чи інакше, сьогодні FTP-ресурси затребувані і навіть характеризуються розвитком не тільки своєї єдиної глобальної пошукової системи Archie (адресу одного з стабільно доступних Web-шлюзів до неї - http://ftpsearch.ntnu.no), а й регіональних систем, зокрема російської - http://ftpsearch.city.ru, охоплює понад 2000 серверів.

    FTP-архіви - Це в першу чергу джерела програмного забезпечення, успішно конкуруючі з Web-сайтами, які спеціалізуються на продажу та поданні колекцій програм. На відміну від Web-сайтів на них набагато частіше можна зіткнутися з порушенням авторських прав у вигляді піратських копій програм і окремих матеріалів, що продаються на інших вузлах за гроші. Як наслідок тіньових сторін FTP-сервісу - небезпека зараження вірусом з неперевіреного джерела. Пошуки, який же інформації варто починати з пошукової системи FTP? Універсальний відповідь проста: оскільки ключовим словом при оформленні запиту є текст, що входить у назву файлу або каталогу на FTP-сервер, то найбільшого успіху можна досягти в пошуку інформації, яка, будучи оформлена у вигляді файлу, або вже має певний ким-небудь ім'я, або існує реальна можливість його вгадати. Відомих автору випадків ділового використання FTP-пошуку чимало. Один з них такий. Система пошуку, що розшукує один з американських стандартів ASTM з матеріалознавства за допомогою пошукової системи HotBot швидко локалізував головний Web-сервер. Там йому вдалося з'ясувати точне назву стандарту. Повний опис стандарту надавалося за плату, а коротка анотація - безкоштовно. З технічних причин анотація на сервері була не доступна. Людина прийняв рішення досліджувати FTP-архіви з допомогою пошукової системи і використовувати алфавітно-цифрову послідовність, кодує назва матеріалу. Незабаром було знайдено версія стандарту, близька до повної, що вичерпало проблему. Достовірність інформації викликала в пошукача деякі сумніви, проте була легко встановлена фахівцями.

    Бази даних Gopher і пошукова система Veronica, скануюча ресурси Gopher-простору на поточний момент перестали грати скільки-небудь істотну роль в інформаційному полі Інтернету. Тим не менше, мати гофер всього світу - сервер, на якому зареєстровано більшість gopher-серверів Мережі (gopher:// gopher2.tc.umn.edu), залишається в робочому стані і до цього дня. Вийти на той чи інший gopher-сервер трапляється і через колекції посилань на Web-сторінках, і через "паперові" Жовті сторінки. Як правило, якщо gopher-сервер ще працює, то в одному й?? файлів на ньому вказана адреса Web-сайту, на який перенесена інформація.

    2.2 Інтерфейс Web-додатків при роботі в мережі Internet

    Гіпертекстова інформаційна система World Wide Web (WWW) та її технології на сьогоднішній день найбільш значні в Мережі і продовжують свій підйом. За своєю навігаційної картині WWW фактично скопіювала Gopher-ресурси, але слідства одній дрібній деталі, мало хто міг передбачити. Ця деталь - використання Web-сторінки як легко створюваного складного об'єкта, в тіло якого монтується більше прості об'єкти, призначені для одночасного відображення. Те, що сьогодні в списку останніх присутні текст, гіперпосилання, графіка, мультимедіа, програмний код, діалогові форми і багато чого іншого в кінцевому підсумку і визначило широке комерційне використання WWW. Павутина змусила пошукові системи Web-простору тонко підлаштуватися під себе і фактично позначила ключову тенденцію їх розвитку. Мова йде з одного боку про те, що при індексуванні ресурсів все більш детального опрацювання пошуковими системами піддаються поля Web-сторінок, що формуються контейнерами мови HTML. З іншого боку інтенсивно розвиваються ті елементи інформаційно-пошукових мов, які підтримують пошук усередині цих полів. Сьогодні можна констатувати глибоку інтеграцію пошукових систем і ресурсів WWW на базі єдиної технології. Крім цього жахливий обсяг інформаційної бази WWW вперше з особливою гостротою поставив питання про необхідність паралельного існування цілого ряду ідентичних пошукових сервісів, які обслуговують інтереси користувачів.

    Каталоги ресурсів - глобальні, локальні, спеціалізовані (у середовищі WWW); являють собою розміщуються в Мережі бази даних з адресами ресурсів і самим різним масштабом накопиченої інформації та охопленням тематики. Зазвичай вони мають ієрархічну структуру, переміщаючись за якою, можна локалізувати потрібний об'єкт. Швидкість накопичення інформації такими системами виявляється порівняно низькою, оскільки в класифікації ресурсів передбачається безпосередню участь людини. Для пошукача отримання інформації про ресурсі з відомого каталозі завжди є певною гарантією достовірності. При вирішенні більш-менш стандартною пошукової завдання саме каталог, а не Пошукова машина виявляються стартовим майданчиком для початку пошуку.

    Пошукові машини, або автоматичні індекси - глобальні, локальні, спеціалізовані (у середовищі WWW) представляють собою потужні інформаційно-пошукові системи, розміщуються на серверах вільного доступу. Їх спеціальні програми-роботи, або павуки, в автоматичному режимі безперервно сканують інформацію Мережі на основі заданих алгоритмів, проводячи індексацію документів. У подальшому на основі створених індексних баз даних пошукові машини надають користувачеві доступ до розподіленої на вузлах Мережі інформації. Це реалізується через виконання пошукових запитів в рамках відповідного інтерфейсу. Останні дослідження возможн

         
     
         
    Реферат Банк
     
    Рефераты
     
    Бесплатные рефераты
     

     

     

     

     

     

     

     
     
     
      Все права защищены. Reff.net.ua - українські реферати ! DMCA.com Protection Status