ПЕРЕЛІК ДИСЦИПЛІН:
  • Адміністративне право
  • Арбітражний процес
  • Архітектура
  • Астрологія
  • Астрономія
  • Банківська справа
  • Безпека життєдіяльності
  • Біографії
  • Біологія
  • Біологія і хімія
  • Ботаніка та сільське гос-во
  • Бухгалтерський облік і аудит
  • Валютні відносини
  • Ветеринарія
  • Військова кафедра
  • Географія
  • Геодезія
  • Геологія
  • Етика
  • Держава і право
  • Цивільне право і процес
  • Діловодство
  • Гроші та кредит
  • Природничі науки
  • Журналістика
  • Екологія
  • Видавнича справа та поліграфія
  • Інвестиції
  • Іноземна мова
  • Інформатика
  • Інформатика, програмування
  • Юрист по наследству
  • Історичні особистості
  • Історія
  • Історія техніки
  • Кибернетика
  • Комунікації і зв'язок
  • Комп'ютерні науки
  • Косметологія
  • Короткий зміст творів
  • Криміналістика
  • Кримінологія
  • Криптология
  • Кулінарія
  • Культура і мистецтво
  • Культурологія
  • Російська література
  • Література і російська мова
  • Логіка
  • Логістика
  • Маркетинг
  • Математика
  • Медицина, здоров'я
  • Медичні науки
  • Міжнародне публічне право
  • Міжнародне приватне право
  • Міжнародні відносини
  • Менеджмент
  • Металургія
  • Москвоведение
  • Мовознавство
  • Музика
  • Муніципальне право
  • Податки, оподаткування
  •  
    Бесплатные рефераты
     

     

     

     

     

     

         
     
    Стандарт XML
         

     

    Інформатика, програмування


    Стандарт XML. Призначення та структура. Відмінності від HTML.
    Що таке XML?
    XML (eXtensible Markup Language) - це розширювана мова розмітки тексту,запропонована W3C у 1996 році. Це мова, яка повною мірою визначає логічнуструктуру документа. Задача XML полягає в тому, щоб дані: тексти,зображення або інші частини Web-документа могли бути визначені іструктуровані незалежно від платформи, що їх відтворює, постачальника ійого програмного забезпечення, наприклад Web-браузерів.
    При створенні документів із використанням XML, ви можете використовувативаші власні елементи і структури для розмітки вмісту ваших документів.
    Можливо визначити DTD (a Document Type Definition), тобто визначення типудокумента. DTD визначає те, що можна назвати "граматикою" документа - цесписок різноманітних елементів і їхніх утворень для використання увизначених документах, у чомусь це нагадує використання CSS, тобто виможете зробити посилання на DTD, що знаходиться або в мережі або написатийого безпосередньо у вашому документі.
    Таким чином, вміст документа, його структура, типи вікоріствуваніх у ньомуелементів і його відгляд визначаться окремо, тобто незалежно один відодного.
    Чому XML?
    Потрібно сказати, що XML корисний для автоматизованих програмних засобів,що шукають у Web. Недосконалість HTML призвела до того, що мережаперетворилася в мішанину тексту, повну різноманітних елементів і тегів,часто використовуваних, що називається Pro Forma і нічого не значущих.
    XML має величезний потенціал для удосконалення гіпертекста. Наприклад у
    HTML для створення зв'язку використовується елемент A, XML же дозволяєстворити не просто посилання, а наприклад, двонаправленій зв'язок.
    Перспектива XML полягає в тому, що він буде використовуватися для описуінших мов розмітки, наприклад, JavaScript, що використовується в HTML -документах.
    XML розроблений для того, щоб спростити і полегшити використання SGML, прицьому зберігши його великі можливості по створенню, поширенню і публікації
    Web-документів мережі.

    Вступ

    Незважаючи на те, що XML дуже молода (W3C затвердила специфікацію
    "Extensible Markup Language (XML) 1.0" на початку лютого 1998 г) і окремікомпоненти цієї мови знаходяться ще в стадії доробки, уже сьогодніз'являються нові мови, створені на основі XML, виникають численні Web -сервери, що використовують цю технологію для організації інформації, щозберігається на них.

    Для чого потрібна нова мова розмітки?

    Мова розмітки документів - це набір спеціальних інструкцій, називанихтегами, призначених для формування в документах якоїсь структури івизначення відношень між різноманітними елементами цієї структури. Тегимови, або, як їх іноді називають, управляючі дескриптор, у такихдокументах якимось чином кодуються, виділяються щодо основного вмістудокумента і служать у якості інструкцій для броузера.
    Всю красу XML можна зрозуміти тільки при порівнянні його з HTML.
    Формалізована у RFC 1866 у 1995 році, HTML є найбільш популярною мовоюрозмітки у всьому світі. Термін «розмітка» стосовно до документа означаєзвичайно усе, що не відноситься до його інформаційного наповнення.
    У ранню пору свого розвитку мова HTML підносилася як засіб масштабованогоформатування документів, яку можна було б використовувати для обмінуінформацією практично на будь-якій платформі. У основі HTML лежить украйпроста ідея: ви візначаєте нескладну мову, що описує структуру документа, ічекаєте, коли компанії розроблять програмні засоби, спроможні подавати такідокументи в різноманітних операційних середовищах з урахуванням обранихкористувачем параметрів. За допомогою HTML можна було б створюватиматеріали, що допускають представлення в будь-якому візуальному абозвуковому форматі.
    Проте поступово ставало ясно, що ця ідея, незважаючи на свою простоту, йдеврозріз з узвічаєною практикою видавничих систем. Традиційний механізмпідготування публікацій передбачає, що графічні дизайнери і компонувальникаповинні брати до уваги специфічні особливості презентаційного середовища,включаючи розмір листа, якість друку, палітру кольорів і т.п. Виявилося, щопереключитися з такого методу на більш простий, при якому автор відповідаєлише за вміст і логічну структуру документа, перекладаючи презентаційніобов'язки на користувацькі програми, досить важко.
    У файлі HTML у його вихідному виді теги форматування перемішані зізвичайним текстом. Головною особливістю розмітки HTML є, звичайно,можливість вставки посилань на зовнішні документи або на внутрішні розділитого ж самого документа.
    HTML процвітав не тільки як адаптована мова розмітки, але й у якостіпроміжного програмного забезпечення. Завдяки своїй дешевізні і поширеностібраузери Web являють собою відмінних клієнтів; за посередництвом HTML вониможуть спілкуватися з найрізноманітнішими серверами.
    Проте HTML стикнувся з певними труднощами. Його обмежені можливостіформатування намагалися перебороти за допомогою CSS, ініціативи TrueDoc від
    Bitstream і звісно ж множини специфічних розширень для браузера; а йогообмежені можливості в якості проміжного ПО - за допомогою Java, Active іт.п. Проте все це не усуває його фундаментальні недоліки.
    По суті, HTML - це технологія представлення інформації, вона описує те, якбраузер повинний скомпонувати текст і графік на сторінці. У результаті «те,що ви бачите, - це усе, що ви одержуєте ». Немає ніякого способу описатидані незалежно від відображення цих даних (за винятком надзвичайно слабкоїсистеми ключових слів у заголовку сторінки Web). "Байдужність" до структуридокумента призводить до того, що пошук або аналіз інформації усерединінього нічим не буде відрізнятися від роботи із суцільним, не розбитим наелементи текстовим файлом. Це головна причина, чому так важко знайтипотрібну інформацію за допомогою механізму пошуку.
    Клієнт не має ніяких менше прийнятних засобів витягу даних із сторінки Webдля подальшої роботи з ними. Далі, на будь-який конкретній сторінці Webклієнт одержує тільки одне представлення конкретної множини даних.
    Припустимо, що ви переглядаєте список аукціонів eBay, упорядкований по датівідкриття торгів. Якщо ви захочете глянути на той же список, алевідсортованій по даті закриття торгів, то вашому браузеру прийдетьсяпосилати новий запит серверу. У свою чергу серверу прийдеться нанововідправляти повну сторінку HTML із списком аукціонів. Такого родуманіпулювання даними веде до значного збільшення числа звертань до серверів
    Web і утруднює, таким чином, їх подальше масштабирование.
    Інша проблема з HTML у тому, що це «плоска» мова, тобто автори не можутьвикористовувати її для надання інформації про ієрархію даних. Далі, вонанепослідовна і тому утрудняє розбір тексту програмним забезпеченням.
    Наприклад, хоча більшість відкріваючіх тегів, (такі, як або) маєвідповідні закріваючі теги, деякі (наприклад,) їх не мають.
    Істотним недоліком HTML можна назвати обмеженість набору його тегов. DTD -правила для HTML визначають фіксований набір дескріпторів і тому врозробника немає можливості вводити власні, спеціальні теги.
    Простим рішенням для деяких із перерахованих проблем було би введеннядодаткових тегів HTML, таких, як, або. З їхньоюдопомогою клієнт міг би визначити, що собою являють дані, і відображати їхпо-різному або експортувати по запиту користувача. Якщо ж ви вирішите НЕчекати зміни стандарту, то майте на увазі, що ви створюєте щось своє,нестандартне і тим самим відмовляєтеся від однієї з головних переваг HTML.
    Тому в 1996 році члени робочої групи Консорціуму World Wide Web (W3C)повернулися до розгляду стандартної узагальненої мови розмітки (Standard
    Generalized Markup Language, SGML), сильно спрощеним нащадком якого є HTML.
    Запропонована у 1974 році Чарльзом Голдфарб, SGML являє собою метамову --систему для опису інших мов. Ця мова призначена для створення інших моврозмітки, він визначає припустимий набір тегів, їхні атрибути і внутрішнюструктуру документа. При всіх своїх можливостях вона занадто складна длябільшості браузеров Web: одна специфікацій SGML займає понад 500 сторінок.
    Спростив SGML для використання з Web, група запропонувала XML
    (рекомендація W3C по статусу на лютий 1998 року). XML - підмножіна SGML,причому любий дійсний документ XML є дійсним документом SGML. І, як і SGML,
    XML - це метамова, що визначає інші мови розмітки для специфічних цілей.
    Наприклад, мова сінхронізованої інтеграції мультимедіа (Synchronized
    Multimedia Integration Language, SMIL) базується на XML.
    Консорціум W3C, закликаючи до використання XML у Web, фактично пропонуєкожному сконструювати особисту мову для своїх гіпертекстових документів,причому для різних документів це будуть різні мови.
    XML дозволяє визначити формальний синтаксис мови, наприклад правилавкладення елементів. Семантику можна, звичайно, описувати на звичайнійанглійській мові.
    XML використовується для розмітки стандартних документів багато в чому таксамо, як HTML. Проте XML перевершує його при роботі зі структурованимданими, такими, як результати запиту, метаінформація про вузол Web абоелементи і типи схеми.
    Документ XML виглядає багато в чому схожим на HTML. Він також складається зтекстових фрагментів, Анотований вкладених в кутові дужки тегами. Проте,на відміну від HTML, зміст тега залежить від регістра, а кожнийвідкріваючій тег повинний в усіх випадках мати парний закриваючи тег.
    XML (Extensible Markup Language)-е те мова розмітки, що описує цілий класоб'єктів даних, називаних XML-документами. Ця мова використовується вякості засобу для опису грамматики інших мов і контролю за правильністювпорядкування документів. XML не містить ніяких тегів, призначених длярозмітки, а просто визначає порядок їх створення. Таким чином, якщо,наприклад, ми вважаємо, що для позначення елемента rose у документінеобхідно використовувати тег;, то XML дозволяє вільновикористовувати обумовлений нами тег і ми можемо включати в документфрагменти, подібні такому:rose
    Таким чином, у розробників з'являється унікальна можливість визначативласні команди, що дозволяють їм найбільш ефективно визначати дані, щозберігаються в документі. Автор документа створює його структуру, будуєнеобхідні зв'язки між елементами, використовуючи ті команди, щозадовольняють його вимогам і домагається такого типу розмітки, що необхіднойому для виконання операцій перегляду, пошуку, аналізу документа.
    Ще одною з очевидних переваг XML є можливість використання її в якостіуніверсальної мови запитів до сховищ інформації. Сьогодні в глибинах W3Cзнаходиться на розгляді робочий варіант стандарту XML-QL (або XQL), що,можливо, у майбутньому складе серйозну конкуренцію SQL. Крім того, XML -документи можуть виступати в якості унікального засобу збереження даних, щомістить у собі одночасно засоби для розбору інформації й представлення їїна стороні клієнта. У цій області одним із перспективних напрямків єінтеграція Java і XML - технологій, що дозволяє використовувати міць обохтехнологій при побудові машинно-незалежних додатків, що використовують,крім того, універсальний формат даних при обміні інформацією.
    XML дозволяє також здійснювати контроль за коректністю даних, щозберігаються в документах, робити перевірки ієрархічних співвідношеньусередині документа і встановлювати єдиний стандарт на структурудокументів, умістом яких можуть бути самі різноманітні дані. Це означає, щойого можна використовувати при побудові складних інформаційних систем, укотрих дуже важливим є питання обміну інформацією між різноманітнимидодатками, що працюють в одній системі. Створюючи структуру механізмуобміну інформації на самому початку роботи над проектом, менеджер можепозбутись себе в майбутньому від багатьох проблем, пов'язаних із несумісністювикористовуваних різноманітними компонентами системи форматів даних.
    На основі XML уже сьогодні створені такі відомі спеціалізовані мовирозмітки, як SMIL, CDF, MathML, XSL, і список робочих проектів нових мов,що знаходяться на розгляді W3C, постійно поповнюється.

    Структура документа

    Не обмежуючи автора яким-небудь фіксованим набором тегів, XML дозволяє йомувводити будь-які імена. Ця можливість є ключовою для активногоманіпулювання даними.
    Приклад для порівняння представлення списку імен і адрес на HTML і на XML.
    От фрагмент HTML:
    Еditor Сontacts
    Ім'я: Джонатан Ейнджел
    Посада: старший редактор
    Видання: Network Magazine
    Вулиця і будинок: Гарісона, 600
    Місто: Сан-Франциско
    Штат: Каліфорнія
    Індекс: 94107
    Електронна пошта:jangel @ mfi. com
    Теги розміщають дані на екрані, але нічого не повідомляють про їхнюструктуру.
    У випадку XML той же самий фрагмент буде поданий у такий спосіб (ізбережений у файлі EDITORS. XML).

    Jonatan

    Andjel chif editor

    Network

    Magazine

    Garissona, 600

    San-Francisko

    California

    94107 [email protected]

    У XML теги не можуть накладатися, як у HTML, проте вони можуть бутивкладені один в одний. Насправді, вкладення навіть рекомендується як засібстворення ієрархії даних (підпорядковані або рівноправні відношення). Якочевидно з приведеного приклада, такі елементи, як і,містять дані, у той час як інші () присутні тільки з метоюструктурування.
    Теги початку і кінця елемента є основними використовуваними в XMLрозміткамі, але ними справа не вичерпується. Наприклад, елементам можутьбути привласнені атрибути. Ця можливість аналогічна наявній в HTML, де,наприклад, елементу може бути привласнений атрибут align = »center».
    У XML елемент може мати один або більше пов'язаних із ним атрибутів,причому при упорядкуванні документа ви можете видумати їх стільки, скількипобажнете, наприклад.
    Документи XML можуть містити посилання на інші об'єкти. Посилання являютьсобою рядок, що починається з амперсанд і закінчується ";". Ці посиланнядозволяють, зокрема, вставити в документ спеціальні символи. Посилання XMLна об'єкти надають набагато більше можливостей, тому що вони можутьпосилатися на визначені автором розділи тексту в тому ж самому або в іншомудокументі.
    Наприклад, посилання на об'єкти дозволяють застосувати об'єктно -орієнтований підхід при створенні журнальної статті:

    & introduction;
    &body;
    &sidebar;
    &conclusion;
    &resources;

    Найпростіший XML-документ може виглядати так, як це показано в прикладі 1


    Перший
    Другий підпункт 1
    Третій
    Останній

    У XML існують відкріваючі, закріваючі і порожні теги (у HTML поняттяпорожнього тега теж існує, але спеціального його позначення не потрібно).
    Тіло документа XML складається з елементів розмітки (markup) ібезпосередньо вмісту документа - даних (content). XML - теги призначені длявизначення елементів документа, їхніх атрибутів і інших конструкцій мови.
    Любий XML-документ повинний завжди починатися з інструкції,усередині якої також можна задавати номер версії мови, номер кодовоїсторінки й інші параметри, необхідні програмі-аналізатору в процесі розборудокумента.

    Правила створення XML-документа

    У загальному випадку XML-документи повинні задовольняти таким вимогам:
    . У заголовку документа поміщається оголошення XML, у якому вказується мова розмітки документа, номер її версії і додаткова інформація
    . Кожний відкріваючій тег, що визначає деяку область даних у документі обов'язково повинний мати відповідний закриваючи тег
    . У XML враховується регістр символів
    . Всі значення атрибутів, використовуваних у визначенні тегів, повинні бути взяті в лапки
    . Вкладеність тегів у XML строго контролюється, тому необхідно стежити за порядком слідування відкріваючіх і закриваючи тегів
    . Вся інформація, що розташовується між початковим і кінцевими тегами, розглядається в XML як дані і тому враховуються всі символи форматування
    Якщо XML-документ не порушує приведені правила, то він називаєтьсяформально-правильним і всі аналізатори, призначені для розбору XML -документів, зможуть працювати з ним коректно.
    З XML-документом пов'язані три рівні коректності:
    . Правильно побудований XML-документ - це такий, у якому елементи правильно структуровані у вигляді дерева з коректно розставленими відкріваючіх і закриваючи тегами.
    . Діючий XML-документ правильно побудований і містить теги, що відповідають оголошенню типу документа. Він містить тільки елементи і значення атрибутів, що відповідають DTD. Хоча XML-документ може підготовлятіся і читатися без DTD, DTD істотно для встановлення дієвості.
    . Синтаксично коректний XML-документ знаходиться поза контролем XML.

    Розробник такого документа відповідає за його логічну структурізацію.
    Проте крім перевірки на формальну відповідність граматиці мови, у документіможуть бути присутнім засоби контролю над вмістом документа, за дотриманнямправил, що визначають необхідні співвідношення між елементами і формуючиструктурою документа. Наприклад, наступний текст, будучи цілком правильним
    XML-документом, буде абсолютно безглуздим:
    RussiaNovosibirsk
    Для того, щоб забезпечити перевірку коректності XML-документів, необхідновикористовувати аналізатори, що роблять таку перевірку і називаютьсяверіфікованімі.
    На сьогоднішній день існує два способи контролю правильності XML-документа:
    DTD - визначення (Document Type Definition) і схеми даних (Semantic
    Schema). Визначення DTD-правил у XML не є необхідністю.

    Конструкції мови

    Вміст XML-документа являє собою набір елементів, секцій CDATA, директиваналізатора, коментарів, спецсімволів, текстових даних.
    Елементи даних
    Елемент - це структурна одиниця XML-документа. Вкладаючи слово rose в утеги, ми визначаємо непорожній елемент, назв
    , Вмістом якого є rose. У загальному випадку в якості вмістуелементів можуть виступати як простий текст, так і інші, вкладені, елементидокумента, секції CDATA, інструкції з опрацювання, коментар, - тобтопрактично будь-які частини XML-документа.
    Любий непорожній елемент повинний складатися з початкового, кінцевого тегов іданих, між ними заключених. Наприклад, наступні фрагменти будуть бутиелементами:rose
    Novosibirsk
    , а ці - ні:

    rose
    Набором всіх елементів, що містяться в документі, задається його структураі визначаються всі ієрархічні співвідношення. Плоска модель данихперетворюється з використанням елементів у складну ієрархічну систему змножиною можливих зв'язків між елементами. Наприклад, у такому прикладі миописуємо місце розташування Новосібірськіх університетів (вказуємо, що
    Новосибірський Університет розташований у місті Новосибірську, що, у своючергу, знаходиться в Росії), використовуючи для цього вкладеність елементів
    XML:

    Новосибірськ
    Siberia


    Новосибірський Державний Технічний Університет

    дуже гарний інститут


    Новосибірський Державний Університет

    теж не поганої

    Проводячи пошук у цьому документі, програма клієнта буде спиратися наінформацію, закладену в його структуру - використовуючи елементи документа.
    Тобто, якщо, наприклад, потрібно знайти потрібний університет у потрібномумісті, використовуючи приведений фрагмент документа, то необхідно будепереглянути вміст конкретного елемента, що знаходитьсявсередині конкретного елемента. Пошук при цьому, природно, буденабагато більш ефективним, ніж знаходження потрібної послідовності повсьому документу.
    У XML документі, як правило, визначається хоча б один елемент, названийкореневим і з нього програми-аналізатори починають перегляд документа. Унаведеному прикладі цим елементом є
    У деяких випадках теги можуть змінювати й уточнювати семантику тих абоінших фрагментів документа, по різному визначаючи ту саму інформацію, тимсамим надаючи додатку-аналізатору цього документа зведення про контекствикористання описуваних даних.
    У випадку, якщо елемент не має вмісту, тобто немає даних, які він повиннийвизначати, він називається порожнім. Необхідно тільки пам'ятати, щопочатковий і кінцеві теги порожнього елемента ніби об'єднується в один, ітреба обов'язково ставити косу ризику перед кутовою закриваючи (наприклад,
    ;)
    Коментар
    Коментарями є будь-яка область даних, поміщена між послідовностямі символів
    Коментар пропускаються аналізатором і тому при розборіструктури документа в якості значущої інформації не розглядається.
    Атрибути
    Якщо при визначенні елементів необхідно задати якісь параметри, щоуточнюють його характеристики, то є можливість використовувати атрибутиелемента. Атрибут - це пару "назва" = "значення", що треба задавати привизначенні елемента в початковому тегу. Приклад:
    # ff08ffwhiteабо
    Ivan Petrov
    Прикладом використання атрибутів у HTML є опис елемента:
    Black
    Cпеціальні символи
    Для того, щоб включити в документ символ, використовуваний для визначенняяких-небудь конструкцій мови і не викликати при цьому помилок у процесірозбору такого документа, потрібно використовувати його спеціальнийсимвольної або числовий ідентифікатор. Наприклад, <,> "або
    $ (десяткового форма запису), (шістнадцяткова) і т.д.
    Директиви аналізатора
    Інструкції, призначені для аналізаторів мови, описуються в XML документі задопомогою спеціальних тегів -


    Опис елементів
    Для визначення класу елемента, до якого надалі будуть застосовуватисяінструкції, що описують його вміст і структуру, призначений спеціальнийелемент схеми elementType,

    Елемент містить інформацію про черговий випускчасопису

    Назва елемента задається атрибутом id. Всі подальші інструкції, щоставляться до описуваних класу, визначають його внутрішню структуру інабір припустимих даних, містяться всередині блока, заданого тегами і.
    Як очевидно з приклада, при визначенні класу елемента, можна такожвикористовувати коментар до нього, що заключають у теги

    Атрибути елемента
    Для того, щоб в описі елемента визначити його атрибути й описативластивості цих атрибутів ми повинні використовувати елемент attribute:


    У даному прикладі елементу визначається атрибут src, значеннямякого може бути будь-яка послідовність дозволених символів:


    Подібно DTD, схеми даних дозволяють встановлювати обмеження на значення ізасіб використання атрибутів. Для цього в дескріпторі необхідновикористовувати параметр atttype.
    Наприклад, якщо ми хочемо зазначити, що значення атрибута повинновикористовуватися програмою-аналізатором як унікальний ідентифікатор, тонам необхідно створити таке правило:

    Якщо ж потрібно задати список можливих значень атрибута, то приклад будевиглядати в такий спосіб:

    Модель вмісту елемента
    Під моделлю вмісту в схемі даних розуміють опис усіх припустимих об'єктів
    XML-документа, використання котрих усередині даного елемента є коректним.
    Модель вмісту визначається інструкціями, розташованими всередині блоку
    .

    Для цього правила коректним буде бути такий фрагмент документа:

    Психи і маніяки в Інтернет

    Вкладені елементи описуються за допомогою інструкції element, у якійпараметром type указується клас об'єкта - посилання на його визначення:


    Якщо потрібно зазначити режим використання вкладеного елемента, то требавизначити параметр occurs:

    Можливі значення цього параметра такі:
    REQUIRED - елемент повинний бути обов'язково визначений
    OPTIONAL - використання елемента не є обов'язковим
    ZEROORMORE - вкладений елемент може зустрічатися декілька разів або жодногоразу
    ONEORMORE - елемент повинний зустрічатися хоча б один раз
    Приклади правильних XML-документів, що використовують приведену вище схему:


    Навіщо він потрібний, XML?
    Іван Петров
    Що таке XMLпотрібний чи він нам

    або

    Навіщо він потрібний, XML?
    Що таке XML

    Крім елементів, вмістом XML-документа можуть також бути звичайним текстом іобластями CDATA. Для позначення типів вмісту поточного елемента в схемахвикористовуються такі інструкції:
    - вказує на те, що вмістом елемента є тільки вільна текстоваінформація (секція PCDATA):

    - вказує на те, що вмістом елемента повинні бути тільки елементи,без тексту, неукладеним ні в один елемент:

    - будь-яке сполучення елементів і тексту

    - порожній елемент
    Приклад:

    Що в імені твоєму?

    розширювана мова розмітки (Extensible Markup Language, XML) дозволяє вамстворювати свої власні теги, документувати їх за допомогою визначень типівдокументів (Document Type Definition, DTD) або схеми XML і потім безпроблем обмінюватися даними з іншими джерелами. Все це добре, але можевиявитися, що інші використовують ті ж самі, що і ви, імена для елементів іатрибутів, але при цьому спираються на інші DTD. Це прямий шлях до проблем.

    Щоб уникнути подібних конфліктів W3C розробив концепцію просторів імен іключового слова xmlns. Завдяки їм в одному документі можутьвикористовуватися імена елементів і атрибутів, що інакше вступили б уконфлікт один з одним. Тепер же вони різняться різними префіксамі просторуімен і визначаються по різноманітним DTD або схемах.
    От, наприклад, фрагмент коду XML із використанням просторів імен:


    Network
    Magazine

    У визначенні DTD магазина А назва книги є піделементом часопису. У схемімагазина Б назва є атрибутом часопису.
    Завдяки розрізненню імен за допомогою різних префіксів просторів імен вониможуть застосовуватися разом. Місцезнаходження DTD і схеми вказується вданому прикладі за допомогою URL, але воно може також визначатися задопомогою Uniform Resource Name (URN, див. RFC 2141) або Uniform Resource
    Identifier (URI, див. RFC 2396).

    Використання для опису даних (Intelligent Enterprise, August 03, 1999,

    Volume 2, Number 11)

    Однією з особливостей XML, що привертає увагу промисловості, є можливістьопису структур даних і даних, що зберігаються. З використанням XML можнавизначити нові теги спеціально для опису еквівалента таблиць і стовпчиків
    (або сутностей і атрибутів) у структурі реляційної бази даних. Ще більшістотно те, що теги для набору стовпчиків або атрибутів можуть зв'язуватисяз тегами для їхньої батьківської таблиці або сутності. Хоча тегівструктура здається гарним механізмом для опису і розуміння структури базиданих, спосіб організації даних потребує як ніколи раніше сувороїдисципліни. XML не забороняє мати повторювані групи, жахливі структуриданих і т.д.
    OMG сформувала набір тегов, названий XML Metadata Interchange (XMI), ізметою надання можливості опису в стандартних термінах структури даних продані ( "метаданих"). Цей стандарт буде корисний для обміну метаданих між
    CASE-засобами і для опису "репозиторія метаданих" у проектах сховищ даних.
    Рухаючись у тому ж напрямку, група компаній (щовключає, зокрема, IBM і
    Oracle) знаходиться в процесі визначення Common Warehouse Metadata
    Interchange (CWMI), підмножіні XMI для підтримки сховищ даних.
    Це означає, що є два підходи до опису структури бази даних на XML:
    По-перше, прикладну базу даних може описувати DTD XML-документа. У цьомувипадку операційні дані бази даних можуть бути розміщені між наборамиописаних тегів. Таке DTD може, наприклад, генеруватися одним CASE-засобом,а читатися іншим, забезпечуючи засіб передачі структури даних.
    По-друге, можна розмістити самі визначення таблиці і стовпчиків між тегами
    XMI, визначеними на більш високому рівні абстракції. Цей підхід трохи більшхитрий, оскільки метамодель XMI дуже абстрактна, але використанняметамоделі XMI дозволяє описувати набагато більше, чим таблиці і стовпчики.

    Проте зауважимо, що проблема визначення репозиторія метаданих або обмінуметаданих між CASE-засобами не пов'язаний із використанням XML або якогосьіншої мови. Проблемою є структура і семантика бази даних. Важливе питанняполягає не в тому, як буде представляти універсальний Репозиторійметаданих. (Можна легко уявити репозиторій у виді набору реляційнихтаблиць або діаграм сутність/зв 'язок.) Питання полягає в тому, щознаходиться в репозіторії і що це означає? Які об'єкти є істотними іповинні бути описані? Це набагато складіша тема, і вона усе ще знаходитьсяв стадії обговорення. Наявність нової мови не вносить істотний внесок у цеобговорення.
    Насправді при наявності розуміння, що XML є гарним засобом для описуструктури бази даних, найбільше очевидним висновком є те, що використанняцієї мови накладає велику відповідальність на адміністраторів даних ізприводу коректності визначення даних. XML не забезпечує таку коректність;
    XML усього лише реєструє будь-який проект даних, що надходить відрозробника.
    Поява XML підвищує важливість моделювання і проектування даних.


         
     
         
    Реферат Банк
     
    Рефераты
     
    Бесплатные рефераты
     

     

     

     

     

     

     

     
     
     
      Все права защищены. Reff.net.ua - українські реферати ! DMCA.com Protection Status