ПЕРЕЛІК ДИСЦИПЛІН:
  • Адміністративне право
  • Арбітражний процес
  • Архітектура
  • Астрологія
  • Астрономія
  • Банківська справа
  • Безпека життєдіяльності
  • Біографії
  • Біологія
  • Біологія і хімія
  • Ботаніка та сільське гос-во
  • Бухгалтерський облік і аудит
  • Валютні відносини
  • Ветеринарія
  • Військова кафедра
  • Географія
  • Геодезія
  • Геологія
  • Етика
  • Держава і право
  • Цивільне право і процес
  • Діловодство
  • Гроші та кредит
  • Природничі науки
  • Журналістика
  • Екологія
  • Видавнича справа та поліграфія
  • Інвестиції
  • Іноземна мова
  • Інформатика
  • Інформатика, програмування
  • Юрист по наследству
  • Історичні особистості
  • Історія
  • Історія техніки
  • Кибернетика
  • Комунікації і зв'язок
  • Комп'ютерні науки
  • Косметологія
  • Короткий зміст творів
  • Криміналістика
  • Кримінологія
  • Криптология
  • Кулінарія
  • Культура і мистецтво
  • Культурологія
  • Російська література
  • Література і російська мова
  • Логіка
  • Логістика
  • Маркетинг
  • Математика
  • Медицина, здоров'я
  • Медичні науки
  • Міжнародне публічне право
  • Міжнародне приватне право
  • Міжнародні відносини
  • Менеджмент
  • Металургія
  • Москвоведение
  • Мовознавство
  • Музика
  • Муніципальне право
  • Податки, оподаткування
  •  
    Бесплатные рефераты
     

     

     

     

     

     

         
     
    Формати баз даних в автоматизованих бібліографічних системах
         

     

    Інформатика, програмування

    ВСТУП.

    Термін MARC являє собою акронім назви системи Machine-
    Readable Catalogue or Cataloguing (машиночитаних каталог чикаталогізація). Проте ця назва не зовсім точно, оскільки MARC НЕє ні будь-яким видом каталогу, ні методом каталогізації. Фактично
    MARC-це стислий і зручний термін для позначення процесу маркуваннябудь-якій частині каталогізаціонной записи так, щоб вона могла бути оброблена здопомогою комп'ютера.

    У загальних словах, комунікативний формат MARC повинен забезпечувати:

    можливість його застосування для всіх видів бібліотечних документів;

    достатню гнучкість для вирішення різноманітних завдань у додаток докаталогізації;

    зручність застосування в різних автоматизованих системах.

    Застосування стандарту MARC в бібліотеці, яка до цього працювала зкаталожними картками, помітно збільшить швидкість роботи, тобто не буденеобхідності стояти "бог знає скільки часу" у каталозі, щоб знайтипотрібну картку. Стандарт MARC дозволяє знайти будь-яку книгу, яка єв бібліотеці, в лічені секунди. Наприклад, якщо читач забув чи незнає якого-небудь потрібного опису книги (автор, назва і т. п), то
    MARC дає можливість знайти цю книгу за ключовими словами. Позитивні
    MARC-а слід віднести і те, що він вимагає мінімум один комп'ютер, то євсі ті каталоги з картками стають непотрібними.

    Використання стандарту MARC запобігає дублювання роботи ідопомагає бібліотекам краще розпорядиться бібліотечними ресурсами. Вибір дляроботи формату MARC дає бібліотекам можливість здобувати надійнікаталогізаціонние дані, представлені в правильній формі.

    Застосування стандарту MARC при управлінні бібліотечними операціямидозволяє бібліотекарям використовувати наявні автоматизованібібліотечні системи. Багато систем, доступні бібліотекам різного рівня,спроектовані для роботи з форматом MARC. Вони технічно обслуговуються іудосконалюються, так що бібліотеки можуть користуватися перевагамиостанніх досягнень у комп'ютерній технології. Стандарт MARC дозволяєтакож бібліотекам замінити одну систему на іншу з упевненістю, що їхдані будуть сумісні.

    Незважаючи на співпрацю країн у цій області з'явилося кількаверсій формату MARC таких, як UKMARC, INTERMARC, USMARC, розбіжності вяких були викликані розходженнями в національних правилах та практицікаталогізації.


    Розділ 1. ОПИС ФОРМАТУ USMARC.

    Бібліотека Конгресу є офіційним депозитарієм публікацій
    Сполучених Штатів і первинним джерелом каталогізаціонних записів дляміжнародних публікацій та публікацій США. У 1960-і рр.. Бібліотека
    Конгресу розробила формат MARC Бібліотеки Конгресу (формат LC MARC),систему, що використовує в каталогізаціонной запису цифри, літери та іншісимволи для позначення різних типів інформації. У процесі розвиткуформат LC MARC став форматом USMARC (форматом MARC США). Веденнябібліографічного формату USMARC, також як і офіційної документації
    USMARC, здійснюється Бібліотекою Конгресу.

    1.1 USMARC ТЕРМІНИ ТА ЇХ ВИЗНАЧЕННЯ.

    Покажчики даних (Signposts): Щоб зчитувати та інтерпретуватибібліографічний запис, комп'ютеру необхідна допомога. Таблиця 1ілюструє інформацію, для позначення якої потрібні "signposts".

    Таблиця 1

    Запис з текстовими "signposts": Та ж запис з мітками MARC:

    | " SIGNPOSTS "| ДАНІ |" SIGNPOSTS "| ДАНІ |
    | Заголовок | | 100 | King, Stephen |
    | основний | | 1 $ а | |
    | бібліографічна | King, Stephen | | |
    | ой записи: | | | |
    | Ім'я: | | | |
    | Назва та | | 245 | Misery |
    | відомості про | | 10 $ а | |
    | відповідальності | Misery | | |
    |: | | | Jim Arnosky |
    | Загальне | Jim Arnosky | $ с | |
    | заголовок: | | | |
    | Відомості про | | | |
    | відповідальності | | | |
    |: | | | |
    | Область | | 250 | 1 st ed. |
    | видання: | 1 st ed. | $ а | |
    | Відомості про | | | |
    | виданні: | | | |

    і так далі ...

    Порівняння однієї і тієї ж записи з текстовими "signposts" і з мітками
    USMARC ілюструє компактність формату USMARC, тобто економневитрачання обсягу комп'ютерної пам'яті.

    Таблиця 1 ілюструє запис MARC, розмічених "signposts".
    Найменуваннями цих "signposts" є: ПОЛЕ, МЕТКА, ІНДИКАТОР, підпілля,
    КОД підпілля і Визначник ЗМІСТУ. Розглянемо ці терміни вокремо.

    Поле: Кожна бібліографічний запис логічно ділиться на поля.
    Є поле для автора, поле для інформації про заголовок і т.д. Ці поляпідрозділяються на одне або декілька "підполів".

    Як було зазначено раніше, текстові найменування полів занадто довгі,щоб їх приводити в кожного запису USMARC. Замість цього поля представляються
    3-х цифровими позначками.

    Мітка: Кожне поле асоціюється з трехціфровим числом, щоназивається міткою. Мітка ідентифікує поле (тип даних), яке слідпісля неї. Навіть якщо на екрані відразу після мітки виведені ще йіндикатори (таким чином, може з'явитися число з 4 або 5 цифр), мітказавжди являє собою перші три цифри.

    Див нижче приклад запису поля. Число 100 є міткою, що визначаєполе заголовка основний бібліографічного запису на ім'я особи (автора).

    | 100 1 # $ a King, Stephen |

    У записі USMARC 10% міток використовуються достатньо, інші 90%зустрічаються тільки в рідких випадках.

    Індикатори: За кожною міткою поля слідують дві позиції символів (завинятком полів 001 - 009). Одна або обидві ці позиції символів можутьвикористовуватися для індикаторів. У деяких полях застосовується тільки першимабо друга позиція; в інших полях використовуються обидві позиції, а в такихполях, як 020 або 300, позиції не використовуються зовсім. Якщо позиціяіндикатора не використовується, індикатор характеризується як "невизначений",позиція залишається незаповненою. У даній роботі, у прикладах, незаповненіабо невизначені позиції індикатора позначаються символом "#".

    Значенням кожного індикатора є цифра від 0 до 9. (Хоча правиламидопускаються букви, вони використовуються рідко). Навіть, якщо два індикаториразом можуть здаватися 2-х значним числом, насправді вони єдвома окремими цифрами. У наведеному нижче прикладі перших 3 цифриє міткою (245 визначає поле заголовку), 2 наступні цифри (1 і 4)є значеннями індикаторів. "1" - перший індикатор; "4" - другаіндикатор.

    | 24514 $ a The waste lands/$ c adapted from Stephen |
    | King. |

    Значення 1 першого індикатора в полі заголовку вказує, що в даномукаталозі повинна бути окрема бібліографічний запис на заголовок. Укартковому каталозі це означає, що для одиниці опису повиннароздруковуватися картка з додатковою бібліографічної записом назаголовок, а в довідці про додаткових записах повинно бути вказано "Заголовок".

    За допомогою друга індикатора на екрані дисплея вказується кількістьсимволів на початку поля (включно з пробілами (spaces)), які не повиннівраховуватися комп'ютером у процесі сортування та розстановки. Для заголовку
    The waste lands другий індикатор встановлюється на цифрі "4", щоб першимчотири символи ( "T", "h", "e", пробіл) не враховувалися при сортуванні тазаголовок сортувати в файлі на слово "waste".

    Підполе: Більшість полів містить кілька окремихвзаємозв'язаних даних. Кожен тип даних у поле називається підпілля, ікожному підпіллю передує код підполя. Поля від 001 до 009 не маютьпідполів.

    Наприклад, поле фізичного опису для книг (певне міткою 300)включає підполе для обсягу (кількість сторінок), підполе для іншихфізичних характеристик (інформація про ілюстрації), а також підполе длярозмірів (сантиметри):

    | 300 # # $ a 675 p.; $ b ill.; $ c 24 |
    | див |

    Код підполя: Код підполя являє собою одну літеру нижньогорегістра (в окремих випадках цифру), якій передує роздільникпідполя. Кожен код підполя вказує, який тип даних слід після нього.

    Роздільник: Різні програми математичного забезпечення дляподання роздільник на екрані або в роздруківці використовують різнісимволи. Прикладами можуть служити подвійний кинджал ((), знак "пов" (@), знакдолара ($), лінія підкреслення (_) та інші. У даній роботі в якостічастини коду підполя, що є роздільником, використовується знак долара ($).

    У наведеному вище прикладі кодами підполів є: $ a дляпозначення обсягу, $ b для інших фізичних характеристик і $ c длярозміру.

    1.2. Комунікативні ФОРМАТ USMARC.

    Записи USMARC називають "тегів" записами (записи з позначками). Першніж стати тегова записом, запис USMARC (у так званому комунікативномуформаті USMARC) виглядає зовсім по іншому, - як одне довге злитепропозицію. Комунікативний формат USMARC складається з маркера ідовідника. У комунікативному форматі мітки перед полями не проставляються.
    Проте, безпосередньо за маркером йде блок даних, які називаютьсядовідником. Цей довідник показує, які мітки є в запису іде вони розташовуються. Довідник формується (комп'ютером) збібліографічного запису.

    Маркер: Маркер являє собою перші 24 (від 0 до 23) символузапису. Кожна позиція має встановлене значення. Розглянемо більшдокладно значення позицій маркера:

    00 - 04 ДОВЖИНА ЛОГІЧНОГО ЗАПИСИ;

    05 СТАТУС ЗАПИСИ:

    a = підвищення рівня кодування;

    c = виправлена або переглянута;

    d = виключена;

    n = нова;

    p = підвищення рівня кодування;

    06 ТИП ЗАПИСИ:

    a = мовний матеріал;

    b = контроль за архівними та рукописними

    матеріалами;

    c = друковане музичне видання;

    d = рукописний музичний матеріал;

    e = друковане картографічне видання;

    f = рукописний картографічний матеріал;

    g = проекційний матеріал ;

    i = немузична звукозапис;

    j = музична звукозапис;

    k = двомірна непроекціонная графіка;

    m = комп'ютерний файл;

    o = комплексна робота;

    r = тривимірний об'єкт;

    07 БІБЛІОГРАФІЧНИЙ РІВЕНЬ:

    a = складова частина монографічного видання;

    b = складова частина серіального видання;

    c = добірка;

    d = частину добірки;

    m = монографія як одиниця опису;

    s = серіальне видання;

    08 - 09 невизначеної позиції

    10 РАХУНОК Індикатори (завжди "2")

    11 РАХУНОК КОДА підпілля (завжди "2")

    12 - 16 БАЗОВИЙ АДРЕСА ДАНИХ (обчислюється

    комп'ютером для кожного запису)

    17 РІВЕНЬ КОДУВАННЯ: < p> # = повний рівень;

    1 = повний рівень, аналіз матеріалу не проводиться;

    2 = менш повний рівень, аналіз матеріалу не

    проводиться;

    5 = частковий (попередній) рівень;

    7 = мінімальний рівень;

    8 = допублікаційної рівень (CIP);

    u = невідомо;

    z = не застосовується;

    18 ФОРМА Описова Каталогізація:

    # = не відповідає ISBN;

    а = AACR2;

    i = ISBN;

    u = невідомо;

    19 ВИМОГИ ДО ЗВ'ЯЗАНОЮ ЗАПИСИ:

    # = пов'язана з собою запис НЕ потрібно (для повної

    обробки яка складається запису);

    r = пов'язана з собою запис потрібно (для повної

    обробки яка складається запису);

    20 ДОВЖИНА КОМПОНЕНТА "ДОВЖИНА ПОЛЯ ДАНИХ"

    (завжди "4")

    21 ДОВЖИНА КОМПОНЕНТА "Пор ПОЧАТКОВОГО

    СИМВОЛУ" (завжди "5")

    22 ДОВЖИНА КОМПОНЕНТА "частині, що визначається

    ПРИ ЗАСТОСУВАННЯ" (завжди "0")

    23 невизначеної позиції СИМВОЛУ ПЛАНУ

    ДОВІДНИКА (завжди "0 ")

    Довідник: Як було сказано раніше, довідник показує, які міткиє в записі і де вони розташовуються. Це досягається за допомогоюпідрахунку символів у напрямку позиції, де починається кожне поле. Длябільш наочного подання розглянемо приклад комунікативної запису
    USMARC:

    00422dam 22001337 450000500170000008000100001709000170002710
    0001400044245007200058260002500130300001600155653009500171990
    002200266 ^ 19970806174944.8 ^ 00 $ a519.2 ^ 00 $ a519 $ xЮ 16 $ hП ^ 0 $ aЮдін М.Д. ^ 0 $ aСходімость розподілів і сум випадкових величин $bУчебн.метод.пособіе ^ 0 $ aМн. $ bУніверсітетское ^ 00 $ a254 c. $ bіл.
    ^ 00 $ aТеорія імовірності, статистичні дослідження, прикладніа математика, Випадкові величини ^ 00 $ b2 $ e2 $ v2 $ t77 $ z0 $ j2 ^ (

    Проаналізуємо цей приклад.

    Перші 24 позиції є маркером. Він закінчується цифрами "4500 ".
    Безпосередньо після маркера починається довідник. Мітки в цьому прикладіпідкреслені .. Кожна окрема стаття довідника разом з міткою маєдовжину 12 символів. Першою міткою є 005. Наступні 4 позиції післякожної мітки вказують довжину поля. У цьому записі дані в полі 005 (датакоригування) мають довжину 17 символів. Наступні 5 позицій позначаютьпочаткову точку відліку (позицію початкового символу) для цього поля врядку даних, яка слідує за довідником (після першого роздільник
    "^").

    Поле 005 починається з позиції 00000 (перша позиція є позицією
    0). Наступною є мітка поля 008, яке має довжину 10 символів іпочинається з 17-й позиції (довжина попереднього поля 17, додана до йогопочатковій позиції 00000, дорівнює 17). Наступна мітка поля-090. Воно маєдовжину 17 символів і починається з 27-ої позиції (17 +10 = 27 )...

    Останнє поле 990 має довжину 22 символу і починається з 266 позиції.

    Роздільники полів ( у прикладі вони зображені знаком ^) відзначають кінецьдовідника та кінець кожного поля, які слідують за довідником.

    Роздільник записи (зображений у цьому прикладі знаком () закінчуєкожну бібліографічний запис.

    Наведемо, нарешті, цей приклад у вигляді розмічені зображення:

    Маркер .................... ..................................................
    00422dam 22001337 4500

    DTLT (дата і час останньої транзакції ).... 005 ....... 19970806174944.8

    Індекс
    УДК ................................................. ............ 080 ........$a 519.2

    Шрифти ........................................ ............................ 09
    0 .......$ a 519

    ................................ ............................................< br>......................$ x Ю 16

    ................. .................................................. .........< br>......................$ h П

    Назваавтора ................................................. .............. 100 ....< br>....$ a Юдін М. Д.

    Заголовок ............................... .....................................< br>245 ........$ a Збіжність розподілів

    випадкових величин

    ..................... .................................................. .....< br>......................$ b Учебн.метод.пособіе

    Публікація ............. ................................................ 260. .
    ......$ a Мн.

    ................................. ...........................................< br>.....................$ b Університетське

    Фізичний опис ................. .......................... 300 .......$ a
    254 с.

    ........................................ ....................................< br>.....................$ b ил.

    Ключові слова
    .................................................. .. 653 ........$ a Теоріяімовірності, статистичні

    дослідження, Прикладна математика,

    Випадкові величини

    Дані прозамовленні ................................................. ... 990 .........$ b 2

    ........................... .................................................< br>.....................$ e 2

    ................... .................................................. .......< br>.....................$ v 2

    ................... .................................................. .......< br>.....................$ t 77

    ................... .................................................. .......< br>.....................$ z 0

    ................... .................................................. .......< br>.....................$ j 2


    Розділ 2. ФОРМАТ UNIMARC.

    2.1. ЦІЛІ СТВОРЕННЯ ФОРМАТУ UNIMARC.

    З початку 70-х років сімейство MARC збільшилося більш ніж на 20форматів. Відмінності в змісті даних цих форматів викликають необхідністьредагування запису до обміну ними.

    Для подолання несумісності форматів було прийнято рішеннярозробити міжнародний формат MARC (UNIMARC), який дозволив биприймати записи, складені в будь-якому форматі MARC так, щоб вони могликонвертувати в UNIMARC, а з нього в будь-який інший формат MARC. Для цьогокожній національній службі достатньо буде скласти тільки дві програми
    (одну для конвертації в UNIMARC, іншу з формату UNIMARC) замістьспеціальних програм конвертування в кожен з форматів MARC, наприклад,
    INTERMARC в UKMARC, USMARC в UKMARC і т.д. Таким чином, основною метоюстворення формату UNIMARC є сприяння міжнародному обміну данимив машиночитаній формі між національними бібліографічними службами, атакож більш просте і зручне складання опису бібліографічниходиниць, їх пошук і контроль. Остання досягається за допомогою розробленихметодів запису бібліографічної інформації, яка здійснюється відповіднодо міжнародних стандартів.


    2.2. ВІДМІННІСТЬ ФОРМАТУ UNIMARC ВІД ФОРМАТУ

    USMARC.

    Перш за все потрібно відзначити, що ті визначення, які наводилисядля формату USMARC підходять (або правильніше сказати застосовуються) у форматі
    UNIMARC (тобто поняття поля, мітки, індикатора, маркера, довідникаін зберігаються). Таким чином, не має сенсу описувати настільки ждокладно формат UNIMARC, як був описаний формат USMARC. Тому вартозупинитися на тих фрагментах, які відрізняють ці два формати.

    Основною відмінністю форматів UNIMARC та USMARC є перш за всеневідповідності полів, підполів, індикаторів і т.п. (тобто правильнішебуде сказати невідповідності міток полів, підполів, індикаторів і т. п.). Довідмінностей можна віднести також і те, що кількість полів у форматі UNIMARCне збігається з кількістю полів у форматі USMARC, причому в UNIMARC полівбільше ніж у USMARC. Це пов'язано з тим, що сам формат UNIMARC, як булосказано раніше, створювався значно пізніше, ніж формат USMARC і,відповідно, при створенні UNIMARC враховувалося все, щоб цей формат бувкращим і замінив все остний формати.

    Подальші відмінності між форматами UNIMARC та USMARC є більшдрібними (наслідками, що випливають з перерахованих вище) і пов'язані знову ж таки з тим, щоформат UNIMARC "молодше" формату USMARC (наприклад, кількість підполів вполях, довжини полів, відмінності в позначення індикаторів та інше).

    Наведемо, нарешті, приклад запису комунікативного формату UNIMARC таможна порівняти його приклад запису коммунікотівного формату USMARC:


    00579nam 2200193 45000010011000000100018000111000041000291
    01000800070200006900078210002400147215002300171225003000194
    61000580022467500270028268600170030968600170032670000160034
    3702002600359 ^ ru96-37586 ^ $ a5-88201-040-3 ^ $ a19970708d1996u a0rusb0103 ca ^ 0 $ arus ^ 1 $ aInternet Windows95 $ fПітер Кент $ g
    Переклад з англ. В. Л. Григорьева ^ $ aM. $ CКомпьютер $ d1996 ^ $a367 c. $ Cил. $ d21 см ^ 1 $ aКомпьютерний світ 21 століття ^ 0 $ aВичіслітельние мережі глобальні-операційні системи ^ $ a681.324/.0
    66 (100) $ zrus ^ $ a50 $ drugasnti ^ $ a32.97 $ drubbk ^ 1 $ aКент $ bПітер
    ^ 1 $ aГрігорьев $ BВ. Л. ^ (

    Почнемо з того, що перші 24 позиції є маркером. Аналогічно ззаписом USMARC, після маркера слід довідник. Мітки в довідникупідкреслені кожна стаття довідника займає 12 символів (4 позиції надовжину поля і 5 позицій на точку відліку).

    Якщо уважно подивитися, то неважко помітити, що мітки полів у
    UNIMARC відрізняються від міток в USMARC (наприклад, поле автора в UNIMARC-200,а в USMARC-100). Також видно, що повторюється полі 686. Це говорить про те,що поля в UNIMARC можуть повторюватися. Більше того, в UNIMARCпослідовність приведення полів в записі є вільною, тобтополя не обов'язково повинні йти в довіднику в порядку зростання (001,
    010, 100, 200 і т.д.), вони можуть располагатся вільно (605, 710, 702, 012і т.д.).

    Інші особливості запису формату UNIMARC наведені на початку пункту 2.2.

    2.3. Конвертування даних ПО СТРУКТУРІ

    USMARC (UNIMARC.

    При створенні конверторів USMARC (UNIMARC необхідно скластипевні алгоритми програм.

    Розглянемо алгоритм програми-конвертора UNIMARC (USMARC.

    Програма-конвертор може складатися з 3 блоків.

    У першому блоці програма-конвертор повинна зчитувати ті дані зфайлу, які необхідно конвертувати.

    Другий блок є основним і самим складним. У ньому, власне, івідбувається конвертація даних. Це конвертування також можнарозділити на кілька состовних частин. Спочатку необхідно перебудуватимаркер. Після належить конвертування довідника. Тут буде важливимперевести всі мітки полів, підполів та індикаторів, які не збігаються.
    Це завдання можна вирішити за допомогою додаткового файлу, в якому зазначенівсі мітки полів, підполів та індикаторів одного з форматів. Також потрібновраховувати й те, що довжини полів формату, який конвертується можуть незбігатися з довжиною полів нового формату (тобто треба перерахувати цідовжини).

    У третьому блоці нову запис необхідно записати в новий файл, якийі буде відображати форму запису нового формату.

    Алгоритм конвертора USMARC (UNIMARC будується аналогічним чином

    ВИСНОВОК.

    Отже, ми провели невеликий огляд за форматами автоматизованихбібліографічних систем USMARC та UNIMARC (тому що саме ці два форматимають найбільше поширення і довіру у світі).

    Основна мета даного дослідження полягала не в детальномурозгляді форматів USMARC та UNIMARC, а в тому, щоб підкреслити фактпереходу бібліотек на ці автоматизовані системи.

    Хотілося б підкреслити також і те, що більш привабливимє формат запису UNIMARC, ніж USMARC (або ще який-небудь). Причиницього називалися раніше. Можна сказати що формат UNIMARC вже витісняєформат USMARC, і згодом він (UNIMARC) стане форматом, використовуваним вбільшості країн світу. Проте наука не стоїть на місці, і можливо, вже внезабаром з'явиться більш зручний формат.


         
     
         
    Реферат Банк
     
    Рефераты
     
    Бесплатные рефераты
     

     

     

     

     

     

     

     
     
     
      Все права защищены. Reff.net.ua - українські реферати ! DMCA.com Protection Status