ПЕРЕЛІК ДИСЦИПЛІН:
  • Адміністративне право
  • Арбітражний процес
  • Архітектура
  • Астрологія
  • Астрономія
  • Банківська справа
  • Безпека життєдіяльності
  • Біографії
  • Біологія
  • Біологія і хімія
  • Ботаніка та сільське гос-во
  • Бухгалтерський облік і аудит
  • Валютні відносини
  • Ветеринарія
  • Військова кафедра
  • Географія
  • Геодезія
  • Геологія
  • Етика
  • Держава і право
  • Цивільне право і процес
  • Діловодство
  • Гроші та кредит
  • Природничі науки
  • Журналістика
  • Екологія
  • Видавнича справа та поліграфія
  • Інвестиції
  • Іноземна мова
  • Інформатика
  • Інформатика, програмування
  • Юрист по наследству
  • Історичні особистості
  • Історія
  • Історія техніки
  • Кибернетика
  • Комунікації і зв'язок
  • Комп'ютерні науки
  • Косметологія
  • Короткий зміст творів
  • Криміналістика
  • Кримінологія
  • Криптология
  • Кулінарія
  • Культура і мистецтво
  • Культурологія
  • Російська література
  • Література і російська мова
  • Логіка
  • Логістика
  • Маркетинг
  • Математика
  • Медицина, здоров'я
  • Медичні науки
  • Міжнародне публічне право
  • Міжнародне приватне право
  • Міжнародні відносини
  • Менеджмент
  • Металургія
  • Москвоведение
  • Мовознавство
  • Музика
  • Муніципальне право
  • Податки, оподаткування
  •  
    Бесплатные рефераты
     

     

     

     

     

     

         
     
    Довгострокове архівування
         

     

    Інформатика, програмування

    Довгострокове архівування

    Міка Корто

    Довгострокове архівування було актуальним ще в Давньому Єгипті. Причому застосована стратегія виявилася настільки ефективною, що видовбані в камені інформацію люди в змозі розібрати навіть дві тисячі років по тому. У наш час суспільство зіткнулося з тим, що збережені відомості навряд чи вдасться використовувати вже через кілька років. Як би там не було, ширяє цифровізація веде до збереженню все більшого обсягу даних, і вибір стратегії архівування сьогодні важливий як ніколи.

    Компанії повинні бути зацікавлені в застосуванні успішних стратегій архівування, якщо вони хочуть забезпечити доступність своїх документів і можливість прочитати їх через 10, 15 і навіть 50 років.

    За Наприклад підприємств і державних установ, які зберігають і архівують важливі для роботи матеріали, бібліотеки і музеї теж почали створювати електронні копії своїх культурних багатств з метою їх довготривалого зберігання та захисту від катастроф, подібних до пожежі в Веймарської бібліотеці герцогині Анни-Амалії, що стався в 2004 р. Поступово з'являється усвідомлення «летючості» цифрових даних і розміру небезпеки стати «суспільством без минулого», тому в довгостроковому архівуванні особливо зацікавлені бібліотеки. У Бібліотеці герцогині Анни-Амалії сканують свої фонди і пропонують їх у різній формі для використання в приватних і наукових цілях, а також в якості оригіналів для перевидань. Мета проекту полягає в тому, щоб зробити найбільші твори доступними користувачам Internet і одночасно захистити цінні оригінали від надмірного використання (див. Малюнок 1).

    Довгострокове архівування цифрового контента саме по собі є наукою. Інформацію, що зберігається в електронній формі, не можна відобразити без спеціального пристрою. У відміну від надрукованих матеріалів, які піддані лише руйнування з плином часу, у разі цифрових документів необхідно враховувати і розвиток технологій.

    що з'являються програму або чергові версії програм, а також новації в області носіїв інформації вимагають постійної уваги. Отже, необхідне вироблення стратегії міграції або хоча б емуляції, а також використання відкритих форматів. Розробники додатків і інфраструктури зберігання повинні робити спільні зусилля зі створення уніфікованих технічних коштів, інтерфейсів, методів і способів надання даних з метою задоволення потреби в довгостроковому архівуванні цифрового контента.

    Необхідно управління документами

    Довготривале зберігання цифрового контента - вкрай динамічний процес, який починається з правильного обліку бітів і байтів і включає в себе їх структуризацію, зберігання і розподіл - аж до архівування. Тому без спеціалізованих систем управління документами, тобто без систем управління корпоративним контентом (Enterprise Content Management, ЄСМ), не обійтися.

    В відповідно до вимог сьогоднішнього дня необхідно консолідувати різноманітні носії інформації, що є на підприємствах, і масштабувати їх разом з розвитком перспективних технологій. Відкриті системи та стандартні формати - лише одна з умов для забезпечення можливості читання важливих відомостей протягом тривалого періоду часу. При цьому слід, однак, забезпечити, щоб дані можна було знайти і в комплексних середовищах. Крім того, слід керувати версіями програм і різними поколіннями операційних систем.

    Але якщо знаходження відповідного програмного рішення вкрай рідко викликає труднощі, то при виборі апаратного забезпечення, особливо для бібліотек, доводиться стикатися зі значними труднощами. Обмежений термін служби сучасних носіїв змушує осіб, які приймають рішення, вдаватися до складних методів, результати застосування яких вони і самі ставлять під сумнів. Доктор Міхаель Кнохе, директор Бібліотеки герцогині Анни-Амалії, розповідає про те, як організовано архівування в його закладі: «Ми перезнімати оцифровані дані разом з метаданими на мікроплівки, що володіє тривалим терміном зберігання, так що в майбутньому вони зможуть бути прочитані й відновлені незалежно від виду апаратного забезпечення ». Відповідно з Законом про цивільну оборону ці мікрофільми зберігаються в Центральному архіві ФРН в Шварцвальде.

    Однак такий метод можна застосовувати лише до статичних документів, наприклад книг. У разі інтерактивних додатків, наприклад сторінок Web з підключеними базами даних, він допомогти не в силах. Тому виробникам варто розробити універсальні платформи сховищ даних, які б, з одного боку, забезпечили цілісність інформації на довгі роки, а з іншого боку - просту міграцію даних на нові технології зберігання.

    Питання формату

    Не менше значення при створення резервної копії інформації має питання формату, в якому повинні зберігатися оцифровані дані. У цьому випадку вирішальну роль грає незалежність від виробника. Лише таким чином вдасться уникнути ситуації, коли в якийсь момент документ вже неможливо прочитати з-за того, що виробник перестав підтримувати будь-який формат.

    Процес архівування починається зі створення оперативно, самим автором або шляхом сканування текстів, обробки зображень або бланків (див. Малюнок 2). Звичайно, є сенс зберігати та архівувати всі документи в стандартних форматах - XML, TIFF (компресія CCITT Group 4), Adobe PDF чи JPEG. Одночасно слід перевірити на різноманіття форматів раніше створені інформаційні масиви. Якщо документи і без того повинні бути піддані архівації, то потрібно якомога раніше провести своєчасне конвертація в сертифікований ISO стандарт архівації PDF/A, що веде походження від широко відомого формату PDF компанії Adobe Systems.

    Голка в копиці сіна

    Неважливо, на підприємстві або в бібліотечному архіві, весь контент, який раніше був переведений у цифрову форму, необхідно правильно впорядкувати, щоб забезпечити простий пошук інформації. Оброблені документи треба класифікувати і розподілити за категоріями на основі метаданих. Такі відомості, як тип документа, автор, права доступу або тривалість зберігання, допомагають структурувати потік даних і дозволяють знайти необхідні матеріали за допомогою відповідних додатків.

    На великих підприємствах, де щодня обробляються великі обсяги інформації, розглянутий етап роботи може стати важким. Величезну допомогу в подібної ситуації здатні надати програмні модулі, що автоматизують класифікацію даних. Надалі результати класифікації використовуються при розподіл за категоріями або розглядаються як ключові слова, що входять до метадані контенту.

    Разом з тим, багато користувачів відчувають труднощі з формуванням несуперечливих метаданих при генерації контенту. Це в значній мірі обмежує можливості подальшого пошуку та програмної обробки інформації. При надходженні даних відповідна програма автоматично пропонує метадані, які користувач може прийняти або відхилити.

    Магнітні стрічки все ще популярні

    Кількість носіїв має бути якомога меншою, щоб спростити їх адміністрування і зробити системи придатними для майбутніх потреб. Магнітні стрічки все ще користуються популярністю, а з введенням технології адресації зберігання по вмісту (Content Addressed Storage, CAS) на ринок архівування стали виходити і виробники жорстких дисків.

    Дискові сховища на базі технології CAS дозволяють архівувати інформацію, призначену для тривалого зберігання і не підлягає змінам. У поєднанні з системами управління контентом такий спосіб зберігання забезпечує швидкий інтерактивний доступ до архівних даних. Однак у порівнянні з класичними стрічковими масивами архіви CAS споживають набагато більше електроенергії та з-за свого програмного інтелекту вимагають більш ретельного обслуговування. Зрозуміло, завдяки таким перевагам, як захист архівних даних за допомогою масивів RAID, автоматична міграція на нові покоління апаратного забезпечення, програмований видалення інформації, інтегроване управління правами, а також більш висока продуктивність, архіви CAS швидко витісняють стрічкові бібліотеки. До того ж користувачам, які мають у своєму розпорядженні незначним вільним простором або взагалі змушені його орендувати, при розміщенні дискових архівів доведеться витратитися щонайбільше на два 19-дюймових корпусу, які встановлюються в обчислювальному центрі.

    Ніщо не є настільки постійним, як зміни

    Хто збирається довго користуватися збереженими документами, повинен підтримувати свою систему управління інформацією на сучасному рівні. В іншому випадку втрата цифрової пам'яті неминуча: пошук даних буде занадто тривалим, або їх взагалі не вдасться відшукати через недостатню індексації.

    Єгипетський метод

    Згаданий на самому початку єгипетський метод довгострокового архівування, на жаль, не застосовується для зберігання енергозалежної цифрової інформації. Тому підприємствам слід звертати особливу увагу на масштабованість форматів, програм та систем, оскільки з регулярним переозброєнням та постійною модернізацією наявних носіїв та інфраструктури жоден відділ ІТ не впорається власними силами.

    Список літератури

    Журнал мережевих рішень, лютий 2007

         
     
         
    Реферат Банк
     
    Рефераты
     
    Бесплатные рефераты
     

     

     

     

     

     

     

     
     
     
      Все права защищены. Reff.net.ua - українські реферати ! DMCA.com Protection Status