ПЕРЕЛІК ДИСЦИПЛІН:
  • Адміністративне право
  • Арбітражний процес
  • Архітектура
  • Астрологія
  • Астрономія
  • Банківська справа
  • Безпека життєдіяльності
  • Біографії
  • Біологія
  • Біологія і хімія
  • Ботаніка та сільське гос-во
  • Бухгалтерський облік і аудит
  • Валютні відносини
  • Ветеринарія
  • Військова кафедра
  • Географія
  • Геодезія
  • Геологія
  • Етика
  • Держава і право
  • Цивільне право і процес
  • Діловодство
  • Гроші та кредит
  • Природничі науки
  • Журналістика
  • Екологія
  • Видавнича справа та поліграфія
  • Інвестиції
  • Іноземна мова
  • Інформатика
  • Інформатика, програмування
  • Юрист по наследству
  • Історичні особистості
  • Історія
  • Історія техніки
  • Кибернетика
  • Комунікації і зв'язок
  • Комп'ютерні науки
  • Косметологія
  • Короткий зміст творів
  • Криміналістика
  • Кримінологія
  • Криптология
  • Кулінарія
  • Культура і мистецтво
  • Культурологія
  • Російська література
  • Література і російська мова
  • Логіка
  • Логістика
  • Маркетинг
  • Математика
  • Медицина, здоров'я
  • Медичні науки
  • Міжнародне публічне право
  • Міжнародне приватне право
  • Міжнародні відносини
  • Менеджмент
  • Металургія
  • Москвоведение
  • Мовознавство
  • Музика
  • Муніципальне право
  • Податки, оподаткування
  •  
    Бесплатные рефераты
     

     

     

     

     

     

         
     
    Принципи реалізації машин БД
         

     

    Інформатика, програмування

    Основи сучасної інформаційної технології складають бази даних
    (БД) та системи управління базами даних (СУБД), роль яких як єдиногозасоби зберігання, обробки і доступу до великих обсягів інформаціїпостійно зростає. При цьому істотним є постійне підвищенняобсягів інформації, що зберігається в БД, що тягне за собою вимогузбільшення продуктивності таких систем. Різко зростає також урізноманітних застосуваннях попит на інтелектуальний доступ до інформації.
    Це особливо проявляється при організації логічної обробки інформації всистемах баз знань, на основі яких створюються сучасні експертнісистеми.


    Швидкий розвиток потреб застосувань БД висуває нові вимоги до
    СУБД:

    підтримка широкого спектру типів представляються даних та операцій над ними
    (включаючи фактографічні, документальні, картинно-графічні дані);

    природні та ефективні подання до БД різноманітних відносин міжоб'єктами предметних областей (наприклад, просторово-часових ззабезпеченням візуалізації даних);

    підтримка несуперечності даних та реалізація дедуктивних БД;

    забезпечення цілісності БД в широкому діапазоні різноманітних предметнихобластей та операційних обстановок;

    управління розподіленими БД, інтеграція неоднорідних баз даних;

    істотне підвищення надійності функціонування БД. Разом з тимтрадиційна програмна реалізація численних функцій сучасних СУБДна ЕОМ загального призначення призводить до громіздким і непродуктивнимсистемам з недостатньо високою надійністю. Тим більше скрутнимвиявляється нарощування програмних засобів, що забезпечують перерахованівище вимоги. Це обумовлено рядом причин:

    фон-неймановская архітектура ЕОМ неадекватна вимогам СУБД, зокремареалізації пошуку, оновлення, захисту даних, обробки транзактов тількипрограмним способом неефективні як за продуктивністю, так і завартості;

    багаторівневе і складне програмне забезпечення СУБД знижує ефективністьі надійність функціонування БД;

    універсальна ЕОМ виявляється важким функціями управліннями базамиданих, що знижує ефективність функціонування власне прикладнихсистем;

    централізація та інтеграція даних в мережах персональних та професійних
    ЕОМ нереалізована з прийнятною вартістю без включення до складу мережспеціалізованих ЕОМ для підтримки функції СУБД.

    Ці міркування приводять до думки про необхідність створенняспеціалізованих автономних інформаційних систем, орієнтованихвиключно на реалізацію функцій СУБД. Однак системи, реалізовані назвичайної універсальної міні-або мікроЕОМ, не здатні повністю вирішитизазначені проблеми. Необхідний пошук нових архітектурних і апаратнихрішень. Дослідження в цьому напрямку привели до появи-проектів ідіючих прототипів машин баз даних, які поряд з самостійнимпризначенням становлять також основу обчислювальних систем 5-го покоління.
    Машиною баз даних (МБД) прийнято називати апаратно-програмниймультімікропроцессорний комплекс, призначений для виконання всіх абодеяких функцій СУБД.

    Такі властивості реляційної моделі даних, як можливість розчленуваннявідносин на непересічні групи, можливість масової і паралельноїобробки, простота і незалежність даних у цій моделі, а також наявністьрозвиненої теорії реляційних баз даних і апарату зведення до реляційноїна інші моделі даних обумовили розробку МБД, орієнтованих в основномуна підтримку реляційних баз даних. В даний час очевиднаправильність такого вибору в зв'язку з встановленням можливості оперуватиоб'єктами баз знань на реляційному концептуальному рівні за допомогоюоперацій реляційної алгебри.


    Перші публікації з МВС з'явилися в 1974 р., зараз можна назвати більш 50проектів, деякі вже реалізовані у вигляді промислових прототипів іє комерційними виробами. Дослідження з апаратурною підтримкиоперацій над базами даних проводяться і в нашій країні. Основнимикритеріями для оцінки того чи іншого проекту є повнота виконуванихфункцій СУБД і очікуване підвищення продуктивності при їх виконанні.
    Це однаково важливо як для МБД, що функціонують спільно з головною ЕОМ ускладі єдиної обчислювальної системи, так і для МБД, що є вузломлокальної мережі (data computer). У всіх сучасних проектах і комерційних
    МБД реалізований повний обсяг функцій СУБД. Підвищити продуктивність,з огляду на обмежені швидкісні характеристики сучасної елементноїбази, можна тільки структурними методами (за рахунок структурногорозпаралелювання). У силу цього МБД є спеціалізованимипаралельними обчислювальними системами, і при їх проектуванні потрібнієдина методологія порівняння та чіткі критерії оцінки продуктивності. Уданий час ведуться інтенсивні дослідження в цій області.

    Основними технічними прийомами, які застосовуються у структурних методахпідвищення продуктивності МВС, є наступні:

    використання багатоканальних пристроїв масової пам'яті (УМП) з вбудованимив апаратуру каналів процесорами пошуку і фільтрації для зменшенняобсягів перекачуваних даних з УМП в обробні підсистеми;

    використання буферизації між основною пам'яттю обробних процесоріві УМП, яка не тільки згладжує різницю у швидкостях обробки даних ічитання їх в УМП, але і зменшує частоту звернення до УМП;

    сегментація даних у УМП, яка збільшує локальність доступу іпокращує ефект двох попередніх методів; з цією метою передбачаєтьсярозвиток мультіатрібутной кластеризації та індексації даних у УМП іапаратна їх підтримка;

    використання асоціативної пам'яті як буферної та відповіднихалгоритмів обробки даних;

    розвиток підсистем випереджає вибірки даних в буферну пам'ять
    (стадіювання даних) і оптимізація алгоритмів керування віртуальнимпростором даних;

    реалізація режимів паралельної інтерпретації кожної операції над БД
    (горизонтальний паралелізм типу SIMD) і режимів конвеєрної і потоковоїобробки не лише операцій, але і транзакцій в цілому;

    функціональна спеціалізація процесорів обробки та їх апаратнареалізація у вигляді НВІС.

    Основні напрямки розвитку структур МВС:

    Можна виділити два узагальнених напрямки, у яких ведуться дослідженняпо структурних методів підвищення продуктивності МВС: багатопроцесорнінеоднорідні (МН) і мережеві МВС. На рис. 1 наведено узагальненітопологічні схеми таких МВС. Приватним випадком МН МВС можна вважатикомерційні МВС IDM-500, RS-310, iDBP 86/440, топологічна схема якихнаведена на рис. 2.

    Рис. 1. Топологія двох класів МВС:

    а - багатопроцесорні неоднорідні МВС з декількома рівнями обробки б - мережеві МВС

    До МН МВС можна віднести більшість сучасних проектів МВС, таких як
    DELTA, GRACE, DSDBS, MPDC, SABRE та ін Основними особливостями МН МВСє наступні.

    1. Наявність декількох рівнів обробки даних, зокрема, трьох основних:

    селекція і первинна фільтрація даних безпосередньо у контрольнихпристроях масової пам'яті;

    вторинна обробка, що полягає в реалізації операцій реляційноїалгебри над допоміжними відносинами, отриманими на першому етапі;


    /- універсальний обробляє/__ /-комунікаційний процесор

    процесор (серійний мікропроцесор)

    -- спеціалізований - комутуючі пристрій (загальна

    обробляє процесор шина, переключательная матриця,

    О - локальна напівпровідникова пам'ять кільцева комутуються шина,

    комутуються мережа)

    - буферна загальнодоступна пам'ять - Керуючийпроцесор (підсистема)

    - пристрій масової пам'яті

    з контролером (НМД з контролером)

    Рис. 2. Топологія комерційних МБД

    структурна обробка чи обробка метаданих, що полягає в підтримцідопоміжних структур даних (індексація, мультіатрібутнаякластеризація).

    2. Наявність системної буферної пам'яті (СБП) між першими двома рівнямиобробки, в якій містяться відносини або допоміжні структуриданих, отримані на першому рівні обробки. Така архітектураприпускає наявність випереджає вибірки та підкачування даних з рівняпервинної обробки (стадіювання). СБП при цьому обов'язково повинна бутидвох або більше портової.


    3. Наявність функціонального паралелізму, при якому різні функціїпервинної та вторинної обробки реалізуються на фізично розподіленоюапаратурі. При цьому частина функціональних пристроїв реалізується науніверсальних мікропроцесори, частина у вигляді спецапаратури (наприклад,замовних НВІС). Функціональний паралелізм дозволяє реалізуватиконвеєрне виконання транзакцій і окремих запитів. У більш загальнихвипадках для збільшення продуктивності допускається дублюванняфункціональних процесорів на найбільш трудомістких операціях.

    Як найбільш типових прикладів таких МН МВС можна розглянути DELTAі GRACE. Японський проект МВС (рис. 3) лежить в основі обчислювальної системи
    5-го покоління. Діючий у даний час прототип складається з двохпідсистем:

    підсистеми вторинної обробки у складі чотирьох реляційних процесорів
    (РП), одного процесора управління (УП), одного комунікаційногопроцесора (КП) і одного процесора технічного обслуговування (НТО),що виконує функції діагностики системи, підтримки БД, зв'язки з операторамі т. п.;

    підсистеми ієрархічної пам'яті (ІЛ), що містить системну буфернупам'ять (електронний кеш-диск ємністю 128 Мбайт), масову пам'ять з вісьмома
    НМД (з контролером магнітного диска КМД) загальною ємністю 20 Гбайт ічотирма ІМЛ (з контролером магнітної стрічки - КМЛ), а також універсальнумікроЕОМ в якості керуючого процесора ієрархічної пам'яті (УПІП) іпроцесора вводу-виводу (пев). Зв'язок між підсистемами здійснюєтьсявисокошвидкісним каналом зі стандартним інтерфейсом зі швидкістю передачідо 3 Мбайт/с. Всі процесори підсистеми вторинної обробки підключаються доцьому каналу за допомогою ПВВ через спеціальні адаптери ієрархічноїпам'яті (АІП).

    Основним функціональним вузлом МЕД DELTA є реляційної процесор (РП)баз даних, призначення якого-виконання операцій реляційної алгебри надвідносинами довільного обсягу з високою продуктивністю. Кожен зчотирьох РП може виконувати окрему операції:

    процесора (КП) і одного процесора технічного обслуговування (НТО),що виконує функції діагностики системи, підтримки БД, зв'язку з операторомі т. п.;

    підсистеми ієрархічної пам'яті (ІЛ), що містить системну буфернупам'ять (електронний кеш-диск ємністю 128 Мбайт), масову пам'ять

    з вісьмома НМД (з контролером магнітного диска КМД) загальною ємністю

    20 Гбайт і чотирма ІМЛ (з контролером магнітної стрічки -- КМЛ), а так

    ж універсальну мікроЕОМ в якості керуючого процесора ієрархічноїпам'яті (вудилами) і процесора вводу-виводу (НЕЇ). Зв'язок між підсистемамиздійснюється високошвидкісним каналом зі стандартним інтерфейсом зшвидкістю передачі до 3 Мбайт/с. Всі процесори підсистеми вторинноїобробки підключаються до цього каналу за допомогою ПВВ через спеціальніадаптери ієрархічної пам'яті (АІП).

    Основним функціональним вузлом МЕД DELTA є реляційної

    процесор (РП) баз даних, призначення якого-виконання операційреляційної алгебри над відносинами довільного обсягу з високоюпродуктивністю. Кожен з чотирьох РП може виконувати окремуоперацію реляційної алгебри незалежно від інших або всі вони можутьвиконувати одну операцію паралельно (наприклад, сортування відносин в ІЛ).
    РП має регулярну структуру (див. рис. 3) для полегшення його реалізації ввигляді НВІС. Крім цього він у своєму складі має центральний процесор (ЦП)з пам'яттю 512 Кбайт для реалізації операцій з обширною логікою (наприклад,агрегатних функцій типу min, mах і т. п.). Для полегшення вхідного (ВП) івихідного (ВЫП) потоку даних РП містить два адаптера ієрархічної пам'яті
    (АІП), а також вхідний модуль для підготовки кортежів відносин (наприклад,перестановки значень атрибутів). Власне операція реляційної алгебриреалізується в РП. Процесор злиття (ПСЛ) сортованих сегментів відносинпризначений для злиття сортованих сегментів відносин, а також в ньомуреалізуються операції природного з'єднання двох відносин та селекціївідносини. Дванадцять процесорів сортування (ПСО) призначені дляреалізації конвеєрної однопроходовой сортування сегмента відносини об'ємом
    64 Кбайт. ПСО і ПСЛ реалізовані повністю апаратно.

    Ієрархічна пам'ять в DELTA є найбільш складною підсистемою, вфункції якої входять:

    управління СІЛ і УМП;

    стадіювання даних (у вигляді сегментів відносин) з УМП в СБП вВідповідно до заявок РП;

    селекція і вертикальна фільтрація відносин при приміщенні їх у СБП ззалученням спеціального (атрібутного) методу зберігання відносин у УМП;

    підтримка індексних структур, кластеризація відносин у УМП та організація зїхньою допомогою швидкого пошуку в УМП.

    Рис. 4. Структурна схема МВС GRACE

    Другим прикладом МН МВС є також японський проект GRACE, структурнасхема якого наведена на рис. 4. СБП реалізована тут наборомелектронних дисків на циліндричних магнітних доменах. Як УМПвикористані багатоканальні НМД, в кожен канал яких вбудовані, крімпристроїв читання-запису (Уч/з), процесори первинної обробки, названіфільтрами потоку кортежів (ФПК). Кожен ФПК містить:

    процесор фільтрації (ПФ), що здійснює в межах доріжки МДвласне псевдоассоціатівний пошук кортежів, що задовольняють заданимумові;

    процесор проекції (ПП) і перетворення кортежів;

    процесор хешування (ПХ), який реалізує динамічну сегментацію

    кортежів читаного відносини. < p> Фільтр потоку кортежів працює в конвеєрному режимі і дозволяєобробляти надходять з УМП кортежі зі швидкістю їх читання (обробка
    «В польоті »).

    На рівні вторинної обробки застосовуються процесори вторинноїобробки (ППО) і ФПК. Призначення ФПК - виконувати описану вище обробкукортежів результуючих відносин, що надходять з ППО в СІЛ. ППО міститьпоряд з процесором реляційної алгебри (ПРА), реалізованих на основіуніверсального мікропроцесора зі своєю локальною пам'яттю, також апаратнийпроцесор сортування відносин (ПСО) і процесор видачі результату (ПВР) вканал головною ЕОМ. ПСО здійснює потокову сортування сегментавідносини, що надходить з банку СІЛ у процесор реляційної алгебри.
    Двупортовий банки СІЛ приєднуються до процесорів обробки обох рівнівза допомогою спеціальних петлевих шин (СПШ). Ці багатоканальні шини зподілом часу здійснюють на кожному рівні обробки комутаціюбудь-якого процесора обробки до будь-якого банку пам'яті і одночасну обробкудекількох банків пам'яті.

    Особливостями даного проекту є наступніструктурні рішення.

    1. Метод випереджає підкачки кортежів з УМП в СБП поєднує тут нетільки з первинної фільтрацією, а й зі спеціальним розподілом кортежівпо банках СІЛ. Ця так звана динамічна хеш-сегментація дозволяєвиконувати операції реляційної алгебри на рівні вторинної обробкипаралельно і без обмінів кількома ПPA, так що кожен ПРА реалізуєбінарну операцію над парою відповідних сегментів відносин-операндів.
    Це є одним із джерел підвищення продуктивності МБД привиконанні операцій реляційної алгебри.

    2. Включення в цикл вторинної обробки фільтрів потоку кортежів,що використовуються в циклі первинної обробки, дозволяє оброблятипроміжні відносини в СБП, так само як і вихідні відносини БД,одноманітно інтерпретувати послідовність операцій реляційноїалгебри. Таким чином, виконання транзакції, що відповідає складномузапиту до реляційної БД, полягає в багаторазовому виконанні циклівпервинної та вторинної обробки.

    3. Попередня і паралельна фільтрація даних зі швидкістю їхнадходження з УМП дозволяє знизити обсяг переміщуються з УМП в СБПданих, що є суттєвим джерелом підвищення продуктивності
    МБД в цілому. Цей механізм використовується в багатьох (якщо не в?? всіх)проектах МН МБД і вважається визнаним рішенням.

    Як показали численні дослідження, СУБД не може бутиефективною, якщо більша частина її працює під управлінням операційноїсистеми загального призначення. Тому підвищення ефективності МБД пов'язано зповною ізоляцією СУБД в рамках МВС, тобто реалізацією функціонално-повних
    МВС, що виконують усі функції управління транзакціями. З огляду на складністьвідповідної операційної системи МБД, реалізувати функціонально повнуі високопараллельную МН МВС складно.

    Друга основна проблема у створенні високопараллельних МН МБД, названа
    «дисковим парадоксом», полягає в тому, що швидкість введення-виведення сучасних УМП (одноканальні і багатоканальні НМД з переміщаються головками ) є вузьким місцем і обмежує досягнення високого паралелізму в обробці. У МН МБД для вирішення цієї проблеми в якості кеш-диска застосовується велика напівпровідникова буферна пам'ять.

    Для вирішення цієї проблеми деякі автори пропонують мережеві МБД в яких розподілене зберігання великих БД здійснюється на більшій кількості НМД.

    Мережеві МВС (див. рис. 1, б) втілюють принципи однорідності структури, сегментації даних в пристроях масової пам'яті і розподілу процесорів обробки по УМП. Таким чином, основна ідея мережевих MBД - наближення дешевої обробної логіки (у вигляді універсальних мікропроцесорів) до УМП і зв'язування таких «обробних сховищ» в мережу. З огляду на швидко знижується вартість процесорів oбработкі і жорстких
    НМД і успіхи в техніці комунікації процесорів, в її складі такої мережі може бути сотні УМП, з кожним з яких з'єднаний свій обробляє процесор. Прикладами таких проектів є МВО; GAMMA. У перспективі розвитку мережевих MB.Д деякі автори бачать створення МВС на основі обчислювальної систолічної середовища. Так, проект NODD, схема якого зображена на рис. 5, реалізований у вигляді регулярної решітки, у вузлах якої розміщені процесорні елементи (ПЕ). З кожним ПЕ пов'язані своя локальна пам'ять (ЛП) і пристрій масової пам'яті (УМП) у вигляді жорсткого НМД.

    Передбачається також заміна УМП енергонезалежній напівпровідниковоїпам'яттю відповідної ємності ( «силіконова» систолічна МВС).
    Призначення ЛП в кожному вузлі-зберігання програм обробки, копії керуючоїпрограми, буфера для обміну повідомленнями і кеш-пам'яті для свого УМП (3%кожного локального УМП знаходиться в цій локальній кеш-пам'яті). Для цілейнадійності простір на кожному УМП розділений на частини: одна частина длязберігання частини БД, що належить своєму вузлу, інша-дублює данічотирьох сусідніх вузлів. Особливістю є і те, що управліннявиконанням транзакцій в таких мережевих МВС повністю розподілено, так щокожен процесор може взяти на себе роль керуючого.

    Особливий інтерес набуває створення систолічним МВС у зв'язку зпоявою серійних однокристальних трансп'ютерів, що містять поряд зпроцесором і пам'яттю канали (порти вводу-виводу). Наприклад, промисловийтрансп'ютерів фірми INMOS IMS Т414 має наступні характеристики. В одномукристалі реалізований 32-розрядний процесор швидкодією до 10 млн.опер./с, статичне ОЗУ на 2 Кбайт, чотири канали зв'язку, 32-розряднийінтерфейс пам'яті і контролер динамічного ОЗУ. Конструктивнотранспьютерная матриця, що є основним елементом систолічнимтранспьютерних МВС (див. рис. 5), може бути реалізована за допомогоюсерійних транспьютерних плат IMS ВОООЗ тієї ж фірми. Ця подвійна европлатамістить чотири трансп'ютерів Т414, пов'язаних між собою портами зв'язку,чотири пристрої динамічної пам'яті по 256 Кбайт кожне і чотири зовнішніхпорту вводу-виводу. Можливо, найближчим часом застосування такихтранспьютерних плат переведе проекти систолічним МВС з областітеоретичних досліджень в область практичної реалізації.

    Основною проблемою в розподілених (мережевих) МБД є оптимальнакластеризація даних по локальних УМП та підтримка відповідноїрозподіленої індексації. У GAMMA, наприклад, пропонується кластеризаціякожного відносини по всіх УМП (відповідно до хешуваннязначенійключевих атрибутів і створенням розподіленого по УМП індексу цихзначень). У NODD пропонується рівномірний розподіл відносин звузлам решітки. Тим конкретними кортежами різних відносин, для якихдіють семантичні зв'язку, існують покажчики, що задають розташуванняпов'язаних кортежів (номери вузлів і їх адреси в УМП). Таким чином, запитв БД збуджує зв'язку між кортежами у вузлах решітки та породжує потікданих між ними. Це дозволяє реалізувати в такій МВС потоковуобробку складних запитів на основі моделі «активного графа»


    До класу мережевих відноситься комерційна МВС фірми Teradata DBC 1012,яка інтенсивно поширюється і знаходить широке застосування в разлінихінформаційних системах. На рис. 6 зображена конфігурація DBC 1012 свісьмома обробними процесорами ПМД (на базі i80386), кожен зяких має НМД і підключається до комунікаційної мережі типу двійковогодерева (Y-мережа). У вузли цієї мережі вбудовані мережеві високошвидкісніпроцесори і програмовані логічні матриці, що реалізують функціїуправління мережею. Y-мережа дозволяє здійснювати дуплексний обміни міжобробними процесорами. У цю ж мережу підключаються комунікаційніпроцесори (ІЛ) для здійснення інтерфейсу з головною ЕОМ. Коженобробляє процесор забезпечує підтримку всіх операцій реляційноїалгебри, достатніх для виконання операторів SQL, підтримку своєї частини
    БД, а також виконання всіх функцій управління транзакціями над своєючастиною БД, у тому числі захист цілісності, відновлення і т. д. Зразки
    DBC 1012 включають до 128 процесорів і мають розподілену пообробляють процесорам напівпровідникову пам'ять ємністю 412 Мбайт наодин процесор. Загальна ємність масової пам'яті складає до 1000 Гбайт ізагальна швидкодія - до 10 ^ 9 опер./с.

    Два властивості DBC 1012 характерні для всіх мережевих МЕД: забезпечення можливості збільшення потужності нарощуванням числаобробних процесорів, так що продуктивність при цьому зростаєлінійно (показник лінійності зростання продуктивності DBC 1012 від числапроцесорів складає 97 %);

    забезпечення надійності функціонування за рахунок дублювання даних улокальних УМП (тобто забезпечується робота без краху системи при виході зладу окремих процесорів або УМП).

    Третій напрямок досліджень в області МБД полягає у створеннінедорогих комерційних пристроїв на серійних процесорних елементах зшинним інтерфейсом (топологія таких МБД зображена на рис. 2, а). В якостіприкладу розглянемо МБД фірми Britton Lee IDM 500, структурна схема якоїзображена на рис. 7. Хоча ці вироби не орієнтовані нависокопараллельную обробку і містять обмежене число функціональнихпроцесорів, вони задовольняють сформульованим вище принципам МН МБД іповністю реалізують всі основні функції МБД. Структурна схемакомерційних МБД є окремим випадком МН МБД (див. рис. 2, a). Роль СБПвиконує напівпровідникова пам'ять, до якої через загальну шину підключаютьсяпериферійні контролери НМД з вбудованими мікропроцесорами AMD 2901,процесор обробки (процесор БД) на основі Z8002 і до 8 канальнихпроцесорів для підключення до головної ЕОМ (канал IBM 370, інтерфейс з VAX
    750) або підключення до локальної мережі (Ethernet). Кроне того, до загальної шиніможе підключатися особливий функціональний процесор (акселератор БД) длявиконання тих операцій, які є вузьким місцем (наприклад,сортування відносин). Старша модель IDM SOO/XL з ємністю зовнішньої пам'ятібільше 1 Гбайт на жорстких МД і 500 Мбайт на МЛ має продуктивність 1000транзакцій/хв і одночасно обслуговує до 400 користувачів.

    Розвитком цього напряму в розробках фірми Britton Lee з'явивсяРеляційний файлсервер (data/file server) RS310 - автономний пристрій,підключається до локальної мережі Ethernet або безпосередньо до головної ЕОМ поінтерфейсу RS232. Він включає:

    власне процесор бази даних (1 плата) на основі 28000 (10
    Мгц); поєднану з цим процесором оперативну пам'ять ємністю 1 Мбайт наодній платі;

    два жорсткі диски типу вінчестер (5 1/4 дюйма) по 80 Мбайт кожен звідповідним контролером;

    контролер касетної МЛ з 60 Мбайт на касеті (Streaming tape 1/4 дюйма);

    до чотирьох інтерфейсних плат двох типів (інтерфейс RS232 з вісьмомавиходами або інтерфейс локальної мережі Ethernet).

    Кожна інтерфейсна плата містить процесор 28000 і свою локальнупам'ять. , RS310 може бути використаний або як автономна СУБД з вихідниммовою SQL, підтримуючи при цьому всі функції СУБД, за винятком першогоетапу трансляції з SQL (управління транзакціями, паралельне виконаннязапитів, відкати та відновлення, автоматичну оптимізацію запитів і т.п.), або як інтегрована система управління файлами. При цьому RS310виступає для головної ЕОМ як інтелектуального контролера збуферизацією і задовольняє інтерфейсу SCSI (Small Computer System
    Interface). RS310 забезпечує одночасну роботу до 50 користувачів івиконує одночасно до 10 запитів. Найближча перспектива розвитку RS310
    - Збільшення зовнішньої пам'яті до восьми НМД ємністю 478 Мбайт і МЛ ємністю
    300 Мбайт.

    Рис. 8. Спеціалізована машина для БД PYRAMID S 9810 (9820)

    Подальшим розвитком такого підходу до створення комерційних МБД єїх реалізація на модульної паралельної мультімікропроцессорной системітипу систем S27 і S81 фірми Sequent і систем серії 9000 (9810, 9820) фірми
    Pyramid-Sybase. На рис. 8 зображена структурна схема нового вироби фірми
    Pyramid - система 9810 (9820), що є спеціалізованої ЕОМ для БД. Цяспеціалізована машина призначена для автономної підтримки СУБД
    Sybase з вхідною мовою SQL, а також для підтримки прикладнихінформаційних систем на основі цієї СУБД для автоматизації конторськихдіяльності, розробки програмного забезпечення і т. п. Система працюєяк data computer в мережі ЕОМ і має інтерфейс не тільки з локальною мережею
    Ethernet, але і х25, telenet, darpa. Загальна дискова пам'ять сягає 15
    Гбайт. Основна пам'ять, що підключається до пристрою управління пам'яттю у виглядіплат до 4 і 16 Мбайт, може нарощуватися до 128 Мбайт. У системіпідтримується віртуальний адресний простір 4 Гбайт зі сторінками в
    2048 байт. В якості процесорів обробки виступають один або дваспецпроцесора (CPU), реалізовані у вигляді 32-розрядних процесорів із RISC -архітектурою. CPU має наступні характеристики:

    час циклу-100 нс;

    число 32-розрядних регістрів - 528;

    кеш-пам'ять інструкції-16 Кбайт;

    кеш-пам'ять - 64 Кбайт.
    У RISC-процесорах реалізований конвеєрний режим виконання інструкцій.


    Основою системи є власна надшвидка шина xtend

    (40 Мбайт/с), що працює за принципом комутації повідомлень. Інтелектуальнийпроцесор вводу-виводу (ПВВ) реалізований на базі мікропроцесора AMD 29116 зшвидкодією 5 млн. опер./с і містить 14 паралельних ОМА-контролерів,загальна пропускна спроможність яких 11 Мбайт/с. Пев обслуговуєпериферійні пристрої, контролери НМД (швидкість передачі в яких до
    2,5 Мбайт/с) і контролери локальної мережі (КЛС).

    До загальної шині підключається до 16 портів з інтерфейсом RS232 дляобслуговування інтелектуальних термінальних процесорів, за допомогою яких досистемі можуть підключатися термінальні користувачі. Підключення до шиниадаптера шини MULTIBUS відкриває широкі можливості для підключеннядопоміжних зовнішніх пристроїв, у яких реалізований інтерфейс цієїшини.

    Управління системою здійснюється процесором підтримки системи, вфункції якого входять також діагностика всіх пристроїв і системи в цілому,сервісна служба системи і т. п. У цьому процесорі функціонує такзвана двупортовий багатопроцесорна операційна система, якапоєднує в собі дві версії UNIX ОС: System V. AT & T і 4.0 Berkly.

    Перспективи розвитку МБД

    Створення високопродуктивних МВС пов'язується з рішенням наступнихпроблем, на яких ведуться інтенсивні дослідження.

    1. Створення спеціалізованих архітектур МВС, що поєднують достоїнствагоризонтального паралелізму при виконанні однієї операції з функціональнимпаралелізмом при виконанні послідовності операцій і транзакцій.
    Особливу роль тут відіграє реалізація конвеєрної потокової обробки (dataflow) стосовно до операцій реляційної алгебри.

    Рис. 5.9. Структура підсистеми потокової обробки в МВС DFRU


    Управління виконанням запитів при цьому має відбуватися власнепотоками даних, що полегшує завдання програмного контролю виконаннямоперацій, синхронізації їх і т. п. Наприклад, у проекті DFRU зробленаспроба апаратно реалізувати потокову обробку в регулярній структуріобробних процесорів (рис. 9). Основним елементом обробляютьє універсальний компаратор кортежів (К). У матриці компараторівкортежів, що з'єднуються коммутірующімі мережами, можлива динамічнакомутація виходів процесорів обробки i-го рівня з входами процесорів
    (i +1)-го рівня. У кожному рядку матриці по одному арифметичногопроцесору (АП) для реалізації агрегатних функцій. Зв'язок між процесорамивстановлюються відповідно до дугами дерева запиту (дерева реляційнихоперацій). Це дозволяє відображати дерева запиту в дерево процесорів,вирізаних в даній матриці, так що кожній операції призначається однапроцесор обробки. Після цього вихідні відносини в потоці читаються зпідсистеми масової пам'яті й обробляються конвейєрно в налаштованому деревіпроцесорів, так що кортежі, утворені в операції i-го рівня, черезкомутуючих мережу потрапляють у відповідний процесор (i + l)-го рівня. Нарис. 10 проілюстрований цей процес для запиту: «Видати іменапостачальників, які постачають більш як 100 деталей типу I »стосовнотрьом вихідним відносин:

    (RI) ПОСТАЧАЛЬНИК (КОД ПОСТАЧАЛЬНИКА, ім'я);

    (R2) ДЕТАЛЬ (КОД-ДЕТАЛІ, ТИП-ДЕТАЛІ, НАЙМЕНУВАННЯ); < p> (R3) ПОСТАВКА (КОД-ДЕТАЛІ, КОД-ПОСТАЧАЛЬНИКА, КІЛЬКІСТЬ).

    Рис. 10. Реалізація дерева операцій в матриці процесорів


    Поява на вході компаратора кортежу вихідного відносини для операціїселекції (select) або двох вихідних кортежів для операції з'єднання (join)активізує його, і після виконання операції та видачі результуючогокортежу він переходить в стан очікування. Процесори сортування відносинпідключаються перед бінарними операціями або перед операцією видаленнядублів. Проміжна пам'ять використовується для зациклення потоку кортежів,якщо довжина дерева запиту більше числа рядків в обробній матриці, абодля передачі проміжних відносин між двома деревами запитів.

    У матриці процесорів можливе одночасне виконання декількохзапитів, кожен з яких відображений у своє дерево процесорів.

    Необхідність у сортуванні пояснюється тим, що реалізація бінарнихоперацій реляційної алгебри (з нелінійної складністю 0 (n ^ 2), де n -кардинальність відносин) в потоковому режимі, коли одиницею обміну міжопераціями є кортежі або сторінки відносин, можлива, тільки якщовідносини однаково впорядковані. Тому операція сортування в конвеєрномуі потоковому режимах обробки є вузьким місцем, і потрібно їїапаратна реалізація, яка задовольняє таким вимогам:

    висока швидкість і близька до лінійної залежність часу сортування відобсягу відносини; один прохід при реалізації сортування; конвеєрний режим обробки потоку даних; наявність внутрішніх буферів обсягом не менш сторінки відносини (64,
    128, 256 Кбайт); можливість виключення дублікатів кортежів під час сортування відносини

    рис. 11. Вплив затримки при сортуванні на потоковий режим обробки кортежів

    Необхідно відзначити, що навіть застосування апаратних потоковихсортувальників не вирішує повністю проблему потокового виконання бінарнихоперацій. Сортувальник може почати видачу кортежів сортованого відносинитільки після отримання на вході останнього кортежу вихідного стосунки, таі то з затримкою. Наприклад, процесор сортування в Delta має затримку
    (2lm + N-1) t, де l-довжина кортежу в байтах, t = ЗЗО нс-час пересилання байтиміж сортують елементами, m-число сортируемих кортежів, N - числосортують елементів. Таким чином, наявність навіть апаратної потоковоїсортування перериває і уповільнює загальний потік кортежів між реляційнимиопераціями. А будь-яке уповільнення вхідного потоку одного відносини-операндавимагає для іншого операнда биНарнії операції наявності проміжногобуфера. Тому конвеєр кортежів при потокової обробки повинен мати вигляд
    «Розтягуваних рукавів» (рис. 11). Все це може звести до мінімумупереваги потокової обробки.

    2. Створення асоціативної пам'яті великої ємності для системного буфера
    МВС. Як відомо, використання асоціативної пам'яті як СБПдозволяє істотно підвищити ефективність пошукових і деяких іншихоперацій в МВС на рівні вторинної обробки. Інтерес представляєгібридна асоціативна пам'ять, що має один порт-звичайний дляпідключення пам'яті до загальної шини, а друга-асоціативний для підключення довідповідного контролера.

    Прикладом такої пам'яті є виріб фірми Сіменс, структурна схемапідключення якого до загальної шині представлена на рис. 12.а., Наявність портузвичайної адресації дозволяє здійснювати підкачування даних в асоціативнийпам'ять через загальну шину з УМП. Асоціативна пам'ять в цьому виробімістить 64 паралельні лінії обробки (шириною 8 розрядів кожна), такщо інформація з пам'яті надходить у кожний з 64 процесорних елементівпобайтно (у вигляді стовпця байтів довжиною 256 К). Довжина оброблюваного слова
    256К, загальна місткість асоціативної пам'яті 16 Мбайт. Модуль пам'яті,оброблюваної кожним процесорним елементом, 256 Кбайт. Кожен модульпам'яті має адресу на загальній шині, і інформація в нього може записуватисяавтономно по першому порту. Крім того, всередині стовпця-своя адресація вмежах 256К, доступна контролеру асоціативної пам'яті. Асоціативнийпошук здійснюється синхронно всіма (або частково) процесорнимиелементами.

    Структура кожного процесорного елемента зображено на рис. 12.б. Кожен процесорний елемент містить АЛУ і тест-пристрій, два вхідних регістра А і В, регістр маски М і блок регістрів С. Всі ці пристрої виходять на внутрішню шину пам'яті (М-шину). Процесорний елемент і модуль пам'яті реалізовані двома кристалами. Загальний контролер керує синхронної роботою всіх процесорних елементів, сприймає результат і при пошуку постійно фіксує поточний адреса в межах 256К, з яким 8 даний момент працюють процесорні елементи. Факт знаходження релевантної інформації в кожному елементі процесорному фіксується в контролері Для подальшого отримання інформації. У такій асоціативної пам'яті найбільш ефективно реалізується операція пошуку входжень по заданому зразком.
    Особливий інтерес представляє використання такої пам'яті в машинах баз знань, де операція пошуку входжень за зразком є основною.

    Рис. 12. Гібридна двупортовий асоціативна пам'ять:

    а - загальна схема; б - схема процесорного елемента


    3. Використання процесора потокової сортування відносин для злиттявідносин. Наприклад, у проекті Delta він призначений для потокового злиттядвох сортованих сторінок відносини зі швидкістю надходження кортежівдругої сторінки. На базі такого двухвходового процесора злиття може бутиреалізовано пристрій з'єднання двох ставлення

         
     
         
    Реферат Банк
     
    Рефераты
     
    Бесплатные рефераты
     

     

     

     

     

     

     

     
     
     
      Все права защищены. Reff.net.ua - українські реферати ! DMCA.com Protection Status