ПЕРЕЛІК ДИСЦИПЛІН:
  • Адміністративне право
  • Арбітражний процес
  • Архітектура
  • Астрологія
  • Астрономія
  • Банківська справа
  • Безпека життєдіяльності
  • Біографії
  • Біологія
  • Біологія і хімія
  • Ботаніка та сільське гос-во
  • Бухгалтерський облік і аудит
  • Валютні відносини
  • Ветеринарія
  • Військова кафедра
  • Географія
  • Геодезія
  • Геологія
  • Етика
  • Держава і право
  • Цивільне право і процес
  • Діловодство
  • Гроші та кредит
  • Природничі науки
  • Журналістика
  • Екологія
  • Видавнича справа та поліграфія
  • Інвестиції
  • Іноземна мова
  • Інформатика
  • Інформатика, програмування
  • Юрист по наследству
  • Історичні особистості
  • Історія
  • Історія техніки
  • Кибернетика
  • Комунікації і зв'язок
  • Комп'ютерні науки
  • Косметологія
  • Короткий зміст творів
  • Криміналістика
  • Кримінологія
  • Криптология
  • Кулінарія
  • Культура і мистецтво
  • Культурологія
  • Російська література
  • Література і російська мова
  • Логіка
  • Логістика
  • Маркетинг
  • Математика
  • Медицина, здоров'я
  • Медичні науки
  • Міжнародне публічне право
  • Міжнародне приватне право
  • Міжнародні відносини
  • Менеджмент
  • Металургія
  • Москвоведение
  • Мовознавство
  • Музика
  • Муніципальне право
  • Податки, оподаткування
  •  
    Бесплатные рефераты
     

     

     

     

     

     

         
     
    Аналіз розвитку суперЕОМ
         

     

    Інформатика, програмування
    ПОРІВНЯЛЬНИЙ АНАЛІЗ І ОЦІНКА СТАНУ РІВНЯ, тенденцій та перспектив розвитку
    СуперЕОМ
     
    В даний час перехід до нових поколінь обчислювальних засобів набуває
    особливої актуальності. Це пов'язано з потребами вирішення складних завдань великих
    розмірностей. Безперервне зростання характеристик нових зразків озброєнь вимагає
    розробки і створення принципово нових обчислювальних засобів для підтримки
    їх ефективного функціонування. У зв'язку з цим, усе більш зростають
    вимоги до продуктивності і надійності обчислювальних засобів для вирішення
    військово-прикладних задач. Однопроцесорні обчислювальні системи вже не
    справляються з рішенням більшості військово-прикладних задач у реальному часі,
    тому для підвищення продуктивності обчислювальних систем військового
    призначення все частіше використовуються багатопроцесорні обчислювальні системи (МВС).

    Найбільший внесок у розвиток обчислювальних засобів завжди вносили
    технологічні рішення, при цьому основною характеристикою покоління
    обчислювальних систем була елементна база, тому що перехід на нову
    елементну базу добре корелюється з новим рівнем показників
    продуктивності та надійності обчислювальних систем. Бурхливий розвиток
    технології НВІС, розробка все нових і нових поколінь мікропроцесорів
    кілька припинило пошуки принципово нових архітектурних рішень. У той
    Водночас стає очевидним, що чисто технологічні рішення втратили своє
    монопольне становище. Так, наприклад, у найближчій перспективі помітно зростає
    значення проблеми подолання розриву між апаратними засобами і методами
    програмування. Ця проблема вирішується чисто архітектурними засобами, при
    цьому роль технології є непрямої: високий ступінь інтеграції створює
    умови для реалізації нових архітектурних рішень. При цьому стало очевидним,
    що без кардинальної перебудови архітектурних принципів підтримувати
    інтенсивні темпи розвитку засобів обчислювальної техніки вже неможливо.
    За найбільш оптимістичними прогнозами тактові частоти сучасних і перспективних
    НВІС можуть бути збільшені в доступному для огляду майбутньому до 5 ГГц. У той же час,
    досягнута ступінь інтеграції дозволяє будувати паралельні системи, в яких
    число процесорів може досягати десятків тисяч. В області підвищення
    продуктивності обчислювальних систем резерв технологічних рішень
    обмежується одним порядком. Освоєння ж масового паралелізму і нових
    архітектурних рішень містить резерв підвищення продуктивності на кілька
    порядків.
    Основними вимогами, що пред'являються до багатопроцесорним систем з масовим
    паралелізмом, є: необхідність високої продуктивності для будь-якого
    алгоритму; узгодження продуктивності пам'яті з продуктивністю
    обчислювальної частини; здатність мікропроцесорів злагоджено працювати при
    непередбачуваних затримки даних від будь-якого джерела і, нарешті,
    машинно-незалежне програмування.
    Збільшення ступеня паралелізму викликає збільшення кількості логічних схем, що
    супроводжується збільшенням фізичних розмірів, в результаті чого зростають
    затримки сигналів на межз'єднань. Цей чинник призводить або до зниження
    тактової частоти, або до створення додаткових логічних ступенів і, в
    результаті, до втрати продуктивності. Зростання числа логічних схем також
    призводить до росту споживаної енергії і відводиться тепла. Крім того, слід
    підкреслити, що більш високочастотні логічні схеми при інших рівних
    умовах споживають велику потужність на один вентиль. В результаті виникає
    теплофізичні бар'єр, обумовлений двома факторами: високою питомою
    щільністю теплового потоку, що вимагає застосування складних засобів відведення
    тепла, і високою загальною потужністю системи, що викликає необхідність
    використання складної системи енергозабезпечення та спеціальних приміщень.
    Іншим фактором, що впливає на архітектуру високопродуктивних обчислювальних
    систем, є взаємозалежність архітектури та алгоритмів задач. Цей фактор
    часто призводить до необхідності створення проблемно-орієнтованих систем, при
    це може бути досягнута максимальна продуктивність для даного класу
    завдань. Зазначена взаємозалежність є стимулом для пошуку алгоритмів,
    які найкраще відповідають можливим формам паралелізму на рівні
    апаратури. А так як для написання програм використовуються мови високого рівня,
    необхідні певні засоби автоматизації процесів розпаралелювання і
    оптимізації програм.
    Класифікація паралельних обчислювальних систем, запропонована Т. Джоном,
    заснована на поділі МВС за двома критеріями: способом побудови пам'яті (загальна
    або розподілена) і способу передачі інформації. Основні типи машин по
    класифікації Т. Джона представлені в таблиці 1. Тут прийняті наступні
    позначення: p-елементарний процесор, M - елемент пам'яті, K-комутатор, С -
    кеш-пам'ять.
    Паралельна обчислювальна система з загальною пам'яттю і шинної організацією обміну
    (машина 1) дозволяє кожному процесору системи "бачити", як вирішується завдання в
    цілому, а не тільки ті частини, над якими він працює. Загальна шина, пов'язана з
    пам'яттю, викликає серйозні проблеми для забезпечення високої пропускної
    спроможності каналів обміну. Одним із способів обійти цю ситуацію є
    використання кеш-пам'яті (машина 2). У цьому випадку виникає проблема
    когерентності вмісту кеш-пам'яті і основний. Іншим способом підвищення
    продуктивності систем є відмова від центральної пам'яті (машина 3).
    Таблиця 1 - Класифікація МВС за типами пам'яті і передачі сообщенійТіпи
          передачіТіпи пам'яті
          СообщенійОбщая памятьОбщая і распределеннаяРаспределенная пам'ять
          Шинні соедіненія1.
          2.
          3.

           
          Фіксовані перехресні соедіненія4.
          5.
          6.

          Комутаційні структури7.
          8.
          9.


    Ідеальною машиною є обчислювальна система, у якій кожен процесор
    має прямі канали зв'язку з іншими процесорами, але в цьому випадку потрібно
    надзвичайно великий обсяг обладнання для організації міжпроцесорних обмінів.
    Певний компроміс представляє мережу з фіксованою топологією, в якій
    кожен процесор сполучений з деяким підмножиною процесорів системи. Якщо
    процесорів, які не мають безпосереднього каналу обміну, необхідно
    взаємодіяти, вони передають повідомлення через проміжні процесори. Одне
    з переваг такого підходу - не обмежується зростання кількості процесорів в
    системі. Недолік - потрібна оптимізація прикладних програм, щоб
    забезпечити виконання паралельних процесів, для яких потрібна активна
    вплив на сусідні процесори.
    Найбільш цікавим варіантом для перспективних паралельних обчислювальних
    комплексів є поєднання гідності архітектур з розподіленою пам'яттю і
    каналами міжпроцесорного обміну. Один з можливих методів побудови таких
    комбінованих архітектур - конфігурація з комутацією, коли процесор має
    локальну пам'ять, а з'єднуються процесори між собою за допомогою комутатора
    (машина 9). Коммутатор може виявитися дуже корисним для групи процесорів з
    розподіленою пам'яттю (машина 8). Дана конфігурація схожа на машину з загальної
    пам'яттю (машина 7), але тут виключені проблеми пропускної здатності шини.
    Недоліками класифікації Т. Джона є приховування рівня паралелізму в
    системі.
    Паралелізм будь-якого роду вимагає одночасної роботи, принаймні, двох
    пристроїв. Такими пристроями можуть бути: арифметико-логічні пристрої
    (АЛП), пристрою керування (УУ). У ЕОМ класичної архітектури УУ та АЛП
    утворюють процесор. Збільшення кількості процесорів або числа АЛУ в кожному з них
    призводить до відповідного зростання паралелізму. Наявність в ЕОМ декількох
    процесорів означає, що одночасно (паралельно) можуть виконуватися кілька
    програм або кілька фрагментів однієї програми. Робота декількох АЛУ під
    керуванням одного УУ означає, що безліч даних може оброблятися
    паралельно по одній програмі. Відповідно до цього опис структур
    паралельних систем можна представити у вигляді впорядкованої трійки:
    ,
    де k - кількість пристроїв управління, тобто найбільшу кількість незалежно і
    одночасно виконуваних програм в системі;
    d - кількість АЛП, що припадають на один пристрій управління;
    w - кількість розрядів, вміст яких обробляється одночасно
    (паралельно) одним арифметико-логічним пристроєм.
    Інша форма розпаралелювання - конвейеризації, також вимагає наявності
    декількох ЦП або АЛП. У той час, як безліч даних обробляється на одному
    пристрої, інше безліч даних може оброблятися на наступному пристрої
    і т.д., при цьому в процесі обробки виникає потік даних від одного
    пристрою (ЦП або АЛП) до наступного. Протягом усього процесу над одним
    безліччю даних виконується одне за одним n дій. Одночасно в
    конвеєрі на різних стадіях обробки можуть знаходитися від 1 до n даних.
    Паралелізм та конвейеризації можна розглядати на трьох різних рівнях,
    представлених в таблиці 2. Шість основних форм паралелізму, в широкому сенсі
    цього слова, дозволяють побудувати схему класифікації, в рамках якої можна
    описати різноманітність високопродуктивних обчислювальних систем та відобразити їх
    еволюцію.
    Таблиця 2 - Класифікація МВС за типом розпаралелювання
          Рівень параллелізмаПараллелізмКонвейерізація
          ПрограммиМультіпроцессор
          Макроконвейер

          КомандиМатрічний процесор
          Конвеєр команд

          ДанниеМножество розрядів
          Арифметичний конвеєр


    У векторних суперЕОМ забезпечена гранична продуктивність для процесів
    скалярною і векторної обробки, яка присутня в більшості завдань.
    Завдання, які містять високий ступінь внутрішнього паралелізму, можуть бути добре
    адаптовані до систем масового паралелізму. Реальні завдання і, тим більше,
    пакети завдань містять цілий ряд алгоритмів, що мають різні рівні
    паралелізму.
    Все це говорить про те, що замість спроб пристосувати всі типи алгоритмів до
    однієї архітектурі, що відбивається на конфігурації архітектур і супроводжується не
    завжди коректними порівняннями пікової продуктивності, більш продуктивним
    є взаємодоповнення архітектур в єдиній системі. Одним з перших прикладів
    такої системи є об'єднання векторної системи Cray Y-XM з системою Cray
    T3D. Проте, це об'єднання за допомогою високошвидкісного каналу призводить до
    необхідність розбиття задач на великі блоки і до втрати часу і пам'яті на
    обмін інформацією.
    Ситуація в даному випадку подібна до тієї, яка існувала до появи
    векторних машин. Для вирішення завдань, які містять велику кількість операцій над
    векторами і матрицями, використовувалися так звані матричні процесори,
    наприклад, фірми FSP, які підключалися до універсальної машині за допомогою
    каналу введення/виводу. Інтеграція скалярною і векторної обробки в одному
    процесорі поряд із забезпеченням високої швидкості роботи синхронного конвеєра
    забезпечила успіх векторних машин.
    Наступним логічним кроком є інтеграція скалярною, векторної та
    паралельної обробки. Завдяки цьому, може бути досягнута висока реальна
    продуктивність за рахунок розподілу окремих частин програми з
    підсистемам з різною архітектурою. Природно, це розподіл роботи
    має бути підтримано апаратно-програмними засобами автоматизації
    програмування. Ці кошти повинні містити можливість інтерактивного
    втручання програміста на етапі аналізу задачі і можливість моделювання
    або пробного запуску програми з виміром параметрів ефективності. Слід
    підкреслити, що форми паралелізму в алгоритмах досить різноманітні,
    тому й їхнє апаратне відображення може бути різним. До найбільш простим можна
    віднести системи з одним потоком команд і множинними потоками даних, системи
    з множинними потоками команд і даних, систолічний системи.
    Одним з перспективних підходів, що забезпечують автоматичне
    розпаралелювання, є принцип потоку даних, при якому
    послідовність або одночасність обчислень визначається не командами, а
    готовністю операндів і наявністю вільного функціонального арифметичного
    пристрою. Однак, і в цьому випадку ступінь реального розпаралелювання залежить
    від внутрішнього паралелізму алгоритму і, очевидно, потрібні ефективні способи
    підготовки завдань. Крім того, для реалізації таких систем необхідне створення
    асоціативної пам'яті для пошуку готових до роботи пар операндів і систем
    розподілу обчислень по великому числу функціональних пристроїв.
    Апаратна реалізація паралельних підсистем повністю залежить від обраних
    мікропроцесорів, БІС пам'яті і інших компонентів. В даний час по
    економічних причин доцільно використовувати найбільш
    високопродуктивні мікропроцесори, розроблені для уніпроцессорних машин.
    Разом з тим, існують підходи, пов'язані із застосуванням спеціалізованих
    мікропроцесорів, орієнтованих на використання в паралельних системах.
    Типовим прикладом є серія трансп'ютерів фірми Inmos. Однак, через
    обмеженого ринку ця серія по продуктивності різко відстала від
    універсальних мікропроцесорів, таких, як Alpha, Power PC, Pentium.
    Спеціалізовані мікропроцесори зможуть бути конкурентноспроможними тільки при
    умови скорочення витрат на проектування та освоєння у виробництві, що в
    великою мірою залежить від продуктивності інструментальних обчислювальних
    засобів, що використовуються в системах автоматизованого проектування.
    У різних обчислювальних машинах використовувалися різні підходи,
    спрямовані на досягнення, в першу чергу, однією з наступних цілей:
    - Максимальна арифметична продуктивність процесора;
    - Ефективність роботи операційної системи і зручність спілкування з нею для
    програміста;
    - Ефективність трансляції з мов високого рівня і виключення написання
    програм на автокодом;
    - Ефективність розпаралелювання алгоритмів для паралельних архітектур.
    Однак, у будь-якій машині необхідно в тій чи іншій формі вирішувати всі зазначені
    завдання. Відзначимо, що спочатку намагалися досягти цього за допомогою одного або
    кількох однакових процесорів.
    Диференціація функцій і спеціалізація окремих підсистем почала розвиватися з
    появи окремих підсистем і процесорів для обслуговування введення/виводу,
    комунікаційних мереж, зовнішньої пам'яті і т.п.
    У суперЕОМ крім основного процесора (машини) включалися зовнішні машини. В
    різних системах можна спостерігати елементи спеціалізації в напрямках
    автономного виконання функцій операційної системи, системи програмування й
    підготовки завдань.
    По-перше, ці додаткові функції можуть виконуватися паралельно з основними
    обчисленнями. По-друге, для реалізації не потрібні багато хто з тих коштів,
    які забезпечують високу продуктивність основного процесора, наприклад,
    можливість виконання операцій з плаваючою комою і векторних операцій. В
    Надалі, при інтеграції скалярною, векторної та паралельної обробки в
    рамках єдиної обчислювальної підсистеми складу цих допоміжних функцій
    повинен бути доповнений функціями аналізу програм з метою забезпечення необхідного
    рівня паралелізму і розподілу окремих частин програми з різних
    гілкам обчислювальної підсистеми.
    Поява зуперЕВМ супроводжувалося підвищенням їх загальної потужності споживання (вище
    100 кВт) і збільшенням щільності теплових потоків на різних рівнях
    конструкції. Їх створення не в останню чергу виявилося можливим, завдяки
    використанню ефективних рідинних і фреонових систем охолодження. Чи є
    значна потужність істотною ознакою суперЕОМ? Відповідь на це питання
    залежить від того, що вкладається в поняття суперЕОМ.
    Якщо вважати, що суперЕОМ або, точніше, суперсистема - це система з найвищою
    можливою продуктивністю, то енергетичний фактор залишається одним з
    визначають цю продуктивність. У міру розвитку технології потужність одного
    вентиля в мікропроцесорах зменшується, але при підвищенні продуктивності
    процесора за рахунок паралелізму загальна потужність в ряді випадків зростає. При
    об'єднанні великої кількості мікропроцесорів в системі з масовим паралелізмом
    інтегральна потужність і тепловиділення стають порівнянними з аналогічними
    показниками для векторно-конвеєрних систем. Однак, іноді в рекламних цілях
    паралельні системи з невеликим числом процесорів порівнюються з
    суперкомп'ютерами попереднього або більш раннього поколінь, щоб показати їх
    переваги в сенсі простоти і зручності експлуатації. Природно, з такого
    некоректного порівняння не можна зробити висновок про доцільність створення
    сучасних суперсистем.
    Основним стимулом створення суперсистем є потреби рішення великих
    завдань. У свою чергу, дослідження і розробки по суперсистем стимулюють
    цілий комплекс фундаментальних і прикладних досліджень, результати яких
    використовуються надалі в інших областях. Перш за все, це стосується
    архітектури та схемотехніки обчислювальних машин, високочастотних інтегральних
    схем і засобів межз'єднань, ефективних систем відводу тепла. Не менш важливі
    результати за методами розпаралелювання при виконанні окремих операцій і
    ділянок програм на апаратному рівні, методам побудови паралельних
    алгоритмів, мов і програмних систем для ефективного вирішення великих завдань.
    У розвитку обчислювальних засобів можна виділити три основні проблеми:
    - Підвищення продуктивності;
    - Підвищення надійності;
    - Покриття семантичного розриву.
    Етапи розвитку обчислювальних засобів прийнято розрізняти за їхніми машин.
    Характеристика покоління визначається конкретними показниками, що відображають
    досягнутий рівень у вирішенні трьох перерахованих проблем. Оскільки переважний
    внесок у розвиток обчислювальних засобів завжди належав технологічним
    рішень, основною характеристикою покоління машин вважалася елементна
    база. І дійсно, перехід на нову елементну базу добре корелюється з
    новим рівнем показників продуктивності, надійності і скорочення
    семантичного розриву.
    В даний час актуальним є перехід до нових поколінь обчислювальних
    коштів. За традицією, що склалася вирішальна роль відводиться технології виробництва
    елементної бази. У той же час стає очевидним, що технологічні рішення
    втратили монопольне становище. Так, наприклад, у найближчій перспективі помітно
    зростає значення проблеми покриття семантичного розриву, що відбивається в
    необхідність створення високосложних програмних продуктів і вимагає
    кардинального зниження трудоемкотсі програмування. Ця проблема вирішується
    переважно архітектурними засобами. Роль технології тут може бути
    тільки непрямої: високий ступінь інтеграції створює умови для реалізації
    архітектурних рішень.
    В даний час одним з домініруюшіх напрямків розвитку суперЕОМ є
    обчислювальні системи c MIMD-паралелізмом на основі матриці мікропроцесорів.
    Для створення подібних обчислювальних систем, що складаються із сотень і тисяч
    пов'язаних процесорів, треба було подолати ряд складних проблем як в
    програмне забезпечення (мови Parallel Pascal, Modula-2, Ada), так і в
    апаратних засобах (ефективна комутаційна середу, високошвидкісні
    засобу обміну, потужні мікропроцесори). Елементна база сучасних
    виcокопроізводітельних систем характеризується виcокой ступенем інтеграції (до
    3,5 млн. транзисторів на кристалі) і високими тактовими частотами (до 600 МГц).
    В даний час всі фірми і всі університети США, Західної Європи та Японії,
    розробляють суперЕОМ, ведуть інтенсивні дослідження в області
    багатопроцесорних суперЕОМ з масовим паралелізмом, створюють безліч їх типів,
    організують їх виробництво і прискореними темпами освоюють світовий ринок у цій
    області. Багатопроцесорні ЕОМ з масовим паралелізмом вже зараз істотно
    випереджають по продуктивності традиційні суперЕОМ з векторно-конвеєрної
    архітектурою. Системи з масовим паралелізмом висувають менші вимоги до
    мікропроцесорах та елементної бази і мають значно меншу вартість при
    будь-якому рівні продуктивності, ніж векторно-конвеєрні суперЕОМ. Вже в
    поточному десятилітті продуктивність суперЕОМ з масовим паралелізмом
    досягне колосальної величини - десятків тисяч мільярдів операцій у секунду з
    плаваючою комою над 64-розрядними числами (десятків Тфлопс).
    На щорічній конференції в Чепел-Хілл (Сев.Кароліна) представлений проект фірми
    IBM, метою якого є створення гіперкубіческого паралельного процесора в
    одному корпусі. Конструкція, названа Execube, має 8 16-розрядних
    мікропроцесоров, вбудованих в кристал 4Мбіт динамічного ЗУ (ДЗУ). При цьому
    ступінь інтегр становить 5 млн. транзисторів. Мікросхема виготовлена за
    КМОП-технології з трьома рівнями металізації на заводі IBM Microelectronic
    (Ясу, Японія). Execube являє собою спробу підвищення ступеня інтеграції
    процесора з пам'яттю шляхом більш ефективного доступу до інформації ДЗУ. За
    суті, пам'ять перетворюється на розширені регістри процесорів.
    Продуктивність мікросхеми складає 50 млн оп/с.
    Фірма CRAY Research оголосила про початок випуску суперкопьютеров CRAY T3/E.
    Основна характеристика, на якій акцентували увагу розробники -
    масштабованість. Мінімальна конфігурація становить 8 мікропроцесорів,
    максимальна-2048. У порівнянні з попередньою моделлю T3/D співвідношення
    ціна/продуктивність знижена в 4 рази і становить 60 дол/Мфлопс, чому
    сприяло застосування недорогих процесорів DEC Alpha EVC, виготовлених за
    КМОП-технології. Орієнтовна вартість моделі Т3/Е на основі 16 процесорів з
    1-Гбайт ЗУ складе 900 тис. доларів, а ціна найбільш потужної конфігурації (1024
    процесора, ЗП 64 Гбайт) -39,7 млн. доларів при пікової продуктивності 600
    Гфлопс.
    Одним із способів подальшого підвищення продуктивності обчислювальної
    системи є об'єднання суперкомп'ютерів в кластери за допомогою
    оптоволоконних з'єднань. З цією метою комп'ютери CRAY T3/E забезпечені каналами
    введення/виводу з пропускною здатністю 128 Гб/с. Потенційні замовники
    виявляють підвищений інтерес до нової розробки фірми. Бажання придбати
    комп'ютер виявили такі організації як Pittsburgh Supercomputer Center, Mobile
    Oil, Департамент з океанографії і атмосферних досліджень США. При цьому
    підписано кілька контрактів на виготовлення декількох комп'ютерів
    512-процесорній конфігурації.
    Серед японських компаній слід виділити фірму Hitachi, яка випустила
    суперкомп'ютер SR2201 з масовим паралелізмом, що містить до 2048 процесором. В
    основі системи перероблена компанією процесорна архітектура RA-RISC від
    фірми Hewlett-Paccard. Псевдовекторний процесор функціонує під управлінням
    ОС HP-UX/MPP Mash 3.0. У комп'ютері, крім того, використана система підтримки
    паралельного режиму роботи Express, створена корпорацією Parasoft і отримала
    назва ParallelWare. Продуктивність нового комп'ютера складає 600
    Гфлопс. До березня 1999 фірма планує продати 30 суперкомп'ютерів.
    Одним з найбільш масштабних проектів у галузі створення обчислювальних засобів
    з масовим паралелізмом є проект фірми Intel з розробки самого
    швидкодіючого комп'ютера на основі мікропроцесорів шостого покоління P6.
    Нова система, яку планується встановити в Sandia National Laboratories
    складатиметься з 9000 процесорів Pentium P6 і мати пікову продуктивність
    1000 Гфлопс. Замовником системи є міністерство енергетики США. При цьому
    основною областю застосування буде моделювання підземних ядерних
    вибухів, що дозволить витрачати 25 млн. доларів на рік замість 300 млн.
    За останнє десятиріччя має місце наступна динаміка зростання продуктивності
    паралельних обчислювальних систем в США: 1987 р. - 50 Мфлопс
    1989 р. - 1 Гфлопс (суперкомп'ютери СМ)
    1991 р. - 10 Гфлопс (векторні процесори і процесори серії 528)
    1994р. - 100 Гфлопс (CRAY, PARAGON)
    1996-1997рр. - 200-500 Гфлопс (комбінація векторного процесора і куба потокової
    обробки).
    1998-1999 рр.. -1000-3000 Гфлопс (ASCI, T3E)
    Особливо видатними характеристиками відрізняються суперкомп'ютери в середині 90-х
    років: - Фірма IBM ALPS (1024 процесора RS6000, продуктивність 50 Гфлопс);
    -Intel Paragon XPS (1872 процесора, продуктивність 72,9 Гфлопс);
    - Thinking Mashines CM5 (512 процесорів Super Spark, продуктивність 83
    Гфлопс);
    - NCube 2SM80 (8192 процесора, продуктивність 84Гфлопс);
    - Numerical Wind Tunnel (140 процесорів, продуктивність 124 Гфлопс на
    тестах LINPACK);
    - Intel Paragon XPS Supercomputer (4000 процесорів 1860XP, продуктивність
    300 Гфлопс)
    - Сray Research MPP System (2048 процесорів Alpha, продуктивність - 300
    Гфлопс)
    - Thinking Mashines CM5 (16384 процесора Super Spark, продуктивність 1000
    Гфлопс)
    Короткі харатеристик найбільш поширених сучасних суперкомп'ютерів
    наведені нижче
    IBM RS/6000 SP2
    Виробник-International Business Machines (IBM), відділення RS/6000.
    Клас архітектури: Масштабована масивно-паралельна обчислювальна система
    (MPP).
    Вузли мають архітектуру робочих станцій RS/6000. Існують декілька типів
    "SP-вузлів", які комплектуються різними процесорами: PowerPC 604e/332MHz,
    P2SC/160MHz, POWER3/MHz (більш ранні системи комплектувалися процесорами
    POWER2/66 і 77MHz). Можливе встановлення вузлів з SMP-архітекутурой - до 4
    процесором PowerPC. Об'єм пам'яті для POWER3-вузлів - до 4GB, для PowerPC-вузлів -
    до 3GB.
    Доступні конфігурації SP від 2 до 128 вузлів (і до 512 за спеціальним замовленням).
    Вузли встановлюються в "стійки" (до 16 вузлів у кожній). Одна SP-система може
    містити вузли різних типів.
    Вузли зв'язані між собою високопродуктивних комутатором (IBM
    high-performance switch), який має багатостадійну структуру і працює з
    комутацією пакетів.
    Cистемное ПО: OC AIX (встановлюється на кожному вузлі). LoadLeveler - система
    підтримки пакетної обробки. Паралельні програми виконуються під
    управлінням Parallel Operating Environment (POE).
    Засоби програмування: поставляється оптимізована реалізація інтерфейсу
    MPI (раніше - MPL).
    HP 9000 (Exemplar)
    Виробник: Hewlett-Packard, High-performance systems division.
    Клас: багатопроцесорні сервера з загальною пам'яттю (SMP).
    В даний час доступні декілька "класів" систем сімейства HP 9000: сервера
    початкового рівня (D, K-class), середнього рівня (N-class) і найбільш потужні
    системи (V-class).
    Процесори: 64-бітові процесори c архітектурою PA-RISC 2.0 (PA-8200, PA-8500).
    Число процесорів: N-class - до 8 процесорів. V-class - до 32 процесорів. В
    надалі очікується збільшення числа процесорів до 64, а потім до 128.
    Можливе об'єднання до 16 SMP-гіперузлов V-class або K-class у кластер "HP
    Enterprise Parallel Server ". Для зв'язку вузлів використовується комутатор HP
    HyperFabric.
    Системне ПО: встановлюється операційна система HP-UX (сумісна на рівні
    двійкового коду з ОС SPP-UX комп'ютерів Convex SPP).
    Засоби програмування: HP MPI - реалізація MPI 1.2, оптимізована до
    архітектурі Exemplar. Распараллелівающіе компілятори Fortran/C, математична
    бібліотека HP MLIB. CXperf - засіб аналізу продуктивності програм.
    Cray T3E
    Виробник: Silicon Graphics
    Клас архітектури: масштабована масивно-паралельна система, складається з
    процесорних елементів (PE).
    В даний час існують дві модифікації: T3E-900 і T3E-1200.
    Процесорний елемент PE складається з процесора, блоку пам'яті і пристрою
    сполучення з мережею. Використовуються процесори Alpha 21164 (EV5) з тактовою
    частотою 450 MHz (T3E-900) і 600 MHz (T3E-1000), пікова продуктивність
    яких становить 900 і 1200 MFLOP/sec відповідно. Процесорний елемент
    володіє своєю локальною пам'яттю (DRAM) обсягом від 256MB до 2GB.
    Системи T3E масштабуються до 2048 PE.
    Процесорні елементи пов'язані високопродуктивної мережею з топологією
    тривимірного тора і двонаправленими каналами. Швидкість обмінів по мережі досягає
    480MB/sec в кожному напрямку.
    Використовується операційна система UNICOS/mk.
    Підтримується явне паралельне програмування c допомогою пакета Message
    Passing Toolkit (MPT) - реалізації інтерфейсів передачі повідомлень MPI, MPI-2 і
    PVM, бібліотека Shmem. Для Фортран-програм можливо також неявне
    розпаралелювання в моделях CRAFT і HPF. Середа розробки включає також набір
    візуальних засобів для аналізу та налагодження паралельних програм.
    Cray T90
    Виробники: Silicon Graphics, Cray Research.
    Клас архітектури: багатопроцесорна векторна система (кілька векторних
    процесорів працюють на загальній пам'яті).
    Моделі T90 Серія включає моделі T94, T916 і T932.
    Процесор Системи серії T90 базуються на векторно-конвеєрному процесорі Cray
    Research з пікової продуктивністю 2GFlop/s.
    Число процесорів Система T932 може включати до 32 векторних процесорів (до
    4-х в моделі T94, до 16 моделі T916), забезпечуючи пікову продуктивність
    більше 60GFlop/s.
    Можливе об'єднання декількох T90 в MPP-системи.
    Система T932 містить від 1GB до 8GB (до 1 GB в моделі T94 і до 4GB в моделі
    T916) оперативної пам'яті і забезпечує швидкість обмінів з пам'яттю до 800MB/sec.

    Використовується операційна система UNICOS.
    Cray SV1
    Виробник: Silicon Graphics
    Клас архітектури: масштабований векторний суперкомп'ютер.
    Використовуються 8-конвеєрні векторні процесори MSP (Multi-Streaming Processor)
    з пікової продуктивністю 4.8 GFLOP/sec, кожен MSP може бути підрозділі
    на 4 стандартних 2-конвеєрних процесора з пікової продуктивністю 1.2
    GFLOP/sec. Тактова частота процесорів - 250MHz.
    Процесори об'єднуються в SMP-вузли, кожен з яких може містити 6 MSP і 8
    стандартних процесорів. Система (кластер) може містити до 32 таких вузлів.
    SMP-сайт може містити від 2 до 16GB пам'яті. Система може містити до 1TB
    пам'яті. Вся пам'ять глобально адресуються (архітектура DSM).
    Використовується операційна система UNICOS.
    Поставляється векторізующій і распараллелівающій компілятор CF90. Підтримується
    також явна паралельне програмування з використанням інтерфейсів MPI,
    OpenMP або Shmem.
    Cray Origin2000
    Виробник Silicon Graphics
    Клас архітектури: модульна система з загальною пам'яттю (cc-NUMA).
    Використано 64-розрядні RISC-процесори MIPS R10000, R12000/300MHz
    Основний компонент системи - модуль Origin, що включає від 2 до 8 процесорів
    MIPS R10000 і до 16GB оперативної пам'яті. Поставляються системи Origin2000,
    що містять до 256 процесорів (тобто до 512 модулів). Вся пам'ять системи (до
    256GB) глобально адресуються, апаратно підтримується когерентність кешей. Модулі
    системи з'єднані за допомогою мережі CrayLink, побудованої на маршрутизаторах
    MetaRouter.
    Використовується операційна система SGI IRIX. Поставляється распараллелівающій
    компілятор Cray Fortran 90. Підтримується стандарт OpenMP.
    Onyx2 InfiniteReality2
    Виробник Silicon Graphics
    Клас архітектури: багатопроцесорна система візуалізації; з апаратної
    архітектурі дуже схожа на Origin2000.
    Система може включати до 128 процесорів MIPS R10000.
    Графічні можливості системи забезпечують спеціальні пристрої трьох типів:
    геометричні (векторні) процесори, растрові процесори, генератори
    аналогових сигналів. Система може бути обладнана 16 незалежними каналами
    графічного виводу (visualization pipelines). На апаратному рівні
    підтримується графічний інтерфейс OpenGL.
    Використовується операційна система SGI IRIX.
    Sun HPC 10000 (StarFire)
    Виробник Sun Microsystems, серія Sun HPC.
    Клас архітектур: багатопроцесорний SMP-сервер.
    Процесор UltraSPARC II/336MHz
    Система StarFire поєднує від 16 до 64 процесорів.
    Система включає від 2GB до 64GB пам'яті.
    Системне ПО: ОС Solaris, ПО розподілу ресурсів Load Sharing Facility (LSF).
    Поставляється пакет підтримки паралельних програм Sun HPC 2.0, що включає
    такі кошти як HPF, MPI, PVM, PFS (паралельна файлова система), Prism
    (візуальне середовище розробки), S3L (бібліотека математичних підпрограм), і
    ін
    NEC SX-5
    Виробник NEC, серія SX.
    Клас архітектури: паралельний векторний суперкомп'ютер (PVP).
    Кожен вузол системи є векторно-конвеєрним SMP-суперкомп'ютером,
    об'єднуючим до 16 індивідуальних векторних процесорів (кожен з пікової
    векторної продуктивністю 8 Gflop/s і скалярною продуктивністю 500
    MFlop/s).
    Об'єм пам'яті кожного вузла - до 128GB, продуктивність обмінів з пам'яттю
    досягає 1TB/sec. Система може включати до 32 вузлів, забезпечуючи сукупну
    пікову продуктивність до 4 TFlop/s.
    Для зв'язку вузлів використовується високошвидкісний комутатор (IXS Internode Crossbar
    Switch).
    Використовується операційна система SUPER-UX.
    Поставляються компілятор мови HPF, реалізація інтерфейсу MPI, компілятори
    Fortran77/SX і Fortran90/SX з автоматичним розпаралелюванням і векторизація,
    а також інтегроване середовище розробки та оптимізації PSUITE.
    Fujitsu VPP
    Виробник Fujitsu
    Клас архітектури паралельний векторний суперкомп'ютер (PVP).
    Модифікації VPP300, VPP700, VPP5000
    Кожен процесорний елемент (PE) системи VPP700E складається скалярного пристрої
    (SU), векторного пристрої (VU), блоку пам'яті і пристрою сполучення. Для
    VPP700: VU складається з 7 конвеєрів і забезпечує пікову продуктивність до
    2.4 GFLOP/sec. Об'єм пам'яті - до 2GB. Для VPP5000: VU складається з 4 конвеєрів,
    пікова продуктивність - 9.6 GFLOP/sec. Об'єм пам'яті - до 16GB.
    Для VPP700: cистема може включати від 8 до 256 PE, сумарна пікова
    продуктивність до 14.4 GFLOP/sec Для VPP5000: до 512 PE, сумарна пікова
    продуктивність до 4.9 TFLOP/sec.
    Процесорні елементи пов'язані комутатором (crossbar network), який
    проводити двосторонні обміни, не перериваючи обчислень. Пропускна здатність
    каналів комутатора: для VPP700 - 615MB/sec, для VPP5000 - 1.6GB/sec.
    Використовується операційна система UXP/V, заснована на UNIX System VR4.
    Серед засобів розробки поставляються: распараллелівающій і векторізующій
    компілятор Fortran90/VPP, оптимізована для VPP бібліотека математичних
    підпрограм SSLII/VPP, бібліотеки передачі сообшеній MPI-2 і PVM 3.3.
    AlphaServer
    Виробник Compaq, Digital.
    Високопродуктивний SMP-сервер, AlphaServer Array - кластерна система.
    Процесори GS140 і GS60 - Alpha 21264, 8400 і 8200 - Alpha 21164
    Число процесорів GS140 і 8400 - до 14, GS60 і 8200 - до 6
    Об'єм пам'яті GS140 - до 28GB.
    Кластери AlphaServer Array можуть поєднувати до 8 вузлів AlphaServer, тобто в загальній
    складності до 112 процесорів. Можуть комбінуватися вузли різних типів. Вузли
    зв'язуються між собою комутатором MEMORY CHANNEL, який забезпечує
    швидкість обмінів до 66MB/sec і латентний
         
     
         
    Реферат Банк
     
    Рефераты
     
    Бесплатные рефераты
     

     

     

     

     

     

     

     
     
     
      Все права защищены. Reff.net.ua - українські реферати ! DMCA.com Protection Status