МІНІСТЕРСТВО ОСВІТИ РФ p>
Читинська ІНСТИТУТ Іркутська державна p>
ЕКОНОМІЧНОЇ АКАДЕМІЇ p>
Факультет: Фінансово-інформаційний p>
Кафедра: ВМ, Вт і АСУ p>
Спеціальність: Прикладна інформатика в економіці p>
Курсова робота p>
З дисципліни: Обчислювальні системи p>
На тему: Суперкомп'ютери p >
Виконав: Любар А.Ю. студент 2 курсу гр. ПівЕ-99 p>
Перевірив:
Прігляднов Б.І. p>
Чіта2001 p>
ЗМІСТ p>
1. ВСТУП
2. СФЕРИ ЗАСТОСУВАННЯ Суперкомп'ютер
3. Суперкомп'ютера в РОСІЇ
4. СУПЕРКОМПЮЬТЕРИ, ЯК ЦЕ?
5. ВСЕ НОВЕ - це добре забуте старе
6. АРХІТЕКТУРА СУЧАСНИХ суперЕОМ
7. ОЦІНКА ПРОДУКТИВНОСТІ суперЕОМ
8. ВИСНОВОК
9. Використаної літератури p>
Введення p>
Діалектична спіраль розвитку комп'ютерних технологій зробила свійчерговий виток - знову, як і десять років тому, відповідно довимогами життя, в моду входять суперкомп'ютерні архітектури.
Безумовно, це вже не ті монстри, які пам'ятають ветерани - новітехнології і вимогливий ринок комерційних застосувань істотнозмінили обличчя сучасного суперкомп'ютера, Тепер це не величезні шафи зунікальною апаратурою, навколо якої чаклують шамани від інформатики, ацілком ергономічні системи з уніфікованим програмним забезпеченням,сумісні зі своїми молодшими побратимами. Розглянемо основні областізастосування суперЕОМ і проаналізуємо особливості різних типівархітектур, характерних для сучасних суперкомп'ютерів.
Що таке суперЕОМ? Оксфордський тлумачний словник з обчислювальної техніки,виданий майже 10 років тому, в 1986 році, повідомляє, що суперкомп'ютер --це дуже потужна ЕОМ з продуктивністю понад 10 MFLOPS (мільйонівоперацій з плаваючою комою в секунду). Сьогодні цей результат перекриваютьвже не тільки робочі станції, але навіть, принаймні, за піковоїпродуктивності, і ПК. На початку 90-х років кордон проводили вже близьковідмітки в 300 MFLOPS.
Проте такий підхід до визначення суперЕОМ не зовсім коректним. Очевидно,що, сучасний двопроцесорний комп'ютер Cray C90 будь-яка розсудливалюдина назве суперЕОМ. А тим не менш, його пікова продуктивністьменше 2 GFLOPS. З цим питанням тісно пов'язані і обмеження (раніше -
КОКОМ, тепер - Держдепартаменту США) на поставку високопродуктивнихзасобів обчислювальної техніки іншим країнам. Комп'ютери зпродуктивністю понад 10 000 млн. теоретичних операцій в сек.
(MTOPS), згідно з визначенням Держдепартаменту США, вважаютьсясуперкомп'ютерами.
Більш коректно перелічити основні ознаки, що характеризують суперЕОМ,серед яких крім високої продуктивності слід зазначити:
. самий сучасний технологічний рівень (наприклад, GaAs-технологія);
. специфічні архітектурні рішення, спрямовані на підвищення швидкодії (наприклад, наявність операцій над векторами);
. ціна, звичайно понад 1-2 млн. дол
У телеконференції USENET по суперкомп'ютерів у зв'язку з швидким прогресом утехнології RISC-мікропроцесорів і відповідним зростанням їхпродуктивності був якось поставили запитання: коли робоча станціяперетвориться на суперЕОМ? На що була відповідь: "Коли вона буде коштуватипонад 1 млн. доларів ". Для ілюстрації можна відзначити, що комп'ютер Cray-
1 свого часу коштував близько 8 млн. доларів, а анонсовані в цьому роцісуперкомп'ютери Сгау Т90, які мають набагато більш високу продуктивність,
- Від 2.5 до 35 млн. дол Вартість створення суперкомп'ютерної MPP-системив проекті лабораторії Sandia Міністерства енергетики США становить близько
46 млн. доларів.
Разом з тим, існують комп'ютери, що мають всі перераховані вищехарактеристики суперЕОМ, за винятком ціни, яка для них складає відкількох сотень до 2 млн. доларів. Йдеться про міні-суперЕОМ, що володієвисокою продуктивністю, що поступається, однак, великим суперЕОМ. При цьомуу мінісуперкомпьютеров, як правило, помітно краще співвідношенняціна/продуктивність і істотно нижче за експлуатаційні витрати:система охолодження, електроживлення, вимоги до площі приміщення та ін
Дані комп'ютери орієнтовані на менш великі обчислювальні центри --рівня факультету, а не всього університету або корпорації. Приклади таких
ЕОМ - Cray J90, Convex C38XX і, можливо, C4/XA. До них можна віднести, такожі сучасні суперкомп'ютерні системи на базі RISC-мікропроцесорів,наприклад, IBM SP2, SGI POWER CHALLENGE, DEC AlphaServer 8200/8400 та ін
З точки зору архітектури мінісуперкомпьютери не представляють собоюякийсь особливий напрям, тому надалі вони окремо нерозглядаються. p>
Сфери застосування суперкомп'ютерів p>
Для яких застосувань потрібна настільки дорога техніка? Може здатися,що зі зростанням продуктивності настільних ПК і робочих станцій, а такожсерверів, сама потреба в суперЕОМ буде знижуватися. Це не так. З одногобоку, цілий ряд програм може тепер успішно виконуватися на робочихстанціях, але з іншого боку, час показав, що стійкою тенденцієює поява все нових додатків, для яких необхідновикористовувати суперЕОМ.
Перш за все слід вказати на процес проникнення суперЕОМ в абсолютнонедоступну для них раніше комерційну сферу. Мова йде не тільки скажімо, прографічних додатках для кіно і телебачення, де потрібна все та жвисока продуктивність на операціях з плаваючою комою, а перш за всепро завдання, що передбачають інтенсивну (у тому числі, і оперативну)обробку транзакцій для надвеликих БД. У цей клас задач можна віднеститакож системи підтримки прийняття рішень і організація інформаційнихскладів. Звичайно, можна сказати, що для роботи з подібними програмами впершу чергу необхідні висока продуктивність введення-виводу ішвидкодію при виконанні цілочисельних операцій, а комп'ютернісистеми, найбільш оптимальні для таких програм, наприклад, MPP-системи
Himalaya компанії Tandem, SMP-комп'ютери SGI CHAL ENGE, AlphaServer 8400 від
DEC - це не зовсім суперЕОМ. Але варто згадати, що такі вимогивиникають, зокрема, з боку ряду додатків ядерної фізики,наприклад, при обробці результатів експериментів на прискорювачахелементарних частинок. Адже ядерна фізика - класична областьзастосування суперЕОМ з дня їх виникнення.
Як би там не було, намітилася явна тенденція до зближення понять
"мейнфрейм", "багатопроцесорний сервер" і "суперЕОМ". Не зайвим буде зауважити, щоце відбувається на тлі що почався в багатьох областях масованогопереходу до централізації і укрупнення на противагу процесуразукрупненіяі децентралізації.
Традиційною сферою застосування суперкомп'ютерів завжди були науковідослідження: фізика плазми та статистична механіка, фізикаконденсованих середовищ, молекулярна та атомна фізика, теорія елементарнихчастинок, газова динаміка і теорія турбулентності, астрофізика. У хімії --різні галузі обчислювальної хімії: квантова хімія (включаючи розрахункиелектронної структури для цілей конструювання нових матеріалів, наприклад,каталізаторів і надпровідників), молекулярна динаміка, хімічнакінетика, теорія поверхневих явищ і хімія твердого тіла,конструювання ліків. Природно, що ряд областей застосуваннязнаходиться на стиках відповідних наук, наприклад, хімії та біології, іперекривається з технічними додатками. Так, завдання метеорології,вивчення атмосферних явищ і, в першу чергу, завдання довгостроковогопрогнозу погоди, для вирішення якої постійно не вистачає потужностейсучасних суперЕОМ, тісно пов'язані з вирішенням ряду перерахованих вищепроблем фізики. Серед технічних проблем, для вирішення яких використовуютьсясуперкомп'ютери, завдання аерокосмічній та автомобільній промисловості,ядерної енергетики, прогнози і розробки родовищ кориснихкопалин, нафтовидобувної та газової промисловості (у тому числі проблемиефективної експлуатації родовищ, особливо тривимірні задачі їхдослідження), і, нарешті, конструювання нових мікропроцесорів ікомп'ютерів, в першу чергу самих суперЕОМ.
Суперкомп'ютери традиційно застосовуються для військових цілей. Крім очевиднихзадач розробки зброї масового знищення та конструювання літаків іракет, можна згадати, наприклад, конструювання безшумних підводних човнівта ін Найзнаменитіший приклад - це американська програма СОІ. Вжезгадуваний MPP-комп'ютер Міністерства енергетики США буде застосовуватисядля моделювання ядерної зброї, що дозволить взагалі скасувати ядернівипробування в цій країні.
Аналізуючи потенційні потреби в суперЕОМ існуючих сьогоднідодатків, можна умовно розбити їх на два класи. До першого можна віднестидодатки, у яких відомо, який рівень продуктивності требадосягти в кожному конкретному випадку, наприклад, довгостроковий прогнозпогоди. До другого можна віднести завдання, для яких характерний швидкийзростання обчислювальних витрат зі збільшенням розміру досліджуваного об'єкта.
Наприклад, у квантовій хімії неемпіріческіе розрахунки електронної структуримолекул потребують витрат обчислювальних ресурсів, пропорційних N ^ 4 або
N ^ 5, де N умовно характеризує розмір молекули. Зараз багатомолекулярні системи вимушено досліджуються у спрощеному модельномуподанні. Маючи в резерві ще більші молекулярні освіти
(біологічні системи, кластери і т.д.), квантова хімія дає прикладдодатки, що є "потенційно нескінченним" користувачемсуперкомп'ютерних ресурсів.
Є ще одна проблема застосування суперЕОМ, про яку необхідно сказати --це візуалізація даних, отриманих в результаті виконання розрахунків.
Часто, наприклад, при рішенні диференціальних рівнянь методом сіток,доводиться стикатися з гігантськими розмірами результатів, які вчисловий формі людина просто не в стані обробити. Тут в багатьохвипадках необхідно звернутися до графічної форми подання інформації.
У будь-якому випадку виникає завдання транспортування інформації з комп'ютерноїмережі. Вирішенню цього комплексу проблем останнім часом приділяється всебільшу увагу. Зокрема, знаменитий Національний центрсуперкомп'ютерних додатків США (NCSA) спільно з компанією Silicon
Graphics веде роботи за програмою "суперкомп'ютерного оточення майбутнього".
У цьому проекті передбачається інтегрувати можливості суперкомп'ютерів
POWER CHALLENGE і засобів візуалізації компанії SGI із засобамиінформаційної супермагістралі. p>
Суперкомп'ютери в Росії p>
суперЕОМ є національним надбанням, і їх розробка і виробництвобезсумнівно повинні бути одним з пріоритетів державної технічноїполітики країн, що є світовими лідерами у галузі науки і техніки.
Блискучим прикладом глибокого розуміння всього комплексу відповіднихпроблем є стаття відомого нобелівського лауреата в галузі фізики
К. Вільсона. Опублікована понад десять років тому, вона і заразстановить інтерес для російського читача.
Практично єдиними країнами, які розробляють і виробляютьсуперЕОМ у великих масштабах, є США та Японія. Свої суперкомп'ютерибули створені в Індії та Китаї. Більшість розвинутих країн, у тому числі і ряддержав Східної Європи, вважають за краще використовувати суперкомп'ютери,вироблені в США і Японії.
Положення з розробками суперкомп'ютерів в Росії, очевидно, залишаєсьогодні бажати кращого. Роботи над вітчизняними суперЕОМ в останні рокивелися одразу в декількох організаціях. Під управлінням академіка
В. А. Мельникова була розроблена векторна суперЕОМ "Електроніка CC-100" зархітектурою, що нагадує Сгау-1. У ІТМіВТ РАН проводяться роботи зстворення суперкомп'ютерів "Ельбрус-3". Цей комп'ютер може мати до 16процесорів з тактовою частотою 10 нс. За оцінками розробників, на тестах
LINPACK при N = 100 швидкодію процесора складе 200 MFL0PS, при N =
1000 - 370 MFLOPS. Інша розробка, виконана в цьому інституті, -
Модульний конвеєрного процесора (МКП), в якому використовується оригінальнавекторна архітектура, однак за швидкодією він, ймовірно, повиненпоступатися "Ельбрус-3".
Іншим центром робіт над вітчизняними суперкомп'ютерами євідомий своїми роботами з ЄС ЕОМ НІЦЕВТ. Там був виконаний ряд цікавихрозробок - різні моделі векторних суперЕОМ ЄС 1191 на ECL-технологіїі йдуть роботи над новим суперкомп'ютером "АМУР", в якому використовується
КМОП-технологія. Ряд організацій на чолі з ІПМ РАН ведуть роботи зстворення MPP-комп'ютера МВС-100, в процесорних елементах якоговикористовуються мікропроцесори i860XP, а для організації комунікаційзастосовуються трансп'ютерів Т805. Хоча в наявності є дослідні зразкидеяких з вищезазначених вітчизняних комп'ютерів, ні одна з нихпромислово не виробляється.
Положення з оснащеністю російських організацій суперкомп'ютерами,мабуть, ще гірше. Ми обмежимося інформацією про стан справ іперспективи на майбутнє в дослідних інститутах і вузах, які,як було сказано вище, є одними з основних потенційнихкористувачів суперЕОМ.
У більшості інсталяцій суперкомп'ютерів використовується ймовірно, продукціяфірми Convex. У кількох організаціях експлуатуються старі моделімінісуперкомпьютеров серій Clxx, С2хх, які за продуктивністю вжепоступаються сучасним робочих станцій. У Санкт-Петербурзі в системі
Госкомвуза інстальована мінісуперЕВМ Convex серії С3800, в Москві в ІПМ
РАН недавно встановлена суперкомп'ютерних система SPP 1000/CD. Єплани інсталяції та інших суперкомп'ютерів (наприклад, SGI POWER CHALLENGE)в ряді інститутів РАН.
Тим часом відсутність можливостей застосування суперЕОМ стримує розвитоквітчизняної науки і робить принципово неможливим успішний розвитокцілих напрямків наукових досліджень. Придбання одногодвух, навіть дужепотужних, суперкомп'ютерів не допоможе вирішити дану проблему. І справа нетільки у вартості їх придбання та витрат на підтримкупрацездатності (включаючи електроживлення та охолодження). Існує щецілий ряд причин (наприклад, доставка інформації з комп'ютерної мережі),перешкоджають ефективному використанню суперЕОМ.
Більш доцільним представляється підхід, запропонований російським Фондомфундаментальних досліджень. Розроблена "Програма створення комплекснихмереж зв'язку і баз даних фундаментальної науки і освіти "на 1995-1998рр.. передбачає організацію цілого ряду регіональних і предметно -орієнтованих суперкомп'ютерних центрів. У таких центрах можуть бутиінстальовані, наприклад, відносно дешеві мінісуперкомпьютери, що маютькраще ставлення вартість/продуктивність. Власне кажучи,достатньо лише звернутися до списку ТОР500, щоб виявити явнутенденцію до витіснення великих (і дорогих) суперЕОМ відносно недорогимисуперкомп'ютерами, яким уже зараз під силу рішення левової часткипотенційних завдань.
Що стосується вітчизняних суперЕОМ, то без необхідної державноїпідтримки проектів з їхньої розробки не доводиться розраховувати на створенняпромислових зразків в найближчі 1-2 роки, і навряд чи такі комп'ютеризможуть скласти основу парку суперЕОМ в створюються сьогодні вітчизнянихсуперкомп'ютерних центрах. p>
Суперкомп'ютери - як це?
Ну що, схоже суперкомп'ютери і справді мають право на існування.
Тепер потрібно прояснити, як видно, основною крутяться на язиціпитання - чому вони вважають так швидко? Варіантів відповіді може бутидекілька, серед яких два мають явну перевагу: розвиток елементноїбази і використання нових рішень в архітектурі комп'ютерів.
Спробуємо розібратися, який з факторів є вирішальним у досягненнісучасних фантастичних показників продуктивності. Для дозволуцього питання звернемося до історичних фактів. Відомо, що на комп'ютері
EDSAC (1949 р.), що мав час такту 2мкс, можна було виконати 2 * nарифметичних операцій за 18 * n мс, тобто в середньому 100 арифметичнихоперацій в секунду. Порівняємо з сучасним суперкомп'ютером CRAY C90: частакту приблизно 4нс, а пікова продуктивність близько 1 мільярдаарифметичних операцій у секунду.
Що ж виходить? Продуктивність комп'ютерів за цей період зросла вприблизно в десять мільйонів разів. Зменшення часу такту єпрямим способом збільшенням продуктивності, однак ця складова (з
2мкс до 4нс) у загальному обсязі дає внесок лише в 500 разів. Звідки ж узяввісьінше? Відповідь очевидна - використання нових рішень в архітектурікомп'ютерів, серед яких основне місце займає принцип паралельноїобробки даних.
Даний принцип, втілюючи ідею одночасного виконання кількохдій, має два різновиди: конвеєрного і власнепаралельність. Обидва види паралельної обробки інтуїтивно зрозумілі, томузробимо лише невеликі пояснення. p>
Паралельна обробка. Якщо якийсь пристрій виконує одну операцію заодиницю часу, то тисячі операцій воно виконає за тисячу одиниць. Якщоприпустити, що є п'ять таких же незалежних пристроїв, здатнихпрацювати одночасно, то ту ж тисячі операцій система з п'яти пристроївможе виконати вже не за тисячу, а за двісті одиниць часу. Аналогічносистема з N пристроїв ту ж роботу виконає за 1000/N одиниць часу.
Подібні аналогії можна знайти і в житті: якщо один солдат скопає городза 10 годин, то рота солдатів з п'ятдесяти людина з такими жздібностями, працюючи одночасно, впораються з тією ж роботою за 12 хвилин
- Принцип паралельності в дії! P>
Конвеєрна обробка. Що необхідно для складання двох дійсних чисел,представлених у формі з плаваючою комою? Ціле безліч дрібних операційтаких, як порівняння порядків, вирівнювання порядків, складання мантиси,нормалізація і т.п. Процесори перших комп'ютерів виконували всі ці
"мікрооперації" для кожної пари аргументів послідовно одна за одною дотих пір, поки не доходили до остаточного результату, і лише після цьогопереходили до обробки наступної пари доданків.
Ідея конвеєрної обробки полягає у виділенні окремих етапіввиконання спільної операції, причому кожен етап, виконавши свою роботу,передавав би результат наступного, одночасно беручи нову порціювхідних даних. Отримуємо очевидний виграш у швидкості обробки за рахуноксуміщення перш рознесені в часі операцій. Припустимо, що воперації можна виділити п'ять мікрооперацій, кожна з яких виконуєтьсяза одну одиницю часу. Якщо є одне неподільне послідовнепристрій, то 100 пар аргументів воно обробить за 500 одиниць. Якщо кожнумікрооперацій виділити в окремий етап (або інакше говорять - ступінь)конвеєрного пристрої, то на п'ятому одиниці часу на різній стадіїобробки такого пристрою будуть знаходиться перші п'ять пар аргументів, авесь набір зі ста пар буде оброблений за 5 +99 = 104 одиниці часу --прискорення в порівнянні з послідовним пристроєм майже в п'ять разів (зчисла ступенів конвеєра).
Здавалося б конвеєрну обробку можна з успіхом замінити звичайнимпаралелізмом, для чого продублювати основний пристрій стільки разів,скільки ступенів конвеєра передбачається виділити. Справді, п'ятьпристроїв попереднього прикладу оброблять 100 пар аргументів за 100 одиницьчасу, що швидше часу роботи конвеєрного пристрою! У чому ж справа?
Відповідь проста, збільшивши в п'ять разів кількість пристроїв, ми значнозбільшуємо як обсяг апаратури, так і її вартість. Уявіть собі, щона автозаводі вирішили прибрати конвеєр, зберігши темпи випуску автомобілів.
Якщо раніше на конвеєрі одночасно перебувала тисячі автомобілів, тодіючи за аналогією з попереднім прикладом треба набрати тисячі бригад,кожна з яких (1) в змозі повністю зібрати автомобіль від початку докінця, виконавши сотні різного роду операцій, і (2) зробити це за те жчас, що машина перш перебувала на конвеєрі. Сьогодні паралелізмом вархітектурі комп'ютерів уже мало кого здивуєш. Всі сучаснімікропроцесори, будь то Pentium II або PA-8200, MIPS R10000 або Power2
SuperChip використовують той чи інший вид паралельної обробки. Напрезентаціях нових чіпів і в прес-релізах корпорацій це підноситься якостаннє слово техніки та передовий край науки, і це дійсно так,якщо розглядати реалізацію цих принципів саме в рамках одногокристала.
Разом з тим, самі ці ідеї з'явилися дуже давно. Спочатку вонивпроваджувалися в самих передових, а тому одиничних, комп'ютерах свогочасу. Потім після належної відпрацювання технології і здешевленнявиробництва вони спускалися в комп'ютери середнього класу, і, нарешті,сьогодні все це в повному обсязі втілюється в робочих станціях іперсональних комп'ютерах. p>
Все нове - це добре забуте старе.
Для того щоб переконатися, що всі основні нововведення в архітектурісучасних процесорів насправді використовувалися ще з часів, колині мікропроцесорів, ні поняття суперкомп'ютерів ще не було, здійснимомаленький екскурс в історію, почавши практично з моменту народження першого
ЕОМ.
Всі самі перші комп'ютери, наприклад, EDSAC, EDVAC, UNIVAC, спочаткузчитувати дані послідовно біт за бітом з пам'яті, а потім їханалогічно обробляли в арифметичному пристрої.
1953 Першим комерційно доступним комп'ютером, що використовують розрядно -паралельну пам'ять (на CRT) і розрядно-паралельну арифметику, ставкомп'ютер IBM 701. До слова буде сказано, найбільшу популярність в тойчас отримала модель IBM 704 (1955 р.), проданої в кількості 150примірників (!), в якій, крім згаданих особливостей, була впершезастосована пам'ять на феритових сердечниках і апаратне арифметичнепристрій з плаваючою точкою.
1958р. Процесори перших комп'ютерів самі керували вводом/виводом. Однакшвидкість роботи найшвидшого зовнішнього пристрою, а на ті часи цемагнітна стрічка, була в 1000 разів менше швидкості процесора, тому підчас операцій введення/виводу процесор фактично простоював. У 1958р. докомп'ютера IBM 704 приєднали 6 незалежних процесорів введення/виводу,які після отримання команд могли працювати паралельно з основнимпроцесором, а сам комп'ютер перейменували на IBM 709. Дана модельвийшла напрочуд вдалою, тому що разом з модифікаціями було проданоблизько 400 екземплярів, причому останній був вимкнений у 1975 році - 20 роківіснування!
1961р. Створюється комп'ютер IBM STRETCH, що має дві принципово важливіособливості: випереджаюче перегляд вперед для вибірки команд і розшаруванняпам'яті на два банки для узгодження низькій швидкості вибірки з пам'яті ішвидкості виконання операцій.
1963р. У Манчестерському університеті розроблено комп'ютер ATLAS,використовує конвеєрний принцип виконання команд. Виконання командрозбито на 4 стадії: вибірка команди, обчислення адреси операнда, вибіркаоперанда і виконання операції, що дозволили зменшити час виконаннякоманд у середньому з 6 мкс до 1,6 мкс. Справедливості ради треба зазначити, щоданий комп'ютер взагалі залишив помітний слід в історії розвиткуобчислювальної техніки: крім сказаного, в ньому вперше була використанамультипрограмному операційна система, заснована на використаннівіртуальної пам'яті і системи переривань.
1964р. Фірма Control Data Corporation (CDC) за безпосередньої участіодного з її засновників, Сеймура Р. Крея (Seymour R. Cray) випускаєкомп'ютер CDC-6600 - перший комп'ютер, в якому використовувалося кільканезалежних функціональних пристроїв. Для порівняння з сьогоднішнім днемнаведемо деякі параметри комп'ютера: час такту 100нс,продуктивність 2-3 млн. операцій в секунду, оперативна пам'ять розбитана 32 банку за 4096 60-ти розрядних слів, цикл пам'яті 1мкс, 10 незалежнихфункціональних пристроїв. Машина мала величезний успіх на науковому ринку,активно витісняючи машини фірми IBM. p>
1969р. CDC випускає комп'ютер CDC-7600 з вісьмома незалежними конвеєрнимифункціональними пристроями - поєднання паралельної і конвеєрноїобробки. p>
Матричні суперкомп'ютери
У 1967 р. група Слотніка, об'єднана в Центр передових обчислювальнихтехнологій (Center of Advanced Computation) при Іллінойському університеті,приступила до практичної реалізації проекту векторної суперЕОМ з матричноїструктурою ILLIAC IV. Роботи фінансувалися Міністерством оборони США, авиготовлення машини взяла на себе фірма Burroughs Corp. Технічна сторонапроекти досі вражає своєю масштабністю: система повинна буласкладатися з чотирьох квадрантів, кожен з яких містив у собі 64процесорних елемента (ПЕ) і 64 модуля пам'яті, об'єднаних комутатором набазі мережі типу Гіперкуб. Всі ПЕ квадранта обробляють векторнуінструкцію, яку їм направляє процесор команд, причому кожен виконуєодну елементарну операцію вектора, дані для якої зберігаються впов'язане з цим ПЕ модулі пам'яті. Таким чином, один квадрант ILLIAC IVздатний одночасно обробити 64 елемента вектора, а вся система зчотирьох квадрантів - 256 елементів.
У 1972 р., після подолання значних проблем, пов'язаних з практичноюреалізацією проекту на апаратному та програмному рівнях, перша система
ILLIAC IV була встановлена в дослідницькому центрі NASA в Еймс.
Результати її експлуатації в цій організації отримали неоднозначнуоцінку. З одного боку, використання суперкомп'ютера дозволило вирішити ряднайскладніших завдань аеродинаміки, з якими не могли впоратися інші ЕОМ.
Навіть сама швидкісна ЕОМ для наукових досліджень того часу - Control
Data CDC 7600, яку, до речі, проектував "патріарх суперЕОМ"
Сеймур Крей (S. Cray), могла забезпечити продуктивність не більше 5 млн.операцій з плаваючою крапкою в секунду (MFLOPS), тоді як ILLIAC IVдемонструвала середню продуктивність приблизно в 20 MFLOPS.
З іншого боку, ILLIAC IV так і не була доведена до повної конфігураціїз 256 ПЕ; практично розробники обмежилися лише одним квадранта.
Причинами з'явилися не стільки технічні складності у нарощуванні числапроцесорних елементів системи, скільки проблеми, пов'язані зпрограмуванням обміну даними між процесорними елементами черезкомутатор модулів пам'яті. Всі спроби вирішити це завдання за допомогоюсистемного програмного забезпечення зазнали невдачі, в результаті кожнедодаток вимагало ручного програмування передач комутатора, що іпородило незадовільні відгуки користувачів.
Якби розробникам ILLIAC IV вдалося подолати проблемипрограмування матриці процесорних елементів, то, ймовірно, розвитокобчислювальної техніки пішло б зовсім іншим шляхом і сьогоднідомінували б комп'ютери з матричної архітектурою.
Проте ні в 60-х роках, ні пізніше задовільний і універсальнерішення двох таких принципових проблем, як програмуванняпаралельної роботи декількох сотень процесорів і при цьому забезпеченнямінімуму витрат рахункового часу на обмін даними між ними, так і не булознайдено. Висунувши піонерську завдання створення комп'ютера надвисокоїпродуктивності, розробники ILLIAC IV першими ж виявилися не взмозі відповісти на ці два принципових питання. Потрібно було щеприблизно 15 років зусиль різних фірм з реалізації суперЕОМ з матричноїархітектурою, щоб поставити остаточний діагноз: комп'ютери даноготипу не в змозі задовольнити широке коло користувачів і мають дужеобмежену область застосування, часто в рамках одного або декількох видівзадач (наприклад, в системах обробки зображень, як ЕОМ STARAN фірми
Goodyear Aerospace). "Лебединою піснею" матричних суперЕОМ став комп'ютер
BSP виробництва Burroughs, який проектувався як альтернативавекторно-конвеєрним суперЕОМ фірми Cray Research, але так і не побачив світз-за очевидної неконкурентоспроможності системи. Звичайно, було б великоюпомилкою стверджувати, що розвиток суперЕОМ з матричної архітектурою не далоніяких позитивних результатів. По-перше, вдалося довести можливістьпрактичної реалізації паралельної надшвидкісний обробки. По-друге,на хвилі інтересу до матричних структур була сформульована доситьструнка теоретична база для побудови комутаційних мереж,об'єднують безліч процесорних елементів. По-третє, у прикладнійматематики сформувався самостійний напрямок по паралельнихобчислень. З часом освоєння коштів надшвидкісний обробки данихрозрив між вдосконаленням методів векторизації програм, тобтоавтоматичного перетворення в процесі компіляції послідовнихмовних конструкцій у векторну форму, і надзвичайною складністюпрограмування комутації та розподілу даних між процесорнимиелементами привів до досить жорсткої реакції користувачів стосовноматричних суперЕОМ - широкому колу програмістів була потрібна більш простаі "прозора" архітектура векторної обробки з можливістю використаннястандартних мов високого рівня типу FORTRAN. Рішення було знайдено вНаприкінці 60-х років, коли фірма Control Data, з якої в той часспівпрацював Крей, представила машину STAR-100, засновану на векторно -конвеєрному принципі обробки даних. Відмінність векторно-конвеєрноїтехнології від архітектури матричних ЕОМ полягає в тому, що замістьбезлічі процесорних елементів, які виконують одну й ту саму команду надрізними елементами вектора, застосовується єдиний конвеєр операцій,принцип дії якого повністю відповідає класичному конвеєруавтомобільних заводів Форда. Якщо в матричному комп'ютері процесорніелементи можна представити як групу робітників-універсалів, кожен зяких збирає автомобіль від шасі до оббивки салону, то векторно -конвеєрна обробка асоціюється з бригадою вузьких фахівців, один зяких вміє прикручувати колеса, інший - встановлювати двигун, третій
- Монтувати корпус, і т.д. Подібно до автомобільного конвеєру Форда,векторно-конвеєрна обробка здатна забезпечити високий темп виходуготової продукції - результатів виконуваних операцій, якщо кожен з
"робітників" (тобто апаратних блоків конвеєра операцій) виконує дорученуйому фазу команди з максимальною швидкістю. Навіть така архаїчна посучасними поняттями суперЕОМ, як STAR-100, показала граничнупродуктивність на рівні 50 MFLOPS, що недоступне для більшостісучасних мейнфреймів. При цьому істотно, що векторно-конвеєрнісуперЕОМ значно дешевше своїх матричних "родичів". Наприклад,розробка та виробництво ILLIAC IV обійшлися в 40 млн. дол при витратахна експлуатацію близько 2 млн. доларів на рік, тоді як ринкова вартістьперший суперкомп'ютерів фірм CRAY та Control Data знаходилася в межах 10 -
15 млн. дол, залежно від обсягу пам'яті, складу периферійнихпристроїв та інших особливостей конфігурації системи.
Другою суттєвою особливістю векторно-конвеєрної архітектури єте, що конвеєр операцій має всього один вхід, за яким надходятьоперанди, і один вихід результату, тоді як у матричних системахіснує безліч входів з даних в процесорні елементи і безлічвиходів з них. Іншими словами, в комп'ютерах з конвеєрної обробкоюдані всіх паралельно виконуваних операцій вибираються і записуються вєдину пам'ять, у зв'язку з чим відпадає необхідність у комутаторіпроцесорних елементів, що став каменем спотикання при проектуванніматричних суперЕОМ.
У 1972 році С. Крей залишає CDC і засновує свою компанію Cray Research,яка в 1976р. випускає перший векторно-конвеєрний комп'ютер CRAY-1:час такту 12.5нс, 12 конвеєрних функціональних пристроїв, піковапродуктивність 160 мільйонів операцій у секунду, оперативна пам'ять до
1Мслова (слово - 64 розряду), цикл пам'яті 50НС. Головним нововведенням євведення векторних команд, що працюють з цілими масивами незалежних данихі що дозволяють ефективно використовувати конвеєрні функціональніпристрою.
На цьому же цей екскурс в історію можна сміливо закінчити, оскільки рольпаралелізму і його вплив на розвиток архітектури комп'ютерів ужеочевидна. p>
Архітектура сучасних суперЕОМ p>
Розглянемо типові архітектури суперЕОМ, широко поширених сьогодні,і наведемо класичну систематику Флінна.
Відповідно до неї, всі комп'ютери діляться на чотири класи в залежностівід числа потоків команд і даних. До першого класу (послідовнікомп'ютери фон Неймана) належать звичайні скалярні однопроцесорнісистеми: одиночний потік команд - одиночний потік даних (SISD).
Персональний комп'ютер має архітектуру SISD, причому не важливо,чи використовуються в ПК конвеєри для прискорення виконання операцій.
Другий клас характеризується наявністю одиночного потоку команд, алемножинного nomoka даних (SIMD). До цього архітектурного класуналежать однопроцесорні векторні або, точніше кажучи, векторно -конвеєрні суперкомп'ютери, наприклад, Cray-1. У цьому випадку ми маємо справуз одним потоком (векторних) команд, а потоків даних - багато: коженелемент вектора входить в окремий потік даних. До цього ж класуобчислювальних систем відносяться матричні процесори, наприклад, знаменитийсвого часу ILLIAC-IV. Вони також мають векторні команди і реалізуютьвекторну обробку, але не за допомогою конвеєрів, як у векторнихсуперкомп'ютерах, а за допомогою матриць процесорів.
До третього класу - MIMD - відносяться системи, що мають множинний потіккоманд і множинний потік даних. До нього належать не тількибагатопроцесорні векторні суперЕОМ, а й взагалі все багатопроцесорнікомп'ютери. Переважна більшість сучасних суперЕОМ мають архітектуру
MIMD.
Четвертий клас у систематиці Флінна, MISD, не представляє практичногоінтересу, принаймні для аналізованих нами комп'ютерів. Останнімчас в літературі часто використовується також термін SPMD (одна програма --множинні дані). Він відноситься не до архітектури комп'ютерів, а домоделі розпаралелювання програм і не є розширенням систематики
Флінна. SPMD звичайно відноситься до MPP (тобто MIMD) - систем і означає, щодекілька копій однієї програми паралельно виконуються в різнихпроцесорних вузлах з різними даними.
Цікаво також згадати про принципово іншому напрямку у розвиткукомп'ютерних архітектур - машинах потоків даних. У середині 80-х роківбагато дослідників вважали, що майбутнє високопродуктивних ЕОМпов'язано саме з комп'ютерами, керованими потоками даних, на відміну відвсіх розглянутих нами класів обчислювальних систем, керованих потокамикоманд. У машинах потоків даних можуть одночасно виконуватися відразу багатокоманд, для яких готові операнди. Хоча ЕОМ з такою архітектурою сьогодніпромислово не випускаються, деякі елементи цього підходу знайшли своєвідображення в сучасних суперскалярні мікропроцесори, що мають багатопаралельно працюючих функціональних пристроїв і буфер команд, які очікуютьготовності операндів. Як приклади таких мікропроцесорів можнапривести HP РА-8000 і Intel Pentium Pro.
Відповідно до класифікації Флінна, розгляд архітектури суперЕОМварто було б почати з класу SISD. Проте всі векторно-конвеєрні (внадалі - просто векторні) суперЕОМ мають архітектуру "не менше" SIMD.
Що стосується суперкомп'ютерних серверів, що використовують сучаснівисокопродуктивні мікропроцесори, таких як SGI POWER CHALLENGE набазі R8000 або DEC AlphaServer 8200/8400 на базі Alpha 21164, то їхмінімальні конфігурації бувають однопроцесорних. Однак, якщо нерозглядати власне архітектуру цих мікропроцесорів, то всеособливості архітектури власне серверів слід аналізувати в
"природною" мультипроцесорної конфігурації. Тому почнемо аналізсуперкомп'ютерних архітектур відразу з класу SIMD.
Векторні суперкомп'ютери [SIMD]
Серед сучасних суперЕОМ цю архітектуру мають однопроцесорні векторнісуперкомп'ютери. Практично всі вони випускаються також у мультипроцесорнихконфігураціях, що відносяться до класу MIMD. Однак багато особливостейархітектури векторних суперЕОМ