ПЕРЕЛІК ДИСЦИПЛІН:
  • Адміністративне право
  • Арбітражний процес
  • Архітектура
  • Астрологія
  • Астрономія
  • Банківська справа
  • Безпека життєдіяльності
  • Біографії
  • Біологія
  • Біологія і хімія
  • Ботаніка та сільське гос-во
  • Бухгалтерський облік і аудит
  • Валютні відносини
  • Ветеринарія
  • Військова кафедра
  • Географія
  • Геодезія
  • Геологія
  • Етика
  • Держава і право
  • Цивільне право і процес
  • Діловодство
  • Гроші та кредит
  • Природничі науки
  • Журналістика
  • Екологія
  • Видавнича справа та поліграфія
  • Інвестиції
  • Іноземна мова
  • Інформатика
  • Інформатика, програмування
  • Юрист по наследству
  • Історичні особистості
  • Історія
  • Історія техніки
  • Кибернетика
  • Комунікації і зв'язок
  • Комп'ютерні науки
  • Косметологія
  • Короткий зміст творів
  • Криміналістика
  • Кримінологія
  • Криптология
  • Кулінарія
  • Культура і мистецтво
  • Культурологія
  • Російська література
  • Література і російська мова
  • Логіка
  • Логістика
  • Маркетинг
  • Математика
  • Медицина, здоров'я
  • Медичні науки
  • Міжнародне публічне право
  • Міжнародне приватне право
  • Міжнародні відносини
  • Менеджмент
  • Металургія
  • Москвоведение
  • Мовознавство
  • Музика
  • Муніципальне право
  • Податки, оподаткування
  •  
    Бесплатные рефераты
     

     

     

     

     

     

         
     
    Суперкомп'ютери
         

     

    Інформатика, програмування

    МІНІСТЕРСТВО ОСВІТИ РФ

    ЮЖНО-РОСІЙСЬКИЙ ДЕРЖАВНИЙ ТЕХНІЧНИЙ

    УНІВЕРСИТЕТ

    (Новочеркаський політехнічний інститут)

    Факультет: Інформаційних Технологій і Управління

    Кафедра: автоматики і телемеханіки

    Спеціальність: Управління та інформатика в технічних системах

    РЕФЕРАТ

    з інформатики < p> На тему: Суперкомп'ютери

    Виконав студент I - 1а Каширін В. В.

    П.І.Б.

    Керівник асистент Малашенко Л.І.

    Посада, звання П.І.Б.

    Консультант асистент Малашенко Л.І.

    Посада, звання П.І.Б.

    До захисту Захист прийнята з оцінкою

    «______» ______________2000г. ____________________________

    ___________________________ «_____»________________ 2000р.

    Підпис ____________________________

    Підпис

    Новочеркаськ 2000

    ЗМІСТ

    ВСТУП 3
    1 ОСНОВНІ ВИДИ АРХІТЕКТУРИ 4

    1.1 Архітектура SMP 4

    1.2 Архітектура MPP 4

    2 Суперкомп'ютер КОМПАНІЇ nCube 4

    2.1 Основні принципи архітектури 5 a) Розподілена пам'ять 5 б) міжпроцесорних мережа 5 в) Високий рівень інтеграції 6

    2.2 Суперкомп'ютер nCube 2 7

    2.3 Архітектура процесора nCube 8 а) Система введення/виводу nCube 2 9

    2.4 Програмне забезпечення 10

    2.5 Надійність системи nCube 2 10
    3 МЕРЕЖА ЯК Суперкомп'ютер 11

    3.1 Паралельні програми - головне гальмо 11

    3.2 MPI 11

    3.3 Реалізації MPI 12

    3.4 Засоби програмування високого рівня 13

    3.5 Спроба прогнозу 14
    4 ПІМЕРИ ВИКОРИСТАННЯ СУПЕРКОМПЬЮЮТЕРОВ 14

    4.1 Моделювання побудова білка 14

    4.2 Віртуальна башта 14

    використаної літератури 16

    ВСТУП

    З моменту появи перших комп'ютерів однією з основних проблем,що стоять перед розробниками, була продуктивність обчислювальноїсистеми. За час розвитку комп'ютерної індустрії продуктивністьпроцесора стрімко зростала, однак поява усе більш витонченогопрограмного забезпечення, зростання числа користувачів і розширення сферипрограми обчислювальних систем висувають нові вимоги до потужностівикористовуваної техніки, що й призвело до появи суперкомп'ютерів. Що жтаке суперкомп'ютери, і навіщо вони потрібні?

    У принципі, суперкомп'ютер це звичайна обчислювальна система,що дозволяє проводити складні розрахунки за більш короткі проміжкичасу. Про що власне і говорить приставка «Супер» (Super в перекладі занглійської означає: понад, над). Будь-яка комп'ютерна система складається зтрьох основних компонентів - центрального процесора, тобто рахунковогопристрої, блоку пам'яті та вторинної системи зберігання інформації (доНаприклад, у вигляді дисків або стрічок). Ключове значення мають не тількитехнічні параметри кожного з цих елементів, але і пропускнаспроможність каналів, що зв'язують їх один з одним і з терміналамиспоживачів. Одна із заповідей «Крей Рисерч» зазначено: «Швидкодія всійсистеми не перевищує швидкості самої медленнодействующей її частини ». Важливимпоказником продуктивності комп'ютера є ступінь йогошвидкодії. Вона вимірюється так званими флопсамі - від англійськогоскорочення, що позначає кількість операцій з числами, представленими вформі з плаваючою комою в секунду. Тобто за основу береться підрахунок --скільки найбільш складних розрахунків машина може виконати за одну мить.

    А навіщо взагалі потрібні суперкомп'ютери? На це запитання дає відповідьпредставник компанії «Крей Рисерч» Віто Бонджорно: розсуванням кордонівлюдського знання завжди спиралося на два наріжних камені, які неможуть існувати одне без одного, - теорію та досвід. Однак тепер вченістикаються з тим, що багато випробувань стали практично неможливими - вдеяких випадках через свої масштаби, в інших - дорожнечі абонебезпеки для здоров'я і життя людей. Ось тут і приходять на допомогу потужнікомп'ютери. Дозволяючи експериментувати з електронними моделями реальноїНасправді, вони стають «третього опорою» сучасної науки івиробництва.

    Минув час, коли творці суперкомп'ютерів прагнули забезпечитимаксимальну продуктивність будь-якою ціною. Спеціальні процесори,дорога надшвидка пам'ять, нестандартне периферійне устаткування
    - Все це обходилося замовникам у круглу суму. Набувалисуперкомп'ютери якого підприємства ВПК, або великі університети. І ті, іінші робили це, як правило, за державний рахунок. Закінчення
    "холодної війни" і пішло за ним скорочення асигнувань на військовіі околовоенние потреби завдали серйозного удару по виробникахсуперкомп'ютерів. Більшість з них були поглинені виготовлювачами меншепродуктивною, але більш доступною і ходової обчислювальної техніки.
    Втім, у цих злиттів були й технологічні передумови - швидкодіясерійно випускаються мікропроцесорів постійно зростала, і виробникисуперкомп'ютерів швидко переорієнтувалися на них, що дозволилоістотно скоротити загальну вартість розробки. Основний акцент ставробитися на збільшення кількості процесорів і підвищення ступеня паралелізмупрограм.

    1 ОСНОВНІ ВИДИ АРХІТЕКТУРИ

    Відомо, що сьогодні існують дві основні архітектури паралельнихкомп'ютерів: симетричні мультипроцесорні системи з загальною пам'яттю (SMP)і багатопроцесорних системи з розподіленою пам'яттю (MPP).

    1.1 Архітектура SMP

    Основна перевага SMP - відносна простота програмування. Уситуації, коли всі процесори мають однаково швидкий доступ до загальноїпам'яті, питання про те, який із процесорів які обчислення будевиконувати, не настільки принциповий, і значна частина обчислювальнихалгоритмів, розроблених для послідовних комп'ютерів, може бутиприскорена за допомогою распараллелівающіх і векторізірующіх трансляторів. SMP -комп'ютери - це найбільш поширені зараз паралельні обчислювачі,а 2 -, 4-х процесорні ПК на основі Pentium і Pentium Pro стали вжемасовим товаром. Проте загальне число процесорів в SMP-системах, якправило, не перевищує 16, а їх подальше збільшення не дає виграшу черезконфліктів при зверненні до пам'яті. Застосування технологій типу UPA,заснованої на комутації пакетів замість загальної шини та локальної кеш-пам'ятівеликого об'єму, здатне частково вирішити проблему, піднявши числопроцесорів до 32.

    1.2 Архітектура MPP

    Альтернатива SMP - архітектура MPP. Кожен процесор має доступ лишедо своєї локальної пам'яті, а якщо програмі треба дізнатися значеннязмінної, розташованої в пам'яті іншого процесора, то задіюєтьсямеханізм передачі повідомлень. Процесор, у пам'яті якого знаходяться потрібнідані, посилає повідомлення тому процесору, якому вони потрібні, аостанній приймає його. Цей підхід дозволяє створювати комп'ютери,включають в себе тисячі процесорів. На ньому засновані всі машини, що маютьпродуктивність в сотні мільярдів операцій у секунду.

    Познайомимося ближче з цією архітектурою і одним з представниківцієї архітектури, суперкомп'ютером nCube.

    2 Суперкомп'ютер КОМПАНІЇ nCube

    Одним з піонерів у створенні MPP-систем стала заснована в 1983 роцікомпанія nCube. У 1985 році з'явився перший її MPP-комп'ютер, nCube 1.
    Система nCube 1, в основі якої, як і в основі всіх наступнихпоколінь комп'ютерів nCube, лежить гіперкубіческая топологіяміжпроцесорних з'єднань і високий рівень інтеграції на базі технології
    VLSI, показала рекордні результати за абсолютною продуктивності і вспіввідношенні ціна/продуктивність для наукових обчислень.

    У 1989 році компанія nCube випустила сімейство суперкомп'ютерів nCube
    2. Великі обчислювальні можливості, гнучка архітектура і потужнеспеціалізоване програмне забезпечення дозволяють застосовувати системиnCube 2 в широкому діапазоні областей - від складних наукових задач доуправління інформацією в бізнесі.

    Сімейство nCube 2 являє собою масштабовану серію систем,продуктивність яких може досягати 34 GigaFlops. Коженсуперкомп'ютер цієї серії містить набір процесорів nCube, з'єднаних вгіперкубіческую мережу. Найбільшу систему становлять 8192 процесора, і їїпотужність більш ніж в 1000 разів перевищує потужність найменшою - з 8процесорами. Можливості пам'яті і системи введення/виводу зростають разом ззростанням процесорної потужності.

    Наступна мета компанії nCube - розробка нового сімейства Mpp -систем, суперкомп'ютерів nCube 3. Нове покоління суперкомп'ютерів nCube,дотримуючись принципів високої інтегровності і масштабованості, стане першимпромислово реалізованої платформою з продуктивністю до декількох
    TFlops, стовідсотково сумісною з попередніми поколіннями систем nCube.

    2.1 Основні принципи архітектури a) Розподілена пам'ять

    У суперкомп'ютерах nCube використовується архітектура розподіленоїпам'яті, що дозволяє оптимізувати доступ до оперативної пам'яті, імовірно,найбільш критичному ресурсу обчислювальної системи.

    Традиційні архітектури з розділеною пам'яттю зручні для систем зневеликим числом, проте, вони погано масштабуються в мірудодати процесорів і пам'яті. Коли в системі з поділом пам'ятізбільшується число процесорів, зростає конкуренція у використанніобмеженою пропускної здатності системної шини, що знижуєпродуктивність з'єднання процесор-пам'ять. Крім того, додаванняпроцесорів в таку систему вимагає збільшення кількості логіки дляуправління пам'яттю, знижуючи тим самим продуктивність системи ізбільшуючи її ціну.

    Ці недоліки відсутні в системах з розподіленою пам'яттю. Утакій системі кожен процесор має свою власну локальну пам'ять.
    Потенційні вузькі місця, пов'язані з шиною процесор-пам'ять інеобхідністю розробляти системи керування кешем, повністювиключаються. З додаванням процесорів додається пам'ять, пропускнаспроможність з'єднання процесор-пам'ять масштабується разом зобчислювальною потужністю. б) міжпроцесорних мережа

    Топологія міжпроцесорних з'єднань, що забезпечує масштабуваннядо великої кількості процесорів без зниження продуктивності комунікаційабо збільшення часу очікування, є обов'язковою для MPP-систем.
    Суперкомп'ютери nCube використовують мережеву топологію гіперкуба, якавідповідає цим вимогам. З'єднання між процесорами nCube-системиутворюють багатовимірний куб, званий гіперкуба. У міру додаванняпроцесорів збільшується розмірність гіперкуба. З'єднання двох гіперкубаоднакової розмірності утворює Гіперкуб наступного розмірності. N-мірнийГіперкуб містить 2 ? n процесорів. Двомірний Гіперкуб - це квадрат.
    Тривимірний Гіперкуб утворює звичайний куб, а чотиривимірний Гіперкубявляє собою куб у кубі. Для сімейства суперкомп'ютерів nCube 2Гіперкуб максимальної розмірності 13 містить 8192 процесора. У системіnCube 3 число процесорів може досягати 65536 (16-мірний Гіперкуб).

    Ефективність мережевої топології вимірюється, зокрема, числом кроківдля передачі даних між найбільш віддаленими процесорами в системі. Длягіперкуба максимальна відстань (число кроків) між процесорамиспівпадає з розмірністю куба. Наприклад, у найбільшому 13-мірному сімействаnCube 2 сполучення між процесорами ніколи не проходять більше 13 кроків.
    Для порівняння, в 2-мірної конфігурації "mesh" (петля) з числом процесорів,вдвічі меншим кількості процесорів в максимальній системі nCube 2, найбільшувідстань між процесорами становить 64 кроку. Затримки комунікацій утакій системі значно збільшуються. Таким чином, ніяка іншатопологія з'єднання процесорів не може зрівнятися з гіперкуба поефективності. Користувач може подвоїти число процесорів в системі, прицьому збільшуючи довжину шляху зв'язку між найбільш віддаленими процесорамитільки на один крок.

    Велика кількість з'єднань в гіперкуба створює високу пропускнуздатність міжпроцесорних сполук в порівнянні з будь-який інший мережевийсхемою. Велика кількість шляхів передачі даних і компактний дизайнгіперкуба дозволяють передавати дані з дуже високою швидкістю. Крімтого, гіперкубіческая схема характеризується великою гнучкістю, так як вонадозволяє емулювати інші популярні топології, включаючи дерева, кільця.
    Таким чином, користувачам nCube-систем гарантується коректневиконання програм, що залежать від інших топологій. в) Високий рівень інтеграції

    Багато переваги nCube-систем, і, перш за все найвищіпоказники - надійності та продуктивності, є результатомвикористання технології VLSI (Very Large Scale Integration - надвисокаступінь інтеграції). Більшою мірою, ніж будь-які інші чинники, нанадійність комп'ютера впливає число використовуваних компонентів. Більше числокомпонентів неминуче збільшує ймовірність збою системи. З цієї причиниnCube інтегрує всі функції процесорного вузла на одне VLSI-пристрій.
    VLSI-інтеграція також скорочує необхідне число сполук, які можутьчинити вирішальний вплив на цілісність всієї системи.

    Високий рівень інтеграції скорочує шляхи передачі даних, підвищуючи тимсамим продуктивність системи. Інтеграція процесорного вузла на один чіпзалишає вільними для контролю тільки прості з'єднання з пам'яттю імережеві інтерфейси замість складних сигналів синхронізації, арбітражу іуправління. Ці прості з'єднання тестуються і коригуються з допомогоюметодів контролю парності і ЕСС (Error Correction Code - код корекціїпомилок), спрощуючи процес визначення та ізоляції помилок.

    2.2 Суперкомп'ютер nCube 2

    Суперкомп'ютер nCube 2 масштабується від 8-процесорних моделей домоделей з 8192 процесорами. Архітектура nCube 2 врівноважуєпроцесорну потужність, пропускну здатність пам'яті і пропускнуздатність системи введення/виводу. Додавання процесорів в систему нетягне за собою появу вузьких місць в пропускної здатності пам'яті абосистеми введення/виводу.

    Сімейство nCube 2 містить у собі дві серії суперкомп'ютерів:
    - Серія nCube 2S базується на процесорі nCube 2S з тактовою частотою 25
    MHz; гранична продуктивність 33 MFLOPS - 34 GFLOPS; розміроперативної пам'яті 32 Мб - 32 Гб;
    - Серія nCube 2 базується на процесорі nCube 2 з тактовою частотою 20
    MHz; гранична продуктивність 26 MFLOPS - 27 GFLOPS; розміроперативної пам'яті 32 Мб - 32 Гб.

    Архітектура суперкомп'ютера сімейства nCube 2 базується нагіперкубіческой мережі VLSI - чіпів, спарених з незалежними один від одногопристроями пам'яті. Чіп, або процесор nCube 2, включає в себе:
    - 64-розрядний центральний процесор;
    - 64-розрядний модуль обчислень з плаваючою точкою;
    - задовольняє стандарту IEEE (Institute of Electrical and Electronic

    Engineers - Інститут інженерів з електротехніки та радіоелектроніки) інтерфейс управління пам'яттю з 39-розрядних шляхом даних 14 двонаправлених каналів DMA (Direct Memory Access - прямий доступ до пам'яті)

    При тактовою частотою 25 МГц процесор має швидкість 4.1 MFLOPS дляобчислень з плаваючою точкою одинарної і 3.0 MFLOPS подвійної точності.

    Кожен процесор nCube 2 конфігурується з пристроєм динамічноїпам'яті місткістю від 4 до 64 МБайт.

    Розподілена архітектура пам'яті фактично не накладає ніякихобмежень на швидкість операцій з пам'яттю. Процесори не конкурують впропускної здатності з'єднання з пам'яттю і не повинні чекатипідкачки даних. Додавання процесорів в систему увінчує пропускнуздатність пам'яті і тим самим підвищує продуктивність.

    Кожен суперкомп'ютер nCube 2 містить компактну мережа процесорів. Наодну процесорну плату nCube 2 може монтуватися до 64 процесорів.
    Процесорна стійка може містити 16 плат із загальним числом процесорів до
    1024. Для побудови систем більшого розміру стійки комбінуються.
    Використання недорогих будівельних блоків забезпечує низьку ціну повноїкомп'ютерної системи в поєднанні з феноменально високоїпродуктивністю, досягнутої за рахунок комбінованої потужностіпроцесорної мережі.

    Кожен процесор nCube 2 містить 14 каналів DMA 13 для з'єднань вгіперкуба і 1 для введення/виводу. Виділений канал введення/виводуврівноважує обчислювальну продуктивність процесора зпродуктивністю його системи введення/виводу. У міру додаванняпроцесорів в систему пропускна здатність системи введення/виводу гіперкубамасштабується разом з процесорної потужністю і пам'яттю. До складупроцесора nCube 2 входить високошвидкісне пристрій маршрутизаціїповідомлень, що керує передачею повідомлень між процесорами.
    Пристрій маршрутизації забезпечує пряму передачу повідомлень безпереривання проміжних процесорів або необхідності зберігання данихповідомлення в їх пам'яті. Повідомлення передаються зі швидкістю 2.75 МБ/сек наканал DMA. Спеціальні методи маршрутизації автоматично обчислюютьнайкоротший шлях між процесорами і запобігають взаємну блокуванняповідомлень, звільняючи користувачів від необхідності планувати маршрути.
    Пристрій маршрутизації передає повідомлення настільки швидко, що числопрохідних кроків впливає на продуктивність набагато менше, ніж в іншихкомп'ютерах. Висока швидкість передачі створює ілюзію, що коженпроцесор пов'язаний безпосередньо з будь-яким іншим у мережі. Ефективністьгіперкубіческой топології в сукупності з високошвидкісним пристроєммаршрутизації створюють високопродуктивну систему міжпроцесорнихз'єднань з максимальною, порівняно з іншими процесорними мережами,швидкістю міжпроцесорних комунікацій. Суперкомп'ютер серії nCube 2 з 8192процесорами має швидкість міжпроцесорних передачі 577 Гб/сек.

    Кожен процесор nCube 2 виконує свою власну програмованупослідовність команд і може функціонувати незалежно. Цей принципдозволяє виділяти підмножини процесорів для паралельного виконаннярізних операцій. Таке розбиття гіперкуба перетворює суперкомп'ютерnCube 2 в багатокористувацьку, багатозадачний систему. Програмнезабезпечення nCube 2 виділяє набір процесорів - подкуб - для програмикористувача і завантажує її. Протягом необхідного часу кожен такийподкуб функціонує як окремий комп'ютер. Користувачі можуть змінюватирозміри подкубов відповідно до вимог своїх програм.

    2.3 Архітектура процесора nCube
    Процесор nCube, як і випливає з загального призначення системи, орієнтованийперш за все на речові обчислення. За один такт генератора йогоречовий арифметичний пристрій виконує дві операції, в той часяк цілочисельне - одну. При цьому речовинний конвеєр складається всього здвох ступенів (в інших архітектурах число ступенів речовогопроцесора від трьох до семи). Висока доступність кеша на кристаліпроцесора забезпечує практично пікові показники ефективності навітьпри обробці довгих векторів, розміщених в пам'яті.
    На кристалі розташовані регістровий файл і два кеша по 16 КБайт кожен:розділені кеш команд та кеш даних. Швидкість доступу до внутрішнього кешустановлять 1.6 ГБайт/сек, а для більшої ефективності обслуговує йогоспеціальний конвеєр. Доступ до кешу здійснюється з фізичного адресою,щоб уникнути непотрібних переміщень даних у разі перемикання контексту.

    Процесор nCube включає в себе повну підтримку віртуальної пам'яті. Уоснову архітектури закладено 64-розрядне поле віртуального адреси, хоча вданий час реалізовано 48-розрядний віртуальний адреса, що забезпечуєадресацію 256 Тбайт. Розміри сторінок можуть мати змінні розміри від 256
    Байт до 64 МБайт.а) Система введення/виводу nCube 2

    високопродуктивної обчислювальної системи має відповідатипотужна, швидка і гнучка система введення/виводу. У суперкомп'ютері nCube 2система введення/виводу використовує той же самий VLSI-процесор, якийфункціонує як обчислювальний елемент у гіперкубіческой мережі. Канони DMAв процесорах системи введення/виводу використовуються як шляхи передачі даних.
    Наявність виділених процесорів введення/виводу дозволяє здійснюватипаралельну роботу обчислювальної мережі та системи введення/виводу.

    Система введення/виводу масштабується разом з процесорної мережею.
    Суперкомп'ютер великого розміру має не тільки більше обчислювальнихпроцесорів, але й більша кількість процесорів введення/виводу. nCube 2підтримують кілька інтерфейсів вводу/виводу, що забезпечуютькористувачів зв'язком з необхідними їм пристроями.

    Плата введення/виводу nChannel здійснює зв'язок суперкомп'ютера nCube 2з пристроями вторинного зберігання, дисками, магнітними стрічками, мережами ііншими пристроями. Плата nChannel має 16 незалежних каналіввведення/виводу, кожен з яких управляється процесором nCube 2. До кожногоканалу підключається модуль введення/виводу, наприклад, контролер SCSI. Коженканал передає дані зі швидкістю 20 МБ/сек. За допомогою каналів платиnChannel система nCube 2 з'єднується з хост-комп'ютером, мережею Ethernet,дисководами і накопичувачами на магнітній стрічці, а також модулямиперетворення сигналів та передачі відеообрази.

    Плата HIPPI дозволяє з'єднувати суперкомп'ютер nCube 2 з іншимисуперкомп'ютерами, запам'ятовуючими пристроями та іншими системами,що підтримують інтерфейс HIPPI (High Performance Parallel Interface
    Високопродуктивний паралельний інтерфейс). Плата HIPPI використовує 16процесорів nCube 2 для обробки мережевого трафіку, звичайно 8 процесорівдля керування введенням і 8 для управління виводу. Швидкість передачі данихдосягає 100 МБ/сек.

    Графічна підсистема реального часу nVision забезпечуєінтегровану підсистему графіки та введення/виводу, яка дозволяєпрограмістам відображати і взаємодіяти з великими обсягами даних уреальному часі. На платі nVision розміщені 16 процесорів nCube 2, 2 CRT -контролера, спеціальний текстовий процесор, 16 МБайт пам'яті та 2 МБайтбуфера.

    Комп'ютер nCube 2 з'єднується по мережі з керуючим комп'ютером, зякого користувачі завантажують nCube 2, розробляють і запускаютьпаралельні програми, спостерігають за функціонуванням процесорної мережі тасистеми введення/виводу. Стандартним керуючим комп'ютером для nCube 2є робоча станція виробництва компанії Silicon Graphics.

    2.4 Програмне забезпечення

    На всіх комп'ютерах сімейства nCube 2 встановлюєтьсяспеціалізована програмна середа PSE (Parallel Software Environment),що включає в себе наступні компоненти:
    - операційна система nCX, побудована за мікроядерної технології і виконується на всіх процесорах гіперкуба, вона керує системою введення/виводу;
    - драйвер хост-інтерфейсу, інтерфейс введення/виводу для з'єднання з керуючим комп'ютером ; бібліотека стандартних UNIX-функцій;
    - засоби розробки для написання, компіляції, профілювання, налагодження, запуску і контролю паралельних програм;
    - утиліти системного адміністратора;
    - підсистема інтерактивної (on-line) документації.

    середу PSE забезпечує узгоджений для різних моделей сімействаnCube 2 прикладної інтерфейс. Програми, розроблені для комп'ютерів зневеликим числом процесорів, не вимагають переробки при перенесенні на системуnCube 2 більшого розміру. Операційне середовище nCube 2 інтегрована зсередовищем керуючого комп'ютера, забезпечуючи користувачів можливістюрозробляти програми на звичної їм платформі. За допомогою PSEкористувачі можуть працювати незалежно, отримуючи автономний контроль надвиконанням своїх програм. Безліч користувачів можуть одночасновиконувати програми.

    середу PSE базується на nCX - високооптімізірованном, невеликому (до
    128 КБ) і швидкому мікроядрі (microkernel), який забезпечує сервісопераційної системи на кожному процесорі, як гіперкуба, так і системивводу-виводу. nCX підтримує управління процесами та управління пам'яттю,багатозадачність, інтерфейс системних викликів UNIX System V Release 4, атакож високопродуктивну систему передачі повідомлень. Іншіопераційні засоби, такі як драйвери введення/виводу і мережевіз'єднання, розподіляються між обчислювальними вузлами і процесорамивведення/виводу. Операційна система nCX забезпечує єдиний інтерфейс дляпаралельних програм і драйверів введення/виводу.

    На суперкомп'ютерах nCube 2 підтримуються два види програмування:
    SPMD (Single Program Multiple Data - Одна програма, Безліч даних): упроцесорну мережа завантажується одна програма, кожен екземпляр програмиобробляє свій власний набір даних; процесори можуть обмінюватисяінформацією.
    MPMD (Multiple Program Multiple Data - Безліч програм, Безлічданих): в процесорну мережа завантажується набір програм, кожен екземпляркожної програми обробляє свої власні дані; програми можутьобмінюватися інформацією.

    2.5 Надійність системи nCube 2

    Суперкомп'ютери nCube 2 представляють найбільш надійні на сьогоднішнійдень системи. Кожен аспект дизайну nCube 2 має на увазі надійність.
    Наприклад, висока інтеграція - процесорний вузол на одному чіпі зменшуєчисло компонентів, у яких може відбутися збій. Швидке, ефективнеМікроядро забезпечує всі необхідні для додатків функції, неперевантажуючи систему більш складною, але менш надійної операційної середовищем.

    3 МЕРЕЖА ЯК Суперкомп'ютер

    Теоретично суперкомп'ютер можна представити як об'єднання великоїкількості звичайних комп'ютерів в один, єдиний блок. Інакше це можнауявити, як локальну мережу, що має деяку кількість вузлів в одномублоці. Отже, можна як суперкомп'ютера використовувати і будь-якулокальну (і не тільки локальну) мережу. Починаючи з 1992 року по швидкостізростання продуктивності мережеве обладнання обганяє процесори. Длябагатьох організацій перспектива використання мереж робочих станцій і ПК вяк суперкомп'ютерів вельми приваблива. Основні переваги мереж --можливість поступового розширення і модернізації, а також режимексплуатації мережі днем для звичайних потреб розробки і проектування, авночі для розрахунків. Мережі не можуть змагатися за швидкістю обчислення зсуперкомп'ютерами-рекордсменами, але вони на один-два порядки дешевше, їхможна використовувати там, де обсяги розрахунків великі, а суперкомп'ютериекономічно не виправдані. Такі мережні технології будуть сприятивикористання мереж як паралельних обчислювачів. У першу чергуце Fast Ethernet і Gigabit Ethernet. Далі йдуть технології комутації. І,нарешті, нові мережеві протоколи, що підтримують широкомовлення

    3.1 Паралельні програми - головне гальмо

    Головною перешкодою до впровадження практично всіх паралельнихархітектур є відсутність паралельних програм. У успадкованих відпослідовного світу програм є недолік - великий об'єм коду,принципово не допускає паралельного виконання. Його не можнаподолати за рахунок удосконалення техніки компіляції. Так, якщопрограма половину часу займається діями, які потрібноздійснювати строго послідовно, то паралельне виконання залишиласяполовини у граничному випадку дасть лише дворазове прискорення. В результаті,хочемо ми цього чи ні, послідовні обчислювальні алгоритми доведетьсязамінювати паралельними.

    3.2 MPI

    Практично на всіх паралельних системах були свої власнібібліотеки передачі повідомлень. У простому випадку вони передбачалипередачу і прийом окремих пакетів між сусідніми процесорами. Більшескладні підтримували передачу повідомлень довільної довжини, маршрутизаціюповідомлень і апарат тегів, який дозволяє приймаючій стороні самоївирішувати, в якій послідовності обробляти надходять повідомлення.
    Деякі бібліотеки допускали динамічне породження і знищенняпроцесів.

    За останні роки у справі створення ПЗ для систем з розподіленоюпам'яттю намітився серйозний прогрес. Найбільшим досягненням буластандартизація інтерфейсу передачі повідомлень MPI (message passinginterface). По-перше, MPI підтримує декілька режимів передачі даних,найважливіші з яких: синхронна передача, яка не потребує виділенняпроміжних буферів для даних і забезпечує надійну передачу данихяк завгодно великого розміру, і асинхронна передача, при якійпосилає повідомлення процес не чекає початку прийому, що дозволяєефективно передавати короткі повідомлення. По-друге, MPI дозволяєпередавати дані не тільки від одного процесу до іншого, але й підтримуєколективні операції: трансляцію передачу, розбирання-складання,операції редукції. По-третє, MPI передбачає гетерогенні обчислення.
    Обчислювальна система може включати різні процесори, у тому числіщо мають різні набори команд і різне уявлення даних. Якщо у васє суперкомп'ютер, то це здається зайвим, але для організацій,експлуатують мережі робочих станцій з різними процесорами і версіями
    Unix, - це знахідка.

    Синтаксис MPI полегшує створення додатків в моделі SPMD (singleprogram multiple data) - одна програма працює в різних процесах зсвоїми даними. Одна і та ж функція викликається на сайті-джерелі і вузлах -приймачах, а тип виконуваної операції (передача або прийом) визначається здопомогою параметра. Такий синтаксис викликів робить SPMD-програмиістотно компактніше, хоча і важче для розуміння.

    Основна відмінність стандарту MPI від його попередників - поняттякомунікатора. Всі операції синхронізації і передачі повідомлень локалізуютьсяусередині комунікатора. З комунікатором зв'язується група процесів. УЗокрема, всі колективні операції викликаються одночасно на всіхпроцесах, що входять в цю групу

    Підтримка модульного програмування в поєднанні з незалежністю відапаратури дала потужний імпульс до створення бібліотек. Одна із самихцікавих розробок - пакет лінійної алгебри ScaLAPACK, розробленийгрупою Дж. Донгарра.

    3.3 Реалізації MPI

    Бібліотеки MPI реалізовані практично на всіх сучаснихсуперкомп'ютерах, наприклад, в університеті Коімбра (Португалія)розробили бібліотеку MPI для Windows 95 (http://pandora.uc.pt/w32mpi),яка особливо цікава для викладачів і студентів, оскільки приналагодження достатньо мати звичайний ПК, а запуск паралельних програм вмережі дозволяє отримати реальний виграш в продуктивності.

    Практичний досвід показує, що ідеально распараллеліваемие завдання,такі як паралельне множення матриць, можна вирішувати практично на будь-якихмережах, і додавання навіть відносно слабких обчислювальних вузлів даєвиграш. Інші завдання, зокрема рішення систем лінійних рівнянь,більш вимогливі до комунікаційного обладнання та якості реалізаціїпередачі повідомлень. Саме тому тести для оцінки реальногошвидкодії паралельних обчислювальних систем базуються напаралельних аналоги відомого пакету Linpack. Так, система лінійнихрівнянь розміром 800х800 вирішується на чотирьох комп'ютерах Sun SPARCstation
    5, об'єднаних мережею Ethernet 10 Мбіт/c, швидше, ніж на трьох; на п'яти --приблизно за той же час, що і на чотирьох, а додавання шостогокомп'ютера однозначно погіршує продуктивність обчислювальної системи.
    Якщо замість Fast Ethernet 10 Мбіт/c використовувати Fast Ethernet 100 Мбіт/с,що лише незначно збільшує загальну вартість системи, час,витрачається на комунікацію, зменшується майже в 10 разів, а для вирішенняданого завдання можна буде ефективно застосовувати вже десятки робочих станцій.

    3.4 Засоби програмування високого рівня

    Часто в мережах окремі комп'ютери нерівноцінні, і має сенснавантажувати їх по-різному, однак навіть найпростіша програма, що враховуєбалансування навантаження, - якщо кодувати її, використовуючи лише кошти MPI, --стає неосяжної, та налагодження її мало кому буде під силу. Так,матриці в пакеті SсаLAPACK, незалежно від розв'язуваної задачі і потужностейобчислювальних елементів, завжди розподіляються по процесорах рівномірно.
    В результаті, при наявності хоча б одного слабкого комп'ютера в мережі,обчислення затягуються - всі чекають відстає. Динамічна балансуваннянавантаження, практично безкоштовно отримують на SMP-комп'ютерах, врозподілених системах надзвичайно важка, і навіть просте розподілданих відповідно до потужностями вузлів і наступні пересилки кодуютьсявельми непросто.

    Виходом з положення, що стали мови програмування,засновані на паралелізм даних. Перший з них, Fortran-D, з'явився в
    1992 р. На зміну йому прийшов High Performance Fortran (HPF), що представляєсобою розширення мови Fortran 90 і вимагає від користувача лише вказатирозподіл даних по процесорах. В іншому програма маєпослідовний вид (це, втім, не означає, що, придумуючи алгоритм,не слід замислюватися про властиві йому паралелізм). Трансляторсамостійно розподіляє обчислення по процесорах, вибираючи в якостівузла, на якому варто робити обчислення, той процесор, на якомубуде використаний результат обчислення виразу. При необхідностітранслятор генерує звернення до бібліотеки передачі повідомлень, наприклад
    MPI. Від компілятора HPF потрібен ретельний аналіз програми. Користувачпрактично не має важелів управління кількістю пересилань, а оскількиініціалізація кожної пересилання, незалежно від обсягу переданоїінформації, - це десятки тисяч машинних тактів, якість одержуваноїпрограми від нього залежить слабо.

    У мові програмування mpC (http://www.ispras.ru/) - розширення ANSI
    Cи - прийнятий компромісний підхід. Тут користувач розподіляє не тількидані, але і обчислення. Змінні і масиви розподіляються по віртуальниммереж (networks) і підмережах, при цьому в описах мереж вказуютьсявідносні потужності вузлів і швидкості зв'язків між ними. У процесівиконання mpC-програми система підтримки мови прагне максимальночином запобігти віртуальні мережі на групи процесорів. У результатікористувач отримує можливість рівномірно навантажувати вузли

    3.5 Спроба прогнозу

    Використання мереж комп'ютерів для обчислювальних завдань - вже сьогоднісправа цілком реальна. У цьому напрямі ведуться наукові розробки тазроблено ряд пілотних проектів. Як комунікаційної платформи заразнайбільш економічно виправдане застосування комутованих мереж Fast
    Ethernet. При цьому собівартість системи продуктивністю 1,5-6 операційз числами в секунду на задачах лінійної алгебри буде нижче
    100 тис. дол Через пару років як комунікаційної платформи можнабуде використовувати Gigabit Ethernet або ATM (Asynchronous Transfer Mode --асинхронний режим передачі), що забезпечують на порядок вищішвидкості передачі даних. Протягом одного-двох років повинні з'явитисязагальновизнані широкомовні протоколи транспортного рівня тазасновані на них реалізації MPI. На рівні прикладних програм MPIвикористовуватися не буде. На ньому стануть базуватися лише деякібібліотеки та системи підтримки мов, засновані на паралелізм даних.

    4 ПІМЕРИ ВИКОРИСТАННЯ СУПЕРКОМПЬЮЮТЕРОВ

    4.1 Моделювання побудова білка

    Корпорація IBM оголосила про те, що планує виділити 100 мільйонівдоларів на створення найшвидшого в світі суперкомп'ютера, який будевикористовуватися для моделювання побудови білка з амінокислот.

    Новий суперкомп'ютер, що носить назву Blue Gene, буде здатнийздійснювати один квадрильйон операцій у секунду, тобто буде в тисячу разівмогутніше знаменитого Deep Blue, з яким у 1997 році грав у шахи чемпіонсвіту Гаррі Каспаров.

    Blue Gene буде працювати на основі більше мільйона процесорів, кожнийз яких здатен робити мільярд операцій у секунду, повідомляютьпредставники IBM. Новий гігант буде в два мільйони разів швидше, ніжіснуючі сьогодні найпотужніші персональні комп'ютери.

    Дослідники розраховують досягти цього рівня потужності протягомп'яти років, після закінчення яких суперкомп'ютер буде використовуватися вгенетичному моделюванні. Якщо Blue Gene виправдає покладені на ньогонадії, його створення стане величезним кроком вперед в областіохорони здоров'я та біології.

    4.2 Віртуальна башта

    За оцінками Федерального управління цивільної авіації США, протягомнайближчих 20 років кількість літаків, які використовуються для комерційнихпольотів, збільшиться вдвічі. Це стане серйозним випробуванням дляавіадиспетчерів, яким доведеться впроваджувати нові технології управлінняавіаційними потоками як на землі, так і в повітрі.

    НАСА вирішило внести свою скромну лепту у подолання цієї проблем

         
     
         
    Реферат Банк
     
    Рефераты
     
    Бесплатные рефераты
     

     

     

     

     

     

     

     
     
     
      Все права защищены. Reff.net.ua - українські реферати ! DMCA.com Protection Status