Підвищення продуктивності комп'ютерних систем

Інформатика, програмування

МІНІСТЕРСТВО ОСВІТИ І НАУКИ РФ

Оренбурзька ДЕРЖАВНИЙ УНІВЕРСИТЕТ

Кафедра ПОВТАС

Реферат

Проблеми підвищення продуктивності обчислювальних систем і методи їх подолання

Оренбург 1999

Зміст.

| 1.Немного історії. | 3 |
| 2.Повишеніе продуктивності в комп'ютерних мережах. | 6 |
| 3.Повишеніе продуктивності процесором | 8 |
| 4. ММХ-революція в мікропроцесорної еволюції. | 9 |
| 5.Основние проблеми. | 12 |
| 6.Одно з перспективних рішень. | 12 |
| 7.Вліяніе архітектури мікропроцесорів на підвищення | 14 |
| продуктивності. | |
| 8.Спісок літератури. | 26 |

Трохи історії.

Електронний комп'ютер був розроблений в 50-і роки як пристрій длявиробництва швидких обчислень. У той час ніхто не замислювався над йогоінформаційними програмами та зусилля розробників були направлені восновному на підвищення швидкодії комп'ютера.
У 60-ті роки була зроблена спроба використовувати комп'ютер для здійсненняінформаційних операцій індексування та аналізу тексту. За допомогоювідповідного програмного забезпечення в пам'ять комп'ютера стализаписувати тексти і шукати можливості оперування з ними. В данийчас існує безліч фірм, що виробляють комп'ютери. Це, наприклад,
Dell, Acer, IBM. Для тих, хто професійно з комп'ютером не пов'язаний,розповімо дуже коротко про деякі принципи функціонування комп'ютера.
Структурно комп'ютер складається з п'яти основних функціональних блоків,об'єднаних спільним завданням швидко виконувати арифметичні та логічнідії над числами. Характер дій та їх послідовністьвизначаються програмою, що є певним чиноморганізовану сукупність машинних операцій, які називаються командами.
Керує роботою комп'ютера пристрій керування. Воно отримує команди зпам'яті, декодує їх і генерує необхідні для їх виконання сигнали.
Кожна команда в пам'яті знаходиться за певною адресою, якувказується програмним лічильником, що знаходяться в пристрої пам'яті. Длязапам'ятовування команд у пристрої керування є спеціальний регістркоманд.
Пристроїв введення і виведення служать для перетворення інформації з тих мовпрограмування і тих швидкостей, на яких працює комп'ютер, на ті,які сприймає людина або інша система, що працює з данимикомп'ютером. Найважливішим функціональним блоком комп'ютера є процесор.
У нашій країні набули широкого поширення процесори фірм Intel, AMDта ін
Команди від оператора надходять через пристрій вводу в регістрінструкцій. За цих інструкцій блок керування виробляє команди длявсіх функціональних блоків комп'ютера Система регістрів загального користуванняслужить оперативною пам'яттю для вступників на вхід даних.
Арифметичне пристрій виробляє арифметичні та логічні операціїнад що поступають від регістра загального призначення даними. Про те, які самеслід виконувати функції, кажуть команди блоку управління.
Адресний регістр забезпечує правильну адресацію даних в системіпам'яті, він також забезпечує кожну наступну інструкцію вказівками адреспам'яті, де вона буде запам'ятовуватися.
Одним з ключових функціональних блоків комп'ютера є програмнийлічильник, призначення якого полягає в оновленні кожної інструкції татимчасове запам'ятовуванні її номера. Якщо записана програма перейде віншої інструктивно номер, ця зміна буде зафіксовано програмнимлічильником. Інформація про ці зміни надходить також у регістрінструкцій. При кожному наступному кроці робочої програми відбуваєтьсязвернення до програмного лічильника із запитом про виконання відповідноїоперації.
Кожна комірка пам'яті комп'ютера запам'ятовує одне машинне слово.
Можливості комп'ютера визначаються кількістю команд, яке можна ввести воперативну пам'ять. Максимальна ємність оперативної пам'яті вмінікомп'ютерах не перевищує звичайно 32M слів, в суперкомп'ютерах ємністьоперативної пам'яті досягає 1000M слів (M = 1 048 576).
Різке підвищення продуктивності мінікомп'ютерів при порівняноневеликому подорожчання призвело до створення мегаміні-або суперміні -комп'ютерів. Поява комп'ютерів нового класу пов'язано з успіхами втехнології їх виготовлення, з розширенням їх функціональних можливостей.
Так, збільшилася швидкість, і розширився набір команд центральногопроцесора, зросла пропускна здатність пристроїв введення-виведення, розширенодіапазон адрес, збільшився асортимент зовнішніх пристроїв.
Одночасно з цим з'явилася можливість створити для суперміні -комп'ютерів багате програмне забезпечення, істотно відрізняється відматематичного забезпечення типових мінікомп'ютерів. У той же час цематематичне забезпечення орієнтоване на інтерактивний режим роботикористувача з машиною, тобто на безпосереднє спілкування. Великимивиробниками програмного забезпечення можна счітеть: Microsoft,
Symantec, Borland, Microprose та ін
На початку 70-х років американська фірма Intel запропонувала замістьінтегрального модуля з жорсткою логікою розробити стандартний логічнийблок, конкретне призначення якого можна визначити після йоговиготовлення, тобто створити програмовану інтегральну схему. Такз'явився мікропроцесор - багатофункціональний цифровий мікроелектроннихмодуль з програмованої логікою, що зробив революцію в електроніці ітехніці обробки інформації.
Основою мікропроцесора є велика інтегральна схема, в якійвідбуваються всі функціональні та обчислювальні операції. Мікропроцесорскладає основу мікрокомп'ютера.
У 1980 р. основу майже всіх мікрокомп'ютерів становили однокристальнихмікропроцесори, у яких на одному кристалі виконані центральнийпроцесор, пристрій пам'яті, пристрій вводу-виводу і інші логічнісхеми. Число транзисторів на одному кристалі сягала приблизно 70 тис.штук. В даний час вже є монокристалічні мікросхеми з числомелементарних вентилів до 5 млн. штук, що закладає основу для переходу домікрокомп'ютера наступного нового покоління.
Виробництво мікрокомп'ютерів відбувається в наростаючому темпі.
До першого покоління персональних комп'ютерів американського виробництвавідносяться комп'ютер TRS-80 на базі мікропроцесора Z80 фірми Zilog,комп'ютер Apple - II фірми Apple Computer, комп'ютер PET фірми Commondore
Int. на базі мікропроцесора 6502 фірми MOS Technology.
До другого покоління належать комп'ютери IBM Personal Computer фірми
IBM з мікропроцесором i8088, Rainbow-100 фірми DEC на базі мікропроцесора
Z80A/i8088.
Мікрокомп'ютери другого покоління з 16-розрядних словом відрізняються відсвоїх попередників включенням в комплект крім гнучких дисків такожмалогабаритних жорстких дисків великої ємності, графічних пристроїв,збільшеним об'ємом оперативної пам'яті до 256 КБайт - 2 Мбайт. Рештапокоління є похідними від цих.
Характеристики персональних комп'ютерів постійно поліпшуються, і вНині технічні характеристики і області застосування міні-імікрокомп'ютерів перекриваються.
Наприкінці 80-х років існувала проблема відставання математичногоозброєння комп'ютера від його фізичних можливостей. Зате в данийчас дана проблема змінилася з точністю до навпаки. Тобтосучасне програмне забезпечення може використовувати всі системніресурси комп'ютера і при цьому вимагати ще більшого збільшення данихресурсів.
Нехай, наприклад, необхідно ввести дані в комп'ютер. Цей процесслід почати з тестових перевірок, щоб переконатися у фізичнійможливості здійснення цієї процедури. Тому робота починається з того,що пристрій введення в комп'ютер посилає сигнал, який вказує на готовністьвведення порції інформації. У свою чергу, комп'ютер повинен сповіститипристрій введення, тобто оператора, про те, що він обробивпопередньої порції даних і готовий до прийому наступної. У результатітого, що відбувається обміну сигналами встановлюється режим, що дозволяє вводитинову порцію даних.
При виведенні інформації з комп'ютера пристрій виведення має сповіститикомп'ютер про те, що воно готове сприймати дані, тобто надіслати вкомп'ютер так званий "сигнал зайнятості". Комп'ютер почне видаватидані тільки після перевірки наявності такого сигналу. У свою чергу,комп'ютер повинен надіслати в пристрій виводу сигнал готовності передаватидані та пристрій виводу повинно переконатися в наявності такого сигналу.
Цей очевидний режим обміну інформацією між комп'ютером і периферійнимипристроями має недолік - нераціональне використання часу, такяк комп'ютер значну частину часу перебуває в режимі очікування.
Тому розроблений більш економічний режим обміну даними - введення та виведення зпереривання. У цьому режимі виконання основної програми комп'ютеромчергується з виконанням підпрограм введення і виводу.

Підвищення продуктивності в комп'ютерних мережах.

Швидке проникнення інформаційних технологій в комерцію, банківськесправа, освіта та сферу розваг в сукупності з неухильнозбільшується потужністю комп'ютерів і ємністю пристроїв зберігання данихвисуває все більші вимоги до мереж зв'язку. На порядок денний виходятьширокосмугові канали зв'язку.
Згідно із прогнозами, потужність персональних комп'ютерів і high-end -обчислювальних машин в найближчі 15 років збільшиться більш ніж у тисячу разів,відповідно і потреби в обсязі трафіку по опорних мереж зв'язкузростуть у десятки і сотні разів. Ці тенденції стимулюють дослідження вобласті високопродуктивних мережевих рішень. Найшвидші лініїпередачі даних - оптоволоконні - вимагають відповідні технологіїпобудови швидких і гнучких мереж. Однією з таких технологій єтимчасове ущільнення каналів.
Сучасні технології ATM і SDH вирішують завдання підвищенняпродуктивності мереж лише в короткостроковій перспективі. Їхнє подальшерозвиток супроводжується збільшенням складності та ціни електронногообладнання, змушуючи розробників звернути погляд у бік оптичнихтехнологій зв'язку.
Зв'язок оптичні - поки що єдиний спосіб задовольнити величезніпотреби в швидкісної передачі даних. Головними технологіями,що дозволяють найбільш повно на сьогоднішній день використовувати воістинувеличезні можливості волокна, є ущільнення каналів з розподілом заспектру (WDM, або спектральна ущільнення) і з тимчасовим поділом (OTDM,або тимчасове ущільнення).
І та і інша технології важливі не тільки для підвищення швидкості передачіданих, але і для прискорення комутації та маршрутизації. Вже розробленінеобхідні кошти для вирішення цих завдань без використання електроннихпристроїв. Таким чином, знімаються обмеження, що накладаютьсяелектронікою. Тимчасовий і спектральна ущільнення не євзаємовиключними, хоча використання першого з деякими видами волоконускладнене. Більш того, ці підходи можуть бути скомбіновані. Невеликечисло OTDM-каналів може бути об'єднано з допомогою WDM, збільшуючи ємністьлінії.
Уявімо, що нам потрібно встановити локальну мережу з великою пропускноюздатністю, так би мовити, з доробком на майбутнє. Чим з'єднати між собоюкомп'ютери? Ще недавно відповідь була очевидна - коаксіал або вита пара (UTP)з третьої по п'яту категорії. Якщо мова йшла про магістральних комунікаціях,прокладалося оптичне скловолокно. З розвитком технології вибіррозширився. З'явився розширений 5-а категорія UTP, екранована крученапара (так звана 6-а європейська категорія UTP). Знизилася вартістьоптоволокна. Крім цього, на ринку кабельних з'єднань для локальних мережвиникло нове явище: пластикове, або полімерне, оптичне волокно. За -англійською воно називається Plastic Optical Fiber або скорочено POF.
Аналітики вважають, що POF повинна заповнити існуючу нішу між міднимипроводами і скловолокном за співвідношенням ціна-продуктивність.
Пластикове оптоволокно вже протягом кількох років проводиться в Японіїта США. Воно вживається для освітлення (в якості світловодів), а також уробототехніці, промисловості і автомобілях. Число мережевих застосувань POF,втім, поки що досить невелика. Кілька американських компаній використовують
POF як коротких (до 100 м) магістралей передачі даних. Новарозробка - POF з змінюються в поперечному перерізі показникомзаломлення (graded-index POF) - обіцяє збільшити пропускну здатністьпластичного волокна до 2 гігабіт на секунду на дистанціях до 100 метрів.
У яких стосунках перебуває POF зі склом і міддю з точки зорутехнічних характеристик та економічної вигоди? Пластикові світлопроводиздатні працювати в найсуворіших температурних режимах, мислимих длясучасних мереж, - від-40њ до 85њC. Без шкоди для оптичниххарактеристик вони можуть витримувати радіус вигину до 20 мм і не ламаютьсянавіть при радіусі вигину в 1 мм. Така гнучкість дозволяє з легкістюпрокладати POF там же, де і мідні дроти, пропускаючи світловод черезстіни та вентиляційні короби.
Область застосування для POF виявляється досить широкою. Крім локальнихмереж в їх звичному розумінні, пластикові світлопроводи можуть використовуватисяяк мережевий основи для літаків, комп'ютеризованих автомобілів,військового спорядження та обмундирування, а також скрізь, де неприпустимовиникнення електричних наведень і полів.

Підвищення продуктивності процесорів.

Говорити про перспективи розвитку обчислювальної техніки досить складно. Зодного боку, ми звикли до божевільним, що не мають аналогів в історіїлюдства темпами зростання її потужностей і проникненню в самірізноманітні сфери життя людського суспільства З іншого боку,дійсно, навіть якось не віриться, що подібні темпи зможуть зберегтитакими ж високими.
До двохтисячному році мікропроцесори досягнуто тактової частоти 900мегагерц, а їхня продуктивність по iSPEC95 буде дорівнює приблизно 60. До
2006 частота підскочить до 4 ГГц, а продуктивність - до 500 (дляпорівняння: продуктивність сьогоднішнього Pentium Pro, що працює начастоті 200 МГц, становить 5,1). Зростання продуктивності буде досягнутийдвома шляхами: підвищенням частоти і ступеня паралелізму в архітектуріпроцесора.
Попит на швидкість і потужність буде рости в міру того, як в сьогоднішніпрограми почнуть вводити відео, звук, анімацію, колір, тривимірнізображення та інші засоби, які повинні зробити PC та програми простішедля використання.

ММХ-революція в мікропроцесорної еволюції.

8 січня 1997 корпорація Intel анонсувала довгоочікуваний процесор
Pentium., Виконаний з використанням технології MMX .. Його офіційнеподання на території СНД і країн Балтії пройшло 22 січня в Москві, вкіноцентрі "Кодак Киномир". У цьому матеріалі представлені основні факти,супутні появи нової технології від Intel.
Новий процесор, що випускається в чотирьох модифікаціях, являє собоюнайбільш продуктивний з усіх наявних на сьогодні процесорів Pentium.
Для настільних ПК, орієнтованих на сегмент ринку споживчихтоварів, процесори випускаються з робочими частотами 166 і 200 МГц, а дляhi-end ноутбуків розроблені процесор з тактовою частотою 150 і 166
МГц. На цю обставину спостерігачі звертають дуже пильну увагу
- Вперше за свою історію корпорація представляє "ноутбучні" процесориодночасно з рішеннями для настільних систем.

Технологія.

На думку корпорації анонсована в березні минулого року технологія MMXявляє собою найбільш істотне поліпшення архітектури процесорів
Intel за останні 10 років, з моменту появи 32-х розрядного Intel386.
Розробка цієї технології почалася близько п'яти років тому у відповідь на швидкерозвиток обчислювальних систем, пов'язаних з обробкою різних видівінформації. Були проведені дослідження широкого кола програм дляобробки зображень, MPEG відео, синтезу музики, стиснення мови та їїрозпізнавання, ігрових, орієнтованих на відеоконференції і багатьохінших. У них виділялися підпрограми, найбільш активно експлуатуютьобчислювальні потужності. Потім, вони були ретельно проаналізовані. Урезультаті такого аналізу було виявлено те спільне, що необхідно дляефективного виконання різних категорій програм.
Основою MMX є архітектура SIMD (Single Instraction Multiply Data -
"одна інструкція над багатьма даними"). Суть її сос?? ОІТ в тому, що данінадходять у процесор у вигляді 64-бітних пакетів, які обробляютьсяоднією командою. Крім того логіка процесора поповнилася 57 новимиінструкціями, що підвищують продуктивність при виконанні найбільштипових циклів, характерних для додатків, що використовують великукількість аудіовізуальної інформації.
Вісім 64-розрядних регістрів MMX фізично використовують ті ж регістри, щота операції з плаваючою точкою. З одного боку такий крок забезпечуєповну сумісність з попередньою архітектурою Intel і, як наслідок,повну сумісність з широко використовуваними операційними системами таприкладним програмним забезпеченням. З іншого боку на переключення звиконання ММХ-інструкцій, на дії з плаваючою комою процесорупотрібно 50 тактів, що розглядається критиками як істотний мінусархітектури. Однак Intel з цим категорично не погоджується, стверджуючи,що подібне рішення оптимально і задовольняє виробників якпрограмного, так і апаратного забезпечення.
Нові процесори розроблені на основі створеної в Intel поліпшеної 0,35 --мікронній технології, що дозволяє одержати більш високупродуктивність при меншому споживанні потужності. Процесори містять по
4,5 млн. транзисторів і використовують два рівні напруги живлення. Длясумісності з існуючими компонентами процесор працюють принапрузі 3,3 В, але ядро процесора у версії для настільних ПК працюєпри напрузі 2,8 В, а у версії для портативних ПК - при напрузі 2,45 В.
Робота ядра при зниженій напрузі дозволяє знизити потужність розсіюванняу нових процесорів до рівня їхніх попередників без технології ММХ. Прицьому максимальне розсіювання потужності у випадку з процесором, використовуваним внастільних ПК, становить 15,7 Вт, а для процесора, що використовується впортативних ПК - 7,8 Вт Так що категорично не слід встановлювати ММХ -процесори в старі, непристосовані для них материнські плати! Експертивважають, що розплата наступить не одразу, але в підсумку стійко процесорипрацювати не будуть, при цьому нагрів буде вимірюватися просто неприпустимимивеличинами, що врешті-решт призведе до неминучої аварії. Томузалишається чекати процесорів Pentium Overdrive, виконаних за новоютехнології і забезпечених перетворювачами напруги, випуск якихпочнеться вже в першій половині поточного року.
Відповідно до прогнозів фахівців Intel можна очікувати подальшогозростання показників мікропроцесорів і по щільності інтеграції, і пошвидкодії. Але цілком можливо, що загальні темпи підвищенняпродуктивності комп'ютерів трохи знизяться.
Тут хотілося б відзначити, що порівняння Pentium і Pentium Pro навітьсьогодні є дещо передчасним. По суті справи, Pentium Pro бувекспериментальної і не дуже вдалою моделлю (наприклад, ідея інтеграції наодному кристалі самого процесора кеш-пам'яті та їх роботи на одній тактовоючастоті явно не виправдалася). Насправді, фактично робоча історіясімейства P6 починається тільки зараз, з виходом Pentium II: у нього євідмінний потенціал для зниження собівартості і одночасно - підвищеннячастоти.
Можливе зниження темпів зростання продуктивності мікропроцесорів --явище досить зрозуміле. Справа в тому, що з точки зору більшостіобчислювальних завдань розмірність даних в 32 біта є оптимальною. 16 --розрядний процесор працював істотно швидше 8-розрядного, а 32 --розрядний - і того швидше. Але ось перехід до 64-розрядної схемою вже навряд чипринесе такий же вагомий результат. Цілком можливо, що майбутній Mercedбуде дійсно дуже сильно випереджати Pentium II, але тільки на 64 --розрядних тестах.

Основні проблеми

Одна з найбільш фундаментальних проблем, які належить вирішити: яксправлятися зі зростаючою складністю вироби і чисельністю командирозробників? Щоб створити нове покоління продуктів, сьогодні і в майбутньомусотні людей повинні працювати як одна команда.
Наступний перешкоду: як гарантувати працездатність ісумісність? Якщо перевіряти всі обчислювальні ситуації і всі аспектисумісності, кількість комбінацій буде наближатися до безкінечності.
Ясно, що нам будуть потрібні якісно інші способи, щоб справлятися змікросхемами, що містять 350 мільйонів транзисторів.
Третя група проблем пов'язана з споживаної потужністю. Напруга живленнядоведеться знизити до одного вольта, для чого буде потрібно внести багатонового в мікроархітектуру, а також у процес і програмне забезпеченнярозробки.
Нарешті, головним гальмом зростання продуктивності будуть внутрісхемниез'єднання - до тих пір, поки не вдасться відкрити матеріали з меншимиопором та ємністю. У сучасній мікросхемі Pentium Pro міститьсяп'ять металізованих шарів, завдяки чому скорочується відстань міжкомпонентами і сигнали передаються швидше. У новому поколінні процесорівцих шарів буде потрібно набагато більше. Історія показує, що технологіяметалізації розвивається повільно. Щоб зробити процесор 2006 року, требатерміново розгортати нові дослідження.

Одне з перспективних рішень.

Одним із шляхів підвищення продуктивності процесорів є новітнятехнологія виробництва мікросхем на основі мідних провідників.
Власне, про прорив у Cu-технології виготовлення мікрочіпів компанія IBMзаявила ще у вересні 1997 року. Але за минулі до того п'ять роківнапружених лабораторних досліджень і випробувань нестачі в подібнихпостійно повторюваних заявах вже ніхто не відчував. І ось тількипішли за цим жовтневі і листопадові події у світі великийнапівпровідникової промисловості дали зрозуміти, що Велика мідна революція,схоже, відбулася, оскільки вийшла з лабораторій і тепер широковпроваджується в серійному обладнанні напівпровідникової промисловості.
Про переваги подвійний дамаської мідної технології: Damascus Complete
Copper, назва технологічної лінійки обладнання альянсу Lam і
Novellus (і примкнула до них IPEC), - перед традиційної алюмінієвої.
Принагідно слід зауважити, що названий Дамаським процес має доситьслабке стосунок до металургії булатної сталі. Схожої між нимиобмаль, крім, можливо, вдало знайденого гетерогенного сполученнярізних мідних структур. Гомогенні плівки міді просто ніяк невписувалися в існуючі технологічні прийоми. Ну і, природно, дужесхожа таємність, якою оточені технологічні режими і параметриотримання тієї та іншої "дамаської" структури.
Краща (ніж у алюмінію) провідність міді дозволяє виключити до 200технологічних операцій (етапів) у виготовленні чіпа. Це сильно, якщозгадати, що ще років десять тому чіп виготовлявся за 60 операцій,сьогодні ж виробництво мікропроцесора вимагає 800 і більше етапів.
Працюючи на одній тактовою частотою, чіпи з мідними межз'єднань будутьспоживати на 30% менше енергії, ніж "класичні". З огляду ж на двох -трикратне скорочення лінійних розмірів, що досягається за допомогою міді,подібна економія відіб'ється в ще більших значеннях. Тут доречноуявити собі легкий і негорячій палмтоп (або хенд-Хелд - як комуподобається) з процесором, рівним по потужності сьогоднішньому Pentium II, тількина частотах близько 1 ГГц, з кешем першого рівня під 1-2 Гбайт, з флеш -пам'яттю під 300-500 Мбайт і/або RAM-диском 1-2 Гбайт.
Зазвичай середні витрати на етап технологічного процесу внапівпровідникової промисловості мають тенденцію знижуватися на 25-30% щорокурік. Впровадження подвійного Дамаського процесу на рівні внутрішньої розводкискоротить загальні витрати на 30% разом, зберігаючи загальну тенденцію скорочуватися ідалі, з року в рік.
Для рівня 0,13 мкм і менше затримки в мідних провідниках вдвічі менше,ніж вони могли б бути в подібних (гіпотетичних, здебільшого)структурах Al-SiO2.
Крім того, в алюмінієвих тонких (ширина близько 0,25 мкм) провідникахщільність струму вже така, що відбувається електроміграція алюмінію,що призводить до відмов. Краща опірність цьому ефекту, характернадля міді, дозволяє досить легко подолати межу по шириніпровідника. Тепер залишаються обмеження типу занадто високоюдіелектричної проникності у SiO2 (між шарами металу лежить самецей матеріал). З подоланням цього недоліку і впровадженням більшдосконалої літографії мідь буде застосовуватися до меж 0,13 мкм.
Два основні відмінності подвійного з Дамаску, мідного процесу виготовленнямежз'єднань від традиційної алюмінієвої технології полягають у наступному.
По-перше, операцією, яка визначає мінімальну ширину і крок розведення ввипадку Al, є травлення металу, а планарізація (вирівнюванняоброблюваної поверхні чіпа по горизонталі) кожного металевогорівня здійснюється на етапах заповнення проміжку і CMP (хіміко -механічної планарізаціі) діелектрика. У процесі ж виготовлення мідноїрозведення етапом, що визначає мінімальну ширину і крок провідників,є не травлення металу, а простіше травлення діелектрика.
Завдання планарізаціі виконують на етапах осадження і CMP міді.
По-друге, подвійний з Дамаску процес володіє ще однією перевагою якперед звичайною дамаської технологією, так і субтрактівним процесом,що застосовуються в даний час для виготовлення алюмінієвої розведення, віндозволяє приблизно на третину скоротити кількість технологічних етапів.

Вплив архітектури мікропроцесорів на підвищення продуктивності.

У важкій ситуації опинилися виробники мікропроцесорів в кінцідев'яностих років. Скільки не збільшували вони продуктивністьпроцесорів, потреб користувачів задовольнити не могли. Азупинитися - означало померти: перестав крутити педалі, впасти звелосипеда.
Нарощувати тактову частоту з кожним днем ставало все важче. Тодірозробники пішли іншим шляхом: оптимізували виконавчі ланцюги, щоббільшість команд виконувалося всього за один такт мікропроцесора, ввелинові інструкції і векторні операції (технології MMX і 3Dnow !)...< br> Сьогодні можна з упевненістю сказати, що RISC-і CISC-архітектуривичерпали себе, досягнувши порівнянної продуктивності. Але програмісти,немов не помітивши цього, все ще продовжують "обважнювати" програмнезабезпечення: Windows 2000 буде побудована на об'єктах COM і COM +. З точкизору розробників це добре, бо дозволить писати більш стійкий івільний від помилок програмний код, але з точки зору мікропроцесора одинтільки виклик об'єкта COM + розпадається на тисячі команд і дуже-дуже багатотактів.
Без подальшого росту обчислювальних потужностей впровадження цих технологій вповсякденне життя просто немислимо! Тому вже сьогодні з'являютьсябагатопроцесорні системи, орієнтовані на домашні та офіснікомп'ютери.
Вузьким місцем мікропроцесорів традиційних архітектур стала вибірка ідекодування інструкцій. Дійсно, в одному кристалі неважкорозмістити кілька незалежних функціональних пристроїв, але тільки однез них зможе обробляти потік команд. Чому? Дуже просто: виконуватинаступну інструкцію можна, тільки повністю впевнені, що їй небуде потрібно результат роботи попередньої.

суперскалярної АРХІТЕКТУРА

Виходить, що виконувати за один такт можна і більше однієї інструкції?
Дійсно, що нам заважає синхронно виконувати щось на кшталт:

MOV AX, 1234h; Записати в регістр AX число 1234h
MOV CX, DX; Записати в регістр CX значення регістра DX

Достатньо лише, щоб пристрій вибірки інструкцій дозволялодекодувати обидві команди за один такт. Для RISC з їх фіксованою довжиноюкоманд це взагалі не становило жодної проблеми (докладніше - у статті
"RISC vs. CISC").
Складний набір інструкцій CISC доставив чимало головного болю розробникам,але все ж, ціною інженерних осяянь і складних апаратних рішень, булипобудовані мікропроцесори, які встигали декодувати два і більшепоширені інструкції за один такт.
Словом, побудова подібних декодерів не було нездоланною перешкодою.
Складність полягала в тому, що далеко не всі команди можна виконуватипаралельно. Наприклад:

MOV AX, 1234h; Записати в регістр AX число 1234h
ADD DX, AX; Скласти вміст регістра DX з регістром AX

Поки не буде відомий результат роботи першої команди , виконання другоїнеможливо. Отже, мікропроцесор буде простоювати, а користувачпити каву, споглядаючи на екрані пісочний годинник.
За статистикою лише десять відсотків суміжних команд не використовуютьрезультатів роботи один одного. Чи варто мізерне збільшенняпродуктивності ускладнення процесора? Виявляється, так: якщо трохиподумати і ще трішки ускладнити аналіз залежності між командами.
Справді, якщо приклад, наведений вище, переписати як

MOV AX, 1234h
ADD DX, 1234h

ми отримаємо ідентичний результат, але обидві команди можуть бути виконаніпаралельно всього за один такт процесора. Можна піти далі і затримативиконання першого інструкції до того часу, поки значення регістра AX НЕбуде потрібно в явному вигляді. Якщо воно й зовсім ніколи не буде потрібно - мизаощадимо цілий такт!
Ідеї про подібну, на льоту, оптимізації коду породили суперскалярнімікропроцесори, тобто такі, де паралелізм команд явно не зазначений івідстежується процесором самостійно.
Однак Intel знайшла подібні прийоми оптимізації занадто важкими дляреалізації і зробила наголос на зміну порядку виконання команд. Так,послідовність

MOV AX, 1234h; Записати в регістр AX число 1234h
ADD DX, AX; Скласти вміст регістра DX з регістром AX
MOV CX, 666h; Записати в регістр CX число 666h
ADD BX.CX; Скласти вміст регістра BX з регістром CX

Можна виконати в іншому порядку:

MOV AX, 1234h; Записати в регістр AX число 1234h
MOV CX, 666h; Записати в регістр CX число 666h
ADD DX, AX; Скласти вміст регістра DX з регістром AX
ADD BX.CX; Скласти вміст регістра BX з регістром CX

Тепер сусідні інструкції незалежні і можуть бути виконані паралельно.
Отже, наведений вище приклад може бути виконаний за два тактизамість чотирьох. Дуже непоганий шлях підвищення продуктивності, але, нажаль, очевидно тупиковий: удосконаливши інтелектуальний "движок",можна знайти спосіб паралельного виконання чотирьох команд, але сумнівно,щоб існував чарівний спосіб усунення залежності між восьмою ібільше командами.
RISC в цій ситуації виявилися в більш виграшному положенні. Обмеженийнабір регістрів CISC породжував проблеми аналогічно наступною:

MOV AX, 1234h; Записати в регістр AX число 1234h
ADD DX, AX; Скласти вміст регістра DX з регістром AX
MOV AX, 666h; Записати в регістр CX число 666h
ADD BX.AX; Скласти вміст регістра BX з регістром AX

Тепер вже неможливо одночасно виконати перший і третій рядки,однак цієї, здавалося б, на перший погляд, нерозв'язної проблеми швидкобуло знайдено гарне рішення. Насправді залежність між двомакомандами помилкова. Очевидно (навіть машині), що повинні використовуватисядодаткові регістри. Але що нас обмежує? Давайте перейменуєморегістри в AX ~ 1 і AX ~ 2 відповідно. Тоді отримаємо наступний код:

MOV AX ~ 1,1234 h; Записати в регістр AX число 1234h
ADD DX, AX ~ 1; Скласти вміст регістра DX з регістром AX
MOV AX ~ 2,666 h ; Записати в регістр CX число 666h
ADD BX, AX ~ 2; Скласти вміст регістра BX з регістром AX

Зрозуміло, тепер ніяких проблем з паралельним виконанням вже невиникне. Звичайно ж, буде потрібно більше регістрів! Але регістри дешеві
(усього лише набір тригери з 4-6 транзисторів), а за швидкодіюспоживач гроші охоче заплатить.
Проблема в тому, що додавання нових регістрів потребують перекомпіляціївсього існуючого програмного забезпечення і зміни адресації. Однимсловом, призведе до несумісності з попередніми моделями. Для когось це,може, було і не критично, але тільки не для Intel, якої зворотнійсумісність потрібна обов'язково.
І Intel знаходить блискуче рішення. Існуючі регістри при декодуваннікоманди проектуються на набагато більший набір внутрішніх. І як тількивиявляється помилкова залежність, черговий регістр перейменовується.
Розрив у продуктивності між CISC і RISC знову загублений.

паралелізм у МІКРОПРОЦЕСОРА RISC і CISC

Мікропроцесори PowerPC (RISC)

Процесор PowerPC був розроблений в результаті тісної співпраціпровідних виробників індустрії - IBM, Apple і Motorola. Він втілив усобі геній тисяч інженерів, довгий час був лідером серед побратимів ввідношенні ціна/продуктивність.
суперскалярної RISC-ядро дозволяло за один такт виконувати до чотирьохкоманд завдяки чотирим конвеєрам вибірки і шести незалежнимфункціональним пристроям: трьом целочисленным АЛП, блоку речовоїарифметики (обробляє числа з плаваючою точкою), модулю чтеніязапісірезультатів і блоку переходів. Для паралельного виконання вибіркаінструкцій повинна відповідати набору наявних пристроїв. Чотирицілочисельні операції за один такт не виконані, а ось три цілочисельніі один речова можуть.
Для підвищення продуктивності та підтримки ефективної завантаженняфункціональних блоків у PowerPC використовується динамічне пророкуванняумовних переходів укупі з випереджувальним виконанням коду на глибину дочотирьох передбачених переходів.
При цьому результати роботи команд записуються в проміжний кеш-буфер,який обнуляється у випадку помилкового передбачення. Що являє собоюдинамічне пророкування розгалужень? У мікропроцесорах PowerPC використанийпростий і надійний механізм таблиці передісторії переходів (або, говорячикрасивим технічною мовою, BTH - Branch History Table).
У кеш цієї таблиці заносяться адреси і результати розгалуження. Якщопопадається умовний перехід, який вже був занесений до таблиці, процесорвважає, що результат розгалуження виявиться той же самий, і починаєпопереджуюче виконання відповідної гілки.
Цей механізм дозволяє вгадувати напрям переходу в середньому в 95випадках зі 100, що значно вище, ніж у CISC-мікропроцесорів. Втім,і самих умовних переходів в RISC'ах значно більше, та й перебувають вониздебільшого в циклах, тоді як в CISC вони іррегулярні розкидані повсьому коду і мають тісний зв'язок між робочою заразданими та напрямком розгалуження. Просто кажучи, вони менш періодичність тапередбачувані. Але з огляду на те, що самих умовних переходів значноменше, вдалість або невдало пророкувань незначно відображається назагальної продуктивності.
PowerPC активно використовує технологію переупорядоченія послідовностівиконання команд. У будь-який момент можуть бути виконані чотири довільніінструкції з шестнадцатіелементного буфера команд.

Мікропроцесор Pentium Pro

Висока продуктивність була досягнута у великій мірі завдякиполіпшенню внутрішнього паралелізму архітектури процесора. Перш за все,це рознесених архітектура і динамічне виконання команд.
Остання являє собою випереджаюче виконання команд, пророкуванняпереходів і переупорядоченіе черги виконання інструкцій. Крім того, в
Pentium широко використовується нехарактерна для RISC технологіяперейменування регістрів для усунення помилкової залежності (в RISC простоЗанадто багато регістрів, щоб у цьому виникла суттєва необхідністьабо виявилося недостатньо переупорядоченія команд).
конвеєрів у Pentium Pro два. Однак це ще не означає, що Pentiumздатний виконати дві будь-які інструкції паралельно. Виходячи зі складностікоманд CISC і того факту, що кожна інструкція може задіятидовільне (читай: часом дуже велике) число функціональнихвус