Зміст: p>
Введення p>
1. Архітектура Intel NetBurst p>
2. Процесор p>
3. Чіпсет і системна шина p>
4. Тестування Pentium 4 p>
Висновок p>
Список використаних джерел p>
Введення p>
Будучи випущеним у 1995 році, процесор Intel Pentium Pro став першим CPU з архітектурою P6. З тих пір пройшло вже досить багато часу, змінилося
кілька поколінь процесорів, проте, по суті архітектура не змінювалася. Родини Pentium II, Pentium III і Celeron мають все те ж будову ядра,
відрізняючись по суті тільки розміром і організацією кеша другого рівня і наявністю набору команд SSE, що з'явився в Pentium III. Природно, рано чи пізно
архітектура P6 повинна була застаріти. І справа тут зовсім не в неможливості подальшого нарощування тактових частот і навіть не в що загострилася останнім
час конкуренцією з AMD. Звичайно, не можна заперечувати той факт, що досягнувши частоти в 1 ГГц Intel зіткнувся з проблемами в подальшому нарощуванні частоти
своїх процесорів: Pentium III 1.13 ГГц навіть довелося відкликати у зв'язку з його нестабільністю. Однак, цю проблему можна легко вирішити переходом на 0.13 мкм
процес - тим більше, що його повсюдне впровадження не за горами. p>
Справжня причина необхідності нової архітектури криється глибше. На жаль, подальше нарощування частоти
існуючих процесорів приводить все до меншого зростання їх продуктивності. Проблема в тому, що латентності, тобто затримки, що виникають при зверненні до
тих чи інших вузлів процесора, за нинішніми мірками в P6 вже занадто великі. Саме це стало основною причиною, по якій Intel затіяв розробку
Pentium 4, яка виконана з чистого аркуша. Таким чином, анонсований сьогодні Pentium 4 - зовсім новий процесор, нічого спільного не має з
своїми попередниками. У його основі лежить архітектура, названа Intel NetBurst architecture. Цією назвою Intel хотів підкреслити, що основна
мета нового процесора - прискорити виконання завдань потокової обробки даних, безпосередньо пов'язаних з бурхливо розвиваються Internet. p>
1. Архітектура Intel NetBurst p>
Насамперед, спробуємо розібратися з особливостями нової архітектури. Архітектура NetBurst має у своїй основі
кілька інновацій, в комплексі та дозволяють досягти кінцевої мети - гарантувати запас швидкодії і майбутню нарощуваність для процесорів
сімейства Pentium 4. До числа основних технологій входять: p>
Hyper Pipelined Technology. Конвеєр
Pentium 4 має безпрецедентно велику глибину - 20 стадій. P>
Advanced Dynamic Execution. Покращене
передбачення переходів і виконання команд зі зміною порядку їх слідування (out of order execution). p>
Trace Cache.
Для кешування декодувати інструкцій в Pentium 4 використовується спеціальний кеш. P>
Rapid Execute Engine. ALU
процесора Pentium 4 працює на вдвічі більшою, ніж сам процесор, частоті. p>
SSE2.
Розширений набір інструкцій для обробки потокових даних. P>
400 MHz System Bus. Нова
системна шина. p>
Розглянемо всі нововведення по порядку. p>
1.1 Hyper Pipelined Technology p>
Назвою Hyper Pipelined Technology конвеєр Pentium 4 зобов'язаний своєю довжиною - 20 стадій. Для порівняння - довжина конвеєра
Pentium III складає 10 стадій. Чого ж досяг Intel, так подовживши конвеєр? Завдяки декомпозиції виконання кожної команди на більш дрібні етапи, кожен
з цих етапів тепер може виконуватися швидше, що дозволяє безперешкодно збільшувати частоту процесора. Так, якщо при використовуваному сьогодні
технологічному процесі 0.18 мкм гранична частота для Pentium III складає 1 ГГц (ну або, більш оптимістичними оцінками, 1.13 ГГц), Pentium 4 зможе
досягти частоти 2 Ггц. p>
Однак, у надмірно довгого конвеєра є і свої недоліки. Перший недолік очевидний - кожна команда тепер, проходячи більше
число стадій, виконується довше. Тому, щоб молодші моделі Pentium 4 перевершували по продуктивності старші моделі Pentium III, частоти Pentium
4 починаються з 1.4 Ггц. Якби Intel випустив би Pentium 4 1 ГГц, то цей процесор безсумнівно б програв в продуктивності гігагерцовий Pentium
III.
Другий недолік довгого конвеєра розкривається у разі помилок в прогнозі переходів.
Як і будь-який сучасний процесор, Pentium 4 може виконувати інструкції не тільки послідовно, але і паралельно, відповідно не завжди в тому
порядку, як вони слідують в програмі і не завжди достеменно знаючи напрямки умовних переходів. Для того, щоб вибирати в таких випадках гілки програми
для подальшого виконання, процесор прогнозує результати виконання умовних переходів на підставі накопиченої статистики. Однак, іноді блок
передбачення переходів все ж таки помиляється, і в цьому випадку доводиться повністю очищати конвеєр, зводячи нанівець всю попередньо пророблену процесором
роботу з виконання не тієї гілки в програмі. Природно, при більш довгому конвеєрі, його очищення обходиться дорожче в тому сенсі, що на нове заповнення
конвеєра йде більше процесорних тактів, а отже і часу. p>
1.2 Advanced Dynamic Execution p>
Метою низки хитрощів в архітектурі Pentium 4, під загальною назвою Advanced Dynamic Execution, як раз і є мінімізація
простою процесора при неправильному прогнозі переходів і збільшення ймовірності правильних прогнозів. Для цього Intel поліпшив блок вибірки
інструкцій для позачергового виконання і підвищив правильність передбачення переходів. Правда, для цього алгоритми передбачення переходів були доопрацьовані
мінімально, основними ж засобом для досягнення мети було обрано збільшення розмірів буферів, з якими працюють відповідні блоки процесора.
Так, для вибірки наступної інструкції для виконання використовується тепер вікно величиною
в 126 команд проти 42 команд у процесора Pentium III. Буфер ж, в якому зберігаються адреси виконаних переходів і на підставі якого процесор
пророкує майбутні переходи, тепер збільшено до 4 Кбайт, у той час як у Pentium III його розмір становив всього 512 байт.
Результатом цього, а також завдяки невеликій доробці алгоритму, ймовірність правильного
передбачення переходів була поліпшена в порівнянні з Pentium III на 33%. Це - дуже гарний показник, оскільки тепер Pentium 4 пророкує переходи
правильно в 90-95% випадків. p>
1.3 Trace Cache p>
Замість звичайного L1 кеша, який в Pentium III був розділений на область інструкцій і область даних у Pentium 4 застосований новий
підхід. Інструкції в L1 кеші не зберігаються, він призначений тепер тільки для даних. Для кешування інструкцій тепер використовується Trace Cache, проте за
порівнянні зі звичайним L1-кешем він має багато переваг, спрямованих знову ж таки на мінімізацію простоїв процесора при виконанні неправильних прогнозів
переходів.
Перше, і основне - в Trace Cache зберігаються вже декодувати інструкції. Це означає,
що в ньому зберігаються не класичні x86 інструкції, а так звані мікрокоманд, більш прості операції якими безпосередньо оперує процесорний
ядро. Збереження в Trace Cache мікрооперацій дозволяє уникнути повторного декодування x86 інструкцій при повторному виконанні того ж ділянки програми
або при неправильному прогнозі переходів. p>
Друга перевага Trace Cache полягає в тому, що мікрооперації в ньому зберігаються саме в тому порядку, в якому вони
виконуються. Правда, правильний порядок визначається знову ж таки на підставі передбачення переходів, однак імовірність того, що переходи передбачається
неправильно, достатньо мала для того, щоб відмовитися від очевидного виграшу, що отримується шляхом відмови від повторних декодування і передбачень переходів. p>
Intel не розкриває розмірів свого Trace Cache в кілобайтах, однак, відомо, що в ньому може бути збережене до 12000 мікрооперацій. p>
1.4 Rapid Execute Engine p>
Найбільш проста частина сучасного процесора - це ALU (арифметико-логічний пристрій). Завдяки цьому факту, Intel вважав
за можливе збільшити його тактову частоту усередині Pentium 4 вдвічі по відношенню до самого процесора. Таким чином, наприклад, в 1.4 Ггц Pentium 4 ALU працює на
частоті 2.8 ГГц. p>
У ALU виконуються прості цілочисельні інструкції, тому, продуктивність нового процесора при операціях з цілими числами
повинна бути дуже високою. Однак, на продуктивності Pentium 4 при операціях з числами, MMX або SSE дворазове прискорення ALU ніяк
не позначається.
Таким чином, латентність ALU істотно знижується. Зокрема, на виконання
однієї інструкції типу add Pentium 4 1.4 ГГц витрачав всього 0.35нс, у той час як виконання цієї команди у Pentium III 1 ГГц займає 1 нс. p>
1.5 SSE2 p>
Реалізувавши у своєму процесорі Athlon новий конвеєрний FPU, AMD дуже сильно обігнала інтеловськіх Pentium III в
продуктивності при операціях з дійсними числами. Однак, у своєму Intel Pentium 4 не став зосереджуватися на вдосконаленні свого FPU, а просто
збільшив можливості блоку SSE. В результаті, в Pentium 4 має місце розширений набір команд SSE2, в якому до наявного набору з 70 інструкцій
було додано ще 144. Таке рішення - результат NetBurst ідеології, основною метою якої є збільшення швидкості роботи з потоками даних.
Інструкції SSE дозволяли оперувати з вісьмома 128-бітними регістрами XMM0 .. XMM7, в
яких зберігалися по чотири речових числа одинарної точності. При цьому всі SSE операції проводилися одночасно над четвірками чисел, в результаті чого
спеціально оптимізовані програми, в яких проводилося велика кількість однотипних обчислень (а до них, крім обробки потоків даних в
якійсь мірі відносяться і 3D-ігри), отримували істотний приріст в продуктивності. p>
SSE2 ж оперує з тими ж самими регістрами і сумісні з SSE процесора Pentium III. А настільки вражаюче розширення
набору команд викликано тим, що тепер операції з 128-бітними регістрами можуть виконуватися не тільки як з четвірками дійсних чисел подвійної точності, але
і як з парами дійсних чисел подвійної точності, з шістнадцятьма однобайтових цілими, з вісьмома короткими багатобайтових цілими, з чотирма
четирехбайтовимі цілими, з двома восьмібайтовимі цілими або з 16 байтовий цілими. Тобто, тепер SSE2 представляючи собою симбіоз MMX і SSE і дозволяє
працювати з будь-якими типами даних, залазять в 128-бітові регістри. p>
p>
Таким чином, SSE2 набагато більш гнучкий, дозволяючи домагатися вражаючого приросту в продуктивності. Однак, використання
нового набору команд вимагає спеціальної оптимізації програм, тому чекати його впровадження відразу після виходу нового процесора не варто. Згодом же,
SSE2 має досить великі перспективи. Тому, навіть AMD збирається реалізувати SSE2 у своєму новому сімействі процесорів Hammer.
Старі ж програми, які не використовують SSE2, а покладаються на звичайний арифметичний співпроцесор, ніякого приросту в продуктивності при
використанні Pentium 4 не отримають. Більше того, незважаючи на те, що що Intel говорить про те, що блок FPU в Pentium 4 був злегка вдосконалено, час,
витрачений на виконання звичайних операцій з числами з зросло в порівнянні з Pentium III в середньому на 2 такту. p>
1.6.1 L1 кеш p>
Що стосується кеша першого рівня в Pentium 4, то оскільки тепер команди зберігаються в Trace Cache, він призначений тільки для
зберігання даних. Однак, його розмір в Pentium 4, заснованому на ядрі Willamette складає всього 8 Кбайт. Це виглядає досить невеликою цифрою навіть на тлі
16-кілобайтні області даних в L1 кеші Pentium III. Однак, Intel був змушений скоротити обсяг кеша першого рівня в Pentium 4, так як ядро цього процесора
і без того виходило занадто великим. Тим не менше, архітектура цього процесора може підтримувати L1-кеш і більшого розміру, тому, швидше за все,
при переході на технологічний процес 0.13 мкм і нове ядро Northwood, цей кеш буде збільшений. p>
Однак, для збільшення продуктивності, Intel застосував для доступу до L1-кешу новий алгоритм, чим зменшив в Pentium 4
латентність цього кешу до двох процесорних тактів замість трьох терактів в Pentium III. Таким чином, з огляду на велику тактову частоту Pentium 4, час реакції
його L1 кеша складає всього 1.4нс для 1.4 Ггц моделі проти 3нс у L1 кеша Pentium III 1 ГГц.
Також як і в Pentium III, L1 кеш Pentium 4 є write through і асоціативним з 4
областями асоціативності. При цьому довжина одного рядка L1 кеша дорівнює 64 байтах. P>
1.6.2 L2 Advanced Transfer Cache p>
Процесор Pentium 4 має Advanced Transfer Cache другого рівня об'ємом 256 Кбайт. Також, як і в Pentium III, L2-кеш має широку 256-бітну шину,
завдяки якій процесори від Intel мають більш високу пропускну здатність кешу, ніж їх конкуренти від AMD, що використовують 64-бітну шину кеша.
Однак, на відміну від Athlon, в Pentium 4 (втім, також як і в Pentium III) L2 кеш не є ексклюзивним, тобто він дублює дані, що знаходяться в L1
кеші. p>
Так як Pentium 4 розрахований на обробку потокових даних, швидкість роботи L2-кеша для нього є одним з ключових моментів.
Тому, Intel збільшив пропускну здатність кеша другого рівня в Pentium 4 в два рази. Це удосконалення було зроблено завдяки передачі даних з
L2-кеша на кожен процесорний такт, в той час, як дані з L2-кеша Pentium III передаються тільки на кожен другий такт. Таким чином, пропускна
здатність L2-кеша Pentium 4, що працює, наприклад, з частотою 1.4 Ггц має тепер значну величину 44.8 Гбайт/с. Для порівняння - пропускна
здатність Advanced Transfer Cache у Pentium III 1 ГГц становить 16 Гбайт/с.
Також як і в Pentium III, L2 кеш має вісім областей асоціативності і рядки довжиною 128
байт. Однак, на відміну від Pentium III, кожен рядок може бути вилучена не цілком, а по 64-байтовий половинкам.
Говорячи про систему кешування в Pentium 4, не можна обійти стороною і той факт, що
архітектура NetBurst підтримує і кеш третього рівня розміром до 4 Мбайт. Однак, в Pentium 4 поки ця можливість використовуватися не буде. Вона
зарезервована для майбутнього застосування в серверних процесорах. p>
2. Процесор p>
Отже, після короткого знайомства з основними деталями NetBurst архітектури, основна зброя Pentium 4 поглянемо на його
формальну специфікацію: p>
Чіп,
вироблений за технологією 0.18 мкм із використанням алюмінієвих з'єднань. Перехід на мідні з'єднання Intel планує провести одночасно з
впровадженням технології 0.13 мкм. p>
Ядро
Willamette, засноване на архітектурі NetBurst. Містить 42 млн. транзисторів і має площу 217 кв.мм. Це більш ніж у два рази більше, ніж площа ядра
Athlon або Pentium III. P>
Працює в
спеціальних материнських платах з 423-контактним процесорним роз'ємом Socket 423. p>
Використовує
високопродуктивну 400 МГц Quad Pumped системну шину p>
Кеш даних
першого рівня 8 Кбайт. Trace Cache для декодувати інструкцій розрахований на 12000 мікрооперацій p>
Інтегрований
Advanced Transfer Cache другого рівня розміром 256 Кбайт. Працює на повній частоті ядра і має 256-бітну шину p>
Напруга
харчування - 1.7В p>
Набір
SIMD-інструкцій SSE2 p>
Випускаються
версії з частотами 1.4 і 1.5 Ггц. Пізніше очікується версія з частотою 1.3 Ггц. P>
Процесор Intel Pentium 4 буде випускатися в FC -PGA упаковці, однак саме ядро буде
закрито heat spreader - спеціальною металевою кришкою, що захищає його від пошкодження. Встановлюватися Pentium 4 буде в гніздо Socket 423, що має 423
контакту і відрізняється за розміром від звичайних Socket 370 і Socket A. p>
Через велику ядра, тепловиділення нових кристалів буде досить високим. Зокрема, Pentium 4 1.4 ГГц, що працює
на напрузі 1.7 В і споживає приблизно 32 A, розсіюватиме близько 52 Вт тепла (1.5 Ггц Pentium 4 розсіює 55 Вт тепла). Тому, кулери для
Pentium 4 повинні мати досить великі розміри і площа поверхні. P>
Вартість процесора при поставках партіями 1000 шт. становить, відповідно, $ 819 і $ 644 для моделей з тактовими
частотами 1.5 ГГц і 1.4 ГГц. Pentium 4 1.3 ГГц, який з'явиться 29 січня 2001, буде коштувати $ 409. Intel планує досить агресивно знижувати ціни на
Pentium 4, з тим, щоб цей процесор міг застосовуватися в настільних комп'ютерах середнього рівня: p>
20 листопада
10 грудня
29 січня
Pentium 4 1.5 Гц
819
819
644
Pentium 4 1.4 Гц
644
574
440
Pentium 4 1.3 Гц
--
--
409
3. Чіпсет і системна шина b> p>
Оскільки Pentium 4 має абсолютно нову архітектуру, то йому потрібен був і новий чіпсет. Так як Intel націлює свій
новий процесор на програми, що працює з потоками даних, то основним завданням такого чіпсета має бути забезпечення високих пропускних
здібностей основних шин: шини пам'яті і системної шини, що з'єднує процесор з північним мостом чіпсета. p>
У першу чергу необхідно сказати про те, що Pentium 4 використовує абсолютно нову
Quad Pumped процесорну шину, що працює з частотою 400 МГц. Пропускна здатність такої шини в три рази більше, ніж пропускна здатність шини
процесора Pentium III, і становить 3.2 Гбайт/с. Завдяки такої високої пропускної здатності, мінімізуються простої швидкого процесора Pentium 4 в
очікуванні наступної порції даних. Фізично, реалізується нова системна шина шляхом множення в контролерах процесорної шини чіпсета і процесора тактовою
частоти, що для Pentium 4 становить 100 МГц, на 4. Тобто, на частоті 400 МГц працює тільки ділянка між процесором і чіпсетом. Поряд з такою високопродуктивної шиною, щоб система була збалансована,
підсистема пам'яті для Pentium 4 повинна забезпечувати не меншу, ніж 3.2 Гбайт/с, пропускну здатність. Тому, при створенні набору системної логіки
для нового процесора Intel прийняв рішення адаптувати чипсет i840, який підтримує два канали Direct RDRAM. Як відомо, пропускна здатність
PC800 RDRAM становлять 1.6 Гбайт/с, тобто, при використанні двох каналів Rambus, пропускна здатність пам'яті виявляється саме на рівні 3.2
Гбайт/с.
Про недоліки RDRAM сказано вже досить багато, головний з них - це висока
ціна цієї пам'яті, проте з технологічної точки зору двоканальна RDRAM виглядає в системах з Pentium 4 цілком виправдане. На жаль, DDR SDRAM з
близькою пропускною здатністю буде випущена тільки до кінця наступного року. Однак, RDRAM гарна тільки в задачах потокової обробки даних. У випадку ж
вирішення завдань, що вимагають непослідовний доступ до даних, латентність RDRAM виявляється занадто високою і цілком може бути виправдане застосування не тільки
DDR SDRAM, а й навіть звичайної SDRAM пам'яті. Однак, чіпсетів з підтримкою SDRAM поки немає, і в кращому випадку вони з'являться тільки до середини наступного року. P>
В якості південного мосту в цьому наборі логіки використовується вже відома нам зі чіпсету i815E мікросхема ICH2, а в якості
північного моста - новий MCH Intel 82850, в числі ключових особливостей якого слід відзначити підтримку двох каналів Rambus, кожен з яких може
функціонувати з парою модулів RIMM, підтримку 400-мегагерцовим системної шини і AGP 4x. p>
3.1 Материнські плати
З огляду на дорожнечу самого чіпсета i850, який коштує $ 75, а також з огляду на те, що
плати під Pentium 4 повинні мати шестіслойную PCB, проводити їх досить складно і дорого. Тому, лише обмежена кількість виробників системних
плат висловило бажання вступити у виробництво плат під Socket 423. Найближчим часом плати під Pentium 4 будуть випускатися тільки вісьмома
виробниками. Специфікації деяких таких плат вже відомі: p>
Плата
Чіпсет
Форм-фактор
RIMM
AGP
PCI
CNR
Примітки
Aopen AX4T
i850
ATX
4
AGP Pro
5
1
ASUS P4T
i850
ATX
4
AGP Pro
5
0
Можливості для розгону CPU
Gigabyte GA-8TX
i850
ATX
4
AGP Pro
5
1
Інтегрований Creative CT5880
Intel D850GB
i850
ATX
4
AGP Pro
5
1
MSI MS-6339
i850
ATX
4
1
5
1
Як можна бачити з таблиці, всі плати під Pentium 4 схожі один на одного: всі мають по чотири слота для RIMM і по п'ять
слотів PCI. Більшість плат буде обладнуватися слотом AGP Pro, що дозволяє використовувати професійні графічні карти з підвищеним
енергоспоживанням. p>
3.2 ATX 2.03
Крім нових системних плат і нових кольорів, як це парадоксально не звучить, новий процесор буде вимагати і новий
корпус, сумісний зі специфікацією ATX 2.03. І викликано це двома причинами.
По - перше, з огляду на те що кулери для Pentium 4 мають великі радіатори, маса яких
може досягати 450 г, кріпити до процесорного сокет їх більше не можна. Тепер для утримування кулера буде використовуватися спеціальний ретеншн-механізм,
кріпиться за допомогою чотирьох болтів безпосередньо до корпуса. Відповідно, корпус повинен мати додаткові кріпильні отвори. P>
p>
Додатковий плюс, який дає використання ретеншн-механізму для кулера, це зменшення електромагнітного
впливу процесора, що працює на надвисоких частотах, на інші компоненти системної плати.
Другим новим вимогою специфікації ATX 2.03 є наявність у блоку харчування
додаткового четирехжільного кабелю живлення, що підключається до системної плати, з
спосіб кріплення напругою 12 і 5 В. p>
Додаткове живлення необхідно для процесора Pentium 4, що відрізняється надмірно великим енергоспоживанням. p>
4. Тестування Pentium 4 p>
Для тестування було зібрано три системи з наступними конфігураціями: p>
Pentium 4
Pentium III
Athlon
Процесор
Intel Pentium 4 1.4 Гц
Intel Pentium III 1 ГГц
AMD Athlon 1.2 Ггц
Системна плата
Intel D850GB (i850)
ASUS CUSL2 (i815)
ABIT KT7 (VIA T133)
Пам'ять
256 Мбайт PC800 RDRAM
256 Мбайт PC133 SDRAM
Відеокарта
ASUS V7700 32MB (NVIDIA GeForce2 GTS)
Жорсткий диск
IBM DTLA 307015
Продуктивність Pentium 4 порівнювалася з найшвидшими на сьогодні процесорами інших родин: Intel Pentium III 1
ГГц або AMD Athlon 1.2 Ггц. P>
Тестування проводилося під керуванням операційної системи Microsoft Windows2000 SP1 з
встановленим DirectX 8. p>
4.1 Результати тестів p>
p>
Оскільки процесор Pentium 4 має абсолютно нову архітектуру, p>
аналіз продуктивності цього процесора буде складатися з двох частин. У перші для
виміру швидкодії ми скористаємося синтетичними тестами, а в другій протестуємо процесори, що приймають участь у тестуванні, реальними
додатками. p>
CPUmark 99 p>
p>
Цей тест показує продуктивність цілочисельний частини процесора та швидкість роботи з даними.
Здавалося б, оскільки ALU Pentium 4 працює на подвоєною частоті процесора, то за результатами цього тесту попереду має бути Pentium 4. Однак цього не
відбувається. Розгадка повільності Pentium 4 в даному тесті криється в недостатньо великому L1 кеші, в який не поміщаються всі необхідні для його
роботи дані. Athlon ж, з областю даних в L1-кеші розміром 64 Кбайта, а це в 8 разів більше, ніж кеш даних Pentium 4, значно переважає своїх
суперників. p>
FPU WinMark
p>
Цей бенчмарк показує "чисту" швидкість роботи арифметичного співпроцесора завдяки тому
що всі дані, необхідні для його роботи вміщаються в L1 кеш процесора. Результати ще раз підтверджують, що блок FPU у Athlon дуже хороший. Крім
того, ясно видно, що через зростання латентності FPU в Pentium 4, його показники в цьому тесті виглядають навіть гірше, ніж у Pentium III. p>
3DMark2000 CPUmarks p>
p>
Цей бенчмарк, що входить до складу 3DMark2000 демонструє теоретичну швидкість роботи процесора за
обробці типових ігрових 3D-сцен при активному використанні наборів SIMD-команд SSE і 3DNow!. На жаль, тестів, що дозволяють оцінити виграш, що отримується від
використання нових SSE2 інструкцій Pentium 4 поки що немає, тому сьогодні ми задовольняємося тільки використанням базового набору інструкцій SSE. Тим не
менше, навіть у цьому випадку Pentium 4 виявляється на висоті, обходячи найближчого конкурента, процесор AMD Athlon 1.2 Ггц на 12%. Таким чином, логічно
очікувати, що в іграх, особливо що підтримують SSE, Pentium 4 буде показувати гідні результати. p>
Так як процесор Pentium 4 працює на зовсім відмінною платформі, що використовує двоканальну RDRAM,
подивимося на те, яку швидкість операцій з пам'яттю може забезпечити ця система в порівнянні з відповідними результатами, отриманими на решті парі
платформ: p>
Memory Speed - Read p>
p>
Memory Speed - Write p>
p>
За графіками цілком очевидно, що дійсно швидкість роботи L1 і L2 кешей в Pentium 4 в порівнянні з Pentium III зросла.
Однак, AMD Athlon володіє набагато більшим за розміром L1 кешем, що в ряді випадків обумовлює його перевагу. Природно, також на графіку ясно
видно, що пропускна здатність двоканальної RDRAM набагато вище, ніж використовується в системах на Athlon і Pentium III PC133 SDRAM. Також, результати цього тесту
дозволяють оцінити, що L2 кеш процесора Athlon дійсно працює повільніше ніж L2 кеш навіть Pentium III, через більш вузької шини. І досить
цікавим є той факт, що вплив L1-кеша абсолютно не позначається в системі з Pentium 4 при записі в пам'ять. p>
Перейдемо тепер до тестів в реальних додатках. p>
Content Creation Winstone 2000 p>
p>
Цей тест грунтується на вимірюванні швидкості системи в декількох додатках для створення контенту.
Як можна бачити, продуктивність системи з Pentium 4 тут однозначно вище, ніж швидкість системи на Pentium III 1 ГГц і наближається до продуктивності
системи з Athlon 1.2 Ггц. Виходить, AMD була права не став випускати процесори з більш високою, ніж 1.2 Ггц частотою. Athlon 1.2 Ггц може
конкурувати з Pentium 4 цілком успішно. p>
Sysmark 2000 p>
p>
Ще один тест, який використовує для виміру продуктивності офісні додатки. Проте, тут
наголос робиться на програми більш широкого профілю, ніж в попередньому тесті, в результаті чого показники Athlon тут вище. Однак, архітектури Pentium III,
Athlon і Pentium 4 відрізняються дуже сильно, тому, співвідношення продуктивностей цих процесорів може змінюватися від додатки до
додатком. Тому, подивимося на швидкості досліджуваних процесорів у конкретних програмах. P>
Sysmark 2000 p>
p>
Неважко помітити, що тут однозначного лідера виділити важко. Однак, у семи з дванадцяти
додатків лідирує AMD Athlon 1.2 Ггц, у той час як Pentium 4 показує велику швидкість тільки в трьох завданнях: системі розпізнавання мовлення Dragon
Naturally Speaking Preferred 4.0, графічному редакторі Adobe Photoshop 5.5 і в утиліту для кодування відеопотоку Microsoft Windows Media Encoder 4.0. Таким
чином, вся корисність Pentium 4 розкривається дійсно тільки в задачах потокової обробки даних. І те, частина заслуги за високу продуктивність
цього процесора лежить на підсистемі пам'яті з набагато більш високою пропускною здатністю, ніж у конкуруючих платформ. p>
3D Studio MAX R3 (чим менше - тим краще) p>
p>
Для оцінки продуктивностей систем в цьому 3D-пакеті, ми засікли час рендерінга сцени
Anisotropic Wheel, що входить в дистрибутив. Відповідно, менший час відповідає кращого результату. Дивно, але тут продуктивність Pentium 4 1.4 ГГц у
точності повторює продуктивність Pentium III 1 ГГц. Це говорить про те, що FPU в Pentium 4 дійсно працює повільніше, ніж у Pentium III. Athlon 1.2
ГГц, володіючи кращим блоком FPU легко обійшов обох конкурентів, побудувавши сцену на 40% швидше. P>
WinZIP (чим менше - тим краще) p>
p>
Тестування в архіваторах дозволяє побачити цілочисельну продуктивність процесорів при
оперуванні з невеликими обсягами даних. У архіватор WinZip кращу швидкість (на діаграмі менше значення відповідає кращого результату)
продемонстрував Athlon 1.2 Ггц. Очевидно, дається взнаки великий кеш першого рівня у цього процесора. P>
WinRar (чим менше - тим краще) p>
p>
Як можна побачити з діаграми (на ній менше значення знову відповідає найкращому результату),
Pentium 4 1.4 Ггц із ALU, що працює на частоті 2.8 ГГц тут рівних немає. Вплив об'ємного кеша першого рівня Athlon у WinRAR зводиться нанівець
досить великим обсягом словника, який використовується в цьому архіватора.
Перейдемо тепер до результатів, які показали випробувані системи в ігрових
додатках. p>
Quake3 Arena (demo001) - 640x480x16 p>
p>
У Quake3 Pentium 4 1.4 ГГц показує себе з кращого боку, показуючи на 30% більш висока
швидкодію, ніж Athlon 1.2 Ггц, не кажучи вже про Pentium III. Це пояснюється як тим, що ALU протестованого Pentium 4 працює на частоті
2.8 ГГц, так і тим, що Quake3 використовує SSE інструкції, які, як ми показали вище, виконуються на Pentium 4 дуже швидко. P>
Quake3 Arena (demo001) - 1024x768x32 p>
p>
З одного боку, число fps у високій роздільній здатності в Quake3 залежить в основному від пропускної здатності
шин, що зв'язують різні компоненти системи, однак з іншого - обмежується швидкістю заповнення що використовується в системі відеокарти. Саме тому, тут
розкид результатів не такий великий, як у попередньому випадку. Однак, завдяки Quad Pumped bus Pentium 4 залишається в лідерах. Однак, Athlon, з
200-мегагерцовим шиною EV6 практично дихає йому в потилицю. P>
Unreal Tournament - 640x480x16 p>
p>
Тут лідируючу позицію утримує Athlon, що має найпродуктивніший серед всіх що беруть участь у
тесті процесорів блок FPU. p>
Unreal Tournament - 1024x768x32 p>
p>
Однак, при зростанні навантаження на шини передачі даних в системі, яке тягне за собою збільшення
дозволу, вперед виходить Pentium 4. Що ж, з 400-мегагерцовим шиною і пам'яттю з пропускною здатністю 3.2 Гбайт/с посперечатися важко. P>
Expendable - 640x480x16 p>
p>
Expendable - гра, що виробляє під час своєї роботи інтенсивні операції з невеликими обсягами
даних. Тому, система на Pentium 4 з RDRAM, що має велику латентність виявляється повільніше обох своїх конкурентів. Причому, відставання Pentium 4 1.4
ГГц від Athlon 1.2 Ггц виявляється немаленьким - більше 30%. P>
Expendable - 1024x768x32 p>
p>
Результати практично повністю повторюють попередній випадок.
На жаль, зараз ми не можемо оцінити потенціал нових Pentium 4 з точки зору
розгону. Справа в тому, що були в нашому розпорядженні системна плата для Pentium 4 Intel D850GB не мала ніяких функцій для запуску процесора на
частоті, що відрізняється від штатної. Однак, у міру появи системних плат від сторонніх виробників, ми протестуємо Pentium 4 і на розгін. P>
Висновок p>
Отже, зробити однозначний висновок щодо процесора Pentium 4 не можна. Безумовно, його
архітектура має масу достоїнств, основним з яких слід визнати можливість легкого нарощування тактових частот. Проте, продуктивність
нового процесора в ряді програм все ж таки не така висока як хотілося б: досить часто вона виявляється менше продуктивності старшого процесора
сімейства Athlon. Причина цього - наддовгих 20-стадійний конвеєр і недостатньо великий кеш даних першого рівня. Тому, найближчим часом
Pentium 4 обігнати за швидкодією конкурента від AMD, Athlon, який також має шляхи для нарощування швидкості за допомогою переходу на нове ядро Palomino
і використання DDR SDRAM, не зможе. p>
У той же час, у систем на Pentium 4 є і більш суттєві недоліки, головний з яких - ціна. Оскільки вартість
RDRAM, необхідної для Pentium 4, а також системних плат для нього достатньо висока, Athlon-платформи мають сьогодні набагато кращим співвідношенням
ціна-продуктивність.
Тим не менше, Pentium 4 все-таки має
віддалені перспективи. З перекладом технологічного процесу на 0.13 мкм і з випуском чіпсетів, що підтримують дешевші ніж RDRAM типи пам'яті, Pentium
4 може стати масовим процесором. Поки ж його доля - високопродуктивні робочі станції. P>
Список використаних джерел: p>
1. Комп'ютерний тижневик "Компьютерра", № 24 2000 г. p>
2. Журнал "Країна ігор", № 22 2000 г. p>
3. Журнал "Мир ПК", № 12 2000 г. p>
4. www.ixbt.ru p>
5. www.computerra.ru p>
6. www.zdnet.ru p>