Интел пентиум 4 3. Процессоры. Температурный режим и энергопотребление

Всем привет Затрону тему процессоров, а то пишу все о программах. Поговорим про мой любимый Pentium 4, конечно он старый, но это был первый мой процессор по настоящему мощный. Да и цена его была также немаленькой, можно тоже сказать что мощной.

Если вы решили собрать себе компьютер на базе Pentium 4, то наверно вы очень редкий человек, ибо мне трудно в это поверить Pentium 4 сегодня уже отжил свое, а семейство Пентиум дальше развивается, вот у меня на данный момент тоже Pentium, только модель G3220, это сокет 1150. В общем современный пенек.

Но как бы там не было, бывают всякие ситуации, например у вас материнская плата под 775-тый сокет, которая поддерживает максимум только Пентиумы. Таких материнок кстати много, и не все покупатели об этом знают, что там только Пентиумы и Целероны идут, а берут и думаю что можно поставить четырехъядерный Quad.

Так вот, у меня был именно Pentium 4 630 — это стандартная и как мне кажется самая популярная модель. Pentium 4 630 немного греется, но не слишком, и при этом не самый слабый, частота там 3 Ггц. В принципе именно эту модель я и вам советую, единственное что — поищите не модель не 630, а 631, это более новее.

Что я могу сказать о процессоре? Скажу так, хотите верьте, хотите нет — это обычный, нормальный процессор для офисного ПК. И об этом говорят его характеристики — поддержка потоков (технология гипертрейдинг), 2 Мб кэша второго уровня, высокая частота (все таки 3 Ггц). И главное, что так как есть потоки, то в Windows такой процессор видится как двухядерный.

Какие игры, программы потянет Пентиум 4? Офис — потянет. Слишком тяжелые страницы в браузере могут работать медленно, это из-за флеш технологии. Игры многие потянет, но тут важно понимать, что для того чтобы Пентиум 4 тянул более-менее игры, нужно чтобы была мощная видеокарта. Тогда на минимальных настройках играть во многие можно. И перед тем как думать, что потянет Пентиум, а что нет, подумайте про оперативку. Вам нужно минимум 2 Гб для более-менее нормального компа, а лучше все 4 Гб, чтобы и в игры пошпилить. Тип оперативки не играет в данном случае большой роли, что DDR1 что DDR2 — разница будет минимальной.

А что еще на такой комп поставить еще SSD накопитель? Тогда комп будет еще быстрее и не каждый поверит что там процессор 10-летнй давности стоит

Какой самый мощный Pentium 4? Хм, хороший вопрос. Я был обладателем такой модели, их два, разница только в поддержке технологии виртуализации. Это Pentium 4 670 и 672 — эти две модели имеют тактовую частоту 3.8 Ггц (у меня была 670 модель), и конечно это хорошо ощутимо. То есть Windows и программы реально работали куда быстрее, чем на 630-той модели.

Какие минусы у процессоров Pentium 4? Главные минусы которые я вижу, это то сколько они потребляют энергии и температура. Все это так, как у современных топовых процов. Вообще-то это и норма, ибо на то время, а это 2004-2005 годы, тогда конечно Pentium 4 считался топовым и мощным. Температура без специального кулера может быть 60 градусов, это в обычном рабочем состоянии, при том что технологии энергосбережения развиты в Пентиумах мягко говоря слабо.

Потребляют Pentium 4 примерно 80 ватт, это на 775-том сокете. На 478 сокете немного меньше — под 70 ватт. Учтите это, при том что мой Pentium G3220 потребляет всего 54 ватт, но по производительности далеко обходит даже разогнанный Пентиум например до 4 ГГц. Вот такие дела.

Зато цена сегодня за эти процессоры очень низкая, можно брать чуть ли не по кг

Вообще есть много хороших моделей, я советую просто смотреть на индекс модели, все что начинается от 630 — это более-менее нормальные, но чем выше индекс, тем больше температура. Есть еще 660, там частота 3.6 Ггц (если не ошибаюсь). Есть два типа индексов или два типа моделей процессоров Pentium 4, это 600-тая линейка и 500-тая. Отличия в основном в кэше, в 500-той линейке он составляет 1 мб. Это все относится к 775-тому сокету.

478 сокет также имеет в своем роду топовые Пентуим 4, там максимальная частота 3.4 (в 775 сокете 3.8) и также в самых топовых моделях есть потоки, то есть гипертрейдинг. То есть можно сказать, что первый псевдо-двухядерный процессор пользователи могли увидеть именно на 478 сокете и примерно в 2002-2003 году. Но сейчас не так часто можно встретить б/у процессоры на 478 сокет и с наличием потоков. Кстати технология потоков была позаимствованная у серверных процессоров.

Введение

Перед началом сезона летних отпусков оба ведущих производителя процессоров, AMD и Intel, выпустили последние модели процессоров в своих современных линейках CPU, нацеленных на использование в высокопроизводительных PC. Сначала сделала последний шаг перед предстоящим качественным скачком AMD и примерно с месяц назад представила Athlon XP 3200+ , который, как предполагается, станет самым быстрым представителем семейства Athlon XP. Дальнейшие же планы AMD в этом секторе рынка связываются уже с процессором следующего поколения с x86-64 архитектурой, Athlon 64, который должен появится в сентябре этого года. Intel же выждал небольшую паузу и представил последний из Penlium 4 на 0.13-микронном ядре Northwood только сегодня. В итоге, заключительной моделью в этом семействе стал Pentium 4 с частотой 3.2 ГГц. Пауза перед выходом следующего процессора для настольных PC, основанного на новом ядре Prescott, продлится до четвертого квартала, когда Intel вновь поднимет планку быстродействия своих процессоров для настольных компьютеров благодаря росту тактовой частоты и усовершенствованной архитектуре.

Следует отметить, что за время противостояния архитектур Athlon и Pentium 4, показала себя более масштабируемой архитектура от Intel. За период существования Pentium 4, выпускаемых по различным технологическим процессам, их частота выросла уже более чем вдвое и без проблем достигла величины 3.2 ГГц при использовании обычного 0.13-микронного технологического процесса. AMD же, задержавшаяся со своими Athlon XP на отметке 2.2 ГГц, не может похвастать на настоящий момент столь же высокими частотами своих процессоров. И хотя на одинаковых частотах Athlon XP значительно превосходит по быстродействию Pentium 4, постоянно увеличивающийся разрыв в тактовых частотах сделал свое дело: Athlon XP 3200+ с частотой 2.2 ГГц назвать полноценным конкурентом Penium 4 3.2 ГГц можно лишь со значительными оговорками.

На графике ниже мы решили показать, как росли частоты процессоров семейств Pentium 4 и Athlon за последние три года:

Как видим, частота 2.2 ГГц является для AMD непреодолимым барьером, покорен который будет в лучшем случае только лишь во второй половине следующего года, когда AMD переведет свои производственные мощности на использование 90-нанометровой технологии. До этих же пор даже процессоры следующего поколения Athlon 64 будут продолжать иметь столь невысокие частоты. Смогут ли они при этом составить достойную конкуренцию Prescott – сказать трудно. Однако, похоже, AMD ждут тяжелые проблемы. Prescott, обладающий увеличенным кешем первого и второго уровня, усовершенствованной технологией Hyper-Threading и растущими частотами может стать гораздо более привлекательным предложением, нежели Athlon 64.

Что касается процессоров Pentium 4, то их масштабируемости можно только позавидовать. Частоты Pentium 4 плавно увеличиваются с самого момента выхода этих процессоров. Небольшая пауза, наблюдающаяся летом-осенью этого года, объясняется необходимостью внедрения нового технологического процесса, но она не должна повлиять на расстановку сил на процессорном рынке. Включив технологию Hyper-Threading и переведя свои процессоры на использование 800-мегагерцовой шины, Intel добился ощутимого превосходства старших моделей своих CPU над процессорами конкурента и теперь может ни о чем не беспокоиться, по крайней мере, до начала массового распространения Athlon 64.

Также на графике выше мы показали и ближайшие планы компаний AMD и Intel по выпуску новых CPU. Похоже, AMD в ближайшее время не должна питать никаких иллюзий по поводу своего положения на рынке. Борьба с Intel на равных для нее заканчивается, компания возвращается в привычную для себя роль догоняющего. Впрочем, долгосрочные прогнозы строить пока рано, посмотрим, что даст для AMD выход Athlon 64. Однако, судя по сдержанной реакции разработчиков программного обеспечения на технологию AMD64, никакой революции с выходом следующего поколения процессоров от AMD не произойдет.

Intel Pentium 4 3.2 ГГц

Новый процессор Pentium 4 3.2 ГГц, который Intel анонсировал сегодня, 23 июня, с технологической точки зрения ничего особенного собой не представляет. Это все тот же Northwood, работающий на частоте шины 800 МГц и поддерживающий технологию Hyper-Threading. То есть, по сути, процессор полностью идентичен (за исключением тактовой частоты) Pentium 4 3.0 , который был анонсирован Intel в апреле.

Процессор Pentium 4 3.2 ГГц, как и предшественники, использует ядро степпинга D1

Единственный факт, который следует отметить в связи с выходом очередного процессора Pentium 4 на ядре Northwood – это вновь возросшее тепловыделение. Теперь типичное тепловыделение Pentium 4 3.2 ГГц составляет порядка 85 Вт, а максимальное - ощутимо превышает величину 100 Вт. Именно поэтому использование грамотно спроектированных корпусов является одним из необходимых требований при эксплуатации систем на базе Pentium 4 3.2 ГГц. Одного вентилятора в корпусе теперь явно недостаточно, кроме того, необходимо следить и за тем, чтобы воздух в районе размещения процессора хорошо вентилировался. Intel также говорит и о том, что температура воздуха, окружающего процессорный радиатор, не должна превышать 42 градуса.

Ну и еще раз напомним, что представленный Pentium 4 3.2 ГГц – последний CPU от Intel для высокопроизводительных настольных систем, основанный на 0.13-микронной технологии. Следующий процессор для таких систем будет использовать уже новое ядро Prescott, изготавливаемое по 90-нанометровой технологии. Соответственно, тепловыделение будущих процессоров для настольных PC будет меньше. Следовательно, Pentium 4 3.2 ГГц так и останется рекордсменом по тепловыделению.

Официальная цена на Pentium 4 3.2 ГГц составляет $637, а это значит, что данный процессор является самым дорогим CPU для настольных компьютеров на сегодняшний день. Более того, Intel рекомендует использовать новинку с недешевыми материнскими платами на базе набора логики i875P. Однако, как мы знаем, данным требованием можно пренебречь: многие более дешевые системные платы на базе i865PE обеспечивают аналогичный уровень производительности благодаря активизации производителями технологии PAT и в наборе логики i865PE.

Как мы тестировали

Целью данного тестирования являлось выяснение того уровня производительности, который может обеспечить новый Pentium 4 3.2 ГГц по сравнению с предшественниками и старшими моделями конкурирующей линейки Athlon XP. Таким образом, в тестировании помимо Pentium 4 3.2 ГГц приняли участие Petnium 4 3.0 ГГц, Athlon XP 3200+ и Athlon XP 3000+. В качестве платформы для тестов Pentium 4 мы выбрали материнскую плату на чипсете i875P (Canterwood) с двухканальной DDR400 памятью, а тесты Athlon XP проводились при использовании материнской платы на базе наиболее производительного чипсета NVIDIA nForce 400 Ultra.

Состав тестовых систем приведен ниже:

Примечания:

  • Память во всех случаях эксплуатировалась в синхронном режиме с FSB в двухканальной конфигурации. Использовались наиболее агрессивные тайминги 2-2-2-5.
  • Тестирование выполнялось в операционной системе Windows XP SP1 с установленным пакетом DirectX 9.0a.

Производительность в офисных приложениях и приложениях для создания контента

В первую очередь по сложившейся традиции мы измерили скорость процессоров в офисных приложениях и приложениях, работающих с цифровых контентом. Для этого мы воспользовались тестовыми пакетами семейства Winstone.

В Business Winstone 2002, включающем в себя типовые офисные бизнес-приложения, на высоте оказываются процессоры семейства Athlon XP, производительность которых ощутимо превосходит скорость процессоров конкурирующего семейства. Данная ситуация достаточно привычна для этого теста и обуславливается как особенностями архитектуры Athlon XP, так и большим объемом кеш-памяти у ядра Barton, суммарная емкость которой благодаря эксклюзивности L2 достигает 640 Кбайт.

В комплексном тесте Multimedia Content Creation Winstone 2003, измеряющем скорость работы тестовых платформ в приложениях для работы с цифровым контентом, картина несколько иная. Процессоры Pentium 4, имеющие NetBurst архитектуру и обладающие высокоскоростной шиной с пропускной способностью 6.4 Гбайта в секунду оставляют старшие модели Athlon XP далеко позади.

Производительность при обработке потоковых данных

Большинство приложений, работающих с потоками данных, как известно, работает быстрее на процессорах Pentium 4. Здесь раскрываются все преимущества NetBurst архитектуры. Поэтому, результат, полученный нами в WinRAR 3.2, не должен никого удивлять. Старшие Pentium 4 значительно обгоняют по скорости сжатия информации топовые Athlon XP.

Аналогичная ситуация наблюдается и при кодировании звуковых файлов в формат mp3 кодеком LAME 3.93. Кстати, данный кодек поддерживает многопоточность, поэтому высокие результаты Pentium 4 здесь можно отнести и на счет поддержки этими CPU технологии Hyper-Threading. В итоге, Pentium 4 3.2 обгоняет старший Athlon XP с рейтингом 3200+ почти на 20%.

В данное тестирование мы включили результаты, полученные при измерении скорости кодирования AVI ролика в формат MPEG-2 одним из лучших кодеров, Canopus Procoder 1.5. Как это не удивительно, Athlon XP в данном случае показывает слегка более высокую производительность. Впрочем, отнести это, скорее всего, следует на счет высокопроизводительного блока операций с плавающей точкой, присутствующего в Athlon XP. SSE2 инструкции процессоров Pentium 4 в данном случае, как мы видим, не могут являться столь же сильной альтернативой. Правда, следует отметить, что разрыв в скорости старших моделей Athlon XP и Pentium 4 совсем небольшой.

Кодирование видео в формат MPEG-4 – еще один пример задачи, где процессоры Pentium 4 с технологией Hyper-Threading и 800-мегагерцовой шиной демонстрирует свои сильные стороны. Превосходство Pentium 4 3.2 над Athlon XP 3200+ в этом тесте составляет почти 20%.

Аналогичная ситуация наблюдается и при кодировании видео при помощи Windows Media Encoder 9: это приложение имеет оптимизацию под набор команд SSE2 и отлично приспособлено для NetBurst архитектуры. Поэтому, совершенно неудивительно, что вновь верхнюю часть диаграммы оккупировали процессоры от Intel.

Производительность в игровых приложениях

После выхода пропатченной версии 3Dmark03 результаты Pentium 4 относительно Athlon XP в этом тесте стали несколько выше. Однако расклад сил это не изменило: Pentium 4 лидировали в этом бенчмарке и ранее.

Pentium 4 подтверждает свое лидерство и в общем зачете в 3Dmark03. Правда, отрыв здесь небольшой: сказывается тот факт, что 3Dmark03 в первую очередь – это тест видеоподсистемы.

После перехода Pentium 4 на использование 800-мегагерцовой шины, Pentium 4 стали обгонять Athlon XP и в более старой версии 3Dmark2001. Причем, отрыв Pentium 4 3.2 ГГц от Athlon XP 3200+ уже достаточно существенен и составляет 6%.

В Quake3 Pentium 4 традиционно обгоняет Athlon XP, поэтому результат удивления не вызывает.

Аналогичная картина наблюдается и в игре Return to Castle Wolfenstein. Это совершенно логично, поскольку данная игра использует тот же движок Quake3.

Одно из немногих приложений, где старшей модели Athlon XP удается удержать лидерство, это – Unreal Tournament 2003. Хочется отметить, что все современные игры не имеют поддержки технологии Hyper-Threading, поэтому в играх потенциал новых Pentium 4 пока раскрывается не полностью.

А вот в Serious Sam 2 Athlon XP 3200+ больше лидером не является. С выходом нового процессора от Intel пальма первенства в этой игре переходит именно к Pentium 4 3.2 ГГц.

Новая игра Splinter Cell, хотя и основана на том же движке, что и Unreal Tournament 2003, быстрее работает на процессорах от Intel.

В целом, остается признать, что быстрейшим процессором для современных 3D игр на данный момент является Pentium 4 3.2 ГГц, обходящий Athlon XP 3200+ в большинстве игровых тестов. Ситуация меняется стремительно. Еще совсем недавно старшие Athlon XP в игровых тестах нисколько не уступали процессорам от Intel.

Производительность при 3D-рендеринге

Поскольку 3ds max 5.1, который мы использовали в данном тестировании, хорошо оптимизирован под многопоточность, Pentium 4, умеющий исполнять два потока одновременно благодаря технологии Hyper-Threading, с большим отрывом оказывается лидером. Даже старший Athlon XP 3200+ не может составить ему никакой конкуренции.

Абсолютно тоже самое можно сказать и про скорость рендеринга в Lightwave 7.5. Впрочем, в некоторых сценах, например при рендеринге Sunset, старшие модели Athlon XP смотрятся не так уж и плохо, однако такие случаи единичны.

Спорить с Pentium 4, выполняющем два потока одновременно, в задачах рендеринга для Athlon XP сложновато. К сожалению, AMD не имеет планов по внедрению технологий, подобных Hyper-Threading даже в будущих процессорах семейства Athlon 64.

Абсолютно аналогичная ситуация наблюдается и в POV-Ray 3.5.

Производительность при научных расчетах

Для тестирования скорости новых CPU от AMD при научных расчетах был использован пакет ScienceMark 2.0. Подробности об этом тесте можно получить на сайте http://www.sciencemark.org . Этот бенчмарк поддерживает многопоточность, а также все наборы SIMD-инструкций, включая MMX, 3DNow!, SSE и SSE2.

То, что в задачах математического моделирования или криптографии процессоры семейства Athlon XP показывают себя с наилучшей стороны, известно давно. Здесь мы видим еще одно подтверждение этого факта. Хотя, надо сказать, свое былое преимущество Athlon XP начинает терять. Например, в тесте Molecular Dinamics на первое место выходит уже новый Pentium 4 3.2 ГГц.

Кроме теста ScienceMark в этом разделе мы решили протестировать и скорость работы новых процессоров в клиенте российского проекта распределенных вычислений MD@home, посвященному расчету динамических свойств олигопептидов (фрагментов белков). Расчет свойств олигопептидов, возможно, сможет помочь изучению фундаментальных свойств белков, тем самым, внеся вклад в развитие науки.

Как видим, задачи молекулярной динамики новые Pentium 4 решают быстрее Athlon XP. Столь высокого результата Pentium 4 достигают благодаря своей технологии Hyper-Threading. Сам клиент MD@home, к сожалению, многопоточность не поддерживает, однако запуск двух клиентских программ в параллели на системах с процессорами с технологией Hyper-Threading позволяет ускорить процесс расчета более чем на 40%.

Выводы

Проведенное тестирование явно показывает, что на очередном этапе конкурентной борьбы Intel удалось одержать победу над AMD. Последний процессор на ядре Northwood обгоняет по своей производительности старшую и последнюю модель Athlon XP в большинстве тестов. За последнее время Intel смог значительно увеличить частоты своих CPU, увеличить частоту их шины, а также внедрить хитрую технологию Hyper-Threading, дающую дополнительный прирост скорости в ряде задач. AMD же, не имея возможности наращивать тактовые частоты своих процессоров ввиду технологических и архитектурных сложностей, не смогла адекватно усилить свои CPU. Не поправило положение даже появление нового ядра Barton: последние модели Pentium 4 оказываются явно сильнее старших Athlon XP. В результате, Pentium 4 3.2 ГГц вполне можно считать наиболее производительным CPU для настольных систем в настоящее время. Такая ситуация продлится по меньшей мере до сентября, когда AMD, наконец, должна будет анонсировать свои новые процессоры семейства Athlon 64.

Необходимо отметить и тот факт, что рейтинговая система, используемая в настоящее время AMD для маркировки своих процессоров, не может больше являться критерием, по которому Athlon XP можно сопоставлять с Pentium 4. Улучшения, которые произошли с Pentium 4, в числе которых следует отметить перевод этих CPU на 800-мегагерцовую шину и внедрение технологии Hyper-Threading, привели к тому, что Pentium 4 с частотой, равной рейтингу соответствующего Athlon XP, оказывается явно быстрее.

В общем, мы с интересом будем ожидать осени, когда и AMD и Intel представят свои новые разработки, Prescott и Athlon 64, которые, возможно, смогут обострить конкурентную борьбу между давними соперниками на процессорном рынке. Сейчас же AMD оказывается оттеснена Intel в сектор недорогих процессоров где, впрочем, эта компания чувствует себя превосходно: Celeron по сравнению с Athlon XP – откровенно слабый соперник.

С одной стороны, время в IT-индустрии летит настолько быстро, что не успеваешь замечать новые продукты и технологии, а с другой… ну-ка, вспомним — сколько лет мы не видели нового ядра от Intel? Не старого с переделками: тут частоту FSB подняли, там виртуальную многопроцессорность с серверного процессора на десктопный перенесли (на самом деле — просто разрешили последнему честно рассказать, что она у него есть), но действительно полностью нового? Если не с нуля разработанного, то хотя бы не латаного, а заново по тем же лекалам сшитого, но с другими рюшечками и по последней моде? А ведь целых два года, оказывается! Даже с хвостиком небольшим. И все это время горячие головы рассуждали на излюбленную тему: а каким же оно будет, новое ядро? Чего только не предсказывали — вплоть до полной анафемы архитектуре NetBurst и воцарения сплошного Banias на декстопной платформе. Правда (как часто бывает), оказалась менее сказочной: новое ядро оказалось честным и последовательным продолжателем Northwood. Разумеется, с некоторыми архитектурными нововведениями, но стремления «до основанья, а затем…» в нем не прослеживается. Поэтому чисто эмоционально Prescott можно оценивать по-разному: кто-то похвалит инжереров Intel за последовательность и целеустремленность, кто-то, наоборот — посетует на отсутствие свежих идей. Однако эмоции — личное дело каждого, мы же обратимся к фактам. Теория

Основные изменения в ядре (Prescott vs. Northwood)

Для начала мы предлагаем вам небольшую табличку, в которой сведены воедино наиболее существенные различия между ядрами Prescott и Northwood во всем что касается «железа» (а точнее — кремния, и прочих «минеральных составляющих»).

Остается только добавить, что новое ядро содержит 125 миллионов транзисторов (куда там бедному Northwood с его 55 миллионами!), и его площадь равна 112 кв. мм (немного меньше площади Northwood — 146/131 кв. мм, в зависимости от ревизии). Произведя несложный арифметический подсчет, видим, что увеличив количество транзисторов в ~2,3 раза, за счет нового техпроцесса инженерам Intel удалось, тем не менее, уменьшить площадь ядра. Правда, не так значительно — «всего» в 1,3 (1,2) раза.

Что же касается технологии «напряженного» (некоторые предпочитают термин «растянутый») кремния — то она, если объяснять на пальцах, довольно проста: с целью увеличения расстояния между атомами кремния, он помещается на подложку, расстояние между атомами у которой больше. В результате, для того чтобы «хорошо усесться», атомам кремния приходится растягиваться по предложенному формату. Выглядит это примерно вот так:

Ну а понять, почему электронам проще проходить через напряженный кремний, вам поможет вот этот простенький рисунок:

Как видите, геометрическая ассоциация в данном случае вполне уместна: путь электрона просто становится короче.

Ну а теперь рассмотрим гораздо более интересные отличия: в логике ядра. Их тоже немало. Однако для начала будет нелишним напомнить об основных особенностях архитектуры NetBurst как таковой. Тем более что не так уж и часто мы это делали в последнее время.

Немного предыстории

Итак, одним из основных отличий ядер, разработанных в рамках архитектуры NetBurst, сама компания Intel считает уникальную особенность, выражающуюся в разделении собственно процесса декодирования x86-кода во внутренние инструкции, исполняемые ядром (uops), и процедуры их выполнения. Между прочим, такой подход породил в свое время немало споров относительно корректности подсчета стадий конвейера у Pentium 4: если подходить к данному процессору с классической точки зрения (эпохи до-NetBurst), то стадии декодера следует включать в общий список. Между тем, официальные данные Intel о длине конвейера процессоров Pentium 4 содержат информацию исключительно о количестве стадий конвейера исполняющего блока, вынося декодер за его рамки. С одной стороны — «крамола!», с другой — это объективно отражает особенность архитектуры, поэтому Intel в своем праве: она же ее и разработала. Спорить, можно, разумеется, до посинения, однако… какая, собственно, разница? Главное — понимать суть подхода. Не нравится вам, что декодер исключен? Ну так прибавьте его стадии к «официальным» — и получите искомую величину конвейера по классической схеме, вместе с декодером.

Таким образом, основная идея NetBurst — асинхронно работающее ядро, в котором декодер инструкций работает независимо от Execution Unit. С точки зрения Intel, существенно бо льшая, чем у конкурентов, частота работы ядра, может быть достигнута только при асинхронной модели т.к. если модель синхронная, то расходы на синхронизацию декодера с исполняющим блоком возрастают пропорционально частоте. Именно поэтому вместо обычного L1 Instructions Cache, где хранится нормальный x86-код, в архитектуре NetBurst применяется Execution Trace Cache, где инструкции хранятся уже в декодированном виде (uops). Trace — это и есть последовательность uops.

Также в историческом экскурсе хотелось бы окончательно развеять мифы, связанные с излишне упрощенной формулировкой, согласно которой ALU у Pentium 4 работает на «удвоенной частоте». Это и так… и не так. Однако для начала взглянем на условную блок-схему процессора Pentium 4 (уже Prescott):

Легко заметить, что ALU состоит из нескольких частей: в нем присутствуют блоки Load / Store, Complex Instructions, и Simple Instructions. Так вот: с удвоенной скоростью (0,5 такта на операцию) обрабатываются лишь те инструкции, что поддерживаются исполняющими блоками Simple Instructions. Блок ALU Complex Instructions, исполняющий команды, отнесенные к сложным — наоборот, может тратить до четырех тактов на исполнение одной инструкции.

Вот, собственно, и все, что хотелось бы напомнить относительно внутреннего устройства процессоров сконструированных на базе архитектуры NetBurst. Ну а теперь перейдем к нововведениям в самом свежем NetBurst-ядре — Prescott.

Увеличение длины конвейера

Вряд ли это изменение можно назвать усовершенствованием — ведь общеизвестно, что чем длиннее конвейер, тем бо льшие накладные расходы вызывает ошибка механизма предсказания ветвлений, и, соответственно, уменьшается средняя скорость выполнения программ. Однако, видимо, другого способа увеличить разгонный потенциал ядра, инженеры Intel найти не смогли. Пришлось прибегнуть к непопулярному, но проверенному. Итог? Конвейер Prescott увеличен на 11 стадий, соответственно, общее их количество равняется 31. Честно говоря, мы намеренно вынесли эту «приятную новость» в самое начало: фактически, описание всех последующих нововведений можно условно назвать «а вот теперь мы вам расскажем, как инженеры Intel боролись с последствиями одного-единственного изменения, чтобы оно окончательно не угробило производительность»:).

Усовершенствования в механизме предсказания ветвлений

В основном, тонкий тюнинг коснулся механизма предсказания переходов при работе с циклами. Так, если ранее по умолчанию обратные переходы считались циклом, то теперь анализируется длина перехода, и исходя из нее механизм пытается предсказать: цикл это, или нет. Также было обнаружено, что для ветвей с определенными типами условных переходов, независимо от их направления и расстояния, использование стандартного механизма предсказания ветвлений чаще всего неактуально — соответственно, теперь в этих случаях он не используется. Однако кроме теоретических изысканий, инженеры Intel не побрезговали и голой эмпирикой т.е. просто-напросто отслеживанием эффективности работы механизма предсказания ветвлений на примере конкретных алгоритмов. С этой целью было исследовано количество ошибок механизма предсказания ветвлений (mispredictions) на примерах из теста SPECint_base2000, после чего по факту были внесены изменения в алгоритм с целью их уменьшения. В документации приводятся следующие данные (количество ошибок на 100 инструкций):

Подтест SPECint_base2000 Northwood (130 nm) Prescott (90 nm)
164.gzip 1.03 1.01
175.vpr 1.32 1.21
176.gcc 0.85 0.70
181.mcf 1.35 1.22
186.crafty 0.72 0.69
197.parser 1.06 0.87
252.eon 0.44 0.39
253.perlbmk 0.62 0.28
254.gap 0.33 0.24
255.vortex 0.08 0.09
256.bzip2 1.19 1.12
300.twolf 1.32 1.23

Ускорение целочисленной арифметики и логики (ALU)

В ALU был добавлен специализированный блок для исполнения инструкций shift и rotate, что позволяет теперь исполнять данные операции на «быстром» (двухскоростном) ALU, в отличие от ядра Northwood, где они исполнялись в блоке ALU Complex Instructions, и требовали бо льшего количества тактов. Кроме того, ускорена операция целочисленного умножения (integer multiply), ранее исполнявшаяся в блоке FPU. В новом ядре для этого выделен отдельный блок.

Также есть информация о присутствии некоторого количества мелких усовершенствований, позволяющих увеличить скорость обработки инструкций FPU (и MMX). Впрочем, ее мы лучше проверим в практической части — при анализе результатов тестов.

Подсистема памяти

Разумеется, одним из основных плюсов нового ядра являются увеличенные размеры L1-кэша данных (в 2 раза т.е. до 16 килобайт) и кэша второго уровня (также в 2 раза т.е. до 1 мегабайта). Однако есть и еще одна интересная особенность: в ядро введена специальная дополнительная логика, обнаруживающая page faults в инструкциях software prefetch. Благодаря этому нововведению, инструкции software prefetch теперь имеют возможность осуществлять не только предвыборку данных, но и предвыборку page table entries т.е., другими словами, prefetch умеет не останавливаться на загруженной странице, но еще и обновлять страницы памяти в DTLB. Разбирающиеся в вопросе наверняка заметят на этом примере, что Intel внимательно следит за отзывами программистов, пусть даже и не кается прилюдно по поводу каждого обнаруженного ими негативного фактора, влияющего на производительность.

Новые инструкции (SSE3)

Кроме всего прочего, в Prescott добавлена поддержка 13 новых инструкций. Назван этот набор, по устоявшейся традиции, SSE3. В их числе присутствуют команды преобразования данных (x87 to integer), работы с комплексной арифметикой, кодирования видео (правда, всего одна), новые команды, предназначенные для обработки графической информации (массивов вершин), а также две инструкции, предназначенные для синхронизации потоков (явно последствия появления Hyper-Threading). Впрочем, о SSE3 мы в скором времени выпустим отдельную статью, поэтому рассматривать возможности данного набора в этом материале воздержимся, чтобы не портить излишней популяризацией серьезную и интересную тему.

Ну а теперь, пожалуй, довольно с нас теории и спецификаций. Попытаемся, как говорилось в одном известном анекдоте, «вместе со всем этим взлететь»:). Тестирование

Конфигурации стендов и ПО

Тестовый стенд

  • Процессоры:
    • AMD Athlon 64 3400+ (2200 МГц), Socket 754
    • Intel Pentium 4 3,2 ГГц «Prescott» (FSB 800/HT), Socket 478
    • Intel Pentium 4 2,8A ГГц «Prescott» (FSB 533/нет HT), Socket 478
    • Intel Pentium 4 3,4 ГГц «Northwood» (FSB 800/HT), Socket 478
    • Intel Pentium 4 3,2 ГГц «Northwood» (FSB 800/HT), Socket 478
  • Материнские платы:
    • ABIT KV8-MAX3 (версия BIOS 17) на чипсете VIA K8T800
    • ASUS P4C800 Deluxe (версия BIOS 1014) на чипсете Intel 875P
    • Albatron PX875P Pro (версия BIOS R1.00) на чипсете Intel 875P
  • Память:
    • 2x512 МБ PC3200 DDR SDRAM DIMM TwinMOS (тайминги 2-2-2-5)
  • Видеокарта: Manli ATI Radeon 9800Pro 256 МБ
  • Жесткий диск: Western Digital WD360 (SATA), 10000 об/мин



Pentium 4 2,8A ГГц «Prescott»
Единственный Prescott с частотой FSB 533 МГц
и без поддержки Hyper-Threading



Pentium 4 3,4 ГГц «Northwood»
Просто еще один Northwood…

Системное ПО и драйверы устройств

  • Windows XP Professional SP1
  • DirectX 9.0b
  • Intel Chipset Installation Utility 5.0.2.1003
  • VIA Hyperion 4.51
  • VIA SATA Driver 2.10a
  • Silicon Image Driver 1.1.0.52
  • ATI Catalyst 3.9
Плата ABIT KV8-MAX3 ASUS P4C800 Deluxe Albatron PX875P Pro
Чипсет VIA K8T800 (K8T800 + VT8237) Intel 875 (RG82004MC + FW82801ЕB) Intel 875 (RG82875 + FW82801ЕB)
Поддержка процессоров Socket 754, AMD Athlon 64 Socket 478, Intel Pentium 4, Intel Celeron
Разъемы памяти 3 DDR 4 DDR 4 DDR
Слоты расширения AGP/ 5 PCI AGP Pro/ 5 PCI AGP/ 5 PCI
Порты ввода/вывода 1 FDD, 2 PS/2 1 FDD, 2 COM, 1 LPT, 2 PS/2 1 FDD, 2 COM, 1 LPT, 2 PS/2
USB 4 USB 2.0 + 2 разъема по 2 USB 2.0 2 USB 2.0 + 3 разъема по 2 USB 2.0
FireWire 1 порт + 2 разъема на 2 порта (планка в комплекте), Texas Instruments TSB43AB23 1 порт + 1 разъем на 1 порт (нет планки в комплекте), VIA VT6307 —
Интегрированный в чипсет ATA-контроллер ATA133 + SATA RAID (0, 1) ATA100 + SATA ATA100 + SATA
Внешний ATA-контроллер Silicon Image Sil3114CT176 (SATA RAID 0, 1, 0+1, Spare) Promise PDC20378 (ATA133+SATA RAID 0, 1, 0+1) —
Звук AC"97-кодек Avance Logic ALC658 AC"97-кодек Analog Devices AD1985 AC"97-кодек Avance Logic ALC655
Сетевой контроллер 3Com Marvell 940-MV00 (Gigabit Ethernet) 3Com Marvell 920-MV00 (Fast Ethernet)
I/O-контроллер Winbond W83627HF-AW Winbond W83627THF-A Winbond W83627THF
BIOS 4 Мбит Award BIOS v6.00PG 4 Мбит AMI BIOS v2.51 3 Мбит Phoenix AwardBIOS v6.00
Форм-фактор, размеры ATX, 30,5x24,5 см ATX, 30,5x24,5 см ATX, 30,5x24,5 см
Средняя текущая цена (количество предложений) Н/Д(0) Н/Д(0) Н/Д(0)

В завершение описания, хотелось бы разъяснить алгоритм подбора участников тестирования. С одной стороны, полностью исключить из тестов процессоры AMD было бы неправильно, ведь эта платформа — основной конкурент Intel, как сейчас, так и в обозримом будущем. С другой стороны — совмещать в одной статье сравнение двух поколений Pentium 4 с процессорами другого производителя, означало бы не сравнить толком ни то, ни другое. Поэтому мы решили в первом материале, посвященном Prescott, пойти на определенный компрормисс: во-первых, полностью исключить всевозможные «экстремальные» варианты в виде Pentium 4 eXtreme Edition и Athlon 64 FX, во-вторых же, взять в качестве представителя альтернативной платформы только один, но быстрый из обычных десктопных процессоров AMD: Athlon 64 3400+.

Да и то, по большому счету, его результаты здесь приводятся лишь в качестве опции. В этом материале нас более всего интересует сравнение нового ядра Intel со старым. Если кто-то желает получить одновременно информацию о том, как производительность Prescott соотносится с ближайшим конкурентом — что ж, она представлена на диаграммах. Комментарии? Пожалуй, они просто излишни. Вы сами в этом убедитесь. Зная, какова производительность Prescott и Northwood, работающих на одинаковой частоте, и то, как соотносятся производительность Northwood и топовых процессоров AMD (а этот вопрос мы уже неоднократно освещали) — вы знаете вполне достаточно для того, чтобы самостоятельного сделать все остальные выводы.

Кроме того, хотелось бы разъяснить наличие на диаграммах двух столбиков для Prescott 3,2 ГГц. Дело просто в том, что мы решили… подстраховаться. Всем известно, что с выходом процессора на другом ядре, среди производителей системных плат сразу же начинается суматоха с обновлением BIOS, всяческих microcode update, и прочего «железно-ориентированного» ПО. Нам показалось логичным использовать такой ресурс нашей тестовой лаборатории как «официально Prescott-ready» системные платы максимально полно, чтобы уберечься от возможных последствий некорректной работы конкретной модели. Впрочем, как вы увидите далее, опасения оказались напрасными: в большинстве случаев новый процессор вел себя на обеих платах совершенно одинаково.

Все характеристики Prescott 2,8A ГГц программа
CPU-Z определяет вполне корректно:
как наличие SSE3, так и шину 533 МГц

Разумеется, не ошиблась она и в случае с
Prescott 3,2E ГГц

Низкоуровневые тесты в CPU RightMark

Для начала, мы решили проверить функционирование нового ядра в двух режимах — традиционно самом лучшем для процессоров Pentium 4 и самом худшем: SSE/SSE2 и MMX/FPU. Начнем с вычислительного блока (Math Solving).

Результаты неутешительные. Новое ядро медленнее старого, более того — в режиме MMX/FPU его отставание даже больше, чем при использовании SSE/SSE2. Делаем первый вывод: если что-то в FPU и «подкручивали», то явно в CPU RightMark используются другие команды. Ну а что у нас с рендерингом?

Во-первых, рассмотрим варианты работы модуля рендеринга в однопоточном и двухпоточном режимах с максимальной производительностью (SSE/SSE2). Картина достаточно интересная: если используется один поток — преимущество Prescott минимально, а больший по частоте Northwood его легко обгоняет. Однако стоит нам задействовать Hyper-Threading, как Prescott тут же резко вырывается вперед, причем настолько, что обгоняет всех других участников. Возникает впечатление, что некая работа над ядром в плане улучшения обработки параллельно выполняющихся потоков, была проведена, и заключалась она не только в расширении набора команд. Посмотрим теперь, как себя ведут те же процессоры в режиме MMX/FPU.

Абсолютно аналогичная картина. Причем если сопоставить ее с предыдущей — хорошо видно, что тщательность анализа себя оправдала: если бы, к примеру, мы ограничились рассмотрением лучшего (двухпотокового) результата, можно было бы ошибочно сделать вывод о том, что ядро Prescott быстрее в плане исполнения инструкций, причем даже в режиме MMX/FPU. Сейчас же хорошо видно, что быстродействие возросло исключительно благодаря оптимизации использования ресурсов виртуальных CPU.

Тесты в реальных приложениях

Перед тем как начать рассмотрение результатов тестов в реальных приложениях, сделаем небольшое вводное разъяснение. Дело в том, что процессор Pentium 4 на ядре Prescott с частотой 3,4 ГГц, к сожалению, до сих пор для нас недоступен, поэтому то, что вы видите на диаграммах под названием "Virtual" Prescott 3,4 ГГц — это не более чем аппроксимация результатов Prescott 3,2 ГГц, рассчитанная исходя из идеальных условий роста производительности пропорционально частоте. Кто-то может заметить, что это слишком топорный подход. Дескать, намного корректнее было бы, к примеру, разогнать имеющийся Prescott 3,2 ГГц с помощью выставления большей частоты FSB, или хотя бы выстроить кривую аппроксимации по трем точкам: Prescott 2,8 ГГц -> 3,0 ГГц -> 3,2 ГГц. Разумеется, так было бы корректнее. Однако «на всякого мудреца довольно простоты», и… просто обратите внимание на то, какие поправки вносит в общую картину наличие на диаграммах даже «идеального» Prescott 3,4 ГГц (а реальный будет либо таким же, либо медленнее — третьего не дано). Рискуя навлечь на себя немилось преждевременным разглашением тайны, скажем сразу: да практически никаких. Где ядро Prescott выигрывает — там это и так видно. А где проигрывает — не помогают ему даже идеализированные 3,4 ГГц…

Работа с графикой

Самые предсказуемые результаты у Northwood 3,4 ГГц (немного лучше, чем у Northwood 3,2 ГГц) и Prescott 2.8 ГГц (отсутствие поддержки Hyper-Threading сразу же выбросило его в аутсайдеры). Prescott 3,2 ГГц пытается быть хотя бы наравне с одночастотным Northwood, но у него не получается даже это. Ну а наш «виртуальный Prescott 3,4 ГГц», в свою очередь, не смог обогнать реальный Northwood 3,4 ГГц — что тоже естественно. C другой стороны, можно заметить, что все процессоры кроме Prescott 2,8 ГГц почти равны. Вряд ли это будет аргументом для апгрейда на Prescott, но хотя бы не станет существенным доводом против его покупки для тех, кто задумывается над приобретением новой системы.

В Lightwave ситуация аналогичная, только Prescott отстает еще больше. Здесь уместно будет вспомнить, что Lightwave (судя по сравнению результатов 6-й ветки с 7-й), затачивался под Pentium 4 очень тщательно и скрупулезно. Можно предположить, что именно поэтому он оказался так чувствителен к малейшим архитектурным изменениям в ядре. Также отметим, что впервые протестированный нами в этой программе Athlon 64 3400+ демонстрирует пусть и не лучший, но вполне приличный результат.

Для Photoshop в современных процессорных архитектурах, видимо, самым главным параметром является размер кэша. Мы уже неоднократно обращали внимание на то, что эта программа весьма «кэшелюбива», и результаты Prescott это подтверждают.

Кодирование медиаданных

Вообще, поскольку мы тестируем новую (или существенно модифицированную, если вам так больше нравится) архитектуру — то для нас любое приложение может стать маленьким открытием. По сути, сейчас количество даже важнее качества, потому что нам просто необходимо набрать как можно больше данных о том, как старые (еще не оптимизированные под Prescott) программы ведут себя с новым процессорным ядром. Вот, тот же LAME: оказывается, для него Prescott по всем статьям новый процессор — результаты совершенно не ложатся на то, что мы ранее знали про Northwood. Правда, они стали хуже. Что ж, бывает. Продолжаем коллекционировать…

Ogg Encoder демонстрирует практически идентичную картину: Prescott существенно проигрывает всем остальным процессорам без исключения, несмотря на удвоенный кэш данных первого уровня и L2. Остается предположить, что виновато увеличение длины конвейера при оставшемся неизменным объеме Trace Caсhe.

Даже тяготеющий к архитектуре NetBurst кодек DivX невзлюбил новое ядро. Не то что бы очень сильно, но все-таки оно ему не понравилось. Впрочем, тут есть определенная надежда на SSE3 — разработчики DivX просто обожают различные оптимизации (во всяком случае, судя по анонсам), поэтому весьма велик шанс, что единственная и неповторимая инструкция, предназначенная для ускорения кодирования видео, найдет свое место в будущем релизе данного кодека. Однако это все в будущем, а пока — увы…

А вот результаты XviD мы опять не приводим по причине совершенно невообразимого «фортеля», который в очередной раз выкинула эта нежно нами любимая программа. Дело в том, что прирост производительности Prescott по отношению к Northwood в ней составил… 232% ! Такие тесты, пардон, мы использовать просто отказываемся. Похоже, что их результаты могут зависеть вообще от чего угодно…

Ну, вот и первая победа. Впрочем, возвращаясь к теме о предпочтениях различного ПО, можно заметить, что Windows Media Video 9 весьма неплохо поддерживает Hyper-Threading, а данные низкоуровневых тестов показали, что эффективность задействования виртуальных CPU в случае с новым ядром возрастает. Похоже, что это первый положительный результат, достигнутый за счет качественного, а не количественного изменения в Prescott. Во всех предыдущих случаях он «выезжал» исключительно за счет большого объема кэша…

Очень, очень интересный результат. Mainconcept MPEG Encoder, которому мы пеняли за «корявую» работу с Hyper-Threading при кодировании в формат MPEG1 — вполне адекватно работает с виртуальными процессорами, если они эмулируются Prescott, а не Northwood! Впору даже задуматься: быть может, программисты не виноваты, просто «затык» был в процессорном ядре, которое некорректно распараллеливало потоки? Вполне возможно, по крайней мере, глядя на результаты Prescott, понимаешь, что и это предположение имеет право на жизнь. C другой стороны вполне неплохо себя показал Prescott 2,8A ГГц, про Hyper-Threading и слыхом не слыхавший. Забавная ситуация. Пожалуй, мы находимся на пороге интересного открытия: напрашивается предположение, что вся «оптимизация работы Hyper-Threading в Prescott» сводится всего лишь к тому… что этой технологии в Northwood не хватало объема кэша, чтобы развернуться в полную силу!

И снова можно порадоваться за новое ядро: в Mainconcept MPEG Encoder не только пропал «глюк» с кодированием MPEG1, но и преобразование в MPEG2 стало работать существенно быстрее. Имея в виду результаты предыдущих тестов, можно почти однозначно утверждать, что основным виновником торжества является улучшенная работа Hyper-Threading (и не забываем о том, за счет чего она могла стать лучше — если наши предположения верны). Что самое интересное — не понадобились даже специальные команды для управления потоками из набора SSE3, процессор сам отлично разобрался (поддержку SSE3 в данной версии кодировщика предполагать не приходится — она вышла довольно давно).

А вот Canopus ProCoder просто почти ничего не заметил. В принципе, небольшая разница в производительности присутствует, и она даже в пользу Prescott. Но, по сути, это копейки, мелочь. Учитывая «кэшелюбивость» ProCoder, можно даже сказать так: весь большой кэш, судя по всему, ушел на компенсацию других недостатков нового ядра. Он просто вытянул Prescott на ту же высоту, что и Northwood, но, увы — не более.

Архивирование

Традиционно, мы протестировали 7-Zip как со включенной поддержкой многопоточности, так и без нее. Ожидаемый эффект достигнут в этой программе не был: не заметно, чтобы многопоточность на Prescott давала намного больший эффект, чем на Northwood. Да и вообще — особой разницы между старым и новым ядром не видно. Похоже, что мы наблюдаем упомянутый выше эффект: все, что смогли сделать количественные показатели Prescott (объемы кэша L1 Data и L2) — это компенсировать его же удлиненный конвейер.

К слову: один из немногих тестов, где хоть как-то видна разница между платами. В остальном — все та же картина: Prescott и Northwood одинаковой частоты идут рядом, практически не отличаясь по скорости. Пессимисты скажут: «плохо», оптимисты: «могло быть и хуже»:). Мы — просто промолчим…

Игры

Картина во всех трех играх схожая, поэтому особенно расписываться нет нужды: Prescott все же медленнее. Правда, ненамного.

Обобщая результаты

Что ж, если делать какие-то выводы на основании тех тестов, что присутствуют в статье, то ситуация выглядит следующим образом: ядро Prescott в целом медленнее Northwood. Иногда это удается компенсировать бо льшим объемом кэша, вытянув производительность на уровень старого ядра. Ну а если программа особенно чувствительна к объему L2, Prescott даже способен выиграть. Кроме того, несколько улучшилась эффективность Hyper-Threading (но похоже, что причина снова кроется в увеличении объема L2-кэша). Соответственно, если программа умеет использовать обе сильные стороны нового ядра — большой кэш и виртуальную многопроцессорность — то выигрыш получается ощутимым. В целом же, производительность Prescott примерно такая же, как у Northwood, а применительно с старому, неоптимизированному ПО — даже более низкая. Ожидаемой революции, увы, не получилось. С другой стороны… а был ли мальчик? Но об этом — ниже.

Что же касается Prescott 2,8A ГГц с 533-мегагерцевой системной шиной и без поддержки Hyper-Threading, то как раз тут все предельно ясно. Во-первых, для Intel это просто очень хороший способ сделать хотя бы что-то из тех экземпляров, которые в «настоящем Prescott"овском» режиме банально не заработали. Этакий «Celeron среди Prescott"ов» (хотя будет, судя по всему, на базе этого ядра и официальный Celeron). Во-вторых — отсутствие Hyper-Threading скорее всего свидетельствует о принципиальном нежелании Intel видеть HT на устаревшей, низкоскоростной шине. Действительно: единственным представителем 533 МГц FSB + HT так и остался первый процессор с поддержкой этой технологии — Pentium 4 3,06 ГГц. Да и то по вполне понятной, извиняющей его причине: не было еще на тот момент CPU с 800-мегагерцевой шиной.

Таким образом, да простят нам инженеры Intel эту вольность, Pentium 4 2,8A ГГц — это «как бы не Prescott». А просто сравнительно недорогой (другим его выпускать нельзя — не купит ведь никто…), но высокочастотный Pentium 4. И совершенно неважно, на каком он сделан ядре, не в этом суть. Честно говоря, было искушение его в этот материал вообще не включать, но потом мы решили поступить наоборот: дать ему один раз «засветиться», и более к данному чу дному процессору не возвращаться. Из простого сравнения одночастотных ядер Prescott и Northwood понятно, что без Hyper-Threading Prescott 2.8 ГГц даже с Pentium 4 2.8C (800 МГц FSB + HT) по усредненным показателям производительности соперничать не сможет. Версии

Да, именно «версии», а не «выводы». Слишком неоднозначным получился этот материал. Проще было бы ограничиться анализом диаграмм и сделать напрашивающийся, лежащий на поверхности вывод: «если новое не быстрее (а то и медленнее) старого — значит, оно хуже». Списать, так сказать, в расход. Однако самый простой ответ — не всегда самый правильный. Поэтому мы решили коснуться аналитики, и рассмотреть выход Prescott в исторически-рыночной перспективе. Получилось, что ответов на вопрос «в чем для Intel состоит смысл выпуска Pentium 4 на ядре Prescott?» на самом деле несколько, и каждый из них можно логично аргументировать.

Версия первая или Большая ошибка

Почему бы и нет? Жила-была компания Intel, и появилась у нее идея: сделать процессорное ядро, ориентированное не на максимальный КПД (если рассматривать КПД как соотношение производительности к частоте), а на легкую масштабируемость. Дескать, если наши 2000 МГц проигрывают 1000 МГц от конкурента — не беда, догоним частоту до 4 ГГц и оставим всех позади. Между прочим, с чисто инженерной точки зрения, это вполне адекватное решение. Не все ли равно? Пользователя-то (грамотного) все равно интересуют не мегагерцы, а производительность, какая ему разница, за счет чего она достигается? Главное чтобы масштабируемость оказалась именно такой, какую предполагалось достичь. И вот, выясняется, что с масштабируемостью начались большие проблемы. Догнали до 3,4 ГГц, остановились… и пришлось придумывать новое ядро, у которого КПД еще ниже… и неизвестно, какими темпами будет расти у него частота… и так далее. Напомним, что это версия. Рассмотрим ее внимательнее в сопоставлении с реальными фактами.

Факт, свидетельствующий в пользу данной версии — рост частоты Pentium 4 за прошедший 2003 год. Все-таки 200 МГц, да еще и по отношению к такой «частотолюбивой» архитектуре как NetBurst — явно мало. Однако… как общеизвестно, рассматривать какой-то факт в отрыве от других — не очень хорошая практика. Был ли смысл в активном наращивании частоты Pentium 4 в прошлом году? Вроде бы нет… Основной конкурент решал другие вопросы — у него новая архитектура, новое ядро, ему нужно наладить массовое производство процессоров на базе этого ядра, обеспечить им соответствующую обвязку в виде чипсетов, системных плат, программного обеспечения, в конце концов! Поэтому один из вариантов ответа на вопрос «почему практически не росла частота (и производительность) Pentium 4 в 2003 году» звучит просто: не было особого смысла ее наращивать. Ни догонять, ни перегонять — вроде некого. Стало быть, можно особенно не торопиться.

Получить ответ на главный вопрос мы, увы, пока не можем: как будет «гнаться» новое ядро? Пока что, если судить по внешним признакам, фактов, подтверждающих хорошую масштабируемость Prescott — нет. Впрочем, равно как и опровергающих ее. Анонсированы 3,4-гигагерцевые версии как Prescott, так и Northwood. Northwood 3,4 ГГц, наверное, будет последним процессором на этом ядре (хотя, официальных подтверждений этого предположения нет). А то, что Prescott стартовал с 3,4 ГГц, а не с 3,8 или 4,0 тоже легко объяснимо: зачем прыгать через ступеньки? Подводя итог: версия «Большой ошибки», в принципе, имеет право на существование. Но если частота (а еще точнее, — производительность) Prescott будет быстро расти, это однозначно подтвердит ее несостоятельность.

Версия вторая или Переходное ядро

Ни для кого не секрет, что иногда производителю требуется выпустить некое устройство, достаточно ординарное само по себе (в другой ситуации совершенно не заслуживающее звания релизного продукта). Но в том-то и дело, что выпуск данного устройства необходим для продвижения на рынок других, анонсируемых одновременно с ним или чуть позже. Таким был Pentium 4 Willamette, вряд ли достойный звания «хорошего и быстрого процессора», однако явно обозначивший факт перехода одного из самых крупных игроков на процессорном рынке, на новое ядро, и под конец своего существования сменивший «промежуточный» Socket 423 на «долгоиграющий» Socket 478. Что, если аналогичная роль уготована Prescott?

Уже всем известно, что с выходом Grantsdale-P, нас ждет появление еще одного процессорного разъема для Pentium 4 (Socket T / Socket 775 / LGA775), и поначалу устанавливаться в него будут именно CPU на ядре Prescott. Лишь впоследствии Pentium 4 «Tejas» начнет постепенно их замещать. И тут вполне логично задаться вопросом: а насколько быстро будет происходить это замещение? Поскольку мы все равно лишь выдвигаем версии, ограничивать свою фантазию не будем, и предположим, что Intel желает этот процесс максимально ускорить. С помощью чего? Скорее всего — оставив Socket 478 мирно почивать в нижних строчках на диаграммах производительности, и сделав Socket 775 символом обновленной, мощной и скоростной платформы для Pentium 4. Тогда все становится ясно: Prescott нужен для того, чтобы на рынке присутствовал процессор, способный работать как в платах с разъемом Socket 478, так и с новым Socket 775. Tejas же, если наши предположения верны, будет устанавливаться только в Socket 775, и станет, таким образом, могильщиком как для Prescott, так и для устаревшей платформы Socket 478. Логично? Нам кажется, что да. В таком случае, правдоподобно смотрится и следующее предположение: жизнь Prescott’у уготована весьма недолгая…

Версия третья или «Кто с мечом к нам придет…»

Не секрет, что соперничество между двумя основными конкурентами — Intel и AMD, почти всегда строилось на противопоставлении двух основных аргументов. Intel: «наши процессоры — самые быстрые!», AMD: «зато у наших лучше соотношение цены и производительности!». Соперничество давнее, аргументы тоже. Причем, они не изменились даже с выходом процессоров AMD на ядрах K7/K8, — несмотря на то, что у последних с производительностью дела обстоят намного лучше, чем у K6. Ранее Intel не делала исключений из основного своего правила: продавать свои CPU с производительностью, аналогичной процессорам конкурента, немного дороже. Рынок местами очень прост, поэтому причина такого поведения понятна: если их и так покупают — то зачем снижать цену? Опять-таки: хоть участвовать в ценовых войнах Intel и приходилось, но развязывала их всегда AMD, это уже стало традицией. Третья версия базируется на очевидном предположении: а что если на этот раз Intel решила повести себя агрессивнее, чем обычно, и развязать ценовую войну первой?

В списке достоинств нового ядра Prescott числится не только новизна, объемы кэшей, и потенциально хорошая (правда, пока не подтвержденная) масштабируемость, но и… цена! Это сравнительно дешевое в производстве ядро: если при использовании 90-нанометровой технологии будет достигнут показатель выхода годных чипов хотя бы такой же, как у Northwood — то, ничуть не теряя в абсолютных показателях прибыли, Intel сможет продавать свои процессоры за гораздо меньшую цену. Напомним одну очевидную зависимость: такую характеристику CPU как «соотношение цена / производительность», можно улучшать, не только повышая производительность, но и снижая цену. Вообще-то, никто не мешает быстродействие даже понизить (!) — главное, чтобы цена упала еще больше:). Судя по появляющимся в Сети неофициальным анонсам цен на Pentium 4 Prescott, стоить они будут намного дешевле Pentium 4 Northwood. Таким образом, мы можем предположить, что Intel решила осуществить своего рода «обход с флангов»: пока основной конкурент, по старинке, все гонится и гонится за производительностью, ему будет нанесен удар в секторе middle-end систем, где пользователи тщательно анализируют именно такой показатель как price / performance.

Версия четвертая или Тайное оружие

Здесь следует сделать небольшое лирическо-историческое отступление для тех, кто «во времена оные» не очень активно отслеживал разные мелкие нюансы в процессорном секторе. Так, к примеру, можно вспомнить, что сразу после появления первых процессоров с поддержкой Hyper-Threading (а ими были вовсе не Pentium 4 «Northwood» + HT, а Xeon «Prestonia»), многие задались вопросом: «если ядра Prestonia и Northwood настолько похожи, что практически не отличаются по основным характеристикам, но у Prestonia поддержка Hyper-Threading присутствует, а у Northwood ее нет — то не логично ли предположить, что и у Northwood она тоже есть, просто искусственно заблокирована?». Впоследствии это предположение косвенно подтвердилось — анонсом Pentium 4 3,06 ГГц на все том же ядре Northwood, но уже с Hyper-Threading. Более того, самые смелые выдвигали и вовсе крамольную мысль: Hyper-Threading была даже в Willamette!

А теперь вспомним: что у нас в последнее время известно по части новых технологических инициатив Intel. Сразу всплывают два названия: «La Grande» и «Vanderpool». Первое — технология аппаратной защиты приложений от вмешательства извне, которую вкратце можно описать словами «сделать так, чтобы одно ПО не могло вмешиваться в функционирование другого». Впрочем, о La Grande вы можете почитать на нашем сайте . Об Vanderpool информации меньше, но исходя из обрывков доступной на сегодня, можно сделать вывод, что она представляет собой вариацию на тему полной виртуализации PC, включая все без исключения аппаратные ресурсы. Таким образом (самый простой, но и самый эффектный пример), на одном компьютере смогут работать параллельно две операционные системы, причем одна из них может быть даже перезагружена — но это совершенно не отразится на работе другой.

Так вот: есть очень большие подозрения, что и La Grande и Vanderpool в ядре Prescott уже реализованы, но (как было ранее с Hyper-Threading) пока не активированы. Если это предположение истинно, то многое относительно самого ядра становится понятным. В частности — то, почему оно такое большое, почему так долго разрабатывалось, но, несмотря на это, не выирывает в скорости у предыдущего. Если исходить из гипотезы «Тайного оружия», можно предположить, что основные ресурсы команды разработчиков были направлены вовсе не на достижение быстродействия, а на отладку новых функций. Частично данная версия перекликается со второй — так или иначе, но мы имеем дело с переходным ядром. Соответственно, быть совершенным оно вовсе не обязано, ибо не в том его основное предназначение. Между прочим, также удачно вторую и четвертую версии дополняет третья: низкая цена в данном случае является именно той конфеткой, что подсластит для конечного пользователя пилюлю «переходности».

Подводя итоги

Мы не зря назвали эту статью «полшага вперед». Prescott получился более сложным и неоднозначным, чем ожидаемый «Northwood с увеличенным объемом кэша и более высокой частотой» (как многие его воспринимали). Разумеется, можно обвинить производителя в том, что прирост скорости в среднем близок к нулю (а местами и отрицательный), в очередной чехарде с поддержкой процессоров на базе нового ядра системными платами… И, между прочим, вполне справедливо это сделать. Это, в конце концов, не наши проблемы — а между тем, именно мы с ними и столкнемся. Поэтому просто поставим в конце статьи «жирное троеточие». На стоп-кадре видно только начало шага: нога, зависшая в воздухе, или, если угодно, лайнер на взлете. Что нас ждет дальше? Благоприятным ли окажется «приземление» (Tejas?..) Пока можно только догадываться.

ВведениеЕщё в прошлом году компания Intel говорила о грядущей смене приоритетов в создании новых процессоров. Ввиду возникших трудностей на пути наращивания тактовых частот процессоров Pentium 4, компания решила сосредоточить основные усилия не на увеличении их производительности, а на расширении функциональности. В течение прошлого года были сделаны первые подвижки в этом направлении: например, CPU стали маркироваться при помощи процессорного рейтинга, а тактовая частота в маркировке была отодвинута на второй план. Однако, реальные шаги, направленные на придание процессорам новых функций, были запланированы на этот, 2005 год. Поэтому, первых в этом году анонсов процессоров мы ждали с особым нетерпением.
И вот, свершилось. Сегодня компания Intel представляет на суд потребителей новые процессоры в семействе Pentium 4, в основе которых лежит обновлённое ядро, известное под кодовым именем Prescott 2M. Хотя, взятый Intel курс на внедрение в настольные системы двуядерных процессоров пока никак не отразился в новинках, новые Pentium 4, обладающие рейтингами вида 6XX, наделены рядом новых и интересных возможностей. Именно поэтому процессоры Pentium 4 6XX на базе ядра Prescott 2M и являются столь интересными объектами для изучения: в этих CPU мы сталкиваемся с увеличенной кеш-памятью второго уровня и с новыми для сектора настольных компьютеров технологиями Enhanced Memory 64 Technology и Enhanced Intel SpeedStep.
Параллельно с линейкой Pentium 4 6XX Intel выводит на рынок и ещё один процессор, нацеленный на энтузиастов. Этот CPU, входящий в семейство Pentium 4 Extreme Edition, в отличие от линейки Pentium 4 6XX, призван поднять планку производительности и стать наиболее быстрым CPU от Intel на сегодняшний день. А потому, новый Pentium 4 Extreme Edition, хотя и лишён некоторой функциональности Pentium 4 6XX, имеет большую тактовую частоту и работает при более высокой частоте шины.
Впрочем, подходить к новым продуктам Intel можно и с другой стороны. На фоне несомненных успехов основного конкурента, компании AMD, процессоры Pentium 4 смотрелись до сегодняшнего дня не лучшим образом. Старшие модели Athlon 64 превосходили аналогичные продукты Intel как по быстродействию, так и по поддерживаемым функциям. Теперь же, очевидно, Intel предпринимает очередную попытку настичь конкурента. Увеличение кеш-памяти второго уровня в процессорах на новом ядре Prescott 2M имеет под собой цель поднять их производительность. А внедрение в Pentium 4 6XX новых технологий Enhanced Memory 64 Technology и Enhanced Intel SpeedStep можно рассматривать как ответ Intel на имеющиеся в процессорах Athlon 64 технологии AMD64 и Cool"n"Quiet.
В данном обзоре мы попробуем оценить новинки от Intel со всех сторон. Мы посмотрим как на то, какие новые возможности способны привнести новые технологии, появившееся в процессорах с ядром Prescott 2M, так и на то, насколько изменилась производительность новых CPU семейств Pentium 4 6XX и Pentium 4 Extreme Edition, и смогут ли они составить достойную конкуренцию старшим моделям процессоров Athlon 64 и Athlon 64 FX. Однако, по традиции, практическое исследование новинок предваряет небольшая теоретическая часть.

Новые процессоры Pentium 4 6XX и Pentium 4 Extreme Edition 3.73 ГГц

Итак, сегодня, 20 февраля 2005 года компания Intel официально объявила новые процессоры Pentium 4 Extreme Edition 3.73 ГГц и Pentium 4 серии 6XX. Все эти процессоры основываются на одном и том же процессорном ядре Prescott 2M, основным отличительным признаком является увеличенная кеш-память второго уровня, которая имеет объём 2 Мбайта. В остальном же, включая и 90 нм технологический процесс с использованием растянутого кремния, ядро Prescott 2M подобно своему предшественнику, ядру Prescott, которое уже давно используется в процессорах Pentium 4 серии 5XX.
Сходство между Prescott и Prescott 2M видно даже на фотографиях этих ядер:

PrescottPrescott 2M


Как видим, кеш память у Prescott 2M действительно стала в два раза больше. В остальном, видимых отличий между ядрами не наблюдается.
Семейство процессоров Pentium 4 6XX состоит на сегодняшний день из нескольких моделей с частотами от 3.0 до 3.6 ГГц. Все эти процессоры, как и их предшественники, используют шину Quad Pumped Bus с частотой 800 МГц. Младшая модель имеет процессорный номер 630, модель с частотой 3.2 ГГц – 640, 3.4-гигагерцовый процессор – 650 и CPU с частотой 3.6 ГГц – 660. Следует заметить, что частота старшего процессора в линейке "шестисотых", Pentium 4 660, меньше частоты старшего процессора на базе обычного ядра Prescott, Pentium 4 570, составляющей 3.8 ГГц. Однако при этом Pentium 4 6XX имеют по сравнению со своими младшими братьями ряд преимуществ.
Во-первых, процессоры семейства Pentium 4 6XX поддерживают технологию Enhanced Memory 64 Technology (EM64T) – 64-битные расширения архитектуры x86, являющиеся аналогом расширений AMD64. Благодаря этому все процессоры Pentium 4 6XX совместимы с операционной системой Windows XP Professional x64 Edition, которой немногим ранее мы посвятили отдельную статью . Благодаря совместимости с этой операционной системой, Pentium 4 6XX теперь могут похвастаться целым рядом преимуществ, знакомым нам по процессорам Athlon 64. В числе оных в первую очередь следует отметить одновременную совместимость с 32-битным и 64-битным программным обеспечением, а также поддержку объёмов памяти, превышающих 4 Гбайта.
Второй плюс процессоров Pentium 4 6XX - это поддержка ими технологии Enhanced Intel SpeedStep (EIST). Данная технология является полным аналогом аналогичного механизма, реализованного в мобильных процессорах Intel. Суть данного механизма заключается в том, что процессоры Pentium 4 6XX могут снижать свою частоту в моменты, когда от них не требуется высокая производительность. При помощи данного метода достигается существенное снижение тепловыделения и энергопотребления.
При этом все CPU семейства Pentium 4 6XX поддерживают технологию Execute Disable Bit (XD bit), появившуюся в Pentium 4 5XX с выходом старшей модели с частотой 3.8 ГГц и процессорным номером 570.
Таким образом, несмотря на свою более низкую тактовую частоту, процессоры Pentium 4 семейства 6XX по числу поддерживаемых функций превосходят своих предшественников, Pentium 4 5XX.
Следует напомнить, что Intel отказался от выпуска процессоров на базе ядра Prescott с частотами 4 ГГц и выше. Это относится и к CPU, в основе которых лежит ядро Prescott 2M. То есть, старшая модель в линейке 5XX, Pentium 4 570 с частотой 3.8 ГГц так и останется самой быстрой моделью CPU на базе ядра Prescott. В линейке же 6XX на сегодня старшая модель процессора с номером 660 имеет частоту 3.6 ГГц. Соответственно, более быстрые процессоры в этом семействе появляться могут. Так, во втором квартале текущего года Intel собирается объявить Pentium 4 670 с тактовой частотой 3.8 ГГц.
Впрочем, вопрос относительно того, какой из процессоров Intel является самым быстрым на сегодняшний день, решается не в пользу ни Pentium 4 660, не в пользу Pentium 4 570. На эту роль претендует ещё один процессор на базе ядра Prescott 2M, анонсированный сегодня и отнесённый к семейству Pentium 4 Extreme Edition. Данная новинка обладает тактовой частотой 3.73 ГГц и рассчитана на работу при частоте шины 1066 МГц. При этом, хотя большинство характеристик Pentium 4 Extreme Edition 3.73 ГГц повторяет характеристики серии Pentium 4 6XX, этот процессор не поддерживает технологию EIST. Технологии же XD bit и EM64T в этом CPU включены.
А вот какую информацию выдаёт о новых процессорах Pentium 4 Extreme Edition 3.73 ГГц и Pentium 4 660 диагностическая утилита CPU-Z:


Intel Pentium 4 660


Intel Pentium 4 Extreme Edition 3.73 ГГц


Подводя итог, приведём формальные характеристики анонсированных сегодня процессоров Pentium 4 6XX и Pentium 4 Extreme Edition. В таблице ниже для сравнения также приведены характеристики процессоров Pentium 4 5XX.


Что касается теплового пакета новых процессоров, то их тепловыделение укладывается в те же самые рамки, что и у процессоров серии 5XX. Соответственно Pentium 4 6XX c частотами до 3.4 ГГц включительно вписываются в TDP в 84 Вт, старшие же модели, а также новый Pentium 4 Extreme Edition 3.73 ГГц имеют TDP в 115 Вт.
Таким образом, новые процессоры могут использоваться в тех же самых материнских платах, что и предшествующие LGA775 Pentium 4. Единственное требование: поддержка новых CPU со стороны BIOS материнской платы.
А вот как выглядят новые процессоры:






Слева-направо: Pentium 4 570, Pentium 4 660,
Pentium 4 Extreme Edition 3.73 ГГц

Ядро Prescott 2M: изменения в кеш-памяти

Так как одним из основных нововведений, произошедших с процессорами Pentium 4 при их переводе на использование нового ядра Prescott 2M, стало увеличение кеш-памяти второго уровня, следует уделить немного внимания организации L2 кеш-памяти в новом ядре. Чтобы понять, как же устроена кеш-память второго уровня в новом ядре Prescott 2M, мы вновь воспользовались диагностической утилитой CPU-Z. Для сравнения, мы приводим и аналогичную информацию, относящуюся к более старому ядру, Prescott:

Как видим, у Prescott 2M и Prescott кеш-память второго уровня (да и первого тоже) организована совершенно одинаково. Различие только в размере. Кеш второго уровня у обоих ядер имеет 8 зон ассоциативности и оперирует строками длиной 64 байт. Однако наличие одинакового количества зон ассоциативности у кеш-памяти разного объёма автоматически означает, что поиск данных в более ёмком кеше должен выполняться дольше. Соответственно, L2 кеш процессоров на базе ядра Prescott 2M должен быть более медленным, чем L2 кеш процессоров, в основе которых лежит обычное ядро Prescott.
Чтобы проверить эту гипотезу, мы вооружились утилитой Cache Burst 32. Тестовая система, на которой мы проводили измерения, основывалась на материнской плате Intel Desktop Board D925XECV2 на чипсете i925XE Express и была снабжена двухканальной DDR2-533 SDRAM с таймингами 4-4-4-11. Для опытов мы использовали процессоры Pentium 4 560 и Pentium 4 660 на ядрах Prescott и Prescott 2M соответственно.












Как показывают результаты теста, действительно, скорость чтения из кеш-памяти второго уровня у нового процессора Pentium 4 660 ниже, чем у аналогичного Pentium 4 560 с меньшим объёмом кеш-памяти. При этом скорость записи и латентность кешей у этих CPU совпадает. Однако при копировании данных мы видим, что кеш-память процессора на ядре Prescott 2M работает несколько быстрее, чем кеш-память CPU с ядром Prescott.
Таким образом, мы вынуждены констатировать, что увеличение кеш-памяти второго уровня у процессоров Pentium 4 6XX повлекло за собой и некоторые глубинные изменения, в результате которых скорость работы с данными в L2 кеше изменилась. Причём, не в лучшую сторону. Отметим, что подобное же явление уже один раз происходило с NetBurst архитектурой при переходе от ядра Northwood к ядру Prescott. Так что мы вновь должны заметить, что увеличение объёма кеш-памяти второго уровня не лучшим образом отражается на её быстродействии.

Подробности о Demand Based Switching

С вводом в процессорах Pentium 4 6XX технологии Enhanced Intel SpeedStep (EIST) эти процессоры стали обладателями сразу трёх технологий, попадающих под собирательное название Demand Based Switching (переключение по потребностям). Первые две технологии мы уже рассматривали, обзирая процессор Pentium 4 570J, который был основан на ядре Prescott степпинга E0. С появлением этого степпинга ядра процессоры Pentium 4 получили в свое распоряжение новый механизм термального мониторинга TM2 и новый режим для снижения энергопотребления C1E. EIST дополнила эти технологии в новом ядре Prescott 2M и теперь новые процессоры Pentium 4 6XX могут похвастать ещё более низким средневзвешенным энергопотреблением и тепловыделением.
Технология EIST предназначается для управления частотой процессора и его напряжением в зависимости от степени загрузки, как это делается в мобильных компьютерах. В настольном сегменте аналогом EIST является технология Cool"n"Quiet от AMD, реализованная в процессорах семейства Athlon 64. Можно сказать, что EIST позволяет более рационально использовать ресурсы процессора: при работе в приложениях, не загружающих процессор на 100% его максимальная тактовая частота никому не нужна, в такие моменты её можно спокойно снизить, параллельно уменьшив тепловыделение и энергопотребление CPU. Если же приложение требует от процессора максимальной производительности, то он увеличит частоту до номинальной отметки, попутно подняв напряжение на ядре до нужной величины.
Включается технология EIST абсолютно также, как и Cool"n"Quiet. В Windows XP, например, на закладке Power Option Properties необходимо изменить схему питания компьютера со стандартной Home/Office Desk на Minimal Power Management. После этой установки процессор начнёт снижать свою частоту в моменты низкой загрузки. Необходимый для работы этой технологии процессорный драйвер входит в Service Pack 2, поэтому технология EIST становится совместимой с Windows XP после установки SP2.
На первый взгляд, EIST не вызывает никаких вопросов, однако эта достаточно интересная технология таит в себе и немало сюрпризов. Дело в том, что все три технологии семейства Demand Based Switching, C1E, TM2 и EIST используют один и тот же механизм. Именно поэтому мы решили ещё раз вернуться к рассказу о том, как же на самом деле работают эти технологии.
Функционирование C1E, TM2 и EIST основано на том факте, что процессоры Pentium 4 с ядром Prescott, начиная со степпинга E0, умеют изменять свой коэффициент умножения и Vid "на лету". Конкретнее, процессоры с ядрами Prescott и Prescott 2M при необходимости могут снижать свой множитель до 14x (а это – минимальное значение для ядра Prescott), уменьшая при этом своё напряжение питания примерно на 0.25В. Сочетание этих характеристик и определяет повсеместно эксплуатируемый "режим пониженного энергопотребления", при котором процессор работает на частоте 2.8 ГГц со сниженным напряжением питания. Вот, например, какую информацию выдаёт утилита CPU-Z про процессор Pentium 4 660 (штатная частота 3.6 ГГц), находящийся в этом "режиме пониженного энергопотребления":


Ещё одна интересная деталь заключается в том, что для всех процессоров серии Pentium 4 6XX с разными тактовыми частотами режим пониженного энергопотребления одинаков: все они в этом режиме работают на частоте 2.8 ГГц вне зависимости от их номинальной частоты.
Важно заметить, что для обеспечения стабильности работы переход в этот режим и выход из него происходит не скачкообразно, а постепенно. Так, при входе в "режим пониженного энергопотребления" процессор сначала понижает свой множитель до 14x, а лишь потом постепенно снижет напряжение питания. Выход из этого режима происходит в обратном порядке: сначала постепенно увеличивается напряжение, а только потом устанавливается штатный множитель.


Все три технологии из серии Demand Based Switching, C1E, TM2 и EIST, используют этот режим пониженного энергопотребления. Различие же между C1E, TM2 и EIST заключается лишь в том, в какие моменты включается данный режим.
Технология C1E (Enhanced Halt State) активизирует режим пониженного энергопотребления при поступлении на процессор команды Halt, говорящей о переводе процессора в режим ожидания. Эта команда отдаётся процессору операционной системой в моменты, когда для исполнения нет никаких других инструкций. То есть, если ранее процессоры Pentium 4 при поступлении команды Halt просто переводили часть своих исполнительных устройств в режим бездействия, режим C1E позволяет ещё сильнее снизить тепловыделение и энергопотребление благодаря дополнительному уменьшению тактовой частоты, на которой работает активная часть CPU в режиме ожидания.
Технология TM2 (Thermal Monitor 2) , хотя и предназначается для защиты процессора от перегрева, использует тот же самый 2.8-гигагерцовый режим пониженного энергопотребления. TM2 переводит CPU в этот режим по команде, поступающей от встроенного в ядро процессора термодатчика. Если температура процессора превышает некоторое предельно допустимое значение температуры (а это значение калибруется индивидуально для каждого экземпляра CPU), частота процессора снижается до 2.8 ГГц и одновременно понижается напряжение питания процессорного ядра. Этот механизм позволяет снизить температуру процессора до допустимых пределов примерно на 40% быстрее, нежели при используемом раньше механизме TM1, основанном на модуляции несущей частоты.
Технология EIST (Enhanced Intel SpeedStep) , как это не покажется странным, также переводит процессор в 2.8-гигагерцовый режим пониженного энергопотребления. В рамках этой технологии переход в данное состояние инициируется операционной системой. Если драйвер процессора рапортует о низкой загрузке CPU в конкретный момент времени, операционная система через соответствующую команду ACPI переводит процессор в режим пониженного энергопотребления. То есть, благодаря EIST удаётся снизить тепловыделение процессора не только в моменты его полного простоя, но и при небольшой загрузке.
Теперь о неприятном. Поскольку минимально возможным коэффициентом умножения для процессоров на базе ядра Prescott (и его производной Prescott 2M) является 14x, использование технологий C1E, TM2 и EIST возможно только для CPU, имеющих больший множитель. Например, именно поэтому новым процессором Pentium 4 Extreme Edition 3.73 ГГц технологии C1E, TM2 и EIST не поддерживаются: штатный множитель этого CPU равен 14x. Соответственно, чем выше штатный множитель у процессора, тем больший эффект способны принести технологии семейства Demand Based Switching.

Температурный режим и энергопотребление

После того, как мы разобрались, какие новые технологии для снижения энергопотребления применил Intel в своих процессорах семейства Pentium 4 6XX, самое время посмотреть, как они проявляются на практике. Поэтому, мы изучили температурный режим и энергопотребление новых процессоров во время их реальной работы.
Для целей тестирования мы собрали тестовую систему, состоящую из следующего набора комплектующих:


Память: 1024MB DDR2-533 SDRAM (OCZ PC2 4300, 2 x 512MB, 4-4-4-11);


В первую очередь в этой тестовой системе мы провели измерение температурного режима LGA775 процессоров Pentium 4 6XX и Pentium 4 5XX. В качестве процессоров линейки Pentium 4 5XX использовались CPU, в основе которых лежат ядра Prescott степпинга E0, то есть поддерживающие C1E и TM2. Pentium 6XX были представлены процессорами с ядром Prescott 2M степпинга N0, эти CPU поддерживали C1E, TM2 и EIST. Частоты испытуемых процессоров устанавливались в 2.8, 3.0, 3.2, 3.4, 3.6 ГГц, а для процессора на ядре Prescott со степпингом ядра E0 – и в 3.8 ГГц. Частота шины во всех случаях была номинальной, напряжение питания ядра – тоже. Во всех опытах использовался штатный боксовый LGA775 кулер. Показания температуры процессоров снимались с встроенного в ядро CPU датчика. Измерения температуры процессорных ядер мы выполняли в двух состояниях: в режиме ожидания (idle) и при максимальной загрузке CPU, создаваемой специальной утилитой S&M версии 0.3.2, являющейся на сегодняшний день лучшим инструментом для прогрева процессоров.
Помимо результатов измерений температур Pentium 4 "пятисотой" и "шестисотой" серий, на итоговые графики мы добавили и данные, полученные при испытании процессора Pentium 4 Extreme Edition 3.73 ГГц. Хотя этот процессор и основывается на том же самом ядре Prescott 2M степпинга N0, как и все Pentium 4 6XX, он не поддерживает технологии C1E, TM2 и EIST. Поэтому, его температурный режим и энергопотребление вызывает особый интерес.






Как видим, при максимальной нагрузке на процессоры Pentium 4 5XX и Pentium 4 6XX они прогреваются примерно до одинаковой температуры при равной тактовой частоте. То есть, увеличение кеш-памяти второго уровня не привело к какому сколько-нибудь заметному изменению температурной картины. Зато работа процессоров в состоянии покоя заслуживает определённого внимания. В первую очередь заметим, что вне зависимости от частоты Pentium 4 5XX и Pentium 4 6XX показывают совершенно одинаковую температуру. Это объясняется тем, что в состоянии бездействия эти процессоры, фактически, работают в "состоянии пониженного энергопотребления" на частоте 2.8 ГГц, независимо от их номинальной частоты. Например, Pentium 4 XE 3.73 ГГц, который технологии C1E, TM2 и EIST не поддерживает, в состоянии покоя прогревается гораздо сильнее. Это неудивительно: в этом состоянии, в отличие от процессоров Pentium 4 5XX и 6XX, он продолжает работать на своей штатной частоте.
Также, помимо температуры, мы оценили и энергопотребление процессоров с ядрами Prescott и Prescott 2M. Для этого при помощи токовых клещей мы измерили ток, проходящий по 12-вольтовой цепи, по которой осуществляется питание процессора. То есть, приводимые ниже данные не учитывают КПД конвертера питания процессора, поэтому, по сравнению с реальным энергопотреблением процессоров они слегка завышены (примерно на 10%).






Качественно картина получается такая же, как и при измерении температуры. Однако мы должны отметить, что новые процессоры на базе ядра Prescott 2M, несмотря на увеличившееся количество транзисторов, обладают более низким энергопотреблением, чем процессоры на базе обычного ядра Prescott. Таким образом, резервы для наращивания тактовых частот процессоров Pentium 4 6XX ещё есть.

Разгон

Чтобы оценить эти резервы, а также понять, насколько новое процессорное ядро Prescott 2M степпинга N0 может понравиться энтузиастам-оверклокерам, мы решили провести испытания CPU Intel Pentium 4 660 со штатной частотой 3.6 ГГц на разгон. Тестовая система, используемая в этом случае, была составлена из следующего набора комплектующих:

Процессор: Intel Pentium 4 660 (3.6 ГГц);
Материнская плата: ASUS P5AD2-E Premium (LGA775, i925XE Express);
Память: 1024MB DDR2-667 SDRAM (Corsair XMS2-5300, 2 x 512MB, 4-4-4-12).
Графическая карта: PowerColor RADEON X800 XT (PCI-E x16);
Дисковая подсистема: Maxtor MaXLine III 250GB (SATA150).

Для охлаждения Pentium 4 660 во время наших разгонных экспериментов мы воспользовались самым производительным воздушным кулером для LGA775 процессоров, имеющимся в нашей лаборатории: Zalman CNPS7700Cu. Напряжение питания процессора при разгоне мы не увеличивали: на старшие модели CPU с ядром Prescott 2M, как и на их предшественников, данный трюк не производит практически никакого впечатления. Разгон мы выполняли путём повышения частоты FSB свыше штатных 200 МГц, частоты шины PCI Express и PCI фиксировались при этом на номинальных значениях 100 и 33 МГц.
Перед тем, как перейти непосредственно к результатам нашего разгона, напомним, что максимальная частота, которую нам удалось достичь при оверклокинге Pentium 4 570, основанного на ядре Prescott степпинга E0, составила 4.3 ГГц. Подобных успехов от Pentium 4 660, ядро которого имеет большее число транзисторов, мы не ожидали. Однако, практика показала, что зря.
Ниже мы приводим скриншот CPU-Z, являющийся отражением наших успехов:


То есть, Pentium 4 660 со штатной частотой 3.6 ГГц разогнался до 4.33 ГГц. Это – достаточно хороший результат, подтверждающий значительный оверклокерский потенциал ядра Prescott 2M. Таким образом, младшие процессоры линейки Pentium 4 6XX могут стать весьма интересными объектами для разгона.
Мы же в очередной раз должны констатировать, что решение Intel не выпускать по 90 нм технологии процессоры с частотами 4 ГГц и более, обусловлено не достижением технологического предела, а скорее маркетинговыми причинами. Как мы вновь убеждаемся, существующие ядра Prescott и Prescott 2M степпингов E0 и N0 могут легко работать на частотах свыше 4 ГГц.

Как мы тестировали

Целью данного тестирования являлось определение уровня производительности, обеспечиваемого новыми процессорами серии Intel Pentium 4 6XX и процессором Intel Pentium 4 Extreme Edition 3.73 ГГц, а также сопоставление этого уровня с быстродействием предшествующих и конкурирующих CPU. Для наших тестовых испытаний мы выбрали две старших модели "шестисотой" серии, Pentium 4 660 со штатной частотой 3.6 ГГц и Pentium 4 650 с частотой 3.4 ГГц.

В составе тестовых систем мы использовали следующее оборудование:

Процессоры:

AMD Athlon 64 FX-55 (Socket 939, 1024KB L2, 2.6GHz);
AMD Athlon 64 4000+ (Socket 939, 1024KB L2, 2.4GHz);
AMD Athlon 64 3800+ (Socket 939, 512KB L2, 2.4GHz);
AMD Athlon 64 3500+ (Socket 939, 512KB L2, 2.2GHz);
Intel Pentium 4 570 (LGA775, 1024KB L2, 3.8 GHz);
Intel Pentium 4 560 (LGA775, 1024KB L2, 3.6 GHz);
Intel Pentium 4 550 (LGA775, 1024KB L2, 3.4 GHz);
Intel Pentium 4 660 (LGA775, 2048KB L2, 3.6 GHz);
Intel Pentium 4 650 (LGA775, 2048KB L2, 3.4 GHz);
Intel Pentium 4 Extreme Edition 3.46GHz (LGA775, 2048KB L3, FSB 1066MHz);
Intel Pentium 4 Extreme Edition 3.73GHz (LGA775, 2048KB L2, FSB 1066MHz);


Материнские платы:

EPoX 9NPA Ultra (Socket 939, NVIDIA nForce4 Ultra);
Intel Desktop Board D925XECV2 (LGA775, i925XE Express).


Память:

1024MB DDR400 SDRAM (Corsair CMX512-3200XLPRO, 2 x 512MB, 2-2-2-10);
1024MB DDR2-533 SDRAM (OCZ PC2 4300, 2 x 512MB, 4-4-4-11).


Графическая карта: PowerColor RADEON X800 XT (PCI-E x16).
Дисковая подсистема: Maxtor MaXLine III 250GB (SATA150).

Тестирование выполнялось в операционной системе MS Windows XP SP2 с установленным пакетом DirectX 9.0c. Тестовые системы настраивались на максимальную производительность. Заметим, что в Athlon 64 мы увеличивали тайминг Cycle Time (Tras) до 10, поскольку, как показывает практика, в таком режиме контроллер памяти Athlon 64 работает более эффективно, нежели при установке этой задержки в минимально возможное значение 5.
В рамках данного тестирования мы существенно расширили набор тестовых приложений. Произошло это благодаря тому, что мы решили задействовать набор стандартных скриптов PC WorldBench 5, широко используемый в индустрии для бенчмаркинга.

Производительность

FutureMark PCMark04, 3DMark2001 SE и 3DMark05

В первую очередь мы решили привести результаты, полученные нами в популярных синтетических тестах компании FutureMark.









Тест PCMark04 активно использует технологию Hyper-Threading, благодаря чему процессоры производства компании Intel показывают лучшие результаты. Что же касается соотношения сил между различными линейками процессоров Pentium 4, то процессоры "шестисотой" серии с увеличенной до 2 Мбайт кеш-памятью лишь незначительно превосходят CPU линейки Pentium 4 5XX. Зато процессор Pentium 4 Extreme Edition 3.73 ГГц, благодаря значительному росту тактовой частоты и более новому процессорному ядру, ощутимо обгоняет своего предшественника, Pentium 4 Extreme Edition 3.46 ГГц, в основе которого использовалось ядро Gallatin.
Достаточно интересные результаты получаются и в подтесте, измеряющем скорость работы подсистемы памяти. Увеличение L2 кеша в процессорах Pentium 4 6XX увеличило скорость их работы с данными, благодаря чему этим CPU в данном бенчмарке удаётся теперь выступать на равных с процессорами Athlon 64, сильной стороной которых является интегрированный контроллер памяти. То есть, увеличенная до 2 Мбайт кеш-память второго уровня нивелирует высокие задержки DDR2 SDRAM, используемой в составе современных Pentium 4 систем.


Старый тест 3DMark2001 SE никак не теряет своей популярности, однако на сегодня он уже гораздо сильнее показывает скорость центральных процессоров, нежели современных видеокарт. Раньше в этом тесте неизменно верхние места занимали CPU семейства Athlon 64, однако теперь ситуация несколько изменилась. Увеличение в новых процессорах Pentium 4 с ядром Prescott 2M кеш-памяти второго уровня позволило этим CPU несколько нарастить свои показатели в данном тесте. Благодаря этому Pentium 4 660 удалось обогнать Athlon 64 3500+, а Pentium 4 Extreme Edition 3.73 ГГц выступает на равных с Athlon 64 3800+. Конечно, назвать такие результаты успехом для Intel явно нельзя, однако этот факт является явным предвестником того, что в игровых приложениях увеличенный кеш процессоров с ядром Prescott 2M должен сказаться положительным образом.






Результаты, полученные в самом новом тестовом пакете от Futuremark, 3DMark05 также говорят нам о том, что увеличенная кеш-память новых процессоров Pentium 4 даёт определённый эффект при работе с игровой 3D графикой. Однако индекс производительности CPU из этого теста не позволяет Pentium 4 660 опередить Pentium 4 570, работающий на 200 МГц более высокой тактовой частоте. Впрочем, это не мешает при этом выставить на первое место по данному индексу процессор Pentium 4 Extreme Edition 3.73 ГГц, которому удаётся обогнать даже Athlon 64 FX-55.

Игровые приложения















С самого момента появления процессоров Athlon 64, CPU этого типа наголову побеждают своих конкурентов семейства Pentium 4 в игровых приложениях. Появление процессоров Pentium 4 6XX и Pentium 4 Extreme Edition 3.73 ГГц эту ситуацию не изменило. Несмотря на то, что увеличение кеш-памяти второго уровня привело к росту скорости Pentium 4 в играх примерно на 3-6%, Athlon 64 в 3D играх вновь оказываются значительно более быстрыми CPU. Положение не спасает и новый Pentium 4 Extreme Edition, уступающий в приложениях этого типа по скорости даже Athlon 64 3500+.

Офисные приложения


При работе в Microsoft Office скорость процессора оказывает небольшое влияние на производительность системы в целом.


Зато рендеринг веб-страниц в одном из самых популярных броузеров Mozilla (движок которого используется и в ещё более распространенном FireFox) на процессорах семейства Athlon 64 выполняется значительно быстрее, чем на конкурирующих CPU от Intel.


Впрочем, если во время работы с броузером в фоновом режиме выполняется какой-либо другой процесс, сильно загружающий ресурсы компьютера, результаты Pentium 4 оказываются несколько лучше, благодаря поддержке этими процессорами технологии Hyper-Threading.


Как видим, производительность ещё одного распространённого приложения, Nero, предназначенного для записи CD и DVD дисков также мало зависит от производительности центрального процессора.

Сжатие данных






Скорость работы приложений для сжатия данных напрямую зависит от тех алгоритмов, которые используются в этих приложениях. Как видим, WinZip несколько лучше оптимизирован для процессоров Intel, зато в WinRAR чудеса быстродействия показывают CPU семейства Athlon 64.
Кстати, по данным WinRAR, очень чутко реагирующего на любые изменения в архитектуре системы, увеличение кеш-памяти второго уровня даёт очень небольшой эффект: всего лишь порядка 3%.

Кодирование аудио и видео















В задачах кодирования видео традиционно выигрывают процессоры семейства Pentium 4. Приложения, используемые для сжатия видео контента, хорошо оптимизированы для NetBurst архитектуры и зачатую используют набор инструкций SSE3, который реально может увеличить производительность в программах этого рода. Поэтому, мы вновь вынуждены констатировать тот факт, что равных Pentium 4 при кодировании видео нет.
Что же касается кодирования аудио в формат mp3, то с этим процессом CPU от Intel и AMD справляются примерно с одинаковой скоростью.
Хочется отметить, что в задачах кодирования аудио и видео контента процессоры Pentium 4 6XX оказываются лишь немного быстрее, чем Pentium 4 5XX. Двукратное увеличение объёма кеш-памяти второго уровня в приложениях такого рода даёт прирост производительности менее 1%.

Редактирование изображений






Соотношение производительности между процессорами и в ACDSee, обладающем простейшими пакетными функциями для редактирования изображений, и в полновесном Adobe Photoshop примерно одинакова. Работа с изображениями на процессорах семейства Athlon 64 выполняется несколько быстрее, нежели на конкурирующих продуктах от Intel.
При этом мы вновь должны констатировать, что CPU семейства Pentium 4 6XX в приложениях этого типа опережают процессоры серии Pentium 4 5XX лишь на десятые доли процента. То есть, и в графических редакторах эффект от увеличения кеш-памяти в процессорах с ядром Prescott 2M проявляется весьма слабо.

Редактирование видео

Процессоры семейства Athlon 64 сильны именно благодаря своей вычислительной мощности. Поэтому их победа в специализированных пакетах для математических расчётов вполне закономерна.
Интересно же в этих тестах другое. Во-первых, Mathematica оказывается одним из немногих приложений, в котором размер кеш-памяти второго уровня имеет большое значение. Так преимущество процессоров с ядром Prescott 2M над процессорами с ядром Prescott, работающими на одинаковой тактовой частоте, оказывается порядка 7%, а это чуть ли не максимальное значение, наблюдаемое нами в данном тестировании. Во-вторых, Matematica очень лояльно отнеслась к процессору Pentium 4 Extreme Edition 3.46 ГГц, основанному на устаревшем 130 нм ядре Gallatin. Как видим, этот процессор, несмотря на свою относительно невысокую тактовую частоту, является в данном приложении лидером среди всех CPU от Intel.
Что же касается пакета MATLAB, то наблюдаемая в нём картина вполне привычна, поэтому полученные здесь результаты вряд ли нуждаются в дополнительных комментариях.
Производительность при финальном рендеринге в Lightwave очень сильно зависит от типа стоящегося изображения. В зависимости от этого в лидерах могут быть как процессоры Athlon 64, так и Pentium 4.
При этом заметим, что в любых задачах 3D рендеринга объём кеш-памяти второго уровня оказывает небольшое влияние на конечный результат. Этот относится как к процессорам Pentium 4 6XX, так и к Athlon 64 с мегабайтным L2 кешем.
Кроме того, обратите внимание на то, что в Lightwave процессоры Pentium 4 6XX проигрывают Pentium 4 5XX, работающим на аналогичной частоте. Скорее всего, этот факт объясняется именно большей медлительностью кеш-памяти второго уровня, реализованной в ядре Prescott 2M.

Выводы

В рамках данного обзора мы познакомились с семейством новых процессоров Intel, использующих в своей основе ядро Prescott 2M. Хотя на первый взгляд основным преимуществом этого ядра является увеличенный до 2 Мбайт L2 кеш, на деле процессоры на базе этого ядра содержат гораздо больше интересных нововведений, чем это кажется на первый взгляд. CPU линейки Pentium 4 6XX, являющиеся основными носителями ядра Prescott 2M на сегодняшний день, обладают не просто большей кеш-памятью, чем их предшественники, они снабжены рядом новых технологий, расширяющих их функциональность.
Тут в первую очередь следует отметить, что Pentium 4 6XX стали первыми массовыми CPU от Intel для настольных компьютеров, поддерживающими 64-битные расширения архитектуры x86. В свете скорого появления 64-битных пользовательских операционных систем, и в первую очередь Windows XP Professional x64 Edition, Intel поддержал инициативу AMD по внедрению архитектуры x86-64 и снабдил свои CPU соответствующими расширениями. Таким образом, теперь поддержка x86-64 прекращает быть прерогативой исключительно процессоров Athlon 64: конкурирующие продукты от Intel, процессоры Pentium 4 6XX теперь также имеют возможность работать с 64-битными приложениями и поддерживать более 4 Гбайт оперативной памяти.
Аналогичные 64-битные расширения архитектуры x86 получили и процессоры Pentium 4 Extreme Edition. Новая модель в этом семействе, Pentium 4 Extreme Edition 3.73 ГГц, которая основывается на новом ядре Prescott 2M, также поддерживает x86-64.
Нельзя обойти вниманием и тот факт, что новые процессоры Pentium 4 6XX получили в свое распоряжение набор технологий Demand Based Switching, благодаря которым снижается тепловыделение и энергопотребление этих процессоров в те моменты, когда от CPU не требуется работа "на пике своих возможностей". В процессорах семейства Pentium 4 6XX реализованы технологии C1E, TM2 и EIST и благодаря этому набору CPU данного типа большинство времени работают на частоте 2.8 ГГц при пониженном напряжении питания, разгоняясь до номинальной частоты лишь в те моменты, когда от системы необходима максимальная производительность.
Именно такой набор новых возможностей, реализованных в процессорах Pentium 4 6XX, позволил Intel установить на них достаточно высокие цены по сравнению с их предшественниками, Pentium 4 5XX с обычным ядром Prescott. Вот выдержка из нового официального прайс-листа (цены процессоров за 1 тыс. шт.):

Intel Pentium 4 Extreme Edition 3.73 GHz (3.73 GHz, 1066 MHz FSB, 2 MB L2) - $999;
Intel Pentium 4 660 (3.60 GHz, 800 MHz FSB, 2 MB L2) - $605;
Intel Pentium 4 650 (3.40 GHz, 800 MHz FSB, 2 MB L2) - $401;
Intel Pentium 4 640 (3.20 GHz, 800 MHz FSB, 2 MB L2) - $273;
Intel Pentium 4 630 (3.00 GHz, 800 MHz FSB, 2 MB L2) - $224.

Что же касается традиционного восприятия новых CPU, а именно их производительности, то нельзя сказать, что появление Pentium 4 "шестисотой серии" как-то повлияло на расстановку сил на процессорном рынке. Пока тактовая частота этих CPU уступает тактовой частоте старших процессоров Pentium 4 5XX, а увеличенный кеш второго уровня лишь незначительно позволяет поднять быстродействие. На графике ниже мы приводим относительную производительность Pentium 4 660 по сравнению с производительностью аналогичного по тактовой частоте процессора Pentium 4 560, основанного на обычном ядре Prescott с кеш-памятью второго уровня объёмом 1 Мбайт:


Как видим, в большинстве случаев эффект от увеличенной в два раза кеш-памяти второго уровня не превосходит 5%. Именно поэтому на сегодняшний день Pentium 4 570 с тактовой частотой 3.8 ГГц и кеш-памятью второго уровня 1 Мбайт следует считать более производительным CPU, нежели Pentium 4 660 с тактовой частотой 3.6 ГГц и 2-мегабайтной кеш-памятью. Сильные же стороны Pentium 4 6XX заключаются в первую очередь в поддержке EM64T и в наборе технологий C1E, TM2 и EIST.
Что же касается процессора Pentium 4 Extreme Edition 3.73 ГГц, то он приходит на смену Pentium 4 Extreme Edition 3.46 ГГц, основанному на ядре Gallatin. Смена ядра, перенос 2 Мбайт кеша с третьего уровня на второй и ощутимое увеличение тактовой частоты возымели своё дело и в целом, новый Extreme Edition стал побыстрее старого:


Однако данная картина наблюдается далеко не всегда и, более того, в игровых приложениях, на работу в которых в первую очередь и нацелены процессоры серии Extreme Edition, новый Pentium 4 Extreme Edition 3.73 ГГц не обгоняет своего предшественника. Все-таки 130 нм ядро Northwood и его производная Gallatin, использовавшаяся в Pentium 4 Extreme Edition 3.46 ГГц, в игровых приложениях работает более эффективно, нежели любой из Prescott.
Впрочем, вновь не следует забывать о том, что неоспоримым преимуществом Pentium 4 Extreme Edition 3.73 ГГц является поддержка 64-битных расширений EM64T.
Что же касается общей расстановки сил "AMD против Intel", то теперь мы можем констатировать, что по своим возможностям процессоры на ядре Prescott 2M уровнялись с процессорами Athlon 64. Так, взамен 64-битных расширений AMD64 у Athlon 64, в процессорах Pentium 4 6XX появились расширения EM64T. Аналогом технологии Cool"n"Quiet от AMD стала технология EIST от Intel, а кроме того процессоры Intel получили поддержку NX-бита (в терминах Intel XD-бита).
Производительность же старших моделей процессоров от Intel при этом пока всё ещё уступает скорости старших процессоров Athlon 64. Хотя, Pentium 4 продолжают лидировать в традиционных для себя областях, как то кодирование видео данных или финальный рендеринг, в большинстве приложений, а в первую очередь в играх, CPU от AMD показывают более высокое быстродействие.