Разгон, производительность, латентность

Память Rambus, как показали тесты, ни в чем не усту­па­ла DDR SDRAM, а в ста­биль­но­с­ти та­ко­го па­ра­мет­ра как ла­тент­ность, она бы­ла да­же луч­шей. Низ­кие за­держ­ки и уд­во­ен­ная ско­рость пе­ре­да­чи дан­ных за счет так­ти­ро­ва­ния по двум фрон­там на­дол­го сде­ла­ли эту тех­но­ло­гию при­вле­ка­тель­ной для иг­ро­вых плат­форм Nin­ten­do и Sony Play­Station. Оце­нить пер­с­пек­ти­вы RDRAM мож­но вы­пол­нив ряд эк­спе­ри­мен­тов, де­мон­ст­ри­ру­ю­щих по­ве­де­ние кон­ку­рент­ных тех­но­ло­гий при раз­го­не, чем мы и зай­мем­ся.

О латентности

Как известно, главным результатом модернизации интерфейсов оперативной памяти в течение по­след­них де­ся­ти­ле­тий яви­лось крат­ное повышение пропускной способности. Столь же стремительного уменьшения ла­тент­но­с­ти не на­блю­да­ет­ся. Те­о­ре­ти­че­ски, при оптимальном проектировании латентность в большей сте­пе­ни обусловлена фи­зи­че­ски­ми свой­ст­ва­ми за­по­ми­на­ю­щей мат­ри­цы DRAM, чем тактовой частотой и типом ин­тер­фей­са. Повышая так­то­вую час­то­ту для передачи дан­ных при­дет­ся ап­про­кси­ми­ро­вать аналоговую за­держ­ку бо́льшим ко­ли­че­ст­вом циф­ро­вых так­тов. В итоге, латентность будет определяться свойствми сле­ду­ю­щих компонентов и шин, обес­пе­чи­ва­ю­щих мар­ш­рут до­сту­па про­цес­со­ра к оперативной памяти:

  1. Центральный процессор;
  2. Системная шина Front Side Bus (FSB);
  3. Северный мост системной логики, в состав которого входит DRAM-контроллер;
  4. Шина доступа к Dual Channel DDR или Dual Channel RDRAM;
  5. Модули памяти DDR DIMM или RDRAM RIMM.

Приступаем к тестированию

Паритет возможностей обеспечивают две тестовые платформы ASUS, метрики производительности на каждой из них будут получены с одним и тем же процессором — Pentium 4 Northwood (SL6SH).

  • Стенд для DDR SDRAM: плата ASUS P4P800-MX на чипсете Intel Morgan Hill i865GV, оперативная память — два DIMM-мо­дуля GR400D64L3 объемом 1 ГБ производства Wilk Elektronik, со­от­вет­ст­ву­ю­щих тре­бо­ва­ни­ям PC3200;
  • Стенд для RDRAM: плата ASUS P4T533-C на чипсете Intel Tehama i850E, оперативная память — два RIMM-мо­ду­ля объ­е­мом 512 МБ про­из­вод­ст­ва A-Tech, со­от­вет­ст­ву­ю­щих спе­ци­фи­ка­ции PC1066.

Синхронная DRAM c DDR

Оценим уровень задержек памяти DDR на эф­фек­тив­ной частоте передачи данных в 333 МГц.

Латентность памяти DDR SDRAM на эф­фек­тив­ной частоте передачи данных в 333 МГц

 

Сравнивая полученные результаты с латентностью этих же модулей памяти, работающих на частоте 266 МГц, за­ме­тим не­боль­шое улуч­ше­ние ха­рак­те­рис­тик: вместо медианного значения около 146.353 нсек, мы по­лу­ча­ем сни­же­ние за­держ­ки об­ра­ще­ния к па­мя­ти до 145.721 нсек. Гора родила мышь — 25% прироста частоты привело к сни­же­нию ла­тент­но­с­ти не более, чем на 0.5%.

Оценим влияние FSB на поведение DDR. Для этого переведем платформу в оверклокерский режим, подняв час­то­ту так­ти­ро­ва­ния CPU со штатных для SL6SH 133 МГц до экстремальных в данном случае 140 МГц.

Латентность памяти DDR SDRAM в оверклокинге FSB с 133 МГц до 140 МГц

 

Медианное значение латентности в оверклокинге вполне адекватно предпринятым шагам: вместо 145.721 нсек при FSB=133 МГц мы получаем 139.203 нсек при FSB=140 МГц, т.е. около 4,5% улучшения при росте FSB на 5,2%.

Rambus-память c DDR

Увеличение частоты системной шины до 140 МГц к ускорению работы с Rambus-памятью не привело. На ли­цо — топ­та­ние на мес­те в ок­рест­но­с­ти 146 нсек, хотя в плане стабильности RDRAM остается верной себе, ре­зуль­та­ты ра­ду­ют за­вид­ным по­сто­ян­ст­вом.

333

 

Предсказуемо ли при оверклокинге такое поведение RDRAM? По правде говоря, результаты немного обес­ку­ра­жи­ва­ют. При­ни­мая во вни­ма­ние спо­соб­ность шины Rambus к сериализации, иного и ожидать трудно: такого рода тех­но­ло­гии слож­но под­да­ют­ся раз­го­ну. Их приоритет — в упрощении трассировки системной логики и в простоте сопряжения CPU с опе­ра­тив­ной па­мятью. Не будет секретом, что именно этими преимуществами RDRAM была впечатлена компания Intel, пла­ни­руя стро­ить будущие вычислительные архитектуры на базе Ram­bus.

И все же, она гонится!

Характеристика RDRAM будет неполной, если мы обойдем вниманием фирменное свойствро Rambus-шины — ре­жим Turbo Mode:

444

 

Включая Turbo Mode в установках BIOS Setup, Rambus не оставляет никаких шансов DDR SDRAM. В этом ре­жи­ме ла­тент­ность RDRAM — выше всяких похвал! Для его соперника на том этапе развития технологий она бы­ла прос­то не­до­сти­жи­ма. И даже с учетом эволюции, нацеленной больше на повышение пропускной спо­соб­но­с­ти, сме­на не­сколь­ких по­ко­ле­ний син­хрон­ной памяти не привела к существенным подвижкам в быст­ро­дей­ст­вии.

Что стоит за Turbo Mode RDRAM?

Опция RDRAM Turbo Mode позволяет оптимизировать тайминги шины Rambus без увеличения тактовой час­то­ты — с вы­со­ки­ми шан­са­ми на сох­ра­не­ние ста­биль­но­сти. Сравнивая содержимое конфигурационных ре­гист­ров кон­т­рол­ле­ра па­мя­ти Intel 82850E, установленное в результате выполнения инициализационных про­це­дур BIOS, не труд­но на­йти раз­ли­чие: па­ра­метр Row to Column Delay, определяющий задержку между пе­ре­да­чей адреса строки и столб­ца в ре­жи­ме Turbo Mode задает задержку в семь тактов. Значение по умол­ча­нию для tRCD составляет девять тактов.

444-б