Производительность памяти

Драма на два фронта: куда катятся цены на память?

Intel готов на все, чтобы про­цес­со­ры ста­ли ос­нов­ным ис­точ­ни­ком до­хо­да. Ком­па­ния давно уже не вы­пус­ка­ет DRAM и по­э­то­му не ста­нет за­бо­тить­ся о ста­биль­нос­ти рын­ка ди­на­ми­че­ской па­мя­ти. Це­ны на Op­tane мо­гут кан­ни­ба­ли­зи­ро­вать про­да­жи DRAM и ни­шу клас­си­че­ских твер­до­тель­ных NAND SSD но­си­те­лей.

Драма на два фронта: куда катятся цены на память?

Цена за DRAM

С появлением AMD Rome про­це­ду­ра сли­я­ния и по­гло­ще­ния кон­т­рол­ле­ров опе­ра­тив­ной па­мя­ти всту­пи­ла в но­вую фа­зу. Ар­хи­тек­ту­ра Zen 2, на ба­зе ко­то­рой со­з­да­ны чи­пы EPYC 7002, пред­по­ла­га­ет на­ли­чие от­дель­но­го уз­ла — кон­цен­т­ра­тора вво­да-вы­во­да I/O Die (IOD). Это единый центр, при­з­ван­ный об­слу­жить кол­лек­тив­ные по­треб­нос­ти всех вось­ми (как ва­ри­ант, че­ты­рех или двух) чип­ле­тов Core Com­plex Die (CCD), каж­дый из ко­то­рых суть два че­ты­рехъ­я­дер­ных ком­п­лек­са CCX. На пу­ти ком­п­лек­сов к об­щей опе­ра­тив­ной па­мя­ти сто­ит «по­душ­ка без­о­пас­нос­ти» в ви­де бло­ка кэш-па­мя­ти L3, объе­мом 16 МБ на каж­дый CCX. Ее ог­ром­ный, по ны­не­ш­ним мер­кам, раз­мер при­зван демп­фи­ро­вать ре­гу­ляр­ные за­про­сы к DRAM, по­вы­шая про­из­во­ди­тель­ность но­вых про­цес­со­ров AMD как еди­но­го це­ло­го. В дей­ст­вен­нос­ти L3-кэш мы мог­ли убедиться в на­тур­ном экс­пе­ри­мен­те на плат­фор­ме ASUS KRPA-U16 с EPYC 7452. Ка­ко­во же яд­рам EPYC 7002 опе­ри­ро­вать объе­ма­ми дан­ных, пре­вы­ша­ю­щи­ми воз­мож­нос­ти кэ­ши­ро­ва­ния? Что луч­ше, при­ват­ный сек­тор DRAM-кон­т­рол­ле­ров или ко­оп­е­ра­тив­ный под­ход к их ис­поль­зо­ва­нию? Раз­би­ра­ем­ся.

AMD EPYC 7452 в контексте CPUID: персистентность на пороге?

Презентация EPYC Rome, раз­ра­бо­тан­но­го с ис­поль­зо­ва­ни­ем ар­хи­тек­ту­ры Zen 2, от­кры­ва­ет путь к на­тур­ным экс­пе­ри­мен­там с но­вин­кой от AMD. В на­шем рас­по­ря­же­нии ока­зал­ся ин­же­нер­ный об­ра­зец 32-х ядер­но­го про­цес­со­ра AMD EPYC 7452 в кон­струк­ти­ве Socket SP3, ис­сле­до­ва­ние внут­рен­них струк­тур ко­то­ро­го да­ет воз­мож­ность уз­нать, ка­ки­ми ар­гу­мен­та­ми ком­па­ния AMD хо­чет убе­дить сер­вер­ный ры­нок в сво­их ли­дер­ских спо­соб­но­с­тях.

AMD EPYC 7452 в контексте CPUID: персистентность на пороге?

Прямо в память

Как известно, механизм сво­пин­га по­зво­ля­ет ас­со­ци­и­ро­вать ди­а­па­зон вир­ту­аль­но­го ад­рес­но­го про­ст­ран­ст­ва с фай­лом на уст­рой­ст­ве хра­не­ния дан­ных. Для при­ло­же­ния это со­зда­ет ил­лю­зию на­ли­чия опе­ра­тив­ной па­мя­ти зна­чи­тель­но боль­ше­го объе­ма, чем фи­зи­че­ски ус­та­нов­ле­но. Ее объем ог­ра­ни­чен воз­мож­но­стя­ми на­ко­пи­те­ля и за­ви­сит от то­го, как про­цес­сор вир­ту­а­ли­зи­рует ад­рес­ное про­ст­ран­ст­во. При­ло­же­ние ра­бо­та­ет с оз­на­чен­ным ди­а­па­зо­ном ис­поль­зуя ли­ней­ный ад­рес, аб­ст­ра­ги­ру­ясь от низ­ко­у­ров­не­вых осо­бен­но­стей об­ме­на с дис­ком. За­бо­ту о «под­кач­ке» бе­рет на се­бя опе­ра­ци­он­ная сис­те­ма.

Как работает твердотельный NVMe-накопитель в режиме DAX?

Персистентность у ворот

В основе кон­вер­ген­ции опе­ра­тив­ных и по­сто­ян­ных за­по­ми­на­ю­щих уст­ройств ле­жит прин­цип со­в­мест­но­го ис­поль­зо­ва­ния обо­их ви­дов па­мя­ти: энер­го­не­за­ви­си­мые но­си­те­ли ин­фор­ма­ции, не ус­ту­па­ю­щие DRAM по про­из­во­ди­тель­но­с­ти, по­ка не­до­ступ­ны мас­со­во­му по­тре­би­те­лю. Гиб­рид­ная ар­хи­тек­ту­ра мо­ду­лей лег­ла в ос­но­ву их клас­си­фи­ка­ции и ди­зай­на но­вых плат­форм. На­ста­ло вре­мя срав­нить ва­ри­ан­ты ре­а­ли­за­ции сис­тем, пред­став­л­я­ю­щ­­их, по су­ти, гра­да­ции ком­про­мис­са про­из­во­ди­тель­но­с­ти, со­в­мес­ти­мос­ти и, ко­неч­но, це­ны.

Персистентность у ворот

ADATA на выставке Embedded World 2019 представляет DIMM-модули промышленного класса

Хотя участие ADATA в выставке Emedded World 2019 для мно­гих ста­ло не­о­жи­дан­но­стью, аб­со­лют­но ор­га­нич­но вы­гля­дит экс­по­зи­ция ком­па­нии, цен­т­раль­ное мес­то в ко­то­рой за­ни­ма­ют мо­ду­ли па­мя­ти с ан­ти-суль­фид­ной за­щи­той. В рас­про­ст­ра­нен­ном пресс-ре­ли­зе го­во­рит­ся о том, что на со­бы­тии, ко­то­рое со­сто­ит­ся с 26-го по 28-е фев­ра­ля с.г. в вы­ста­воч­ном цен­т­ре Нюрн­бер­га, ADATA пред­ста­вит DIMM-мо­ду­ли, со­от­вет­ст­ву­ю­щие ASTM B809-95. Эта спе­ци­фи­ка­ция нор­ми­ру­ет ме­тод ис­пы­та­ний на по­рис­тость по­кры­тий в сре­де, на­сы­щен­ной па­ра­ми се­ры. По­че­му вдруг у про­из­во­ди­те­ля ADATA стал ак­ту­аль­ным во­прос ра­бо­то­спо­соб­нос­ти опе­ра­тив­ной па­мя­ти в аг­рес­сив­ных сре­дах?

Модуль DDR4-памяти производства ADATA Technology

 

ОЗУ в контексте интегрированной и дискретной графики

Чтобы проанализировать вли­я­ние про­из­во­ди­тель­но­с­ти оперативной па­мя­ти на ре­зуль­та­ты раз­лич­ных ви­дов бенч­ма­рок, мож­но ис­поль­зо­вать мо­дель, в ко­то­рой цент­раль­ный и гра­фи­че­ский про­цес­со­ры (один или не­сколь­ко) вы­ступают в ка­че­стве ини­ци­а­то­ров опе­ра­ций чте­ния и за­пи­си дан­ных, а сис­тем­ное ОЗУ — ис­пол­ни­те­лем этих опе­ра­ций.

Экспериментировать бу­дем на про­цес­сор­ных ре­ше­ни­ях от AMD. Это по­зво­ля­ет за­дей­ст­во­вать в тес­тах как ин­те­гри­ро­ван­ные GPU, так и дис­к­рет­ные гра­фи­че­ские чи­пы. До­пол­ни­тель­ный бо­нус — опор­ная точ­ка в ви­де дис­крет­ной гра­фи­ки NVIDIA Ge­For­ce GTX 1050: всег­да по­лез­но взгля­нуть на про­из­во­ди­тель­ность гла­за­ми глав­но­го кон­ку­рен­та.

Занимательная топология AMD EPYC

Занимательная топология AMD EPYC

У AMD нет заоблачных продаж в серверном сегменте. Тем не ме­нее, но­вые про­цес­со­ры EPYC наш­ли путь к сер­дцу по­­тре­­би­­те­лей. Но це­на на сер­вер­ные чи­пы AMD не мог­ла стать оп­ре­де­ля­ю­щим фак­то­ром без при­ем­ле­мо­го уров­ня фун­к­ци­о­наль­но­сти: ком­па­ния вторг­лась на ры­нок, где вы­со­кую план­ку по­ста­вил Intel.

Сравнивая две архитектуры, эксперты приводят в при­мер плотность про­цес­сор­ных ядер на од­но про­цес­сор­ное гнез­до. У In­tel Xe­on это 28 ядер, у AMD EPYC – на 4 боль­ше. На­сколь­ко хо­ро­шо спра­ви­лись раз­ра­бот­чи­ки с эф­фек­тив­ной ре­а­ли­за­ци­ей столь на­сы­щен­но­го ре­ше­ния? Тес­ти­ро­ва­ние од­но­со­кет­ной сер­вер­ной плат­фор­мы ASUS KNPA-U16, ос­на­щен­ной EPYC 7351Pдает воз­мож­ность по­нять, чем взял про­цес­сор от AMD.

Как Ryzen 7 2700U работает с ОЗУ?

Как Ryzen 7 2700U работает с ОЗУ?

Целью серии экспериментов, выполненных с помощью утилиты NCRB, яв­ля­ет­ся из­ме­ре­ние про­пуск­ной спо­соб­нос­ти DRAM-ши­ны при до­сту­пе со сто­ро­ны цен­т­раль­но­го про­цес­со­ра. В от­ли­чие от ра­нее вы­пол­нен­но­го ис­сле­до­ва­ния кэш-па­мя­ти, на гра­фи­ках про­из­во­ди­тель­нос­ти ОЗУ по­лез­ную ин­фор­ма­цию не­сут по­ло­гие го­ри­зон­таль­ные участ­ки, име­ю­щие мес­то при об­ме­не ин­фор­ма­ци­ей объе­мом бо­лее, чем 4 МБ — то есть по­сле за­вер­ше­ния пе­ре­ход­ных про­цес­сов, об­ус­лов­лен­ных вли­я­ни­ем кэш-па­мя­ти пос­лед­не­го уров­ня.

Кэш-память процессора Ryzen 7 2700U: штрихи к портрету

Кэш-память процессора Ryzen 7 2700U: штрихи к портрету

Если сравнивать процессор с автомобилем, а программное обес­пе­че­ние с дорогой, то Intel напоминает гоночный автомобиль, а AMD — вне­до­рож­ник. Для Intel очень важен фактор оп­ти­ми­за­ции про­грам­мно­го обес­пе­че­ния под но­вей­шие функциональные рас­ши­ре­ния, а так­же оп­ти­ми­за­ция с учетом па­ра­мет­ров кэш-памяти (то есть, «качества дороги»). Ком­пи­ля­тор или про­грам­мист должен тщательно раз­де­лить ин­фор­ма­цию на блоки, раз­ме­ща­е­мые в кэш.