Seagate FireCuda 520: пока все на карантине, мы — на PCIe Gen4

С появлением процессоров се­мей­ст­ва Ryzen 3000 и сис­тем­ной ло­ги­ки AMD X570 шин­ная то­по­ло­гия PCI Ex­press Gen4 — в фо­ку­се про­из­во­ди­те­лей ком­пью­тер­ной пе­ри­фе­рии. Как и всег­да, из трех ее со­став­ля­ю­щих — се­ти, гра­фи­ка, сред­ст­ва хра­не­ния — на­и­бо­лее при­вле­ка­тель­ным для мас­со­во­го поль­зо­ва­те­ля бы­ли и ос­та­ют­ся на­ко­пи­те­ли. Ком­па­ния Sea­gate до­ста­точ­но опе­ра­тив­но от­ре­а­ги­ро­ва­ла на но­вый ви­ток шин­ной эво­лю­ции, пред­ло­жив M.2-на­ко­пи­те­ли Fire­Cuda 520 с под­держ­кой PCIe Gen4. Раз­ра­бо­тан­ные на ба­зе ори­ги­наль­но­го кон­т­рол­ле­ра, эти уст­рой­ст­ва од­ни из пер­вых да­ли воз­мож­ность ощу­тить ско­рост­ные пре­и­му­ще­ст­ва но­во­го ин­тер­фей­са, от­кры­ва­ю­ще­го до­ступ к за­по­ми­на­ю­щим 3D NAND мат­ри­цам мак­си­маль­ной плот­но­с­ти.

Как устроен NVMe Fire­Cuda 520?

Sea­gate не особо раскрывает под­роб­но­с­ти компонентов, за­дей­ст­во­ван­ных в раз­ра­бот­ке Fire­Cuda 520, хотя о том, что в ка­че­с­т­ве интерфейсного чипа используется Phison PS5016-E16, судачат все. Косвенным до­ка­за­тель­ст­вом этому служит ин­фор­ма­ция, доступная в PCI-пространстве. Там, кроме иден­ти­фи­ка­то­ра 1BB1h, при­над­ле­жа­ще­го Seagate Tech­no­lo­gy PLC, есть Device ID на­ко­пи­те­ля 5016h, который со­впа­да­ет с циф­ро­вым ко­дом в на­з­ва­нии конт­рол­ле­ра. В силу этого можно пред­по­ло­жить, что в Fire­Cuda 520 установлен именно такой или фун­к­ци­о­наль­но бли­з­кий чип, кас­то­ми­зи­ро­ван­ный под по­треб­но­с­ти Sea­gate.

Разработанные на базе контроллера Phison PS5016-E16, накопители Seagate FireCuda 520 первыми дали возможность ощутить скоростные преимущества PCIe Gen4

 

Архитектура контроллера PS5016-E16, раз­ра­бо­тан­но­го в ла­бо­ра­то­ри­ях этих тай­вань­ских «вы­ско­чек», стоит не­сколь­ких важ­ных замечаний. Одна из причин, по которой Seagate могла о­ста­но­вить свой вы­бор на этом чи­пе, со­сто­ит в том, что Phison всегда была лучшей по такому параметру, как time-to-market, и PS5016-E16 не ис­клю­че­ние: уже на CES-2019 компания про­де­мон­ст­ри­ро­ва­ла ин­же­нер­ные об­раз­цы своего кон­т­рол­ле­ра для NVMe 4.0, обозначив его про­из­во­ди­тель­ность на уровне 4,8 GBPs. Переход с 64-слой­ных эле­мен­тов флеш-памяти Toshiba BiCS-3 на 96-слойные мат­ри­цы мак­си­маль­ной плот­но­с­ти BiCS-4 обе­щал под­нять эту план­ку еще вы­ше — на уро­вень про­из­во­ди­тель­ности PCI Express Gen4.

Производная от E12, вось­ми­ка­наль­ная модель E16 в со­стоя­нии об­слу­жи­вать 3D NAND-матрицы TLC и QLC. Для этого у нее есть 32 линии chip enable (CE), что по­зво­ля­ет раз­ра­ба­ты­вать на­ко­пи­те­ли ем­ко­стью до 2 ТБ. Пре­д­ы­ду­щая версия кон­т­рол­ле­ра E12 те­о­ре­ти­че­ски может замахнуться и на 8 ТБ уст­рой­ст­ва, но с учетом их высокой цены, спрос на них вряд может быть до­ста­точ­ным. Об этой преемственности нуж­но сказать, потому что фактически PS5016-E16 со­зда­вал­ся «из того, что было», маневрируя на ог­ра­ни­чен­ном про­ст­ран­ст­ве по­лу­про­вод­ни­ко­вых вентилей, из ко­то­рых со­сто­ит ло­ги­че­ская матрица кон­т­рол­ле­ра. В итоге, оп­ти­ми­зи­ро­вав временны́е па­ра­мет­ры шин­но­го ин­тер­фей­са, Phi­son E16 ока­зал­ся ог­ра­ни­ченным в плане вза­и­мо­дей­ст­вия с буферным ОЗУ, рассчитанным на трафик PCIe 3.0. Все это, как мы уви­дим, повлияло (и не мог­ло не повлиять!) на общую оценку Seagate Fire­Cuda 520.

Еще о талантах ­Seagate Fire­Cuda 520

Не будем забывать, что воз­мож­но­с­ти NVMe-ин­тер­фей­са ог­ра­ни­че­ны форм-фактором M.2, главный по­тре­би­тель ко­то­ро­го — мобильные платформы. Здесь накопители Fire­Cuda 520 всегда де­мон­с­т­ри­ро­ва­ли ве­ли­ко­леп­ную энер­го­эф­фек­тив­ность. Бла­го­да­ря Phison E16 устройства от Seagate могут похвастать под­держ­кой APST в среде опе­ра­ци­он­ных систем Linux и ASPM в Microsoft Windows.

Про инструменты

В нашем распоряжении — два совершенно одинаковых образца NVMe-накопителей FireCuda 520. Эк­с­пе­ри­мен­ти­руя с ни­ми, по­ста­ра­ем­ся определить за­ко­но­мер­но­с­ти их поведения в Windows 10. В этом нам по­мо­жет плат­фор­ма ASUS Prime TRX40-Pro с процессором AMD Threadripper 3970X на борту. Объем памяти — до­ста­точ­ный для ис­сле­до­ва­ния про­из­во­ди­тель­но­с­ти NVMe-устройства: все четыре канала памяти заняты модулями HyperX Pre­da­tor Black Kingston (HX432C16PB3K2/32).

Что умеет Seagate Fire­Cuda 520?

Глазами пользователя

Для начала оценим про­из­во­ди­тель­ность NVMe FireCuda 520 в од­но­по­точ­ном тесте с не­боль­шим объе­мом дан­ных — типовой нагрузке, ха­рак­тер­ной для при­ло­же­ний до­маш­не­го поль­зо­ва­те­ля. В нем есть все ус­ло­вия для пол­но­цен­ной ре­а­ли­за­ции по­тен­ци­а­ла бу­фер­ного ОЗУ накопителя.

Оценим производительность NVMe FireCuda 520 в однопоточном тесте с типовой нагрузкой, характерной для приложений домашнего пользователя

 

Именно таким увидят FireCuda 520 те, кто хочет по­лу­чить максимум от шины PCIe Gen4 — не­до­сти­жи­мую для Gen3 ско­рость чтения в ди­а­па­зо­не 5300...6100 MBPs. Собственно, ради этого Seagate и то­ро­пи­лся быть в числе первых, кто вы­ве­дет на рынок поль­зо­ва­тель­ский на­ко­пи­тель FireCuda 520, пусть даже и с кон­т­рол­ле­ром на­чаль­но­го уровня Phison PS5016-E16.

Показатели двух разных экземпляров FireCuda 520, установленных в разные M.2-слоты сис­тем­ной пла­ты ASUS Prime TRX40-Pro, в какой-то мере гарантируют объективность в оценке устройства. Вы­би­рая в ка­че­ст­ве тес­то­во­го пат­­тер­­на небольшие объемы обрабатываемых данных, не вы­зы­ва­ю­щих де­фи­цит системной памяти, FireCuda 520 уверен­но де­мон­ст­ри­ру­ет ста­биль­ные по­ка­за­тели чтения. Как мы уви­дим ниже, на­клад­ные рас­хо­ды на об­слу­жи­ва­ние от­но­си­тель­но малых блоков данных при­во­дят к не­ко­то­ро­му сни­же­нию скорости записи.

Интегральная скорость чтения, как част­ное сум­мы всех об­ра­ба­ты­ва­е­мых объемов данных и времени, за­тра­чен­но­го на их пол­ную об­ра­бот­ку, во­об­ще выводит FireCuda 520 на ре­корд­ную отметку 6200 MBPs.

Глазами операционной системы

Бло­ки­руя спе­ку­ля­тив­ные операции упреж­да­ю­ще­го чте­ния и от­ло­жен­ной записи, в на­тив­ном сце­на­рии (Na­tive OS API) мы получаем более взве­шен­ный рабочий профиль накопителя FireCuda 520 — его про­из­во­ди­тель­ность в «чис­том ви­де» без вли­я­ния StorNVMe-драйверов Windows, ис­поль­зу­ю­щих ме­ха­низ­мы бу­фе­ри­за­ции дан­ных. Для того, чтобы те­сто­вый файл уверенно по­мес­тил­ся в DRAM-буфер на­ко­пи­те­ля, ог­ра­ни­чим его объем 100 MB, ус­та­но­вив раз­мер бло­ка равным 10 MB, что­бы пе­ре­да­ча файла осу­щест­в­ля­лась за 10 итераций.

Тестирование NVMe-накопителя Seagate в нативном сценарии (Native OS API) утилиты NIOBench демонстрирует влияние DRAM-буфера устройства на его производительность

 

Полученные результаты снизились до 4 GBPs, их ин­те­г­раль­ная оцен­ка вообще опустилась до отметки 3200 MBPs по за­пи­си и 3600 по чтению. От стре­ми­тель­но­го падения их пока еще удерживает буферное ОЗУ на­ко­пи­те­ля.

В упомянутой документации по Phison PS5016-E16 ут­верж­да­ет­ся, что он работает с буфером DDR4@1600. С уче­том 16-бит­ной ши­ны данных, эта связка в со­сто­я­нии об­слу­жи­вать поток данных до 6400 MBPs. Ком­па­ния Seagate ре­ши­ла не фор­си­ро­вать эту экс­т­ре­маль­ную кон­фи­гу­ра­цию, разумно ограничившись буферным ОЗУ с бо­лее «мяг­ки­ми» па­ра­мет­ра­ми — DDR4@1200 (два чипа SK Hynix H5AN8G8NAFR-UH). Вслед­ст­вие этого про­из­во­ди­тель­ность по NMVe-ин­тер­фей­су упала до 4800 MBPs, что мы и на­блю­да­ем в сценарии Navtive OS API.

Глазами NMVe-контроллера

С уве­ли­че­ни­ем объемов данных буферное ОЗУ накопителя пе­ре­пол­ня­ет­ся, и ско­рос­ти на­чи­на­ют в большей сте­пе­ни за­ви­сеть от ог­ра­ни­че­ний, присущих NAND-матрице:

С увеличением объемов тестовых паттернов DRAM-буфер накопителя Seagate FireCuda 520 переполняется

 

Симптоматичны результаты с мас­си­ро­ван­ной ата­кой данными на устройстве-двойнике. Второй на­ко­пи­тель Sea­gate Fire­Cuda 520, как по команде, повторяет все подъемы и спады про­из­во­ди­тель­но­с­ти своего брата-близнеца.

На больших объемах данных производительность Seagate FireCuda 520 начинает зависеть от возможностей NAND-матрицы

 

Заметим, что на снижение ско­рос­ти повляло также уменьшение размера блока с 10 MB до 128 KB. Но ре­ша­ю­щее зна­че­ние, ко­неч­но, имеет скорость отклика 96-слойных BiCS-4 мат­ри­ц Toshiba.

Итоги

Ходят слухи, что к концу 2020 года ком­па­ния Phison го­то­ва была представить обновленную версию NVMe-кон­т­рол­ле­ра. Есть основания предположить, что если усовершенствовать этот интерфейсный чип, удвоив про­пус­к­ную спо­соб­ность DRAM-буфера, например, за счет ширины шины буферного ОЗУ или частоты пе­ре­да­чи данных, то вполне ре­аль­но при­б­ли­зит­ся к сак­раль­ной цифре 8 GBPs.

Вполне понятно, по каким причинам модернизация существующего контроллера началась с ин­тер­фей­са — пер­во­про­ход­цы получают все. В затянувшемся карантине Seagate FireCuda 520 не­о­жи­дан­но может стать чуть ли не един­ст­вен­ным выбором для потребителей и имеет не­пло­хие шан­сы до­ста­точ­но дол­го ос­та­вать­ся одним из не­мно­гих NVMe-на­ко­пи­те­лей с подключением к PCI Ex­press Gen4.