NVIDIA сертифицирует платформы с элементами искусственного интеллекта

На днях NVIDIA анонсировала ини­ци­а­ти­ву, на­прав­лен­ную на под­держ­ку плат­форм для ге­те­ро­ген­ных вы­чис­ле­ний на ба­зе гра­фи­че­ских про­цес­со­ров (GPU) в ло­каль­ных сре­дах. Сис­те­мы, сер­ти­фи­ци­ро­ван­ные NVIDIA, мо­гут ос­на­щать­ся во­семью гра­фи­че­ски­ми про­цес­со­ра­ми A100 и раз­вер­ты­ва­ть­ся на гра­ни­це се­ти, а не толь­ко в об­ла­ке. В чис­ле про­чих, пер­вы­ми одоб­ре­ны сер­вер­ные плат­фор­мы от Su­per­mic­ro, а имен­но: AS-4124GS-TNR и AS-2124GQ-NART.

Предоставляемые на сертификацию системы включает в себя как графические процессоры NVIDIA, так и ком­му­та­то­ры хра­ни­ли­ща, ко­то­рые компания получила в результате приобретения Mellanox. Пер­вы­ми участ­ни­ка­ми про­г­рам­мы, кро­ме Su­per­mic­ro, являются Dell Technologies, Hewlett-Packard, Inspur Technologies и Gigabyte. Если ве­­рить ин­фор­ма­ции, опуб­ли­ко­ван­ной в корпоративном блоге, высокое звание NVIDIA Certified Systems по­лу­ча­ют пред­ва­ри­тель­но про­тес­ти­ро­ван­ные плат­фор­мы, на ко­то­рых поль­зо­ва­те­ли га­ран­ти­ро­ва­но смогут запускать кон­тей­не­ры NVIDIA NGC с эле­мен­та­ми ис­кус­ст­вен­но­го интеллекта (AI).

Адель Эль-Халлак (Adel El-Hallak), директор по управлению продуктами NGC, объявил о планах в ближайшем будущем сертифицировать до 70 платформ от почти десятка OEM-производителей

 

Адель Эль-Халлак (Adel El-Hallak), директор по управлению продуктами NGC, объявил о планах в бли­жай­шем бу­ду­щем сер­ти­фи­ци­ро­вать до 70 платформ от почти десятка OEM-производителей, которые уже вы­ра­зи­ли готовность при­со­е­ди­нить­ся к этой программе. И хотя сама NVIDIA не раскрывает подробности тес­ти­ро­ва­ния, Эль-Халлак дает сле­ду­ю­щее тол­ко­ва­ние подходам компании: «Сначала мы тестируем ал­го­рит­мы ма­шин­но­го обучения, затем — вывод ре­зуль­та­тов, например, потоковую передачу видео или го­ло­са с раз­лич­ны­ми типами рабочих нагрузок HPC. Этим, по су­ти, мы определяем базовый уровень, нижний по­рог про­из­во­ди­тель­но­с­ти. Исходя из него и даем нашим OEM-парт­не­рам советы по обучению, что затем от­ра­жа­ет­ся на типе и уровне рабочих нагрузок».

Эль-Халлак отметил, что в долгосрочной перспективе NVIDIA планирует расширить инициативу сер­ти­фи­ка­ции также на платформы с графическими процессорами без коммутаторов Mellanox.

NVIDIA заявила, что OEM-производители или другие партнеры не платят за участие в программе сер­ти­фи­ка­ции, но по­сле сер­ти­фи­ка­ции они имеют право на контрактную поддержку программного обеспечения. Когда OEM-про­из­во­ди­тель продает конечному пользователю контракт на поддержку графических систем с сетевым обес­пе­че­ни­ем, тот по­лу­ча­ет доступ к сервису непосредственно от NVIDIA, который регламентируется со­гла­ше­ни­ем об уров­не об­слу­жи­ва­ния. В итоге, клиент компании получает поддержку всего программного сте­ка — будь то наборы инструментов CUDA или драй­ве­ры — все, что связано с рабочими нагрузками, сер­ти­фи­ци­ро­ван­ны­ми для работы на таких платформах.

Возможно, пройдет некоторое время, прежде чем модели искусственного интеллекта и платформы, на ко­то­рых они ра­бо­та­ют, будут повсеместно развернуты на границе сети или даже за ее пределами. Однако оче­вид­но, что элементы AI в той или иной степени потребуются почти в каждой вычислительной системе. В боль­шин­с­т­ве случаев бу­дут вос­тре­бо­ва­ны алгоритмы, основанные на моделях, обученных в облаке. Сегодня пе­ре­об­у­че­ние на платформах об­лач­ных вы­чис­ле­ний зачастую слишком громоздко. Приложениям все чаще при­хо­дит­ся обрабатывать и ана­ли­зи­ро­вать дан­ные в ре­аль­ном мас­шта­бе вре­ме­ни, поскольку они создаются или собираются непосредственно на периферийных вы­чис­ли­тель­ных устройствах или узлах.

Теги