Команды AVX512 ждет «ледниковый период»?

18 мая 2018

Эффект понижения тактовой частоты процессора при выполнении ре­сур­со­ем­ких операций, в частности 256-битных векторных ин­ст­рук­ций, до­ста­точ­но давно известен. О нем знают не только спе­ци­а­лис­ты, но и гра­мот­ные пользователи. Вместе с тем, определяя клю­че­вые ха­рак­те­рис­ти­ки и лимиты технологии автоматического уве­ли­че­ния так­то­вой частоты, известной под брендом Turbo Boost, ком­па­ния In­tel пред­по­чи­та­ет минимизировать об­суж­де­ние «сколь­зких нюансов», в оче­ред­ной раз подогревая ожидание ши­ро­ко­го вне­д­ре­ния инструкций AVX512.

Реализуя динамический оверклокинг в рамках технологии Turbo Boost, процессор выбирает тактовую частоту в зависимости от целого ряда факторов: температуры, рабочей нагрузки, количества одновременно активных ядер и т. п. В числе этих факторов также находится разрядность векторных инструкций, выполняемых в данный момент времени.

Стив Ланц (Steve Lantz), профессор Корнелльского университета, в недавно опубликованном документе «Turbo Boost Up, AVX Clock Down: Complicaons for Scaling Tests» в очередной раз официально подтверждает,что лимиты ди­на­мического оверклокинга могут понижаться в соответствии с разрядностью выполняемых в данный момент вре­ме­ни век­торных инструкций. Очевидно, ресурсоемкие операции приводят к увеличению потребления мощ­нос­ти и росту температуры, поэтому анализ потока выполняемых инструкций является лишь одним из факторов, ус­лож­ня­ю­щих учет зависимости быстродействия вычислительной системы от условий функционирования.

Для потребителей это означает, что прибавка в производительности, связанная с переходом от 256-битных к 512-битным AVX-регистрам, даже для хорошо векторизуемых алгоритмов может быть несколько меньше двукратной. Для авторов бенчмарок асинхронное динамическое изменение тактовой частоты актуализирует вопросы обес­пе­че­ния повторяемости результатов. В условиях, когда в силу неумолимых физических причин, временное по­ни­же­ние тактовой частоты при выполнении векторных операций высокой разрядности представляется неизбежным, приобретают значимость интеллектуальные алгоритмы управления тактированием, включая ответы на во­про­сы:

  • Поддерживается ли индивидуальная установка тактовой частоты для каждого из вычислительных ядер, или возможно, некоторого домена из нескольких ядер?
  • Как поведет себя процессор после выполнения фрагмента кода, содержащего инструкции AVX512, сколько времени пройдет от момента выполнения последней такой инструкции до восстановления режима ди­на­ми­че­ско­го разгона?

В результате, словосочетание «Cooler с поддержкой AVX512» кажется все менее анекдотичным, и определение разрядности обрабатываемых векторов по звуку вентилятора рискует стать очередной забавой технических эстетов…

Теги: