Intel на пути к искусственному интеллекту

29 Апр 2016

Intel на пути к искусственному интеллекту

Распознавание аудиовизуальных образов — краеугольный камень ком­муникации человека и компьютера. Не обеспечив такой интерактив, человечество не сможет решить задачу построения искусственного интеллекта, чему в своё время столько внимания уделил один из творцов отечественной кибернетики — Виктор Михайлович Глушков. Магия дат такова, что в эти дни исполняется ровно 40 лет с того момента, когда мне посчастливилось впервые увидеть и услышать корифея компьютерной мысли.

Академик Глушков (в центре) на встрече со студентами в День факультета кибернетики 6 мая 1976 г.
Академик Глушков (в центре) на встрече со студентами в День факультета кибернетики 6 мая 1976 г.
Фото ©Composter, 1976 — 2016.

Сегодня по его заветам живет корпорация Intel, в документации которой без лишнего ажиотажа появился некий узел, который, без сомнения, можно назвать речевым сопроцессором. Из открытой информации следует, что устройство GMM (Gaussian Mixture Model) используется для аппаратной поддержки распознавания голосовых сообщений ASR (Accelerated Speech Recognition).

Устройство Gaussian Mixture Model как элемент внутрипроцессорной шинной топологии: размещение GMM с Северной стороны от линка Direct Media Interface (DMI), в одной функциональной группе с видео адаптером и контроллером оперативной памяти, свидетельствует о насыщенном шинном трафике
Устройство Gaussian Mixture Model как элемент внутрипроцессорной шинной топологии: размещение GMM с Северной стороны от линка Direct Media Interface (DMI), в одной функциональной группе с видео адаптером и контроллером оперативной памяти, свидетельствует о насыщенном шинном трафике

Примечательно, что среди задач, решаемых новой технологией, фигурирует не только повышение производительности при обработке аудио сигналов и повышение качества распознавания речи, но и радикальное уменьшение мощности, потребляемой в пересчете на выполненную операцию.

Ключевое слово в названии сопроцессора — Accelerated. Оно означает (и подтверждает), что функциональность ASR реализована внешними по отношению к процессору аппаратными средствами, и CPU освобожден от низкоуровневых операций по обработке аудио информации. Словосочетание внешние аппаратные средства следует понимать, как логическое разделение функций аудио процессора и ядер центрального процессора. Хотя, конечно, физически рассматриваемый узел может находиться в составе микросхемы CPU. Вспомним об активном переходе индустрии к системам на чипе (SoC).

Применение отдельного вычислительного модуля для обработки речевых сигналов является антагонистичным подходом по отношению к ранее практикуемым технологиям, при которых обработкой сигнала занимается центральный процессор, а под аппаратной поддержкой понимается наличие процессорных инструкций, ориентированных на обработку сигналов средствами CPU, в машинном коде Kernel Mode драйвера или DLL-библиотеки. Таким образом, наличие отдельного GMM-процессора является гетерогенным решением.

 

Низкоуровневые подробности

Попробуем аргументировать сказанное, воспользовавшись открытой информацией. Рассмотрение файла GMM.INF из комплекта OEM-драйверов, позволяет осторожно предположить, что устройство GMM работает автономно, в формате получения заданий от центрального процессора, выполнения этих заданий и извещения центрального процессора о завершении обработки. Это следует из декларации механизма MSI (Message Signaled Interrupts), реализующего передачу запросов на прерывания в виде сообщений. Точнее, циклы записи в memory-mapped регистры применяются вместо выделенных линий запросов на прерывание IRQ. Этот механизм типичен для современных устройств.

В любом случае, применение механизма прерываний (как Legacy, так и MSI) характерно для устройств, выполняющих передачу и(или) обработку информации асинхронно от CPU. Прерывание используется для информирования центрального процессора о завершении обработки задания и готовности результирующих данных.

К слову сказать, современные интерфейсные технологии, например PCI Express, а также шины, используемые для связи микросхем системной логики, в целях экономии количества сигнальных цепей не используют выделенные линии IRQ. Именно поэтому прерывания, обрабатываемые программным обеспечением как Legacy IRQ на аппаратном уровне также передаются в виде специальных шинных циклов-сообщений Interrupt Messages.

Резюме

Нововведение Intel своевременно и логично, ведь, например, сканирование клавиатуры и формирование скан-кодов требует значительно меньше ресурсов и интеллекта, чем распознавание голосовых сообщений, тем не менее, этой задачей занимаются два микроконтроллера (контроллер внутри клавиатуры и контроллер 8042 на системной плате, второй обычно в составе микросхемы SuperIO). Видимо, голосовой ввод вскоре станет таким же привычным, как клавиатурный.

Теги: