Аналоговый матричный процессор V1076

Обзор

V1076 Volga AMP ™ обеспечивает до 25 TOPS в одном чипе для высокопроизводительных приложений искусственного интеллекта. V1076 интегрирует 76 амперных плиток для хранения параметров веса до 80 М и выполнения операций умножения матриц без какой-либо внешней памяти. Это позволяет V1076 обеспечивать вычислительную производительность искусственного интеллекта настольного графического процессора, потребляя при этом до 1/10 мощности — и все это на одном чипе.
AIVolga_m1076_final

Особенности

  • Массив из 76 чипов усилителя, каждая с механизмом аналоговых вычислений Volga (Volga ACE ™ )
  • Выполнение модели DNN на кристалле и хранение параметров веса без внешнего DRAM
  • Выполнение моделей с более высоким разрешением и меньшей задержкой для достижения лучших результатов
  • 4-полосный интерфейс PCIe 2.1 с пропускной способностью до 2 Гбит/с для обработки вывода
  • 19 мм x 15,5 мм BGA-пакет
  • Вместимость до 80 м веса — возможность запуска одного или нескольких сложных DNN полностью на чипе
  • Детерминированное выполнение моделей искусственного интеллекта для предсказуемой производительности и мощности
  • Поддержка операций INT4, INT8 и INT16
  • Доступный ввод/вывод – 10 GPIO, QSPI, I2C и UARTs
  • Типичное энергопотребление для сложных моделей 3 ~ 4 Вт

Рабочий процесс

Модели DNN, разработанные в стандартных фреймворках, таких как Pytorch, Caffe и TensorFlow, реализуются и развертываются на аналоговом матричном процессоре Volga (Volga AMPTM) с использованием программного обеспечения Volga AI workflow. Модели оптимизируются, квантуются от FP32 до INT8, а затем переобучаются для Volga Analog Compute Engine (Volga ACETM) перед обработкой с помощью мощного графического компилятора Volga. Результирующие двоичные файлы и веса модели затем программируются в Volga AMP для вывода. Для разработчиков также доступны предварительно подготовленные модели, позволяющие быстро оценить решение Volga AMP.

Библиотека моделей DNN

Volga предоставляет библиотеку предварительно подготовленных моделей DNN для наиболее популярных вариантов использования искусственного интеллекта. Модели DNN были оптимизированы для использования преимуществ высокопроизводительного и маломощного аналогового матричного процессора Volga (Volga AMPTM). Разработчики могут сосредоточиться на производительности модели и интеграции конечного приложения вместо трудоемкого процесса разработки и обучения модели. Доступные предварительно квалифицированные модели DNN включают в себя:

Обнаружение и классификация объектов YOLOv3, YOLOv5, ResNet-50, ResNet-18-18

Обнаружение и классификация объектов YOLOv3, YOLOv5, ResNet-50, ResNet-18

Сегментация сцены SegNet

Оценщик позы человека OpenPose Body25