Мы реализовали две эталонные задачи на основе нейронных сетей на прототипе чипа нейроморфной системы SpiNNaker второго поколения (SpiNNaker 2): распознавание ключевых слов и адаптивное роботизированное управление.
Распознавание ключевых слов обычно используется в умных колонках для прослушивания слов-активаторов.
Адаптивное управление используется в робототехнике для адаптации к неизвестной динамике в режиме онлайн.
Мы подчеркиваем преимущество наличия массива умножения-накопления (MAC) в прототипе SpiNNaker 2, который обычно используется в машином обучении на основе частоты импульсов, но здесь применяется в нейроморфном, спайковом контексте.
Кроме того, те же самые задачи были реализованы на нейроморфном чипе Loihi, что позволяет провести прямое сравнение с точки зрения энергопотребления и времени вычислений. В то время как Loihi показывает лучшую эффективность, когда задействовано менее сложное векторно-матричное умножение, прототип SpiNNaker 2 с MAC-массивом демонстрирует лучшую эффективность при работе с векторно-матричным умножением высокой размерности.
С значительным прогрессом искусственного интеллекта (ИИ) в последние годы нейросетевые алгоритмы все чаще развертываются в embedded-приложениях ИИ. Примеры из промышленности и исследований — это умные колонки, которые постоянно прослушивают ключевые слова, такие как «Алекса», и робототехнические приложения, использующие алгоритмы адаптивного управления на основе нейронных сетей.
Для повышения эффективности с точки зрения энергопотребления и времени вычислений были предложены различные аппаратные архитектуры. Нейронные сети, используемые в этих приложениях ИИ, чаще всего являются глубокими нейронными сетями (DNN). Значительная часть вычислений в DNN приходится на операции умножения-накопления (MAC). Для эффективных вычислений DNN многие аппаратные архитектуры для машинного обучения включают MAC-блок.
В то время как DNN в настоящее время широко распространены, все большее внимание привлекают спайковые нейронные сети (SNN), которые более точно имитируют поведение биологических нейронных сетей, поскольку этот тип сетей обладает потенциалом высокой эффективности, особенно в сочетании с нейроморфным оборудованием. Один из prominentных примеров — нейроморфный чип Loihi, который показал свою эффективность в различных эталонных задачах. Другая нейроморфная архитектура представлена системой SpiNNaker второго поколения (SpiNNaker 2).
Loihi имеет специализированные схемы для синапсов и нейронов (повышает эффективность) и программируемый движок обучения (повышает гибкость).
SpiNNaker 2 использует универсальные процессоры (ядра Arm), соединенные с числовыми ускорителями. Процессоры увеличивают гибкость моделей и правил обучения, а ускорители повышают эффективность определенных вычислений. Помимо нейроморфных ускорителей, SpiNNaker 2 также содержит MAC-массивы для эффективных матричных операций и, таким образом, способен объединять операции SNN и DNN.
Обе платформы доказали свою эффективность в ряде приложений. Однако прямое сравнение обеих платформ на одних и тех же эталонах отсутствовало.
В этой работе мы реализуем задачи распознавания ключевых слов и адаптивного управления на прототипе SpiNNaker 2. Мы сравниваем время вычислений и энергопотребление с Loihi и выделяем преимущество MAC-массива.
Для распознавания ключевых слов исходная DNN-версия реализована на прототипе SpiNNaker 2 с MAC-массивом, а SNN-версия — на Loihi (поскольку он поддерживает только SNN). Прототип SpiNNaker 2 показывает лучшую эффективность.
Для адаптивного управления SNN реализована на обоих аппаратных средствах. Loihi показывает лучшую эффективность при низкоразмерном векторно-матричном умножении, а прототип SpiNNaker 2 — при высокоразмерном.
В разделе 2 представлен обзор прототипа чипа с акцентом на MAC-массив. Раздел 3 описывает две эталонные задачи. Раздел 4 представляет программную реализацию. Экспериментальные результаты представлены в разделе 5.*
*Перевод выполнен с помощью нейросетей
Comparing Loihi with a SpiNNaker 2 prototype on low-latency keyword spotting and adaptive robotic control
We implemented two neural network based benchmark tasks on a prototype chip of the second-generation SpiNNaker (SpiNNaker 2) neuromorphic system: keyword spotting and adaptive robotic control. Keyword spotting is commonly used in smart speakers to listen for wake words, and adaptive control is used in robotic applications to adapt to unknown dynamics in an online fashion. We highlight the benefit of a multiply-accumulate (MAC) array in the SpiNNaker 2 prototype which is ordinarily used in rate-based machine learning networks when employed in a neuromorphic, spiking context. In addition, the same benchmark tasks have been implemented on the Loihi neuromorphic chip, giving a side-by-side comparison regarding power consumption and computation time. While Loihi shows better efficiency when less complicated vector-matrix multiplication is involved, with the MAC array, the SpiNNaker 2 prototype shows better efficiency when high dimensional vector-matrix multiplication is involved.
1. Introduction With the substantial progress of artificial intelligence (AI) in recent years, neural network based algorithms are increasingly being deployed in embedded AI applications. Smart speakers which continuously listen for keywords like ‘Alexa’ and robotic applications which employ neural network based adaptive control algorithms are examples from industry and research. To improve the efficiency regarding power consumption and computation time, various hardware architectures have been proposed. The neural networks employed in these AI applications are most commonly deep neural networks (DNNs). A substantial amount of computation in DNNs is caused by the multiply-accumulate (MAC) operations. For efficient computation of DNNs, many machine learning hardware architectures include an MAC unit to facilitate the MAC operations in DNNs [1]. While DNNs are currently widely adopted for applications, spiking neural networks (SNNs) which more closely mimic the behavior of biological neural networks are increasingly gaining attention as this type of network has the potential of high efficiency, especially in combination with neuromorphic hardware [2]. One prominent example is the Loihi neuromorphic chip [3] which has been shown to be efficient in various neural network based benchmark tasks like keyword spotting [4] and adaptive control [5]. Another neuromorphic architecture is represented by the second generation of the SpiNNaker system (SpiNNaker 2) [6]. While Loihi has dedicated circuits for synapses and neurons, which increases the efficiency for the implemented models, and a programmable learning engine for more flexibility for various learning rules, SpiNNaker 2 uses general purpose processors (Arm cores) connected with numerical accelerators. While the processor increases the flexibility of the synapse and neuron models and learning rules, the accelerators increase theefficiency for certain computations like exponential function and random number generation which are often required in neuromorphic applications. Besides the neuromorphic accelerators, SpiNNaker2 also contains MAC arrays for efficient matrix operations and is thus able to merge SNN and DNN operation. Both neuromorphic hardware platforms have been proved to be efficient in a number of applications. For example, neuromorphic olfactory circuit [7] and online few-shot learning [8] on Loihi, and rewardbased structural plasticity [9] on SpiNNaker 2.
However, a direct comparison of both neuromorphic hardware platforms with the same benchmarks has been missing. In this work, we implement the keyword spotting and adaptive control benchmark tasks on the second SpiNNaker 2 prototype [10]. We compare the computation time and active energy consumption of the benchmark tasks with Loihi, and highlight the benefit of the MAC array. Specifically, for keyword spotting, because the original DNN version is implemented on the SpiNNaker 2 prototype with the MAC array, and the SNN version is implemented on Loihi because it only supports SNN, the SpiNNaker 2 prototype shows better efficiency regarding computation time and energy consumption. For adaptive control, SNN is implemented on both hardwares and Loihi shows better efficiency when low dimensional vector-matrix multiplication is involved, and the SpiNNaker 2 prototype shows better efficiency when high dimensional vector-matrix multiplication is involved.
In section 2 we give an overview of the prototype chip, with emphasis on the MAC array. Section 3 describes the two benchmarks implemented in this work. Section 4 presents the software implementation. The experimental results are presented in section 5.