Intel представила друге покоління нейроморфних чіпів: loihi ii. Ідейно і архітектурно новий чіп, в цілому, повторює перше покоління, анонсоване чотири роки тому, проте має цілий ряд поліпшень технічного і програмного характеру. Але що більш цікаво, з виходом loihi ii, який все ще вважається дослідницькою розробкою, компанія готова зробити перші кроки по обмеженій комерціалізації даного рішення.

В рамках нейромофорного підходу дослідники намагаються апаратно відтворити з тією чи іншою мірою точності механізми, що лежать в основі мозку, які на перший погляд досить прості: по густо провязанной і мінливої з часом мережі нейронів асинхронно і паралельно поширюються сигнали як відповідь на зовнішні події.

Спроби повторити це в рамках звичайного «заліза» можна вважати досить успішними, адже нейронними мережами зараз нікого не здивуєш. Однак такі мережі вимагають витратного попереднього навчання на заздалегідь розмічених даних, тоді як мозок вчиться «на льоту». А з ростом складності моделей гостро постає питання енергоефективності, причому не тільки навчання, а й виконання.

«вершиною еволюції ” класичних ші-прискорювачів на сьогоднішній день можна вважати cerebras wse-2: чіп розміром з кремнієву пластину містить 850 тис.ядер і споживає 15 квт. Але і цього мало-за словами самих розробників, тільки кластер з таких чіпів здатний працювати з ші-моделями, порівнянними за масштабом з людським мозком. І всі ці обмеження покликані усунути саме нейроморфні системи.

Loihi ii виготовляється по euv-техпроцесу intel 4, який все ще знаходиться в стадії розробки. Чіп має площу 31 мм2 і містить 2,3 млрд транзисторів, а площа одного ядра становить 0,21 мм2, тобто щільність в порівнянні з першим поколінням зросла практично вдвічі. Чіп все так же містить 128 нейронних ядер, але число доступних нейронів виросло з 128 тис. До 1 млн. Обсяг пам’яті на ядро злегка зменшився, з 208 до 192 кбайт, проте тепер банки пам’яті можна більш гнучко розподіляти між нейронами і синапсами, а компресія дозволяє ще більш ефективно використовувати наявний обсяг.

Самі ядра теж змінилися. У першому поколінні вони були оптимізовані під конкретні імпульсні нейронні мережі, а тепер для кожного ядра є власний програмований конвеєр, а самі моделі на рівні чіпа задаються мікрокодом. Крім того, для стану нейрона можна використовувати до 4096 байт в залежності від завдань (раніше було тільки 24 байт). Число синапсів на чіп зменшилося з 128 до 12 млн, але вони отримали істотний апгрейд — для кодування сигналу використовується int32-значення, а не бінарне (є/ні).

Все разом це дозволяє задіяти навчання (в тому числі на льоту) з третім фактором. Тим не менш, набір інструкцій нейроморфних ядер залишився як і раніше простим. Він включає базові арифметичні операції, зрушення, розгалуження, роботу з пам’яттю/регістрами і імпульсами. Самі ядра об’єднані швидкою mesh-мережею 8х16, а за конфігурацію мережі, (де-)кодування даних і управлінням передачею імпульсів відповідають ще шість виділених ядер (раніше їх було тільки три) з апаратним прискоренням відповідних завдань.

Сумарний ефект від усіх нововведень такий, що loihi ii швидше loihi першого покоління приблизно на порядок. Більш того, він отримав поліпшені можливості масштабування: до 1000 ядер на самому чіпі, а також можна сформувати тривимірну mesh-мережу з чіпів завдяки шести виділеним i/o-контролерам на кожному з них і вчетверо більш швидким лініям. А для зв’язку із зовнішнім світом тепер доступні стандартні інтерфейси spi/aer, gpio і 1/2.5 / 10gbe.

Першим пристроєм на базі loihi ii стала одночіпова карта oheo gulch, призначена для розробки і налагодження пз. Вона поки що доступна тільки обраним партнерам intel в хмарі neuromorphic research cloud. Наступним пристроєм стане компактна (4″ x 4″) плата kapoho point, яка несе на борту вже вісім чіпів loihi ii і надає ethernet і gpio, а також різні інтерфейси для сенсорів і актуаторів. Плати можна буде безпосередньо об’єднувати між собою для простого нарощування обчислювальної потужності. Надалі можлива інтеграція чіпів в гібридні soc для різних завдань, а також поява рішень для цод.

В цілому, області застосування і завдання новинок збігаються з тими, що зараз обслуговують «класичні» нейронні мережі (з поправкою на енергоефективність). Однак одного “заліза” для поширення мало, тому intel підготувала універсальний open source фреймворк lava, який дозволить уніфікувати розробку і підготовку моделей для практичних будь-яких апаратних рішень (не тільки нейроморфних) з урахуванням специфіки конкретних архітектур.