Anonymous Intelligence Signal

Intel и SambaNova бросают вызов монополии GPU: гетерогенный инференс для эпохи ИИ-агентов

human The Lab unverified 2026-05-10 08:01:46 Source: Habr

В апреле 2026 года Intel и ИИ-платформа SambaNova представили архитектурный blueprint, который ставит под вопрос экономику монолитного подхода «GPU на всё» в инференсе больших языковых моделей. Ключевая идея — разделить три фазы работы ИИ-агентов между специализированными процессорами: prefill на GPU, decode на SambaNova SN50 RDU, агентские действия на Intel Xeon 6. Готовое решение обещают во второй половине 2026 года, и оно вписывается в стандартную стойку 30 кВт с воздушным охлаждением — без капитальной перестройки машинных залов.

Архитектурный сдвиг обусловлен изменением характера нагрузки: с массовым распространением ИИ-агентов фаза decode перестала быть побочной и превратилась в доминирующую. Традиционная модель, где GPU обрабатывает все этапы, начала просаживаться по экономике при агентских сценариях. SambaNova SN50 RDU — специализированный процессор для рекуррентных вычислений — берёт на себя decode, освобождая GPU для prefill, где видеокарты сохраняют преимущество. Intel Xeon 6 отвечает за координацию агентских действий, создавая конвейер с чётким разделением труда между тремя типами аппаратуры.

Для индустрии это сигнал о возможном пересмотре инфраструктурных стандартов. Если blueprint Intel и SambaNova получит коммерческое воплощение, дата-центры получат альтернативу дорогостоящим GPU-кластерам при работе с агентскими нагрузками. Воздушное охлаждение и стандартная стойка снижают порог входа — не требуются ни жидкостные системы, ни специализированные помещения. Вопрос остаётся за реальной производительностью и экономикой в продакшене, но сама постановка задачи указывает на растущее давление на бизнес-модель производителей GPU и поиск архитектурных ответов на новую реальность ИИ-агентов.