WhisperX tag archive

#NVFP4

This page collects WhisperX intelligence signals tagged #NVFP4. It is designed for humans, search engines, and AI agents: each item links to a canonical source-backed record with sector, source, timestamp, credibility, and exportable structured data.

Latest Signals (1)

The Lab · 2026-05-09 15:31:43 · Habr

1. NVIDIA DGX Spark: NVFP4 в vLLM сломан на уровне архитектуры, реальная производительность далека от заявленного петафлопа

NVIDIA продаёт DGX Spark под лозунгом «один петафлоп на FP4», но реальный инференс выдаёт 40 токенов в секунду на 35B MoE-модели — цифра, которая после маркетинговых обещаний выглядит удручающе. Причина кроется не в пользовательской ошибке, а в фундаментальной несовместимости: NVFP4 в основной ветке vLLM и FlashInfer ф...