🎉 Вітаємо @nvidia з виходом Nemotron 3 Super — підтримка першого дня у vLLM v0.17.1! Перевірено на відеокартах NVIDIA. 120B гібридний MoE, активний лише 12B на момент виведення. Великі покращення порівняно з попереднім Nemotron Super: - У 5 разів більша пропускна здатність - У 2 рази вища точність за Індексом інтелекту штучного аналізу - Multi-Token Prediction (MTP) для швидшої генерації довгих форм - Налаштовуваний бюджет мислення — точність набору проти вартості токена за завдання - 1M контекстне вікно токена Підтримує BF16, FP8 та NVFP4. Повністю відкриті: ваги, набори даних, рецепти. Блог: 🤝 Дякую @NVIDIAAIDev команді Nemotron і учасникам спільноти vLLM!