NVIDIA выпустила Nemotron 3 Super, модель рассуждений с открытыми весами на 120B (12B активных), которая набрала 36 баллов в Индексе Искусственного Интеллекта Анализа. Нам предоставили доступ к этой модели до запуска, и мы оценили её по критериям интеллекта, открытости и эффективности вывода. Ключевые выводы ➤ Сочетает высокую открытость с сильным интеллектом: Nemotron 3 Super демонстрирует высокие результаты для своего размера и значительно более интеллектуален, чем любая другая модель с сопоставимой открытостью. ➤ Nemotron 3 Super набрала 36 баллов в Индексе Искусственного Интеллекта Анализа, на 17 пунктов опережая предыдущий выпуск Super и на 12 пунктов от Nemotron 3 Nano. По сравнению с моделями в аналогичной категории по размеру, это ставит её впереди gpt-oss-120b (33), но позади недавно выпущенной Qwen3.5 122B A10B (42). ➤ Сосредоточена на эффективном интеллекте: мы обнаружили, что Nemotron 3 Super имеет более высокий интеллект, чем gpt-oss-120b, при этом обеспечивая ~10% более высокую пропускную способность на GPU в простом, но реалистичном нагрузочном тесте. ➤ Поддерживается сегодня для быстрого безсерверного вывода: провайдеры, включая @DeepInfra и @LightningAI, обслуживают эту модель с момента запуска со скоростью до 484 токенов в секунду. Детали модели 📝 Nemotron 3 Super имеет 120.6B общих и 12.7B активных параметров, а также контекстное окно на 1 миллион токенов и поддержку гибкого рассуждения. Она опубликована с открытыми весами и разрешительной лицензией, наряду с открытыми данными для обучения и раскрытием методологии. 📐 Модель имеет несколько проектных особенностей, позволяющих эффективный вывод, включая использование гибридных архитектур Mamba-Transformer и LatentMoE, многотокенное предсказание и квантованные веса NVFP4. 🎯 NVIDIA предварительно обучила Nemotron 3 Super в (в основном) точности NVFP4, но перешла на BF16 для постобучения. Наши оценочные баллы используют веса BF16. 🧠 Мы провели бенчмаркинг Nemotron 3 Super в её режиме рассуждений с наибольшими усилиями ("обычный"), который является самым способным из трёх режимов вывода модели (выключение рассуждений, низкие усилия и обычный).
NVIDIA выпустила значительные данные до и после обучения вместе с новыми комплексными рецептами обучения для этой модели. Эти раскрытия достигли 83 баллов в Индексе Открытости Искусственного Анализа, уступая только высокооткрытым моделям от Ai2 и MBZUAI, и помещают Nemotron 3 Super в самый привлекательный квадрант по Открытости и Интеллекту среди аналогов. Nemotron 3 Super является безусловно самой интеллектуальной моделью, когда-либо выпущенной с таким уровнем открытости.
Nemotron 3 Super использовал относительно большое количество токенов в наших оценках. Он использовал 110M выходных токенов для проведения оценок Индекса Искусственного Анализа Интеллекта - это примерно на 40% больше, чем gpt-oss-120b с высоким уровнем рассуждений, но на ~20% меньше по сравнению с Nemotron 3 Nano. Это значительно меньше токенов, чем у Claude Opus 4.6 (макс) от Anthropic, который использовал 160M токенов, и немного меньше, чем у GPT-5.4 (xhigh) от OpenAI, который использовал 120M токенов.
С 120B в общей сложности и 12B активных параметров, Nemotron 3 Super все еще относительно мал по сравнению с другими недавними выпусками моделей с открытыми весами от ведущих мировых лабораторий — GLM-5 (744B в общей сложности, 40B активных), Qwen3.5 397B A17B (397B в общей сложности, 17B активных) и Kimi K2.5 (1T в общей сложности, 32B активных), каждая из которых в 3-8 раз больше.
NVIDIA сосредоточена на эффективном интеллекте для семейства Nemotron, и мы протестировали производительность вывода по сравнению с аналогичными моделями, чтобы увидеть влияние архитектурных решений. Мы провели тесты пропускной способности на собственных серверах с использованием простой методологии и рабочими нагрузками, представляющими собой общие случаи использования, такие как агентные рабочие процессы с умеренной историей, приложения RAG или обработка документов. В этом тесте Nemotron 3 Super (NVFP4) показывает на 11% более высокую пропускную способность на один GPU NVIDIA B200 по сравнению с gpt-oss-120b (MXFP4), что ставит Nemotron 3 Super «выше и правее» относительно gpt-oss-120b. Qwen3.5 122B A10B достигает +6 пунктов в Индексе Интеллекта по сравнению с Nemotron 3 Super, но при 40% более низкой пропускной способности на один GPU. Наши оценки Индекса Интеллекта для Nemotron 3 Super были оценены на весах BF16. Мы еще не оценили, есть ли какое-либо влияние на интеллект от квантизации NVFP4, но внутренние тесты NVIDIA показали, что модель NVFP4 достигла 99.8% медианной точности относительно базового уровня BF16. Для получения более подробной информации о нашей настройке тестирования и конфигурациях моделей смотрите нашу статью о Nemotron 3 Super:
Nemotron 3 Super будет доступен с момента его выпуска на безсерверных API от таких провайдеров, как Lightning AI и DeepInfra. Мы протестировали эти конечные точки и увидели производительность до 484 токенов в секунду на наших стандартных нагрузках с 10k токенами. При запуске Nemotron 3 Super занимает наиболее привлекательный квадрант по интеллекту и скорости вывода среди сопоставимых аналогов.
6,65K