🎉 Grattis till @nvidia med lanseringen av Nemotron 3 Super — day-0-stöd i vLLM v0.17.1! Verifierat på NVIDIA GPU:er. 120B hybrid MoE, endast 12B aktiv vid inferensen. Stora uppgraderingar jämfört med tidigare Nemotron Super: - 5x högre genomströmning - 2x högre noggrannhet på Index för artificiell analysintelligens - Multi-Token Prediction (MTP) för snabbare generering av långformsmodeller - Konfigurerbart tänkande – urtavlens noggrannhet kontra tokenkostnad per uppgift - 1M tokenkontextfönster Stöder BF16, FP8 och NVFP4. Helt öppet: vikter, dataset, recept. Blogg: 🤝 Tack @NVIDIAAIDev Nemotron-teamet och vLLM-communityns bidragsgivare!