O modelo indiano Sarvam-105b é realmente muito bom A Sarvam AI tornou públicos dois modelos de raciocínio construídos na Índia, Sarvam 30B e 105B, posicionando-os como modelos abertos competitivos a nível global. A grande revelação não são apenas as pontuações de benchmark como 98,6 no Math500 para 105B ou a forte eficiência de implantação local para 30B, mas a história completa: dados internos, treinamento, RL, design de tokenizador e otimização de inferência construídos tanto para GPUs de ponta quanto para dispositivos de consumo.