L'utilisation de Trinity, surtout pendant qu'il est gratuit sur openrouter, a été incroyable. Nous avons en fait réussi à gérer 3 fois plus de débit sur notre cluster d'inférence que ce que nous avions estimé. Mais notre TPS a chuté alors que l'utilisation continue de croître. Nous avons déplacé une partie des ressources de formation vers l'inférence (ce n'est pas aussi simple que je le pensais) et nous devrions revenir à pleine vitesse. Donnez-nous tout ce que vous avez.