L'uso di Trinity, specialmente mentre è gratuito su openrouter, è stato incredibile. Siamo riusciti a gestire effettivamente 3 volte il throughput sul nostro cluster di inferenza rispetto a quanto stimato. Ma il nostro TPS è crollato poiché l'uso continua a crescere. Abbiamo spostato un po' di calcolo per l'addestramento su inferenza (non è stato semplice come pensavo) e dovremmo tornare a piena velocità. Dacci tutto quello che hai.