estou entusiasmado para anunciar a inferência em contêineres dedicados - um dos produtos que eu estava tão animado para construir quando entrei na @togethercompute e agora, 6 meses depois, estamos ao vivo! grandes elogios à equipe - isso facilita a execução de inferência para modelos com alta demanda computacional, como vídeo, áudio e geração de avatares, com primitivas para autoescalonamento, enfileiramento, prioridades, métricas, registro e muito mais se você está construindo neste espaço, adoraria ouvir de você!