LTX-2.3 é uma atualização importante. É um motor multimodal pronto para produção - projetado para ser construído. Aqui está a novidade 🧵 1/7
Envio hoje: → Código completo, pesos de modelo e código de treinamento → acesso à API para integração em produção → LTX Studio para geração baseada na web Faça isso localmente. Ajuste melhor. Integre diretamente isso aos seus fluxos de trabalho. 2/7
A maior melhoria é a fidelidade visual e a estabilidade do movimento. Um novo VAE de vídeo e um espaço latente refinado oferecem detalhes mais nítidos e movimentos mais estáveis. Imagem-vídeo se mantém melhor, pequenas texturas sobrevivem à compressão, e a interpolação no último quadro faz com que os finais pareçam intencionais. Também aplicamos filtragem de dados mais agressiva e melhoramos o processamento de dados, o que melhora diretamente os detalhes visuais finos e reduz artefatos. 3/7
A compreensão rápida também deu um passo real à frente. Um conector de texto maior melhora como o modelo interpreta o movimento da câmera, a composição da cena e as ações dos personagens. Você não precisa mais fazer superengenharia dos prompts para obter resultados previsíveis. Por trás do capot, a normalização adaptativa e a atenção limitada reforçam o controle sem aumentar a complexidade. 4/7
Keyframes e controle estruturado agora estão mais profundamente integrados. O LTX-2.3 é treinado com objetivos multitarefa desde a fase de pré-treinamento, incluindo imagem-para-vídeo, retake, keyframes e mais. Isso torna as transições, a evolução controlada da cena e os fluxos de trabalho com múltiplos planos mais consistentes e confiáveis. 5/7
A qualidade do áudio também melhorou em todos os aspectos. Um novo vocoder aumenta a clareza dos diálogos e o realismo sonoro. O alinhamento intermodal entre áudio e vídeo é mais preciso. Filtragem mais forte e processamento de dados aprimorado reduzem os ruídos de saída e melhoram a fidelidade geral do áudio. 6/7
131