LTX-2.3 est une mise à jour majeure. C'est un moteur multimodal prêt pour la production - conçu pour être construit. Voici ce qui est nouveau 🧵 1/7
Expédition aujourd'hui : → Code complet, poids du modèle et code d'entraînement → Accès API pour intégration en production → LTX Studio pour génération basée sur le web Exécutez-le localement. Affinez-le. Intégrez-le directement dans vos flux de travail. 2/7
La plus grande amélioration est la fidélité visuelle et la stabilité du mouvement. Une nouvelle vidéo VAE et un espace latent affiné offrent des détails fins plus nets et un mouvement plus stable. L'image vers la vidéo se maintient mieux, les petites textures survivent à la compression, et l'interpolation de la dernière image rend les fins plus intentionnelles. Nous avons également appliqué un filtrage des données plus agressif et amélioré le traitement des données, ce qui améliore directement les détails visuels fins et réduit les artefacts. 3/7
La compréhension des invites a également fait un réel pas en avant. Un connecteur de texte plus large améliore la façon dont le modèle interprète le mouvement de la caméra, la composition de la scène et les actions des personnages. Vous n'avez plus besoin de sur-ingénier des invites pour obtenir des résultats prévisibles. Sous le capot, la normalisation adaptative et l'attention contrôlée resserrent le contrôle sans augmenter la complexité. 4/7
Les images clés et le contrôle structuré sont désormais plus profondément intégrés. LTX-2.3 est entraîné avec des objectifs multitâches depuis la phase de préentraînement, y compris l'image vers la vidéo, la reprise, les images clés, et plus encore. Cela rend les transitions, l'évolution contrôlée des scènes et les flux de travail multi-prises plus cohérents et fiables. 5/7
La qualité audio s'est également améliorée dans l'ensemble. Un nouveau vocodeur augmente la clarté des dialogues et le réalisme sonore. L'alignement cross-modal entre l'audio et la vidéo est plus précis. Un filtrage plus puissant et un traitement des données amélioré réduisent les sorties bruyantes et améliorent la fidélité audio globale. 6/7
142