LTX-2.3 är en stor uppgradering. Det är en produktionsklar multimodal motor – designad för att byggas på. Här är vad som är nytt 🧵 1/7
Skickas idag: → Fullständig kod, modellvikter och träningskod → API-åtkomst för produktionsintegration → LTX Studio för webbaserad generering Kör det lokalt. Finjustera den. Integrera det direkt i dina arbetsflöden. 2/7
Den största förbättringen är visuell kvalitet och rörelsestabilitet. En ny video-VAE och förfinad latent space levererar skarpare, finare detaljer och mer stabil rörelse. Bild-till-video håller ihop bättre, små texturer överlever komprimering, och interpolation i sista bildrutan gör att sluten känns avsiktliga. Vi har också tillämpat mer aggressiv datafiltrering och förbättrat databehandlingen, vilket direkt förbättrar fina visuella detaljer och minskar artefakter. 3/7
Snabb förståelse tog också ett verkligt steg framåt. En större textkoppling förbättrar hur modellen tolkar kamerarörelser, scenkomposition och karaktärshandlingar. Du behöver inte längre överkonstruera prompts för att få förutsägbara resultat. Under huven skärper adaptiv normalisering och gated attention kontrollen utan att öka komplexiteten. 4/7
Keyframes och strukturerad kontroll är nu mer djupt integrerade. LTX-2.3 tränas med multitask-mål från förträningsstadiet, inklusive bild-till-video, omtagning, nyckelbilder och mer. Detta gör övergångar, kontrollerad scenutveckling och arbetsflöden för flera tagningar mer konsekventa och pålitliga. 5/7
Ljudkvaliteten förbättrades också överlag. En ny vokoder ökar dialogens tydlighet och ljudrealism. Tvärmodal anpassning mellan ljud och bild är tätare. Starkare filtrering och förbättrad databehandling minskar brusiga utgångar och förbättrar den övergripande ljudkvaliteten. 6/7
143