LTX-2.3 je zásadní vylepšení. Je to multimodální engine připravený pro produkci – navržený k budování. Tady je, co je nového 🧵 1/7
Dnešní odeslání: → Plný kód, váhy modelů a tréninkový kód → API pro integraci do produkce → LTX Studio pro webovou generaci Spusti to lokálně. Ladit to. Integrujte ho přímo do svých pracovních postupů. 2/7
Největším vylepšením je vizuální kvalita a stabilita pohybu. Nový video VAE a vylepšený latentní prostor přinášejí ostřejší detaily a stabilnější pohyb. Převod obrazu na video lépe drží pohromadě, malé textury přežívají kompresi a interpolace na poslední snímek dělá konce záměrnými. Také jsme aplikovali agresivnější filtrování dat a zlepšili zpracování dat, což přímo zlepšuje jemné vizuální detaily a snižuje množství artefaktů. 3/7
Rychlé pochopení také udělalo skutečný pokrok. Větší textový konektor zlepšuje interpretaci pohybu kamery, kompozice scény a akcí postav. Už nemusíte přehánět projektování promptů, abyste dosáhli předvídatelných výsledků. Pod kapotou adaptivní normalizace a uzavřená pozornost zpřísňují kontrolu, aniž by zvyšovaly složitost. 4/7
Klíčové snímky a strukturované řízení jsou nyní hlouběji integrovány. LTX-2.3 je trénován s multitaskovými úkoly již od fáze předtréninku, včetně převodu obrazu na video, přepisování, klíčových snímků a dalších. To činí přechody, kontrolovaný vývoj scén a vícezáběrné pracovní postupy konzistentnějšími a spolehlivějšími. 5/7
Kvalita zvuku se také zlepšila celkově. Nový vokodér zvyšuje srozumitelnost dialogů a realistickost zvuku. Mezimodální sladění mezi zvukem a obrazem je přísnější. Silnější filtrování a vylepšené zpracování dat snižují šum na výstupech a zlepšují celkovou věrnost zvuku. 6/7
173