Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
LTX-2.3 je zásadní vylepšení.
Je to multimodální engine připravený pro produkci – navržený k budování.
Tady je, co je nového 🧵
1/7
Dnešní odeslání:
→ Plný kód, váhy modelů a tréninkový kód
→ API pro integraci do produkce
→ LTX Studio pro webovou generaci
Spusti to lokálně. Ladit to. Integrujte ho přímo do svých pracovních postupů.
2/7
Největším vylepšením je vizuální kvalita a stabilita pohybu.
Nový video VAE a vylepšený latentní prostor přinášejí ostřejší detaily a stabilnější pohyb.
Převod obrazu na video lépe drží pohromadě, malé textury přežívají kompresi a interpolace na poslední snímek dělá konce záměrnými.
Také jsme aplikovali agresivnější filtrování dat a zlepšili zpracování dat, což přímo zlepšuje jemné vizuální detaily a snižuje množství artefaktů.
3/7
Rychlé pochopení také udělalo skutečný pokrok.
Větší textový konektor zlepšuje interpretaci pohybu kamery, kompozice scény a akcí postav.
Už nemusíte přehánět projektování promptů, abyste dosáhli předvídatelných výsledků.
Pod kapotou adaptivní normalizace a uzavřená pozornost zpřísňují kontrolu, aniž by zvyšovaly složitost.
4/7
Klíčové snímky a strukturované řízení jsou nyní hlouběji integrovány.
LTX-2.3 je trénován s multitaskovými úkoly již od fáze předtréninku, včetně převodu obrazu na video, přepisování, klíčových snímků a dalších.
To činí přechody, kontrolovaný vývoj scén a vícezáběrné pracovní postupy konzistentnějšími a spolehlivějšími.
5/7
Kvalita zvuku se také zlepšila celkově.
Nový vokodér zvyšuje srozumitelnost dialogů a realistickost zvuku. Mezimodální sladění mezi zvukem a obrazem je přísnější.
Silnější filtrování a vylepšené zpracování dat snižují šum na výstupech a zlepšují celkovou věrnost zvuku.
6/7
173
Top
Hodnocení
Oblíbené
