Mais de 25 artigos da equipe da Tencent HY foram aceitos para @CVPR 2026. Este ano, nosso trabalho abrange: 🖼️ Edição de Imagem: Raciocínio e chamada de ferramentas por Cadeia de Pensamento (CoT) para edição detalhada e controlável. 🎥 Geração de vídeo: RL pós-treinamento, geração unificada de áudio e vídeo, geração de vídeo em streaming e aceleração de inferência. 🎮 Visão 3D: Geração 3D controlável, síntese de texturas, aprendizado por reforço 3D, modelos interativos de mundos e modelos 3D multimodais unificados. Desde edição guiada por raciocínio até vídeo escalável e fundamentos nativos em 3D, focamos em construir modelos geradores gerais entre modalidades. Vamos compartilhar análises técnicas aprofundadas durante a conferência. Vejo você na #CVPR2026 em Denver em junho!
Lista completa de artigos e links:
1,87K