Más de 25 artículos del equipo de Tencent HY han sido aceptados para @CVPR 2026. Este año, nuestro trabajo abarca: 🖼️ Edición de imágenes: razonamiento y llamada de herramientas por cadena de pensamiento (CoT) para una edición de grano fino y controlable. 🎥 Generación de vídeo: RL post-formación, generación unificada de audio-vídeo, generación de vídeo en streaming y aceleración de inferencia. 🎮 Visión 3D: Generación 3D controlable, síntesis de texturas, aprendizaje por refuerzo 3D, modelos interactivos de mundos y modelos 3D multimodales unificados. Desde la edición guiada por razonamiento hasta vídeo escalable y fundamentos nativos en 3D, nos centramos en construir modelos generativos generales entre modalidades. Durante la conferencia compartiremos análisis técnicos en profundidad. ¡Nos vemos en #CVPR2026 en Denver este junio!
Lista completa de artículos y enlaces:
1.87K