Modelos internacionales en ARC-AGI-2 Semi Private - Kimi K2.5 (@Kimi_Moonshot): 12%, $0.28 - Minimax M2.5 (@MiniMax_AI): 5%, 0,17 $ - GLM-5 (@Zai_org): 5%, 0,27 $ - Deepseek V3.2 (@deepseek_ai): 4%, $0,12 Estos modelos puntuan por debajo de los laboratorios de julio de 2025
Solo realizamos pruebas semiprivadas con proveedores que tienen acuerdos de retención de datos confiables. Qwen 3 Max Thinking no está incluido por esta razón.
- Clasificación de posiciones: - Reproduce los resultados: ... - Política de pruebas: - La Fundación ARC Prize está contratando a: - Ver resultados en bruto:
236