ARC-AGI-2 Yarı Özel üzerinde uluslararası modeller - Kimi K2.5 (@Kimi_Moonshot): %12, 0.28 $ - Minimax M2.5 (@MiniMax_AI): %5, 0,17 $ - GLM-5 (@Zai_org): %5, 0,27 dolar - Deepseek V3.2 (@deepseek_ai): %4, 0,12 dolar Bu modeller Temmuz 2025 sınır laboratuvarlarının altında puan alır
Yarı-Özel testleri yalnızca güvenilir veri saklama anlaşmaları olan sağlayıcılarla yürütüyoruz. Qwen 3 Max Thinking bu nedenle dahil edilmemiştir.
- Liderlik Tablosu: - Sonuçları tekrarlayın: ... - Test politikası: - ARC Prize Foundation şu kişileri işe alıyor: - Ham sonuçları görüntüleyin:
207