Benchmark-urile PinchBench evaluează performanța modelelor mari de limbaj AI în task-urile proxy-ului OpenClaw. Rezultatele arată că Gemini 3 Flash conduce cu o rată de succes de 95,1% în procesarea sarcinilor OpenClaw, în timp ce minimax-m2.1 și kimi-k2.5 ocupă locurile doi și trei cu 93,6% și, respectiv, 93,4%. Claude Sonnet 4,5 este 92,7%, iar GPT-4o este 85,2%.