PinchBench-benchmarks evaluerer ytelsen til AI-modeller for store språk i OpenClaw-proxy-oppgaver. Resultatene viser at Gemini 3 Flash leder an med en suksessrate på 95,1 % i behandlingen av OpenClaw-oppgaver, mens minimax-m2.1 og kimi-k2.5 ligger på andre- og tredjeplass med henholdsvis 93,6 % og 93,4 %. Claude Sonnet 4,5 er 92,7 %, og GPT-4o 85,2 %.