PinchBench kıyaslamaları, OpenClaw proxy görevlerinde yapay zeka büyük dil modellerinin performansını değerlendirir. Sonuçlar, Gemini 3 Flash'ın OpenClaw görevlerini işlemede %95,1 başarı oranıyla önde olduğunu, minimax-m2.1 ve kimi-k2,5'in ise sırasıyla %93,6 ve %93,4 ile ikinci ve üçüncü sıralarda yer aldığını gösteriyor. Claude Sonnet 4.5 %92.7, GPT-4o ise %85.2'dir.