Бенчмарки PinchBench оцінюють продуктивність великих мовних моделей ШІ у проксі-завданнях OpenClaw. Результати показують, що Gemini 3 Flash лідирує з успішністю 95,1% у обробці завдань OpenClaw, тоді як minimax-m2.1 і kimi-k2.5 посідають друге і третє місця з 93,6% та 93,4% відповідно. Claude Sonnet 4.5 — це 92.7%, а GPT-4o — 85.2%.