Spálil jsem 84 milionů tokenů 28. února. Zkoumání firem, psaní memorand, řízení agentů. To běží na Kimi K2.5, serverless modelu přes API. Při sazbách Claude nebo OpenAI — přibližně 9 dolarů za milion tokenů smíchaných — by ekvivalentní využití stálo 756 dolarů za jeden den práce. Moje vrcholné dny dosáhly 80 milionů tokenů. Můj průměrný den je 20 milionů. Cloudová inference při cenách podle modelů frontierů rychle roste.
Tento týden Alibaba vydala Qwen3.5-9B, open-source model, který odpovídá Claude Opus 4.1 z prosince 2025. Běží lokálně na 12GB RAM. Před třemi měsíci tato schopnost vyžadovala datové centrum. Teď je potřeba zásuvka z napájení.
Notebook za 5 000 dolarů — MacBook Pro s dostatečnou pamětí pro lokální spuštění Qwen — se vyplatí po 556 milionech tokenů. Při mém tempu spotřeby je to asi měsíc. Při 20 milionech tokenů denně je to čtyři týdny. Po návratu se mezní náklady snižují na elektřinu. Není to kompromitace inteligence. Uvažování, kódování, agentické pracovní postupy, zpracování dokumentů, dodržování instrukcí: model 9B odpovídá prosincové hranici ve všech oblastech.
@twlvone Více výpočetní kapacity nepomáhá kromě určité úrovně přesnosti volání nástrojů
134