M5 Max ise 3.500 dolarlık bir oyuncak yerel yapay zeka için önemli olan tek sayı: token/sec LLM çıkarımı için gerçekten önemli olan (sırayla): Bellek bant genişliği → tok/s'yi belirler VRAM/birleşik bellek → model boyutunu belirler hesaplama → çıkarım için pek önemli değil 70B'de 25 jeton saniye etkileyici görünüyor, ta ki ajanik yapay zekanın kırık hissetmemesi için 100+ ihtiyacı olduğunu fark edene kadar M5 harika bir dizüstü bilgisayar ama sunucu malzemesi değil