M5 Max adalah mainan seharga $3,500 satu-satunya angka yang penting untuk AI lokal: token/detik apa yang sebenarnya penting untuk inferensi LLM (secara berurutan): bandwidth memori → menentukan tok/s VRAM/memori terpadu → menentukan ukuran model komputasi → hampir tidak penting untuk inferensi 25 token/detik pada 70B terdengar mengesankan sampai Anda menyadari AI agen membutuhkan 100+ agar tidak merasa rusak M5 adalah laptop yang hebat, tetapi bukan bahan server