M5 Max là một món đồ chơi giá 3.500 đô la số duy nhất quan trọng đối với AI địa phương: token/giây những gì thực sự quan trọng cho suy diễn LLM (theo thứ tự): băng thông bộ nhớ → xác định tok/s VRAM/bộ nhớ thống nhất → xác định kích thước mô hình tính toán → hầu như không quan trọng cho suy diễn 25 token/giây trên 70B nghe có vẻ ấn tượng cho đến khi bạn nhận ra AI có tính tác động cần 100+ để không cảm thấy bị hỏng M5 là một chiếc laptop tuyệt vời, nhưng không phải là vật liệu cho máy chủ