M5 Max este o jucărie de 3.500 de dolari singurul număr care contează pentru AI-ul local: tokens/sec Ce contează cu adevărat pentru inferența LLM (în ordine): Lățimea de bandă a memoriei → determină tok/s VRAM/memoria unificată → determină dimensiunea modelului calculul → contează foarte puțin pentru inferență 25 de jetoane/secundă pe 70B sună impresionant până realizezi că AI-ul agentic are nevoie de 100+ ca să nu se simtă stricat M5 este un laptop excelent, dar nu este material pentru server