o M5 Max é um brinquedo de $3,500 o único número que importa para a IA local: tokens/segundo o que realmente importa para a inferência de LLM (em ordem): largura de banda de memória → determina tok/s VRAM/memória unificada → determina o tamanho do modelo cálculo → mal importa para a inferência 25 tokens/segundo em 70B soa impressionante até você perceber que a IA agente precisa de 100+ para não parecer quebrada O M5 é um ótimo laptop, mas não é material de servidor