el M5 Max es un juguete de $3,500 el único número que importa para la IA local: tokens/segundo lo que realmente importa para la inferencia de LLM (en orden): ancho de banda de memoria → determina tok/s VRAM/memoria unificada → determina el tamaño del modelo cómputo → apenas importa para la inferencia 25 tokens/segundo en 70B suena impresionante hasta que te das cuenta de que la IA agente necesita 100+ para no sentirse rota el M5 es un gran portátil, pero no es material de servidor