MetalRT se ha convertido en el primer motor de inferencia de IA completo para Apple Silicon: LLM + STT + TTS por @RunAnywhereAI. Ya teníamos la decodificación LLM más rápida (658 tok/s). Ahora también hemos superado STT y TTS, superando a MLX en todos los aspectos. Los números de hoy en M4 Max: - Podcast de 1 hora transcrito en ~5 segundos - Reunión de 3 horas transcrita en ~15 segundos - Subtitulación en vivo con cero retraso perceptible - 714x más rápido que el tiempo real para STT - 4.6x más rápido que el MLX de Apple en conversión de voz a texto Las tres modalidades. Un motor unificado. Y esto es solo los componentes individuales. El pipeline completo de IA de voz que estamos construyendo será el MÁS RÁPIDO jamás en Apple Silicon. Lanzamiento pronto. Benchmarks completos, gráficos y detalles en los comentarios. #AppleSilicon #OnDeviceAI #MetalRT #STT #TTS #VoiceAI