O MetalRT acabou de se tornar o primeiro motor completo de inferência de IA para o Apple Silicon: LLM + STT + TTS por @RunAnywhereAI. Já tínhamos a decodificação mais rápida do LLM (658 tok/s). Agora arrasamos no STT e no TTS também, superando o MLX em todos os aspectos. Números de hoje sobre o M4 Max: - Podcast de 1 hora transcrito em ~5 segundos - Reunião de 3 horas transcrita em ~15 segundos - Legendagem ao vivo com atraso perceptível zero - 714x mais rápido que o tempo real para STT - 4,6 vezes mais rápido que o MLX da Apple no reconhecimento de voz Todas as três modalidades. Um motor unificado. E isso são apenas os componentes individuais. O pipeline completo de IA de voz que estamos construindo em cima será o MAIS RÁPIDO já visto na Apple Silicon. Lançamento em breve. Referências completas, gráficos e detalhes nos comentários. #AppleSilicon #OnDeviceAI #MetalRT #STT #TTS #VoiceAI