MetalRT刚刚成为首个完整的AI推理引擎,专为Apple Silicon设计:LLM + STT + TTS,由@RunAnywhereAI提供。 我们已经拥有最快的LLM解码(658个token/秒)。 现在我们也击败了STT和TTS,全面超越了MLX。 今天在M4 Max上的数据: - 1小时的播客在约5秒内转录完成 - 3小时的会议在约15秒内转录完成 - 实时字幕无可感知的延迟 - STT比实时快714倍 - 在语音转文本方面比Apple的MLX快4.6倍 三种模式。一个统一的引擎。 而这只是单个组件。我们正在构建的完整语音AI管道将在Apple Silicon上成为最快的。即将推出。 完整的基准测试、图表和详细信息请见评论。 #AppleSilicon #OnDeviceAI #MetalRT #STT #TTS #VoiceAI