MetalRT baru saja menjadi mesin inferensi AI lengkap pertama untuk Apple Silicon: LLM + STT + TTS pada @RunAnywhereAI. Kami sudah memiliki dekode LLM tercepat (658 tok/s). Sekarang kami telah menghancurkan STT dan TTS juga, mengalahkan MLX secara keseluruhan. Angka hari ini di M4 Max: - Podcast 1 jam ditranskripsi dalam ~5 detik - Rapat 3 jam ditranskripsikan dalam ~15 detik - Teks langsung tanpa penundaan yang terlihat - 714x lebih cepat dari real-time untuk STT - 4,6x lebih cepat dari MLX Apple pada ucapan-ke-teks Ketiga modalitas. Satu mesin terpadu. Dan ini hanya komponen individu. Pipeline AI suara penuh yang kami bangun di atas akan menjadi yang TERCEPAT yang pernah ada di Apple Silicon. Segera diluncurkan. Tolok ukur lengkap, grafik, dan detail di komentar. #AppleSilicon #OnDeviceAI #MetalRT #STT #TTS #VoiceAI