Voimmeko ajaa paikallisesti 1T-parametreja kuten Kimi K2.5? 👀 Kyllä me siihen pystymme! Tässä se on: - 20 toks/s nopeudella @exolabs Apple MLX:llä kahdella Mac Studio M3 Ultra 512GB -ohjaimellani, käyttäen ~630GB RAM-muistia - @opencode käytettiin käärmepelin luomiseen automaattitoistolla - Voit nähdä mallin luovan pelin ja sitten automaattisesti syöttävän lopulliset tulokset ChromeDevTools MCP:llä tarkistaaksesi tuloksen. Paikallinen tekoäly on saavuttanut uskomattomia tasoja! 🚀