Temas en tendencia
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
🏎️ gemma-webgpu: un Gemma 1B sin dependencias y rapidísimo que se ejecuta completamente en tu navegador. Vibra completa codificada desde mi móvil.
🔥 136,8 tok/s en un Mac M4 (3,3 veces más rápido que transformers.js)
📱 101 tok/s en iPhone 17 (270M), 34 tok/s (1B)
Lo que construimos desde cero:
• 18 shaders de cómputo WGSL escritos a mano con operaciones fusionadas (fusedNormAdd guarda 36 despachos de GPU por pasada hacia adelante)
• Q8_0 descuantización directamente en la GPU — mayor calidad que el Q4 Y más rápida
• El streaming de solicitudes de rango carga, pesa capa por capa (~44MB bloques), se sube a la GPU y libera memoria JS inmediatamente. Pico de montón: ~50MB incluso para el modelo de 1GB
• Ese truco de streaming es lo que hace que 1B funcione en iPhone. nunca almacena el modelo completo en RAM
12KB se desvanecieron. Cero dependencias. NPM install gemma-webgpu

Populares
Ranking
Favoritas
