Tendencias del momento
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Quemé 84 millones de tokens el 28 de febrero. Investigando empresas, redactando memorandos, gestionando agentes.
Eso es ejecutar Kimi K2.5, un modelo sin servidor a través de API. A las tarifas de Claude o OpenAI — aproximadamente $9 por millón de tokens mezclados — el uso equivalente costaría $756 por un solo día de trabajo. Mis días pico alcanzan los 80 millones de tokens. Mis días promedio son de 20 millones. La inferencia en la nube a precios de modelos de frontera se acumula rápidamente.

Esta semana, Alibaba lanzó Qwen3.5-9B, un modelo de código abierto que iguala a Claude Opus 4.1 de diciembre de 2025. Funciona localmente con 12GB de RAM. Hace tres meses, esta capacidad requería un centro de datos. Ahora solo requiere un enchufe.

Un portátil de $5,000 — un MacBook Pro con suficiente memoria para ejecutar Qwen localmente — se paga solo después de 556 millones de tokens. A mi tasa de uso, eso es aproximadamente un mes. A 20 millones de tokens por día, son cuatro semanas.
Después de recuperar la inversión, el costo marginal se reduce a la electricidad.
No se trata de un compromiso de inteligencia. Razonamiento, codificación, flujos de trabajo agentes, procesamiento de documentos, seguimiento de instrucciones: el modelo de 9B coincide con la frontera de diciembre en todos los aspectos.

@twlvone Más capacidad de cómputo no ayuda más allá de cierto nivel de precisión en la llamada de herramientas
195
Parte superior
Clasificación
Favoritos
