Estamos colaborando con @cerebras para construir la inferencia más rápida posible. Próximamente en Amazon Bedrock, estamos ofreciendo un rendimiento de inferencia un orden de magnitud más rápido que lo que está disponible hoy al conectar AWS Trainium3 para el prellenado intensivo en computación con Cerebras CS-3 para potenciar la decodificación. Aprende más sobre la asociación.