Estamos a unir forças com @cerebras para construir a inferência mais rápida possível. Em breve no Amazon Bedrock, estamos a oferecer um desempenho de inferência uma ordem de magnitude mais rápido do que o que está disponível hoje, conectando o AWS Trainium3 para pré-preenchimento intensivo em computação com o Cerebras CS-3 para potenciar a decodificação. Saiba mais sobre a parceria.