Ci stiamo unendo a @cerebras per costruire l'inferenza più veloce possibile. In arrivo su Amazon Bedrock, stiamo offrendo prestazioni di inferenza un ordine di grandezza più veloci rispetto a quelle disponibili oggi collegando AWS Trainium3 per il prefill ad alta intensità di calcolo con Cerebras CS-3 per alimentare il decode. Scopri di più sulla partnership.