Segundo o GTC da Nvidia, Jensen chama isso de "provavelmente o gráfico mais importante para o futuro das fábricas de IA". O eixo Y é "Throughput" (volume total), enquanto o eixo X é "Velocidade do Token" (mais tokens por segundo = mais interatividade para o usuário + mais contexto + mais raciocínio). As empresas comercializam e precificam as ofertas de tokens com base nessas duas variáveis, que estão em tensão. Um tier gratuito normalmente tem alta taxa de rendimento, mas menor velocidade de token. Enquanto isso, o nível mais caro teria tokens de menor valor mas de alto valor (ex: pesquisa, programação) O desafio da Nvidia é construir sistemas que elevem toda a linha para cima e para a direita. Jensen diz que a arquitetura Vera Rubin melhora a oportunidade de receita 5x em relação à Blackwell. Então, se você adicionar Groq ao Vera Rubin, essa oportunidade de receita aumenta 10 vezes em relação ao Blackwell (Groq é útil para tokens de valor mais alto).