Como venho dizendo, esta é a próxima etapa da computação podemos ir além, colocar o LLM no chip e receber 10 mil tokens por segundo, fazendo qualquer binário em um segundo dividido realizar qualquer tarefa