come ho detto, questa è la prossima fase del calcolo possiamo andare oltre e mettere l'LLM onchip e ottenere 10k token al secondo, rendendo istantaneamente qualsiasi binario in un attimo per svolgere qualsiasi compito