17 000 tokens per sekund!! Les det igjen! LLM er direkte koblet til silisium. ingen HBM, ingen væskekjøling, bare rå spesialisert maskinvare. 10 ganger raskere og 20 ganger billigere enn en B200. «venting på at LLM-en skal tenke»-æraen er død. Kode genereres i menneskelig tankefart. Overgang fra brute-force GPU-klynger til faktiske AI-enheter.