OpenAI właśnie wypuściło GPT-5.4, a my testowaliśmy go w Cline przez cały tydzień. Zauważyliśmy wzrost w użyciu komputerów i ogólnej wiedzy, a wyniki testów to potwierdzają: OSWorld (ocena użycia komputerów) wzrosło z 47,3% → 75,0%, przewyższając wydajność ludzką na poziomie 72,4%! 🧵
GPT-5.4 ma również okno kontekstowe o wielkości 1M, ale ich oceny pokazują, że znalezienie igły w stogu siana (MRCR v2) osiąga 97% przy 16-32K tokenów, spada do 57% przy 256-512K, a tylko 36% przy 512K-1M. Dlatego warto regularnie kompresować!
46