Czuję, że algorytm wyszukiwania znów będzie świetny. W miarę jak kontekst lub podpowiedź stają się coraz większe. Jak właściwie zredukować zużycie tokenów naprawdę zależy od tego, jaką podpowiedź z jakim kontekstem powinniśmy przesłać. Nie sądzę, żeby kompresja działała tak dobrze, gdy masz dużą pamięć. Ponieważ 90% podpowiedzi może być nadal niepotrzebne. Zamiast przesyłać cały kontekst/podpowiedź, wyszukujemy i dedukujemy cały kontekst tylko dla istotnych informacji.