Mám pocit, že vyhledávací algoritmus bude zase skvělý. Jak se kontext nebo podnět zvětšuje. Jak správně snížit spotřebu tokenů opravdu spadá do toho, jaký prompt a v jakém kontextu bychom měli zadávat. Nemyslím si, že komprese bude fungovat tak dobře, když máte velkou paměťovou banku. Protože 90 % zadání nemusí být stále potřeba. Místo toho, abychom zadali veškerý kontext nebo zadání, vyhledáváme a odvodujeme celý kontext pouze pro relevantní informace.