Відчуваю, що алгоритм пошуку знову буде чудовим. Як контекст або підказка, що стає більшою. Як правильно зменшити споживання токенів — це питання, у якому контексті ми повинні подати. Я не думаю, що компресія працюватиме так добре, коли у вас велика пам'ять. Адже 90% запиту все одно можуть бути не потрібні. Замість того, щоб надсилати весь контекст/запит, ми шукаємо і виводимо весь контекст лише за релевантною інформацією.