検索アルゴリズムはまた素晴らしいものになりそうです。文脈やプロンプトが大きくなっていくにつれて。トークン消費を適切に減らす方法は、どのプロンプトと文脈を提出すべきかに大きく依存します。メモリバンクが大きいと圧縮はあまり効果的ではないと思います。なぜなら、プロンプトの90%はまだ必要ない場合もあります。 すべての文脈やプロンプトを提出するのではなく、関連する情報だけを検索・推論します。