IBMリサーチによる自己改善エージェントに関する新しい研究。 エージェントは「健忘症」を抱えています。 今日特定のAPI認証フローで苦労しているエージェントは、手動で更新しない限り明日も同じフローで苦労します。 本論文では、エージェントの実行軌跡から実践的な学習を自動的に抽出し、それを文脈記憶検索を通じて将来のパフォーマンス向上に活用するフレームワークを紹介します。 システムは3種類のガイダンスを生成します:成功したパターンからの戦略的ヒント、失敗処理からの回復のヒント、そして非効率ながらも成功した実行からの最適化のヒントです。トレイジェクトリテリジェンス抽出器はエージェントの推論パターンの意味解析を行い、意思決定帰属アナライザーは推論ステップを遡って根本原因を特定します。 AppWorldベンチマークでは、メモリ強化エージェントは73.2%のタスク目標達成率を達成しており、ベースラインの69.6%(+3.6pp)、シナリオ目標達成率は64.3%、50.0%(+14.3pp)を上回っています。その利点はタスクの複雑さに応じて拡大します。難易度3の課題で最も劇的な改善が見られました。シナリオ目標の+28.5pp(19.1%から47.6%)、相対的に149%の増加です。 なぜ重要なのか: 訓練データだけでなく、自身の実行トレースから学習するエージェントは、手動のプロンプトエンジニアリングなしで体系的に改善できます。 より良いチップがより良い軌道を生み出し、さらにより良いチップを生み出す自己強化サイクルは、自己改善エージェントシステムへの実用的な道です。 論文: 私たちのアカデミーで効果的なAIエージェントの構築方法を学びましょう: