トレンドトピック
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
IBMリサーチによる自己改善エージェントに関する新しい研究。
エージェントは「健忘症」を抱えています。
今日特定のAPI認証フローで苦労しているエージェントは、手動で更新しない限り明日も同じフローで苦労します。
本論文では、エージェントの実行軌跡から実践的な学習を自動的に抽出し、それを文脈記憶検索を通じて将来のパフォーマンス向上に活用するフレームワークを紹介します。
システムは3種類のガイダンスを生成します:成功したパターンからの戦略的ヒント、失敗処理からの回復のヒント、そして非効率ながらも成功した実行からの最適化のヒントです。トレイジェクトリテリジェンス抽出器はエージェントの推論パターンの意味解析を行い、意思決定帰属アナライザーは推論ステップを遡って根本原因を特定します。
AppWorldベンチマークでは、メモリ強化エージェントは73.2%のタスク目標達成率を達成しており、ベースラインの69.6%(+3.6pp)、シナリオ目標達成率は64.3%、50.0%(+14.3pp)を上回っています。その利点はタスクの複雑さに応じて拡大します。難易度3の課題で最も劇的な改善が見られました。シナリオ目標の+28.5pp(19.1%から47.6%)、相対的に149%の増加です。
なぜ重要なのか:
訓練データだけでなく、自身の実行トレースから学習するエージェントは、手動のプロンプトエンジニアリングなしで体系的に改善できます。
より良いチップがより良い軌道を生み出し、さらにより良いチップを生み出す自己強化サイクルは、自己改善エージェントシステムへの実用的な道です。
論文:
私たちのアカデミーで効果的なAIエージェントの構築方法を学びましょう:

トップ
ランキング
お気に入り
