Penelitian baru dari IBM Research on Self-Improving Agents. Agen menderita "amnesia". Agen yang kesulitan dengan alur autentikasi API tertentu hari ini akan kesulitan dengan alur yang sama besok kecuali diperbarui secara manual. Makalah ini memperkenalkan kerangka kerja untuk mengekstrak pembelajaran yang dapat ditindaklanjuti secara otomatis dari lintasan eksekusi agen dan menggunakannya untuk meningkatkan kinerja di masa mendatang melalui pengambilan memori kontekstual. Sistem ini menghasilkan tiga jenis panduan: tips strategi dari pola yang berhasil, tips pemulihan dari penanganan kegagalan, dan tips pengoptimalan dari eksekusi yang tidak efisien tetapi berhasil. Extractor Kecerdasan Lintasan melakukan analisis semantik pola penalaran agen sementara Penganalisis Atribusi Keputusan melacak mundur melalui langkah-langkah penalaran untuk mengidentifikasi akar penyebab. Pada tolok ukur AppWorld, agen yang ditingkatkan memori mencapai penyelesaian sasaran tugas 73,2% dibandingkan dengan 69,6% penyelesaian sasaran skenario (+3,6 pp) dan 64,3% penyelesaian sasaran skenario dibandingkan dengan 50,0% (+14,3 pp). Manfaatnya berskala dengan kompleksitas tugas. Tugas kesulitan 3 menunjukkan peningkatan paling dramatis: +28,5 pp pada tujuan skenario (19,1% menjadi 47,6%), peningkatan relatif 149%. Mengapa itu penting: Agen yang belajar dari jejak eksekusi mereka sendiri, tidak hanya dari data pelatihan, dapat secara sistematis meningkatkan tanpa rekayasa prompt manual. Siklus penguatan diri dari ujung yang lebih baik yang menghasilkan lintasan yang lebih baik yang menghasilkan ujung yang lebih baik adalah jalan praktis menuju sistem agen yang memperbaiki diri. Kertas: Pelajari cara membangun agen AI yang efektif di akademi kami: