Chủ đề thịnh hành
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Nghiên cứu mới từ IBM Research về Các Đại Lý Tự Cải Thiện.
Các đại lý có "trí nhớ ngắn hạn."
Một đại lý gặp khó khăn với một quy trình xác thực API cụ thể hôm nay sẽ gặp khó khăn với cùng một quy trình vào ngày mai trừ khi được cập nhật thủ công.
Bài báo này giới thiệu một khung để tự động trích xuất những bài học có thể hành động từ các quỹ đạo thực thi của đại lý và sử dụng chúng để cải thiện hiệu suất trong tương lai thông qua việc truy xuất trí nhớ theo ngữ cảnh.
Hệ thống tạo ra ba loại hướng dẫn: mẹo chiến lược từ các mẫu thành công, mẹo phục hồi từ việc xử lý thất bại, và mẹo tối ưu hóa từ các thực thi không hiệu quả nhưng thành công. Một Trình Trích Xuất Trí Tuệ Quỹ Đạo thực hiện phân tích ngữ nghĩa của các mẫu lý luận của đại lý trong khi một Trình Phân Tích Gán Quyết Định theo dõi ngược lại qua các bước lý luận để xác định nguyên nhân gốc rễ.
Trên chuẩn AppWorld, đại lý được tăng cường trí nhớ đạt được 73,2% hoàn thành mục tiêu nhiệm vụ so với 69,6% cơ sở (+3,6 pp) và 64,3% hoàn thành mục tiêu kịch bản so với 50,0% (+14,3 pp). Lợi ích tăng theo độ phức tạp của nhiệm vụ. Các nhiệm vụ độ khó 3 cho thấy sự cải thiện rõ rệt nhất: +28,5 pp về mục tiêu kịch bản (19,1% đến 47,6%), tăng 149% tương đối.
Tại sao điều này quan trọng:
Các đại lý học từ chính các dấu vết thực thi của họ, không chỉ từ dữ liệu đào tạo, có thể cải thiện một cách hệ thống mà không cần kỹ thuật nhắc nhở thủ công.
Chu trình tự củng cố của những mẹo tốt hơn tạo ra những quỹ đạo tốt hơn tạo ra những mẹo tốt hơn là một con đường thực tiễn hướng tới các hệ thống đại lý tự cải thiện.
Bài báo:
Học cách xây dựng các đại lý AI hiệu quả trong học viện của chúng tôi:

Hàng đầu
Thứ hạng
Yêu thích
