Bị ảnh hưởng bởi autoresearch của Karpathy, tôi đã để VibeHQ học cách tự tiến hóa, không phải tiến hóa một tác nhân đơn lẻ, mà là tiến hóa cách hợp tác của toàn bộ các tác nhân đa dạng. 7 lần vận hành hoàn toàn tự động, không có sự can thiệp của con người: • Lượng token: 7.2M → 5.7M (đỉnh điểm giảm 62%) • Giảm thiểu các vấn đề liên quan đến phối hợp (tình huống làm việc lặp lại...): 4 → 0 • Lãng phí token PM: -91% Vòng lặp: benchmark → định lượng hợp tác và phân tích mô hình thất bại LLM → /optimize-protocol viết lại mã phối hợp → xây dựng lại → lặp lại. AI tự nhìn vào sự thất bại trong hợp tác của các tác nhân, tự phân tích lý do thất bại, sau đó tự sửa mã nguồn của mình để điều chỉnh logic hợp tác, toàn bộ quá trình không có sự can thiệp của con người, hoàn toàn để AI tự tổ chức sự ăn ý của đội ngũ của mình. Đã xem qua một số thông tin liên quan, autoresearch trong việc tối ưu hóa tự động đào tạo mô hình, trước đây Ralph là vòng lặp tự chủ của một tác nhân, Gastown chạy đồng thời 20-30 Claude Code để thực hiện orchestration nhưng không có khả năng tiến hóa, tất cả đều rất mạnh, nhưng sau đó cũng chỉ tiến hóa khả năng của một tác nhân đơn lẻ. Không ai đang tiến hóa chính sự hợp tác của đội ngũ, cách phân công, cách tránh xung đột, cách chia sẻ ngữ cảnh, cách hỗ trợ lẫn nhau, giống như thế giới thực, đội ngũ AI cũng cần phải mài giũa. Hãy tưởng tượng điều này sẽ phát triển thành gì: • Các tác nhân tự phát triển văn hóa đội ngũ và sự ăn ý trong công việc. • Tự thích ứng theo dự án, phân bổ đội 3 người hoặc 7 người dựa trên mức độ phát triển của dự án. • Càng nhiều dự án cùng thực hiện, đội ngũ càng mạnh. • Các tác nhân có thể onboard đồng đội mới trong quá trình dự án, tự động phân bổ lại công việc. Nói thật, cuối cùng sẽ tiến hóa thành gì? Tôi cũng không biết, nhưng đó lại là phần thú vị nhất.