🚨 Alibaba vừa mã nguồn mở một tác nhân GUI sống trong trang web của bạn và điều khiển nó bằng ngôn ngữ tự nhiên. Nó được gọi là Page Agent và không phải là một tiện ích mở rộng trình duyệt. Nó hoàn toàn là JavaScript không có Python, không có Puppeteer, không có trình duyệt không đầu, không có ảnh chụp màn hình. Chỉ cần một thẻ script và ứng dụng web của bạn hiểu ngôn ngữ tự nhiên. Dưới đây là những gì nó thực sự làm: → Nhúng nó với một thẻ <script> duy nhất hoặc cài đặt npm → Điều khiển bất kỳ giao diện web nào bằng lệnh tiếng Anh đơn giản → Manipulation DOM dựa trên văn bản không cần OCR, không cần mô hình thị giác → Mang theo LLM của riêng bạn (GPT, Claude, Qwen, bất kỳ thứ gì) → Gửi kèm một giao diện người dùng tích hợp với hỗ trợ con người trong vòng lặp → Biến 20-click ERP/CRM workflows thành một câu → Tiện ích mở rộng Chrome tùy chọn cho các tác vụ tác nhân đa tab → Hoạt động trên bất kỳ ứng dụng web SaaS, bảng điều khiển quản trị, công cụ nội bộ nào Các công ty đang tính phí 30 đô la/tháng cho các AI copilots được xây dựng dựa trên ý tưởng chính xác này. Đây là 3 dòng mã. Người dùng của bạn. Giao diện của bạn. Lớp AI copilot cho mọi ứng dụng web vừa được mã nguồn mở. 1.6K sao. 100% Mã nguồn mở. (Link trong các bình luận)