OpenAI vừa công bố một tính năng hoàn toàn mới mang tên ChatGPT Agent, cho phép trí tuệ nhân tạo (AI) không chỉ trả lời câu hỏi như truyền thống, mà còn chủ động thực hiện các tác vụ phức tạp thay người dùng trên máy tính.
Theo giới thiệu từ OpenAI, ChatGPT Agent là “AI biết hành động”, có thể kết nối với các ứng dụng, duyệt web, mở file, tạo slide, gửi email, viết mã, và thậm chí lên lịch họp, đặt chỗ đậu xe… nhờ khả năng thao tác trực tiếp thông qua một môi trường máy tính ảo do OpenAI kiểm soát.
ChatGPT Agent được tích hợp với các nền tảng phổ biến như Google Drive, Calendar, Gmail, GitHub, Microsoft 365, Salesforce… nhờ hệ thống connector. Người dùng chỉ cần mô tả yêu cầu, ví dụ: “Tạo slide thuyết trình về xu hướng năng lượng sạch và gửi qua email cho nhóm marketing”, phần còn lại do AI xử lý.
Trong một demo cụ thể, ChatGPT Agent mất khoảng 40 phút để tự tìm kiếm thông tin, tạo báo cáo, thiết kế file PowerPoint, gửi email và chốt lịch họp – toàn bộ mà không cần người dùng chạm chuột.
Dù ấn tượng về chức năng, OpenAI nhấn mạnh ChatGPT Agent đang ở giai đoạn thử nghiệm giới hạn, và chưa phù hợp cho các tác vụ “liên quan tới dữ liệu nhạy cảm hoặc có rủi ro cao” như tài chính, pháp lý hay y tế.
Để đảm bảo an toàn, ChatGPT Agent hoạt động trong “Watch Mode” – chỉ chạy khi người dùng mở tab trình duyệt. Nếu rời khỏi màn hình, quá trình tự động sẽ tạm dừng. Ngoài ra, mọi hành động gửi email, chỉnh sửa hệ thống đều phải có sự xác nhận trực tiếp từ người dùng.
Hiện tại, ChatGPT Agent chỉ khả dụng cho người dùng gói ChatGPT Pro, sau đó sẽ mở rộng sang các gói Plus, Team và Enterprise trong vài tháng tới. ChatGPT Agent chưa được triển khai tại khu vực Châu Âu do vướng mắc về quy định dữ liệu.
Ảnh: OpenAI