OpenAI đã chính thức công bố Operator, bước tiến đầu tiên của hãng vào lĩnh vực các tác nhân AI (AI agent) có khả năng tự động hóa các tác vụ phức tạp và thực hiện nhiều hành động khác nhau trên các trang web, giúp người dùng tiết kiệm đáng kể thời gian. Đây là một động thái quan trọng trong việc hiện thực hóa tiềm năng của trí tuệ nhân tạo trong cuộc sống hàng ngày, đặc biệt là trong việc quản lý các công việc trực tuyến.
Operator Hoạt Động Như Thế Nào?
Operator được thiết kế để xử lý hàng loạt tác vụ đa dạng, bao gồm đặt bàn nhà hàng, mua sắm trực tuyến hay đặt vé du lịch. Điều đáng chú ý là đối với các hành động nhạy cảm, Operator có thể yêu cầu sự chấp thuận của người dùng. OpenAI giải thích rõ: “Trên các trang web đặc biệt nhạy cảm, như email, Operator yêu cầu sự giám sát chủ động của người dùng, đảm bảo họ có thể trực tiếp phát hiện và xử lý bất kỳ lỗi tiềm ẩn nào mà mô hình có thể mắc phải.” Đây cũng là lý do tại sao Operator hiện chưa hỗ trợ gửi email hay xóa sự kiện trong lịch, mặc dù OpenAI đang nỗ lực phát triển tính năng này.
Các tác vụ tự động hóa hiện tại thuộc các danh mục như Giao hàng, Ăn uống, Mua sắm và Du lịch. Trong quá trình Operator thực hiện tự động hóa, các giải thích về hành động cụ thể đang được thực hiện sẽ hiển thị trên màn hình, giúp người dùng theo dõi và hiểu rõ quy trình.
Giao diện OpenAI Operator đang thực hiện tác vụ đặt vé trên TripAdvisor
Thay vì sử dụng các API dành cho nhà phát triển để kết nối với các ứng dụng web, mô hình Computer-Using Agent (CUA) của Operator đã được huấn luyện để tương tác trực tiếp với giao diện người dùng của các trang web thông qua trình duyệt web chuyên dụng của riêng nó. OpenAI khẳng định Operator tuân thủ các điều khoản dịch vụ của các đối tác ra mắt ban đầu như DoorDash, eBay, Instacart, Priceline, StubHub và Uber.
Giới Hạn và Hạn Chế Của OpenAI Operator
Mặc dù mang lại nhiều tiềm năng, nhà sản xuất ChatGPT không kỳ vọng mô hình CUA sẽ hoạt động đáng tin cậy 100% mọi lúc. Tài liệu hỗ trợ của OpenAI thừa nhận điều này, nêu rõ: “Operator không thể xử lý đáng tin cậy nhiều tác vụ phức tạp hoặc chuyên biệt.” Một số ví dụ bao gồm “tạo bản trình chiếu chi tiết, quản lý hệ thống lịch phức tạp, hoặc tương tác với các giao diện web tùy chỉnh cao hoặc không theo tiêu chuẩn.”
Operator cũng có những nhược điểm khác, bao gồm giới hạn tốc độ theo tác vụ và giới hạn sử dụng tổng thể được đặt lại hàng ngày. Hơn nữa, nó có thể thất bại trong một số tác vụ, như giải mã CAPTCHA, và gặp khó khăn khi điều hướng các giao diện web phức tạp. Những hạn chế này cho thấy công nghệ AI agent vẫn đang trong giai đoạn phát triển ban đầu.
Khả Năng Tiếp Cận và Kế Hoạch Ra Mắt
Hiện tại, Operator đang được cung cấp dưới dạng bản xem trước nghiên cứu thông qua operator.chatgpt.com dành cho những người đăng ký ChatGPT Pro tại Hoa Kỳ, với mức phí hàng tháng là 200 USD. Những người dùng ở các gói Plus, Team và Enterprise sẽ cần kiên nhẫn chờ đợi, vì OpenAI đang nỗ lực đưa Operator đến với các cấp độ này. Tính năng này sẽ “sớm” mở rộng sang các ngôn ngữ và quốc gia khác. Tuy nhiên, CEO Sam Altman cho biết “Châu Âu sẽ mất một thời gian.”
Cuộc Đua AI Agent: OpenAI và Các Đối Thủ
Trước Operator, OpenAI từng triển khai các khả năng tự động hóa đơn giản hơn trong ChatGPT, như đặt lời nhắc nhở. Tuy nhiên, Operator là nỗ lực đầu tiên của hãng trong việc phát triển một AI agent hoàn chỉnh. Đối thủ Google cũng đã giới thiệu AI agent của riêng mình vào tháng 11 năm 2024, Project Mariner, dưới dạng một tiện ích mở rộng thử nghiệm cho Chrome có thể tự động điền biểu mẫu web, nhấp vào nút, di chuyển con trỏ chuột và nhiều hơn nữa.
Các AI agent được xem là bước tiến logic tiếp theo trong cuộc cách mạng AI. Những công nghệ này hứa hẹn sẽ sử dụng web thay mặt người dùng dựa trên yêu cầu, giúp họ không phải tương tác trực tiếp với các trang web. Tuy nhiên, tiện ích của các AI agent hiện tại vẫn còn nhiều nghi vấn, vì chúng đang trong giai đoạn thử nghiệm và sẽ chưa được sử dụng rộng rãi cho đến khi độ tin cậy được cải thiện đáng kể.
Kết luận:
OpenAI Operator đánh dấu một cột mốc quan trọng trong sự phát triển của các AI agent, mở ra kỷ nguyên mới cho việc tự động hóa tác vụ trực tuyến. Mặc dù vẫn còn những hạn chế và đang trong giai đoạn thử nghiệm, tiềm năng của Operator trong việc đơn giản hóa và tối ưu hóa các công việc hàng ngày trên web là rất lớn. Hãy tiếp tục theo dõi thuthuatso.net để cập nhật những thông tin mới nhất về công nghệ AI đột phá này và cách nó có thể thay đổi cách bạn tương tác với thế giới số!