OpenAI giới thiệu ChatGPT agent có thể “tự sử dụng máy tính ảo” để hoàn thành tác vụ phức tạp

OpenAI đã cung cấp hai loại agent riêng biệt: Operator (có thể duyệt web và thực hiện độc lập các tác vụ) và Deep Research (chuyên tổng hợp khối lượng lớn thông tin trực tuyến). Hôm nay, công ty tiếp tục công bố ChatGPT agent, một AI mới kết hợp khả năng duyệt web của Operator, thế mạnh nghiên cứu của Deep Research và kỹ năng hội thoại của ChatGPT thành một agent mạnh mẽ duy nhất.

ChatGPT agent giờ đây có thể thực hiện công việc bằng cách sử dụng máy tính ảo riêng của mình. Dựa trên truy vấn người dùng, nó có thể điều hướng website, lọc kết quả, nhắc người dùng đăng nhập khi được yêu cầu, chạy code, thực hiện phân tích, tạo bảng tính và PowerPoint, và hơn thế nữa.

ChatGPT agent sẽ có quyền truy cập vào các công cụ sau để hoàn thành tác vụ được giao bởi người dùng:

  • Một trình duyệt web trực quan tương tác với web thông qua GUI
  • Một trình duyệt dựa trên văn bản cho các truy vấn web đơn giản dựa trên lý luận
  • Một terminal
  • Truy cập API trực tiếp
  • Khả năng kết nối với ChatGPT connectors.

Vì ChatGPT agent thực hiện tất cả công việc sử dụng máy tính ảo riêng, nó sẽ có tất cả ngữ cảnh cần thiết để hoàn thành tác vụ. Ví dụ: agent có thể truy cập website bằng trình duyệt, tải xuống tệp từ website, thao tác cùng tệp đó bằng cách chạy lệnh trong terminal, và sau đó xem đầu ra trở lại trong trình duyệt trực quan.

OpenAI tuyên bố rằng ChatGPT agent đạt hiệu suất state-of-the-art (SOTA) trên các đánh giá khác nhau đo lường khả năng duyệt web và hoàn thành tác vụ thực tế. Dưới đây là một số điểm nổi bật:

  • Humanity’s Last Exam: ChatGPT agent đạt điểm pass@1 SOTA mới ở mức 41.6. Khi chạy tới 8 lần thử cùng lúc và chọn lần thử có độ tự tin tự báo cáo cao nhất, điểm số tăng lên 44.4.
  • FrontierMath: ChatGPT agent đạt độ chính xác 27.4%.
  • Benchmark nội bộ của OpenAI (đánh giá hiệu suất mô hình trên các tác vụ công việc tri thức phức tạp, có giá trị kinh tế): Đầu ra của ChatGPT agent tương đương hoặc tốt hơn con người trong khoảng một nửa trường hợp.
  • DSBench⁠: ChatGPT agent vượt trội hiệu suất con người với biên độ đáng kể trên các tác vụ khoa học dữ liệu.
  • SpreadsheetBench: ChatGPT agent đạt 45.5%, so với 20.0% của Copilot in Excel.
  • BrowseComp⁠: ChatGPT agent thiết lập SOTA mới với 68.9%.
  • WebArena: ChatGPT agent đạt 65.4%.

ChatGPT agent hiện có sẵn trong menu công cụ ChatGPT với chế độ 'agent mode' mới. Khi agent đang thực hiện tác vụ, người dùng có thể tìm thấy tường thuật trên màn hình; họ cũng có thể ngắt và kiểm soát trình duyệt bất cứ khi nào cần.

ChatGPT agent sẽ sớm khả dụng cho tất cả người dùng ChatGPT Pro. Người dùng ChatGPT Plus và Team sẽ được truy cập trong vài ngày tới, trong khi người dùng Enterprise và Education sẽ phải chờ thêm vài tuần. Người dùng ChatGPT Pro sẽ có giới hạn 400 tin nhắn mỗi tháng với agent, các gói người dùng trả phí khác chỉ nhận được 40 tin nhắn hàng tháng. Tuy nhiên, người dùng có thể mua thêm lượt sử dụng agent bằng các tùy chọn dựa trên tín dụng linh hoạt.

Thứ Sáu, 18/07/2025 14:15
31 👨 117
Xác thực tài khoản!

Theo Nghị định 147/2024/ND-CP, bạn cần xác thực tài khoản trước khi sử dụng tính năng này. Chúng tôi sẽ gửi mã xác thực qua SMS hoặc Zalo tới số điện thoại mà bạn nhập dưới đây:

Số điện thoại chưa đúng định dạng!
Số điện thoại này đã được xác thực!
Bạn có thể dùng Sđt này đăng nhập tại đây!
Lỗi gửi SMS, liên hệ Admin
0 Bình luận
Sắp xếp theo
    ❖ Chuyện công nghệ