Nghiên cứu mới cho thấy AI vẫn chưa sẵn sàng thay thế công việc văn phòng

Gần hai năm đã trôi qua kể từ khi CEO Microsoft Satya Nadella dự đoán rằng AI tạo sinh sẽ sớm “thâu tóm” các công việc trí óc. Tuy nhiên, nếu nhìn vào thực tế tại các hãng luật hay ngân hàng đầu tư hiện nay, con người vẫn đang là lực lượng nắm quyền chủ đạo. Bất chấp những lời quảng bá rầm rộ về khả năng “lập luận” và “lập kế hoạch”, một nghiên cứu mới từ Mercor – công ty chuyên về dữ liệu huấn luyện AI – đã chỉ ra lý do rất rõ ràng vì sao cuộc cách mạng robot vẫn chưa thể xảy ra: AI không xử lý nổi sự phức tạp và lộn xộn của công việc thực tế.

Mercor vừa công bố một thang đo mới có tên APEX-Agents, và kết quả của nó thực sự khắc nghiệt. Thay vì yêu cầu AI làm thơ hay giải toán như các bài kiểm tra quen thuộc, APEX-Agents sử dụng những yêu cầu thật đến từ luật sư, chuyên gia tư vấn và nhân viên ngân hàng. Các mô hình phải hoàn thành trọn vẹn những nhiệm vụ nhiều bước, đòi hỏi liên tục chuyển đổi giữa các loại thông tin khác nhau.

Kết quả cho thấy ngay cả những mô hình AI mạnh nhất trên thị trường hiện nay – như Gemini 3 Flash hay GPT-5.2 – cũng không đạt nổi mức chính xác 25%. Gemini dẫn đầu với 24%, GPT-5.2 theo sát phía sau với 23%, trong khi phần lớn các mô hình khác chỉ quanh quẩn ở mức hơn 10%.

Theo CEO Mercor, Brendan Foody, vấn đề không nằm ở trí thông minh thuần túy mà nằm ở khả năng hiểu và xử lý ngữ cảnh. Trong môi trường làm việc thực tế, câu trả lời không bao giờ có sẵn. Một luật sư có thể phải kiểm tra tin nhắn Slack, đọc tài liệu PDF về chính sách, xem bảng tính rồi tổng hợp tất cả để trả lời một câu hỏi liên quan đến tuân thủ GDPR.

Con người làm việc đó một cách tự nhiên. AI thì không. Khi bị buộc phải tìm kiếm và kết nối thông tin từ nhiều nguồn rời rạc, các mô hình AI thường rơi vào trạng thái bối rối, trả lời sai, hoặc thậm chí “bỏ cuộc” hoàn toàn.

Với những ai đang lo lắng về nguy cơ mất việc, kết quả nghiên cứu này phần nào mang lại sự yên tâm. Ở thời điểm hiện tại, AI hoạt động giống một thực tập sinh thiếu ổn định hơn là một chuyên gia dày dạn kinh nghiệm: chỉ làm đúng khoảng một phần tư số nhiệm vụ được giao.

Tuy vậy, tốc độ tiến bộ của AI vẫn rất đáng chú ý. Brendan Foody cho biết chỉ một năm trước, các mô hình này mới đạt độ chính xác khoảng 5–10%, còn hiện tại đã chạm mốc 24%. Điều đó có nghĩa là dù chưa thể “cầm lái”, AI đang học cách điều khiển rất nhanh, nhanh hơn nhiều so với kỳ vọng ban đầu. Nhưng ít nhất ở thời điểm này, cuộc cách mạng “công việc trí óc” vẫn phải tạm hoãn, cho đến khi AI thực sự học được cách xử lý đa nhiệm như con người.

Thứ Ba, 03/02/2026 09:30
31 👨
Xác thực tài khoản!

Theo Nghị định 147/2024/ND-CP, bạn cần xác thực tài khoản trước khi sử dụng tính năng này. Chúng tôi sẽ gửi mã xác thực qua SMS hoặc Zalo tới số điện thoại mà bạn nhập dưới đây:

Số điện thoại chưa đúng định dạng!
Số điện thoại này đã được xác thực!
Bạn có thể dùng Sđt này đăng nhập tại đây!
Lỗi gửi SMS, liên hệ Admin
0 Bình luận
Sắp xếp theo
    ❖ Chuyện công nghệ