Claude Opus 4.5 ra mắt: Mô hình lập trình mạnh nhất thế giới, vượt Gemini và GPT-5.1

Nguyễn Đạt

Anthropic vừa ra mắt Claude Opus 4.5, phiên bản model mới nhất được thiết kế cho lập trình, tác vụ tác nhân (agents) và sử dụng máy tính nâng cao. Hãng tự tin tuyên bố đây là model lập trình tốt nhất thế giới hiện nay, dựa trên kết quả từ chuẩn đánh giá SWE-bench Verified. Trong nhiều tác vụ thực tế khác như nghiên cứu chuyên sâu, chỉnh sửa slide hay bảng tính, Opus 4.5 cũng cho thấy hiệu năng vượt trội hơn Sonnet 4.5.

Theo bảng điểm được công bố, Claude Opus 4.5 đạt mức 80,9% ở SWE-Bench Verified — cao nhất từ trước tới nay, vượt qua cả Gemini 3.0 và GPT-5.1-Codex-Max. Khi tuyển kỹ sư, Anthropic sử dụng một bài thi về nhà khá khó, đồng thời xem đây là bài benchmark nội bộ cho các model mới. Hãng cho biết Opus 4.5 đã đạt điểm cao hơn bất kỳ ứng viên kỹ sư nào từng làm bài trong giới hạn 2 giờ.

Model mới này hiện đã có mặt trên tất cả ứng dụng Claude, API và ba nền tảng đám mây lớn: Azure, GCP và AWS. Anthropic đồng thời giảm giá API, đưa mức phí xuống còn 5 USD / 25 USD cho mỗi triệu token (đầu vào/đầu ra), giúp nhiều người dùng hơn có cơ hội tiếp cận dòng model cao cấp Opus.

Ngoài hiệu năng được cải thiện, Claude Opus 4.5 còn vận hành tiết kiệm hơn đáng kể. Model sử dụng ít token hơn nhiều so với các phiên bản trước, kể cả Opus 4.1, nhưng vẫn tạo ra kết quả tương đương hoặc tốt hơn. Bản chất, Opus 4.5 giảm việc suy luận vòng vo, hạn chế lặp lại và tránh tư duy quá dài dòng. Ở mức "Medium" của tính năng reasoning effort, Opus 4.5 vượt Sonnet 4.5 trên SWE-bench Verified dù dùng ít hơn 76% token đầu ra. Ở mức "High", Opus 4.5 vẫn hơn Sonnet 4.5 tới 4,3% trong khi tiết kiệm 48% token.

Tương tự OpenAI, Anthropic bổ sung tham số reasoning effort vào API, cho phép lập trình viên cân chỉnh giữa tốc độ và khả năng suy luận. Với Opus 4.5, Claude Code cũng được nâng cấp: model có thể lên kế hoạch chính xác hơn, đặt câu hỏi làm rõ ngay từ đầu, sau đó tạo một file plan.md dễ chỉnh sửa trước khi bắt tay vào thực thi nhiệm vụ.

Thứ Ba, 25/11/2025 11:30

5 ★ 1 👨 1.682

#Gemini #Claude

Bạn nên đọc

Xác thực tài khoản!

Theo Nghị định 147/2024/ND-CP, bạn cần xác thực tài khoản trước khi sử dụng tính năng này. Chúng tôi sẽ gửi mã xác thực qua SMS hoặc Zalo tới số điện thoại mà bạn nhập dưới đây:

Số điện thoại chưa đúng định dạng!

0 Bình luận

Sắp xếp theo

Xóa Đăng nhập để Gửi

Claude

Giấy phép Mạng Xã Hội số 362/GP-BTTTT. Cơ quan chủ quản: CÔNG TY CỔ PHẦN MẠNG TRỰC TUYẾN META. Địa chỉ: 56 Duy Tân, Phường Cầu Giấy, Hà Nội. Điện thoại: 024 2242 6188. Email: info@meta.vn. Chịu trách nhiệm nội dung: Lê Ngọc Lam.

Claude Opus 4.5 ra mắt: Mô hình lập trình mạnh nhất thế giới, vượt Gemini và GPT-5.1

Nguyễn Đạt

Bạn nên đọc

Tại sao nên thay thế Claude Code bằng Codex?

Những tính năng hầu hết người đăng ký Claude Pro chưa bao giờ thử

Khi nào nên dùng ChatGPT, Claude hay Gemini?

Cách tạo một Claude skill có thể biến bất kỳ tài liệu nào thành sơ đồ tư duy

Sự khác biệt giữa Claude Code Skills và các lệnh slash

Claude đã giải phóng 143GB ổ C: như thế nào?

ChatGPT ghi nhớ mọi thứ về bạn: Đây là cách để duy trì quyền kiểm soát!

14 lựa chọn thay thế ChatGPT