Claude Opus 4.5 ra mắt: Mô hình lập trình mạnh nhất thế giới, vượt Gemini và GPT-5.1

Anthropic vừa ra mắt Claude Opus 4.5, phiên bản model mới nhất được thiết kế cho lập trình, tác vụ tác nhân (agents) và sử dụng máy tính nâng cao. Hãng tự tin tuyên bố đây là model lập trình tốt nhất thế giới hiện nay, dựa trên kết quả từ chuẩn đánh giá SWE-bench Verified. Trong nhiều tác vụ thực tế khác như nghiên cứu chuyên sâu, chỉnh sửa slide hay bảng tính, Opus 4.5 cũng cho thấy hiệu năng vượt trội hơn Sonnet 4.5.

Theo bảng điểm được công bố, Claude Opus 4.5 đạt mức 80,9% ở SWE-Bench Verified — cao nhất từ trước tới nay, vượt qua cả Gemini 3.0 và GPT-5.1-Codex-Max. Khi tuyển kỹ sư, Anthropic sử dụng một bài thi về nhà khá khó, đồng thời xem đây là bài benchmark nội bộ cho các model mới. Hãng cho biết Opus 4.5 đã đạt điểm cao hơn bất kỳ ứng viên kỹ sư nào từng làm bài trong giới hạn 2 giờ.

Model mới này hiện đã có mặt trên tất cả ứng dụng Claude, API và ba nền tảng đám mây lớn: Azure, GCP và AWS. Anthropic đồng thời giảm giá API, đưa mức phí xuống còn 5 USD / 25 USD cho mỗi triệu token (đầu vào/đầu ra), giúp nhiều người dùng hơn có cơ hội tiếp cận dòng model cao cấp Opus.

Ngoài hiệu năng được cải thiện, Claude Opus 4.5 còn vận hành tiết kiệm hơn đáng kể. Model sử dụng ít token hơn nhiều so với các phiên bản trước, kể cả Opus 4.1, nhưng vẫn tạo ra kết quả tương đương hoặc tốt hơn. Bản chất, Opus 4.5 giảm việc suy luận vòng vo, hạn chế lặp lại và tránh tư duy quá dài dòng. Ở mức "Medium" của tính năng reasoning effort, Opus 4.5 vượt Sonnet 4.5 trên SWE-bench Verified dù dùng ít hơn 76% token đầu ra. Ở mức "High", Opus 4.5 vẫn hơn Sonnet 4.5 tới 4,3% trong khi tiết kiệm 48% token.

Tương tự OpenAI, Anthropic bổ sung tham số reasoning effort vào API, cho phép lập trình viên cân chỉnh giữa tốc độ và khả năng suy luận. Với Opus 4.5, Claude Code cũng được nâng cấp: model có thể lên kế hoạch chính xác hơn, đặt câu hỏi làm rõ ngay từ đầu, sau đó tạo một file plan.md dễ chỉnh sửa trước khi bắt tay vào thực thi nhiệm vụ.

Thứ Ba, 25/11/2025 11:30
51 👨 1.284
Xác thực tài khoản!

Theo Nghị định 147/2024/ND-CP, bạn cần xác thực tài khoản trước khi sử dụng tính năng này. Chúng tôi sẽ gửi mã xác thực qua SMS hoặc Zalo tới số điện thoại mà bạn nhập dưới đây:

Số điện thoại chưa đúng định dạng!
Số điện thoại này đã được xác thực!
Bạn có thể dùng Sđt này đăng nhập tại đây!
Lỗi gửi SMS, liên hệ Admin
0 Bình luận
Sắp xếp theo