Anthropic hôm nay đã công bố thế hệ mới của các mô hình Claude: Claude Opus 4 và Claude Sonnet 4 . Công ty tự tin tuyên bố Claude Opus 4 — phiên bản cao cấp nhất — là mô hình lập trình mạnh nhất thế giới , vượt trội trong các quy trình tự động (agentic workflows) và khả năng xử lý tác vụ phức tạp, dài hạn. Trong khi đó, Claude Sonnet 4 được cải thiện hiệu suất về lập trình và tư duy logic so với phiên bản Claude Sonnet 3.7 trước đó.
Theo bảng so sánh dưới đây, Claude Sonnet 4 đạt 72.7% trên SWE-bench Verified — tiêu chuẩn đánh giá phổ biến cho khả năng lập trình tự động — mức cao nhất từ trước đến nay. Với sức mạnh này, GitHub của Microsoft đã thông báo Sonnet 4 sẽ là mô hình cốt lõi cho agent lập trình mới trong GitHub Copilot .
Anthropic mô tả hiệu suất của các mô hình mới như sau:
Những mô hình này thúc đẩy chiến lược AI của khách hàng trên mọi mặt: Opus 4 phá vỡ giới hạn trong lập trình, nghiên cứu, viết lách và khám phá khoa học, trong khi Sonnet 4 mang hiệu suất đỉnh cao vào các tác vụ hàng ngày như một bản nâng cấp tức thì từ Sonnet 3.7.

Cả hai mô hình Claude 4 mới đều hỗ trợ hai chế độ:
- Phản hồi gần như tức thì
- Suy nghĩ mở rộng (dành cho các bài toán đòi hỏi phân tích sâu)
Lập trình viên có thể chuyển đổi giữa hai chế độ tùy theo nhu cầu.
Người dùng miễn phí của Claude chỉ được truy cập mô hình Sonnet 4. Trong khi đó, người dùng các gói Pro, Max, Team và Enterprise có quyền truy cập cả hai mô hình và chế độ suy nghĩ mở rộng. Anthropic cũng cho biết các mô hình này đã có mặt trên Anthropic API , Amazon Bedrock và Google Cloud's Vertex AI . Đáng chú ý, Anthropic không giảm giá cho các mô hình mới:
- Claude Opus 4: $15/1 triệu token đầu vào và $75/1 triệu token đầu ra
- Claude Sonnet 4: $3/1 triệu token đầu vào và $15/1 triệu token đầu ra
Cùng với các mô hình mới, Anthropic công bố bản cập nhật cho Claude Code với hỗ trợ tác vụ nền qua GitHub Actions , tích hợp native với VS Code và JetBrains , cùng nhiều tính năng khác. Ngoài ra, Anthropic API được bổ sung công cụ thực thi code (code execution tool), kết nối MCP, Files API và khả năng cache prompt lên đến 1 giờ .