Anthropic vừa chính thức giới thiệu mô hình ngôn ngữ lớn (LLM) mới nhất của mình: Claude Sonnet 4.6. Bản phát hành này được tung ra chỉ ít ngày sau khi hãng ra mắt Claude Opus 4.6 – dòng AI cao cấp nhất – vào ngày 5/2.
Theo Anthropic, “Claude Sonnet 4.6 là phiên bản Sonnet mạnh nhất từ trước đến nay.” Mô hình hiện hỗ trợ cửa sổ ngữ cảnh lên tới 1 triệu token (đang ở giai đoạn beta). Đáng chú ý, công ty cho biết Sonnet 4.6 đạt kết quả tốt trong các bài kiểm tra an toàn nội bộ, với tỷ lệ “ảo giác” thấp và hạn chế xu hướng xu nịnh (sycophancy) – hai vấn đề thường gặp ở các mô hình AI lớn.
Anthropic nhấn mạnh Sonnet 4.6 cải thiện đáng kể năng lực lập trình, vốn là một trong những lý do khiến Claude được cộng đồng developer ưa chuộng trong các tác vụ viết và tối ưu code.

Cách sử dụng Claude Sonnet 4.6
Claude Sonnet 4.6 hiện đã trở thành mô hình mặc định cho cả người dùng miễn phí và người dùng Pro trên nền tảng claude.ai và Claude Cowork. Bên cạnh đó, Anthropic cũng triển khai phiên bản này thông qua API và các nền tảng đám mây lớn.
Người dùng miễn phí sẽ bị giới hạn số lượt sử dụng tùy theo mức độ tải hệ thống tại từng thời điểm; hạn mức sẽ được đặt lại sau mỗi 5 giờ. Với nhu cầu cao hơn, người dùng có thể đăng ký gói Claude Pro với giá 20 USD/tháng hoặc 17 USD/tháng nếu thanh toán theo năm.
Nếu tích hợp qua API, mức giá của Sonnet 4.6 được giữ nguyên như phiên bản trước: 3 USD cho mỗi triệu token đầu vào và 15 USD cho mỗi triệu token đầu ra. Trong khi đó, Opus 4.6 có mức phí cao hơn, lần lượt là 5 USD và 25 USD cho mỗi triệu token.
Hiệu năng benchmark: Sonnet 4.6 gây bất ngờ
Theo kết quả thử nghiệm nội bộ từ Anthropic, Claude Sonnet 4.6 hiện là mô hình mạnh nhất của hãng cho các tác vụ phân tích tài chính mang tính “agentic” và xử lý công việc văn phòng. Đáng chú ý, nó vượt qua cả các đối thủ như Gemini 3 Pro của Google và GPT-5.2 của OpenAI trong những bài kiểm tra này.
Thậm chí, ở một số hạng mục, Sonnet 4.6 còn vượt qua chính Opus 4.6 – vốn được xem là dòng AI cao cấp và thông minh nhất của Anthropic.
Trong các thang đo tiêu chuẩn, Sonnet 4.6 đạt 89,9% ở GPQA Diamond, 58,3% ở ARC-AGI-2 và 89,3% ở MMMLU. Ở bài kiểm tra SWE-bench Verified – thước đo quan trọng cho năng lực xử lý tác vụ phần mềm – mô hình đạt 79,6%. Với Humanity’s Last Exam, Sonnet 4.6 ghi nhận 49% khi được phép sử dụng công cụ hỗ trợ và 33,2% nếu không dùng công cụ.
Theo công ty bảo hiểm ứng dụng AI Pace chia sẻ với VentureBeat, Sonnet 4.6 đạt điểm cao nhất trong số các mô hình Claude khi thử nghiệm trên bộ benchmark chuyên biệt cho tác vụ xử lý hệ thống bảo hiểm phức tạp.
Những kết quả này khá đáng chú ý, bởi thông thường dòng Opus mới là lựa chọn ưu tiên cho các bài toán suy luận phức tạp. Việc Sonnet 4.6 không chỉ tiệm cận mà còn vượt qua một số phiên bản Opus cho thấy Anthropic đang thu hẹp khoảng cách giữa hai dòng sản phẩm – trong khi vẫn giữ mức giá dễ tiếp cận hơn.
Học IT










Công nghệ
Microsoft Word 2013
Microsoft Word 2007
Microsoft Excel 2019
Microsoft Excel 2016
Microsoft PowerPoint 2019
Google Sheets
Lập trình Scratch
Bootstrap
Prompt
Ô tô, Xe máy