Google công bố Gemini 2.5 Pro Deep Think, đánh bại các mô hình o3 và o4 của OpenAI

Tại Google I/O 2025, Google đã công bố một số bản cập nhật cho dòng mô hình Gemini 2.5. Điểm nổi bật chính là chế độ Gemini 2.5 Pro Deep Think, được cho là đánh bại các mô hình dòng o3 và o4 mới nhất của OpenAI trong các benchmark AI phổ biến.

Google không công bố bất kỳ bản cập nhật nào cho mô hình Gemini 2.5 Pro vì nó vừa nhận được bản cập nhật quan trọng vào đầu tháng này. Tuy nhiên, chế độ suy luận nâng cao mới, có tên là Deep Think, sẽ đưa khả năng của mô hình 2.5 Pro lên một tầm cao mới. Deep Think sẽ sử dụng các kỹ thuật nghiên cứu mới để xem xét nhiều giả thuyết trước khi phản hồi.

Google đã chia sẻ 3 benchmark sau cho 2.5 Pro Deep Think:

  • 49,4% trong benchmark toán học USAMO 2025.
  • 80,4% trong benchmark mã hóa cấp độ cạnh tranh LiveCodeBench.
  • 84,0% trong benchmark suy luận đa phương thức MMMU.

Tất cả các điểm số trên đều là SOTA mới, thậm chí còn đánh bại cả những mô hình dòng o3 và o4 mới nhất của OpenAI. 2.5 Pro Deep Think sẽ có sẵn cho những người thử nghiệm đáng tin cậy thông qua API Gemini ngay bây giờ.

Google cũng đã công bố bản cập nhật mới nhất cho Gemini 2.5 Flash, mô hình giá rẻ của hãng. Mô hình mới này hoạt động tốt hơn phiên bản trước trong mọi benchmark và hiện có sẵn để xem trước trong Google AI Studio dành cho nhà phát triển, trong Vertex AI dành cho doanh nghiệp và trong ứng dụng Gemini. Google sẽ phát hành phiên bản sản xuất của 2.5 Flash vào tháng 6.

Cùng với các bản cập nhật mô hình, Google đã công bố những cải tiến sau đây đối với trải nghiệm dành cho nhà phát triển Gemini:

  • Bản xem trước API trực tiếp mới hỗ trợ nhiều loa, cho phép chuyển văn bản thành giọng nói bằng hai giọng nói thông qua đầu ra âm thanh gốc, v.v...
  • SDK gốc hỗ trợ các định nghĩa Model Context Protocol (MCP) trong API Gemini để tích hợp dễ dàng hơn với những công cụ nguồn mở.
  • Gemini 2.5 Pro với "Thinking budget" (một khái niệm ám chỉ cách tiếp cận lập ngân sách dựa trên sự suy nghĩ sâu sắc, phân tích kỹ lưỡng và đưa ra quyết định dựa trên các dữ liệu và thông tin có sẵn) sẽ có sẵn để sử dụng sản xuất ổn định trong những tuần tới.
  • Khả năng sử dụng máy tính của Project Mariner sẽ có trong API Gemini và Vertex AI.
    2.5 Pro. Flash hiện sẽ bao gồm các bản tóm tắt suy nghĩ trong Gemini API và trong Vertex AI.

Bạn có thể tìm hiểu thêm về các bản cập nhật mô hình Gemini 2.5 tại đây.

Thứ Tư, 21/05/2025 10:29
51 👨 489
Xác thực tài khoản!

Theo Nghị định 147/2024/ND-CP, bạn cần xác thực tài khoản trước khi sử dụng tính năng này. Chúng tôi sẽ gửi mã xác thực qua SMS hoặc Zalo tới số điện thoại mà bạn nhập dưới đây:

Số điện thoại chưa đúng định dạng!
Số điện thoại này đã được xác thực!
Bạn có thể dùng Sđt này đăng nhập tại đây!
Lỗi gửi SMS, liên hệ Admin
0 Bình luận
Sắp xếp theo
❖
    ❖ Gemini
    Chia sẻ
    Chia sẻ FacebookChia sẻ Twitter
    Đóng