Xiaomi gây bất ngờ với MiMo-V2-Pro: 1 nghìn tỷ tham số, hiệu năng tiệm cận GPT-5.2 nhưng rẻ hơn nhiều

Hãng công nghệ Trung Quốc Xiaomi vừa khiến cộng đồng AI toàn cầu bất ngờ khi công bố MiMo-V2-Pro — một mô hình nền tảng quy mô tới 1 nghìn tỷ tham số.

Theo công bố, hiệu năng của mô hình này đang tiến gần tới các hệ thống hàng đầu từ OpenAI và Anthropic, nhưng chi phí sử dụng qua API chỉ bằng khoảng 1/6 đến 1/7. Ngoài ra, mô hình được tối ưu để xử lý dưới 256.000 token mỗi lượt tương tác, giúp giảm đáng kể chi phí vận hành.

Dự án do Fuli Luo — người từng tham gia phát triển DeepSeek R1 — dẫn dắt. Ông gọi đây là một “cuộc phục kích thầm lặng” vào thị trường AI toàn cầu. Xiaomi cũng hé lộ kế hoạch mở mã nguồn một phiên bản của mô hình khi hệ thống đủ ổn định.

Từ chatbot sang “AI hành động”

Khác với nhiều mô hình tập trung vào hội thoại, MiMo-V2-Pro hướng tới “không gian hành động” — nơi AI không chỉ tạo nội dung mà còn trực tiếp thực hiện các tác vụ phức tạp.

Đây là bước chuyển từ AI dạng trò chuyện sang AI dạng agent, có thể vận hành như một “bộ não” cho các hệ thống lớn, từ chuỗi cung ứng đến các agent lập trình tự động.

Nền tảng này cũng phản ánh thế mạnh lâu năm của Xiaomi trong phần cứng và hệ sinh thái IoT. Sau khi mở rộng sang xe điện với các mẫu như Xiaomi SU7, hãng đang dần xây dựng một hệ sinh thái tích hợp từ thiết bị, phần mềm đến AI.

Một trong những thách thức lớn của AI hiện nay là cân bằng giữa khả năng suy luận và chi phí xử lý. MiMo-V2-Pro giải quyết bài toán này bằng kiến trúc “sparse” — dù có 1 nghìn tỷ tham số, nhưng chỉ khoảng 42 tỷ tham số được kích hoạt trong mỗi lần xử lý.

Nhờ đó, mô hình vừa mạnh hơn đáng kể so với phiên bản trước (MiMo-V2-Flash), vừa tiết kiệm tài nguyên.

Bên cạnh đó, Xiaomi sử dụng cơ chế Hybrid Attention với tỷ lệ 7:1 để xử lý ngữ cảnh dài tới 1 triệu token. Cách tiếp cận này giúp mô hình “quét nhanh” phần lớn dữ liệu, đồng thời tập trung xử lý sâu vào phần quan trọng nhất — giống như một nhà nghiên cứu lọc thông tin trong thư viện khổng lồ.

Một lớp Multi-Token Prediction cũng được bổ sung, cho phép AI dự đoán nhiều token cùng lúc, từ đó giảm đáng kể độ trễ khi xử lý.

Hiệu năng thực tế và kiểm chứng độc lập

Theo dữ liệu từ Xiaomi, MiMo-V2-Pro thể hiện tốt trong các tác vụ thực tế hơn là benchmark lý thuyết.

Trên bài kiểm tra GDPval-AA — đánh giá khả năng làm việc của AI trong môi trường thực — mô hình đạt điểm Elo 1426, vượt qua nhiều đối thủ Trung Quốc như GLM-5 và Kimi K2.5.

Tổ chức đánh giá độc lập Artificial Analysis cũng xác nhận kết quả này, xếp MiMo-V2-Pro vào top 10 toàn cầu về năng lực AI, ngang nhóm với GPT-5.2 Codex và vượt Grok 4.20 Beta.

Một số chỉ số đáng chú ý cho thấy bước tiến rõ rệt:

  • Tỷ lệ “hallucination” giảm còn 30% (so với 48% trước đó)
  • Khả năng suy luận ngắn gọn, hiệu quả hơn với lượng token thấp hơn đáng kể
  • Hiệu năng lập trình cao, đạt 86,7 điểm trên Terminal-Bench 2.0

Lợi thế lớn về chi phí

Điểm đáng chú ý nhất của MiMo-V2-Pro nằm ở tỷ lệ “giá/hiệu năng”.

Theo Artificial Analysis, chi phí chạy toàn bộ bài test chỉ khoảng 348 USD, trong khi GPT-5.2 tốn hơn 2.300 USD và Claude Opus 4.6 gần 2.500 USD.

Điều này khiến mô hình trở thành lựa chọn hấp dẫn cho doanh nghiệp muốn triển khai AI quy mô lớn mà vẫn kiểm soát chi phí.

Ngoài ra, cửa sổ ngữ cảnh 1 triệu token cho phép xử lý toàn bộ codebase hoặc tài liệu doanh nghiệp trong một lần, rất phù hợp với các hệ thống RAG hoặc multi-agent.

MiMo-V2-Pro mở ra khả năng xây dựng các hệ thống AI phức tạp hơn, không chỉ dừng ở tự động hóa mà còn có thể giải quyết bài toán nhiều bước.

Tuy nhiên, chính khả năng “hành động” mạnh mẽ này cũng làm tăng rủi ro bảo mật. Việc AI có thể thao tác file, chạy lệnh hoặc truy cập hệ thống khiến nguy cơ tấn công prompt injection hoặc truy cập trái phép cao hơn.

Ngoài ra, do chưa mở toàn bộ trọng số mô hình, các doanh nghiệp cũng khó kiểm tra sâu ở cấp độ hệ thống — một yếu tố quan trọng trong các môi trường nhạy cảm.

Xiaomi đang định giá rất cạnh tranh để thu hút nhà phát triển:

  • Dưới 256K token: 1 USD / triệu token đầu vào, 3 USD / triệu token đầu ra
  • Từ 256K đến 1M token: 2 USD / triệu input, 6 USD / triệu output
  • Cache đọc rất rẻ, còn cache ghi tạm thời miễn phí

Hiện mô hình chỉ vận hành qua API riêng của Xiaomi và chưa hỗ trợ đa phương thức (multimodal). Tuy nhiên, hãng đã hé lộ phiên bản MiMo-V2-Omni trong tương lai.

Sự xuất hiện của MiMo-V2-Pro cho thấy một bước chuyển quan trọng của ngành AI. Cuộc đua giờ đây không còn xoay quanh việc mô hình nói hay đến đâu, mà là khả năng thực thi hành động.

Nếu xu hướng này tiếp tục, AI sẽ không chỉ là công cụ hỗ trợ, mà trở thành “tác nhân” trực tiếp tham gia vào quy trình vận hành của doanh nghiệp.

Chủ Nhật, 22/03/2026 12:18
31 👨
Xác thực tài khoản!

Theo Nghị định 147/2024/ND-CP, bạn cần xác thực tài khoản trước khi sử dụng tính năng này. Chúng tôi sẽ gửi mã xác thực qua SMS hoặc Zalo tới số điện thoại mà bạn nhập dưới đây:

Số điện thoại chưa đúng định dạng!
Số điện thoại này đã được xác thực!
Bạn có thể dùng Sđt này đăng nhập tại đây!
Lỗi gửi SMS, liên hệ Admin
0 Bình luận
Sắp xếp theo