Xiaomi gây bất ngờ với MiMo-V2-Pro: 1 nghìn tỷ tham số, hiệu năng tiệm cận GPT-5.2 nhưng rẻ hơn nhiều

Phạm Hải

Hãng công nghệ Trung Quốc Xiaomi vừa khiến cộng đồng AI toàn cầu bất ngờ khi công bố MiMo-V2-Pro — một mô hình nền tảng quy mô tới 1 nghìn tỷ tham số.

Theo công bố, hiệu năng của mô hình này đang tiến gần tới các hệ thống hàng đầu từ OpenAI và Anthropic, nhưng chi phí sử dụng qua API chỉ bằng khoảng 1/6 đến 1/7. Ngoài ra, mô hình được tối ưu để xử lý dưới 256.000 token mỗi lượt tương tác, giúp giảm đáng kể chi phí vận hành.

Dự án do Fuli Luo — người từng tham gia phát triển DeepSeek R1 — dẫn dắt. Ông gọi đây là một “cuộc phục kích thầm lặng” vào thị trường AI toàn cầu. Xiaomi cũng hé lộ kế hoạch mở mã nguồn một phiên bản của mô hình khi hệ thống đủ ổn định.

Từ chatbot sang “AI hành động”

Khác với nhiều mô hình tập trung vào hội thoại, MiMo-V2-Pro hướng tới “không gian hành động” — nơi AI không chỉ tạo nội dung mà còn trực tiếp thực hiện các tác vụ phức tạp.

Đây là bước chuyển từ AI dạng trò chuyện sang AI dạng agent, có thể vận hành như một “bộ não” cho các hệ thống lớn, từ chuỗi cung ứng đến các agent lập trình tự động.

Nền tảng này cũng phản ánh thế mạnh lâu năm của Xiaomi trong phần cứng và hệ sinh thái IoT. Sau khi mở rộng sang xe điện với các mẫu như Xiaomi SU7, hãng đang dần xây dựng một hệ sinh thái tích hợp từ thiết bị, phần mềm đến AI.

Một trong những thách thức lớn của AI hiện nay là cân bằng giữa khả năng suy luận và chi phí xử lý. MiMo-V2-Pro giải quyết bài toán này bằng kiến trúc “sparse” — dù có 1 nghìn tỷ tham số, nhưng chỉ khoảng 42 tỷ tham số được kích hoạt trong mỗi lần xử lý.

Nhờ đó, mô hình vừa mạnh hơn đáng kể so với phiên bản trước (MiMo-V2-Flash), vừa tiết kiệm tài nguyên.

Bên cạnh đó, Xiaomi sử dụng cơ chế Hybrid Attention với tỷ lệ 7:1 để xử lý ngữ cảnh dài tới 1 triệu token. Cách tiếp cận này giúp mô hình “quét nhanh” phần lớn dữ liệu, đồng thời tập trung xử lý sâu vào phần quan trọng nhất — giống như một nhà nghiên cứu lọc thông tin trong thư viện khổng lồ.

Một lớp Multi-Token Prediction cũng được bổ sung, cho phép AI dự đoán nhiều token cùng lúc, từ đó giảm đáng kể độ trễ khi xử lý.

Hiệu năng thực tế và kiểm chứng độc lập

Theo dữ liệu từ Xiaomi, MiMo-V2-Pro thể hiện tốt trong các tác vụ thực tế hơn là benchmark lý thuyết.

Trên bài kiểm tra GDPval-AA — đánh giá khả năng làm việc của AI trong môi trường thực — mô hình đạt điểm Elo 1426, vượt qua nhiều đối thủ Trung Quốc như GLM-5 và Kimi K2.5.

Tổ chức đánh giá độc lập Artificial Analysis cũng xác nhận kết quả này, xếp MiMo-V2-Pro vào top 10 toàn cầu về năng lực AI, ngang nhóm với GPT-5.2 Codex và vượt Grok 4.20 Beta.

Một số chỉ số đáng chú ý cho thấy bước tiến rõ rệt:

Tỷ lệ “hallucination” giảm còn 30% (so với 48% trước đó)
Khả năng suy luận ngắn gọn, hiệu quả hơn với lượng token thấp hơn đáng kể
Hiệu năng lập trình cao, đạt 86,7 điểm trên Terminal-Bench 2.0

Lợi thế lớn về chi phí

Điểm đáng chú ý nhất của MiMo-V2-Pro nằm ở tỷ lệ “giá/hiệu năng”.

Theo Artificial Analysis, chi phí chạy toàn bộ bài test chỉ khoảng 348 USD, trong khi GPT-5.2 tốn hơn 2.300 USD và Claude Opus 4.6 gần 2.500 USD.

Điều này khiến mô hình trở thành lựa chọn hấp dẫn cho doanh nghiệp muốn triển khai AI quy mô lớn mà vẫn kiểm soát chi phí.

Ngoài ra, cửa sổ ngữ cảnh 1 triệu token cho phép xử lý toàn bộ codebase hoặc tài liệu doanh nghiệp trong một lần, rất phù hợp với các hệ thống RAG hoặc multi-agent.

MiMo-V2-Pro mở ra khả năng xây dựng các hệ thống AI phức tạp hơn, không chỉ dừng ở tự động hóa mà còn có thể giải quyết bài toán nhiều bước.

Tuy nhiên, chính khả năng “hành động” mạnh mẽ này cũng làm tăng rủi ro bảo mật. Việc AI có thể thao tác file, chạy lệnh hoặc truy cập hệ thống khiến nguy cơ tấn công prompt injection hoặc truy cập trái phép cao hơn.

Ngoài ra, do chưa mở toàn bộ trọng số mô hình, các doanh nghiệp cũng khó kiểm tra sâu ở cấp độ hệ thống — một yếu tố quan trọng trong các môi trường nhạy cảm.

Xiaomi đang định giá rất cạnh tranh để thu hút nhà phát triển:

Dưới 256K token: 1 USD / triệu token đầu vào, 3 USD / triệu token đầu ra
Từ 256K đến 1M token: 2 USD / triệu input, 6 USD / triệu output
Cache đọc rất rẻ, còn cache ghi tạm thời miễn phí

Hiện mô hình chỉ vận hành qua API riêng của Xiaomi và chưa hỗ trợ đa phương thức (multimodal). Tuy nhiên, hãng đã hé lộ phiên bản MiMo-V2-Omni trong tương lai.

Sự xuất hiện của MiMo-V2-Pro cho thấy một bước chuyển quan trọng của ngành AI. Cuộc đua giờ đây không còn xoay quanh việc mô hình nói hay đến đâu, mà là khả năng thực thi hành động.

Nếu xu hướng này tiếp tục, AI sẽ không chỉ là công cụ hỗ trợ, mà trở thành “tác nhân” trực tiếp tham gia vào quy trình vận hành của doanh nghiệp.

Chủ Nhật, 22/03/2026 12:18

3 ★ 1 👨 388

Bạn nên đọc

Xác thực tài khoản!

Theo Nghị định 147/2024/ND-CP, bạn cần xác thực tài khoản trước khi sử dụng tính năng này. Chúng tôi sẽ gửi mã xác thực qua SMS hoặc Zalo tới số điện thoại mà bạn nhập dưới đây:

Số điện thoại chưa đúng định dạng!

0 Bình luận

Sắp xếp theo

Xóa Đăng nhập để Gửi

Giấy phép Mạng Xã Hội số 362/GP-BTTTT do bộ TTTT cấp ngày 30/06/2016. Cơ quan chủ quản: CÔNG TY CỔ PHẦN MẠNG TRỰC TUYẾN META. Địa chỉ: 56 Duy Tân, Phường Cầu Giấy, Hà Nội. Điện thoại: 024 2242 6188. Email: info@meta.vn. Chịu trách nhiệm nội dung: Lê Ngọc Lam.

Xiaomi gây bất ngờ với MiMo-V2-Pro: 1 nghìn tỷ tham số, hiệu năng tiệm cận GPT-5.2 nhưng rẻ hơn nhiều

Phạm Hải

Từ chatbot sang “AI hành động”

Hiệu năng thực tế và kiểm chứng độc lập

Lợi thế lớn về chi phí

Bạn nên đọc

Midjourney vs ChatGPT: Công cụ tạo ảnh AI nào tốt hơn?

TOP công cụ AI quản lý chiến dịch PPC tốt nhất

5 tác vụ ChatGPT vẫn chưa thể làm thay lập trình viên

5 công dụng của Gemini Notebook có thể bạn chưa biết

Gemini không còn vô dụng như 2 năm trước nữa

Tổng quan về tất cả các mô hình Google Gemini

TOP trợ lý AI cho CEO, quản lý và founder tốt nhất

Hướng dẫn cách tạo podcast cá nhân hóa với Copilot Podcasts

Cách chạy AI trên Raspberry Pi cục bộ với Ollama (LLM) và Open WebUI