Alibaba ra mắt mô hình lập luận thị giác QVQ-Max: Có thể "nhìn, hiểu và tư duy"

Tập đoàn công nghệ Trung Quốc Alibaba vừa công bố mô hình AI mới mang tên QVQ-Max thuộc dòng Qwen, đánh dấu bước tiến đột phá trong lĩnh vực AI đa phương tiện. Điểm đặc biệt của mô hình này là khả năng phân tích nội dung hình ảnh/video, sau đó đưa ra lập luận và giải pháp dựa trên thông tin thu nhận được.

Khả năng ấn tượng

QVQ-Max được Alibaba mô tả là cầu nối giữa các mô hình AI dựa trên văn bản thuần túy với thế giới thực. Với khả năng lập luận thị giác, hệ thống có thể:

  • Phân tích hình ảnh và xác định các yếu tố then chốt
  • Ứng dụng linh hoạt trong nhiều lĩnh vực từ thiết kế minh họa, tạo kịch bản video đến đóng vai nhân vật
  • Giải quyết các bài toán có kèm biểu đồ (toán, vật lý)
  • Hướng dẫn từng bước nấu ăn dựa trên hình ảnh công thức

Alibaba cho biết mô hình này giúp thu hẹp khoảng cách giữa các AI chỉ xử lý văn bản và thông tin thực tế. Nhờ khả năng suy luận hình ảnh, QVQ-Max có thể "nhìn, hiểu và tư duy" về thế giới xung quanh. Công ty này nhấn mạnh mô hình vượt trội trong việc phân tích hình ảnh, xác định yếu tố then chốt, đồng thời linh hoạt ứng dụng trong nhiều lĩnh vực như thiết kế minh họa, tạo kịch bản video hay nhập vai.

QVQ-Max

Giống các chatbot AI khác, QVQ-Max hỗ trợ công việc, giáo dục và đời sống cá nhân, nhưng nhờ tích hợp thị giác, nó còn giải quyết những tác vụ đặc thù hơn như: giải toán/vật lý kèm biểu đồ, hướng dẫn nấu ăn thông qua hình ảnh công thức.

Alibaba xem QVQ-Max là phiên bản đầu tiên và đã vạch ra lộ trình nâng cấp cho các bản tiếp theo. Thứ nhất, họ muốn cải thiện độ chính xác nhận diện hình ảnh bằng kỹ thuật grounding (xác thực quan sát). Thứ hai, mô hình sẽ được tối ưu để xử lý đa tác vụ và vấn đề phức tạp như thao tác với điện thoại, máy tính hay chơi game. Cuối cùng, Alibaba dự kiến mở rộng từ tương tác văn bản sang xác minh công cụ và tạo nội dung hình ảnh.

Người dùng có thể trải nghiệm QVQ-Max bằng cách:

  1. Truy cập chat.qwen.ai
  2. Chọn menu model ở góc trái → "Expand more models"
  3. Chọn QVQ-Max và bắt đầu trò chuyện
  4. Đính kèm file hình ảnh để khám phá khả năng xử lý của AI

Với sự ra mắt của QVQ-Max, Alibaba tiếp tục khẳng định vị thế trong cuộc đua phát triển AI đa phương tiện, cạnh tranh trực tiếp với các đại gia công nghệ toàn cầu. Mô hình hứa hẹn mang lại ứng dụng thực tế trong cả công việc, giáo dục lẫn đời sống cá nhân.

Thứ Bảy, 29/03/2025 13:00
31 👨 69
Xác thực tài khoản!

Theo Nghị định 147/2024/ND-CP, bạn cần xác thực tài khoản trước khi sử dụng tính năng này. Chúng tôi sẽ gửi mã xác thực qua SMS hoặc Zalo tới số điện thoại mà bạn nhập dưới đây:

Số điện thoại chưa đúng định dạng!
Số điện thoại này đã được xác thực!
Bạn có thể dùng Sđt này đăng nhập tại đây!
Lỗi gửi SMS, liên hệ Admin
0 Bình luận
Sắp xếp theo
❖
    Chia sẻ
    Chia sẻ FacebookChia sẻ Twitter
    Đóng