OpenAI công bố mô hình ngôn ngữ “trọng số mở” chi phí thấp, chạy được cả trên laptop cá nhân

OpenAI vừa phát hành hai mô hình ngôn ngữ mới có tên gpt-oss-120bgpt-oss-20b – đây là lần đầu tiên kể từ thời điểm mô hình GPT-2 (2019) ra mắt, hãng mới giới thiệu mô hình trọng số mở ra công chúng, nhằm cạnh tranh trực tiếp với Meta, Mistral AI và DeepSeek trong lĩnh vực AI nguồn mở.

Mô hình “trọng số mở” là gì?

Khác với mô hình mã nguồn mở (open-source) công khai toàn bộ mã huấn luyện, trọng số mở (open-weights) chỉ công khai các tham số huấn luyện (weights) và cho phép người dùng tải về, sửa đổi hoặc triển khai tùy ý. Điều này giúp tăng tính minh bạch, kiểm soát, và đặc biệt phù hợp với các công ty hoặc nhà nghiên cứu muốn tự chạy mô hình mà không phụ thuộc vào nền tảng đám mây.

Nói về cột mốc đáng nhớ này, CEO Sam Altman chia sẻ:

Chúng tôi vui mừng khi có thể đưa kết quả của nhiều năm nghiên cứu trị giá hàng tỷ USD đến tay cộng đồng, giúp AI đến gần hơn với mọi người.

Sức mạnh và hiệu năng thực tế

Mặc dù là mô hình mở, gpt-oss-120bgpt-oss-20b đều được đánh giá là mạnh mẽ, có khả năng suy luận chuỗi, gọi công cụ (tool use) và tương thích với đa dạng môi trường triển khai. Kết quả thử nghiệm cho thấy:

  • Trên bài kiểm tra Codeforces, hai mô hình đạt lần lượt 2.6222.516 điểm, vượt qua R1 của DeepSeek nhưng vẫn thấp hơn các mô hình o3 và o4-mini.
  • Trong bài kiểm tra kiến thức tổng hợp Humanity’s Last Exam (HLE), gpt-oss-120b và gpt-oss-20b đạt 19% và 17,3%, thấp hơn o3 nhưng cao hơn nhiều mô hình mở khác như Qwen hay DeepSeek.

Tuy nhiên, OpenAI thừa nhận các mô hình này vẫn có hiện tượng "ảo giác thông tin" (hallucination) nhiều hơn so với các mô hình lý luận đóng gần đây như o3 hoặc o4-mini.

Đào tạo an toàn và chống lạm dụng

Trước khi phát hành, OpenAI cho biết họ đã tiến hành huấn luyện và kiểm tra an toàn kỹ lưỡng. Trong giai đoạn tiền huấn luyện, nhóm đã chủ động lọc bỏ toàn bộ dữ liệu liên quan đến hóa học, sinh học, phóng xạ và hạt nhân nguy hiểm, đồng thời mô phỏng các tình huống lạm dụng mô hình bởi tác nhân xấu.

Người dùng có thể tải trọng số mô hình tại các nền tảng phổ biến như:

  • Hugging Face
  • GitHub
  • LM Studio hoặc Ollama (chạy trực tiếp trên máy tính cá nhân)
  • Các dịch vụ đám mây như Amazon, Baseten, Microsoft Azure

Gpt-oss-20b thậm chí có thể chạy mượt mà trên laptop, giúp người dùng dùng như một trợ lý AI cá nhân, phục vụ các tác vụ như tra cứu, ghi chú, hỗ trợ code...

Nước đi chiến lược của OpenAI

Việc OpenAI cuối cùng cũng phát hành mô hình mở – sau nhiều lần trì hoãn – cho thấy công ty đang có xu hướng "mở cửa" chiến lược AI hơn, sau thời gian dài bị chỉ trích vì khép kín mã nguồn. CEO Nvidia – ông Jensen Huang – nhận định:

OpenAI cho thấy thế giới có thể xây dựng gì trên nền tảng AI của Nvidia, và giờ họ đang thúc đẩy đổi mới phần mềm mã nguồn mở.

Thứ Tư, 06/08/2025 18:10
31 👨 91
Xác thực tài khoản!

Theo Nghị định 147/2024/ND-CP, bạn cần xác thực tài khoản trước khi sử dụng tính năng này. Chúng tôi sẽ gửi mã xác thực qua SMS hoặc Zalo tới số điện thoại mà bạn nhập dưới đây:

Số điện thoại chưa đúng định dạng!
Số điện thoại này đã được xác thực!
Bạn có thể dùng Sđt này đăng nhập tại đây!
Lỗi gửi SMS, liên hệ Admin
0 Bình luận
Sắp xếp theo