AI mã nguồn mở là gì?

Chàng trai nhạt nhẽo

OpenAI không tạo ra các mô hình AI mở: Các mô hình GPT và DALL·E khác nhau đều là độc quyền hoặc mã nguồn đóng. Còn Llama của Meta thì sao? Cho dù Mark Zuckerberg có nói bao nhiêu lần đi nữa, nó cũng không phải là mã nguồn mở - mặc dù nó là mã nguồn mở, không giống như các mô hình của OpenAI.

Nói một cách tổng quát, có 3 loại mô hình AI chính:

Độc quyền
Mã nguồn mở
Mở

Các loại này áp dụng cho cả mô hình ngôn ngữ lớn (LLM) và mô hình chuyển đổi văn bản thành hình ảnh. Mọi thứ vẫn đang được định hình, và Open Source Initiative hiện đang phát triển một định nghĩa nghiêm ngặt về những gì cần thiết để một mô hình AI thực sự được coi là mã nguồn mở, nhưng hãy xem tình hình hiện tại như thế nào.

Mã nguồn mở là gì?

Trước khi xem xét các mô hình AI mã nguồn mở, hãy cùng nhìn lại và xem xét mã nguồn mở thực sự có nghĩa là gì. Nó không phải là một từ ngữ thời thượng ngẫu nhiên: Open Source Initiative (OSI) duy trì một định nghĩa mô tả đầy đủ triết lý và các yêu cầu cơ bản. Nó được phát hành theo Giấy phép Quốc tế Creative Commons Attribution 4.0, nhưng đây là ý chính.

Mã nguồn mở không chỉ có nghĩa là bạn có thể tự do tải xuống hoặc truy cập mã nguồn. Nó phải được cung cấp cho bất kỳ ai sử dụng và sửa đổi theo bất kỳ cách nào họ muốn và cho bất kỳ mục đích nào. Giấy phép mã nguồn mở không được phép hạn chế bất kỳ "lĩnh vực hoạt động" nào, đó là điểm mà nhiều mô hình AI mã nguồn mở còn thiếu sót.

OSI duy trì một danh sách các giấy phép được phê duyệt, nhưng một số giấy phép lớn là Giấy phép Apache 2.0, Giấy phép MIT và Giấy phép Công khai GNU.

Mô hình AI độc quyền là gì?

Các mô hình AI độc quyền là một số mô hình phổ biến và mạnh mẽ nhất hiện có. Những mô hình này được phát triển và vận hành bởi các công ty tư nhân, và mã nguồn, chiến lược huấn luyện, trọng số mô hình, thậm chí cả các chi tiết như số lượng tham số đều thường được giữ bí mật. Cách duy nhất để truy cập vào một mô hình độc quyền là thông qua một số dịch vụ chính thức như chatbot, API hoặc công cụ được xây dựng bằng API.

Hãy lấy ví dụ về GPT-4o của OpenAI. Chúng ta không biết nó được huấn luyện trên dữ liệu nào hoặc nó có bao nhiêu tham số. Cách duy nhất để truy cập nó là thông qua ChatGPT, API của OpenAI hoặc một ứng dụng sử dụng GPT-4o, như Perplexity hoặc Zapier Chatbots.

Và tất nhiên, OpenAI tính phí để truy cập GPT-4o. Nếu muốn sử dụng nó - và đây là một trong những mô hình AI tốt nhất hiện có - thì bạn có thể trả 20 USD/tháng cho ChatGPT Plus, hoặc trả phí để sử dụng API, bằng cách đăng ký một dịch vụ khác hoặc tự xây dựng một cái gì đó. Bạn không thể chỉ tải xuống GPT-4o và chạy nó trên máy chủ của riêng mình.

Điều tương tự cũng đúng với tất cả các mô hình AI độc quyền khác, bao gồm:

GPT-4o mini và DALL·E 3 từ OpenAI
Claude 3 và Claude 3.5 từ Anthropic
Gemini và Imagen 3 từ Google
Command R và R+ từ Cohere
Midjourney

AI mã nguồn mở là gì?

AI mã nguồn mở là các mô hình AI được phát hành theo giấy phép mã nguồn mở, nhưng điều đó không hẳn chỉ đơn giản như vậy. Các nhà nghiên cứu đã phát hiện ra rằng nhiều mô hình tự nhận là mã nguồn mở nhưng thực chất lại không phải. Quá trình này được gọi là "tẩy trắng mã nguồn mở" (open-washing), và nó làm phức tạp mọi thứ một cách nghiêm trọng… kể cả đối với những người viết về các mô hình AI.

Biểu đồ cho thấy mức độ "mở" của một số mô hình AI

Hiện tại, Open Source Initiative đang nỗ lực phát triển định nghĩa về trí tuệ nhân tạo (AI) mã nguồn mở vì các giấy phép hiện có không thực sự bao quát hết những khía cạnh kỹ thuật của thế hệ mô hình AI hiện tại. Để thực sự đáp ứng các yêu cầu và triết lý của phần mềm mã nguồn mở, không chỉ mã nguồn của mô hình cần được cung cấp miễn phí, mà cả dữ liệu huấn luyện, code huấn luyện, tham số và nhiều thứ khác nữa cũng vậy. Các phần mềm cần được chia sẻ theo giấy phép mã nguồn mở, trong khi những thứ như dữ liệu huấn luyện và mô tả cách hoạt động cần được chia sẻ theo giấy phép Creative Commons - hoặc các giấy phép mở tương tự.

Ngoài ra, khó có thể nói quá lời về mức độ tự do của các giấy phép mã nguồn mở. Những giấy phép nghiêm ngặt nhất về cơ bản yêu cầu bạn phải công khai mọi thứ bạn xây dựng bằng nó - và ghi công cho các nhà phát triển ban đầu. Chỉ vậy thôi!

Mô hình AI mở là gì?

Các mô hình mở lấp đầy khoảng trống giữa những mô hình AI độc quyền, khép kín và lý tưởng hoàn hảo về các mô hình AI mã nguồn mở thực sự. (Cho đến khi OSI đưa ra định nghĩa của họ, mô hình gần nhất có thể tìm thấy với lý tưởng đó là OLMo 7B).

Nói một cách đơn giản, các mô hình AI mở được cung cấp miễn phí ở một mức độ nào đó. Thông thường, bạn có thể tải xuống chúng từ Hugging Face và các nền tảng mô hình khác và chạy chúng trên thiết bị của riêng bạn sau khi đồng ý với bất kỳ điều khoản cấp phép nào được đưa ra. Bạn thường có thể huấn luyện lại chúng với dữ liệu của riêng mình để tạo ra mô hình của riêng bạn, rồi xây dựng chatbot và ứng dụng của riêng bạn dựa trên chúng. Trong hầu hết các trường hợp, bạn có thể tìm hiểu sâu về những yếu tố như trọng số của mô hình và kiến trúc hệ thống để hiểu cách chúng hoạt động (ở mức độ tốt nhất có thể).

Giấy phép mở vẫn có thể cho phép sử dụng rộng rãi, nhưng chúng có một số giới hạn bổ sung mà mô hình mã nguồn mở sẽ không có. Ví dụ, giấy phép của Llama 3 cho phép sử dụng thương mại cho tối đa 700 triệu người dùng hàng tháng và chặn một số mục đích sử dụng nhất định. Bạn hoặc tôi có thể xây dựng thứ gì đó với nó, nhưng Apple và Google thì không thể. Tương tự, chính sách sử dụng bị cấm của Gemma 2, trong số những điều khác, cấm "tạo điều kiện hoặc khuyến khích người dùng phạm bất kỳ loại tội phạm nào". Có thể hiểu được, Google không muốn thấy những chatbot không lành mạnh "được cung cấp bởi Google Gemma" tràn lan trên các phương tiện truyền thông.

Những hạn chế này, mặc dù dễ hiểu, lại trái ngược với triết lý mã nguồn mở, vì vậy bạn có thể hiểu tại sao mọi thứ lại trở nên gây tranh cãi. Nhiều nhà nghiên cứu đang nghiên cứu các cách để phân loại những mô hình khác nhau dựa trên mức độ mở của chúng để làm cho mọi thứ rõ ràng hơn. Nếu bất kỳ điều nào trong số này trở nên phổ biến, chắc chắn chúng tôi sẽ thông báo cho bạn.

Các mô hình AI mở và mã nguồn mở tốt nhất

Dưới đây là danh sách tất cả các mô hình mở và mã nguồn mở đáng biết đến hiện nay. Vị trí của chúng trên thang đo từ mã nguồn mở đến mở vẫn còn đang được tranh luận cho đến khi chúng ta có một định nghĩa tốt hơn.

Mô hình AI	Nhà phát triển	Loại mô hình	Giấy phép	Tham số	Ghi chú
Llama 3.1	Meta	LLM	Tùy chỉnh	8B, 70B, 405B	Các hạn chế về sử dụng và số lượng người dùng
Gemma 2	Google	LLM	Tùy chỉnh	2B, 9B, 27B	Người dùng bị hạn chế
Phi-3	Microsoft	LLM	MIT	3.8B, 7B, 14B
Mixtral 8x7B	Mistral	LLM	Apache 2.0	8x7B
Mistral 7B	Mistral	LLM	Apache 2.0	7B
DBRX	Databricks/Mosaic	LLM	Tùy chỉnh	Tương đương 36B	Mixture of Experts, số lượng tham số rất phức tạp.
OLMo 7B	Allen Institute for AI	LLM	Apache 2.0	7B	Mô hình AI mã nguồn mở tốt nhất có thể tìm thấy
FLUX.1 [schnell]	Black Forest Labs	Trình tạo ảnh	Tùy chỉnh	N/A	Sử dụng phi thương mại
FLUX.1 [dev]	Black Forest Labs	Trình tạo ảnh	Apache 2.0	N/A
Stable Diffusion	Stability AI	Trình tạo ảnh	Tùy chỉnh	N/A	Các phiên bản trước của Stable Diffusion, bao gồm 1.5, 2.1 và SDXL, đều có sẵn theo giấy phép mở

Nên sử dụng mô hình AI mở hay mã nguồn mở?

Mặc dù không có nhiều mô hình AI mã nguồn mở hàng đầu như mong muốn, nhưng các mô hình mở tốt nhất lại có khả năng cạnh tranh đáng kinh ngạc với những lựa chọn thay thế độc quyền. Ví dụ, Llama 3 405B và FLUX.1 có thể cạnh tranh sòng phẳng với GPT-4o và DALL·E 3. Nếu có đủ kỹ năng kỹ thuật để sử dụng một mô hình mã nguồn mở, bạn có thể đạt được hiệu suất tương tự với chi phí thấp hơn nhiều và với nhiều sự tự do hơn.

Thứ Bảy, 27/06/2026 11:11

5 ★ 1 👨 141

Bạn nên đọc

Xác thực tài khoản!

Theo Nghị định 147/2024/ND-CP, bạn cần xác thực tài khoản trước khi sử dụng tính năng này. Chúng tôi sẽ gửi mã xác thực qua SMS hoặc Zalo tới số điện thoại mà bạn nhập dưới đây:

Số điện thoại chưa đúng định dạng!

0 Bình luận

Sắp xếp theo

Xóa Đăng nhập để Gửi

AI cho người mới

Giấy phép Mạng Xã Hội số 362/GP-BTTTT do bộ TTTT cấp ngày 30/06/2016. Cơ quan chủ quản: CÔNG TY CỔ PHẦN MẠNG TRỰC TUYẾN META. Địa chỉ: 56 Duy Tân, Phường Cầu Giấy, Hà Nội. Điện thoại: 024 2242 6188. Email: info@meta.vn. Chịu trách nhiệm nội dung: Lê Ngọc Lam.

AI mã nguồn mở là gì?

Chàng trai nhạt nhẽo

Mã nguồn mở là gì?

Mô hình AI độc quyền là gì?

AI mã nguồn mở là gì?

Mô hình AI mở là gì?

Các mô hình AI mở và mã nguồn mở tốt nhất

Nên sử dụng mô hình AI mở hay mã nguồn mở?

Bạn nên đọc

AI Copilot trong Dynamics 365 là gì?

So sánh Claude Opus 4.8 và GPT-5.5: Benchmark, test, nên chọn loại nào

Tích hợp Gmail vào Claude trên điện thoại và những thứ bạn có thể làm

Hướng dẫn tạo game ô chữ AI bằng Gemini

Zapier là gì?

NotebookLM Enterprise là gì?

AI agent framework: Định nghĩa, so sánh và hướng dẫn

Meta AI có thể tạo deepfake từ ảnh Instagram: Cách bảo vệ tài khoản của bạn

Hướng dẫn tạo sơ đồ diagram trên Canva AI