AI mã nguồn mở là gì?

OpenAI không tạo ra các mô hình AI mở: Các mô hình GPT và DALL·E khác nhau đều là độc quyền hoặc mã nguồn đóng. Còn Llama của Meta thì sao? Cho dù Mark Zuckerberg có nói bao nhiêu lần đi nữa, nó cũng không phải là mã nguồn mở - mặc dù nó là mã nguồn mở, không giống như các mô hình của OpenAI. 

Nói một cách tổng quát, có 3 loại mô hình AI chính:

  • Độc quyền
  • Mã nguồn mở
  • Mở

Các loại này áp dụng cho cả mô hình ngôn ngữ lớn (LLM) và mô hình chuyển đổi văn bản thành hình ảnh. Mọi thứ vẫn đang được định hình, và Open Source Initiative hiện đang phát triển một định nghĩa nghiêm ngặt về những gì cần thiết để một mô hình AI thực sự được coi là mã nguồn mở, nhưng hãy xem tình hình hiện tại như thế nào.

Mã nguồn mở là gì?

Trước khi xem xét các mô hình AI mã nguồn mở, hãy cùng nhìn lại và xem xét mã nguồn mở thực sự có nghĩa là gì. Nó không phải là một từ ngữ thời thượng ngẫu nhiên: Open Source Initiative (OSI) duy trì một định nghĩa mô tả đầy đủ triết lý và các yêu cầu cơ bản. Nó được phát hành theo Giấy phép Quốc tế Creative Commons Attribution 4.0, nhưng đây là ý chính.

Mã nguồn mở không chỉ có nghĩa là bạn có thể tự do tải xuống hoặc truy cập mã nguồn. Nó phải được cung cấp cho bất kỳ ai sử dụng và sửa đổi theo bất kỳ cách nào họ muốn và cho bất kỳ mục đích nào. Giấy phép mã nguồn mở không được phép hạn chế bất kỳ "lĩnh vực hoạt động" nào, đó là điểm mà nhiều mô hình AI mã nguồn mở còn thiếu sót.

OSI duy trì một danh sách các giấy phép được phê duyệt, nhưng một số giấy phép lớn là Giấy phép Apache 2.0, Giấy phép MIT và Giấy phép Công khai GNU.

Mô hình AI độc quyền là gì?

Các mô hình AI độc quyền là một số mô hình phổ biến và mạnh mẽ nhất hiện có. Những mô hình này được phát triển và vận hành bởi các công ty tư nhân, và mã nguồn, chiến lược huấn luyện, trọng số mô hình, thậm chí cả các chi tiết như số lượng tham số đều thường được giữ bí mật. Cách duy nhất để truy cập vào một mô hình độc quyền là thông qua một số dịch vụ chính thức như chatbot, API hoặc công cụ được xây dựng bằng API.

Hãy lấy ví dụ về GPT-4o của OpenAI. Chúng ta không biết nó được huấn luyện trên dữ liệu nào hoặc nó có bao nhiêu tham số. Cách duy nhất để truy cập nó là thông qua ChatGPT, API của OpenAI hoặc một ứng dụng sử dụng GPT-4o, như Perplexity hoặc Zapier Chatbots.

Và tất nhiên, OpenAI tính phí để truy cập GPT-4o. Nếu muốn sử dụng nó - và đây là một trong những mô hình AI tốt nhất hiện có - thì bạn có thể trả 20 USD/tháng cho ChatGPT Plus, hoặc trả phí để sử dụng API, bằng cách đăng ký một dịch vụ khác hoặc tự xây dựng một cái gì đó. Bạn không thể chỉ tải xuống GPT-4o và chạy nó trên máy chủ của riêng mình.

Điều tương tự cũng đúng với tất cả các mô hình AI độc quyền khác, bao gồm:

  • GPT-4o mini và DALL·E 3 từ OpenAI
  • Claude 3 và Claude 3.5 từ Anthropic
  • Gemini và Imagen 3 từ Google
  • Command R và R+ từ Cohere
  • Midjourney

AI mã nguồn mở là gì?

AI mã nguồn mở là các mô hình AI được phát hành theo giấy phép mã nguồn mở, nhưng điều đó không hẳn chỉ đơn giản như vậy. Các nhà nghiên cứu đã phát hiện ra rằng nhiều mô hình tự nhận là mã nguồn mở nhưng thực chất lại không phải. Quá trình này được gọi là "tẩy trắng mã nguồn mở" (open-washing), và nó làm phức tạp mọi thứ một cách nghiêm trọng… kể cả đối với những người viết về các mô hình AI.

Biểu đồ cho thấy mức độ "mở" của một số mô hình AI

Hiện tại, Open Source Initiative đang nỗ lực phát triển định nghĩa về trí tuệ nhân tạo (AI) mã nguồn mở vì các giấy phép hiện có không thực sự bao quát hết những khía cạnh kỹ thuật của thế hệ mô hình AI hiện tại. Để thực sự đáp ứng các yêu cầu và triết lý của phần mềm mã nguồn mở, không chỉ mã nguồn của mô hình cần được cung cấp miễn phí, mà cả dữ liệu huấn luyện, code huấn luyện, tham số và nhiều thứ khác nữa cũng vậy. Các phần mềm cần được chia sẻ theo giấy phép mã nguồn mở, trong khi những thứ như dữ liệu huấn luyện và mô tả cách hoạt động cần được chia sẻ theo giấy phép Creative Commons - hoặc các giấy phép mở tương tự.

Ngoài ra, khó có thể nói quá lời về mức độ tự do của các giấy phép mã nguồn mở. Những giấy phép nghiêm ngặt nhất về cơ bản yêu cầu bạn phải công khai mọi thứ bạn xây dựng bằng nó - và ghi công cho các nhà phát triển ban đầu. Chỉ vậy thôi! 

Mô hình AI mở là gì?

Các mô hình mở lấp đầy khoảng trống giữa những mô hình AI độc quyền, khép kín và lý tưởng hoàn hảo về các mô hình AI mã nguồn mở thực sự. (Cho đến khi OSI đưa ra định nghĩa của họ, mô hình gần nhất có thể tìm thấy với lý tưởng đó là OLMo 7B).

Nói một cách đơn giản, các mô hình AI mở được cung cấp miễn phí ở một mức độ nào đó. Thông thường, bạn có thể tải xuống chúng từ Hugging Face và các nền tảng mô hình khác và chạy chúng trên thiết bị của riêng bạn sau khi đồng ý với bất kỳ điều khoản cấp phép nào được đưa ra. Bạn thường có thể huấn luyện lại chúng với dữ liệu của riêng mình để tạo ra mô hình của riêng bạn, rồi xây dựng chatbot và ứng dụng của riêng bạn dựa trên chúng. Trong hầu hết các trường hợp, bạn có thể tìm hiểu sâu về những yếu tố như trọng số của mô hình và kiến ​​trúc hệ thống để hiểu cách chúng hoạt động (ở mức độ tốt nhất có thể).

Giấy phép mở vẫn có thể cho phép sử dụng rộng rãi, nhưng chúng có một số giới hạn bổ sung mà mô hình mã nguồn mở sẽ không có. Ví dụ, giấy phép của Llama 3 cho phép sử dụng thương mại cho tối đa 700 triệu người dùng hàng tháng và chặn một số mục đích sử dụng nhất định. Bạn hoặc tôi có thể xây dựng thứ gì đó với nó, nhưng Apple và Google thì không thể. Tương tự, chính sách sử dụng bị cấm của Gemma 2, trong số những điều khác, cấm "tạo điều kiện hoặc khuyến khích người dùng phạm bất kỳ loại tội phạm nào". Có thể hiểu được, Google không muốn thấy những chatbot không lành mạnh "được cung cấp bởi Google Gemma" tràn lan trên các phương tiện truyền thông.

Những hạn chế này, mặc dù dễ hiểu, lại trái ngược với triết lý mã nguồn mở, vì vậy bạn có thể hiểu tại sao mọi thứ lại trở nên gây tranh cãi. Nhiều nhà nghiên cứu đang nghiên cứu các cách để phân loại những mô hình khác nhau dựa trên mức độ mở của chúng để làm cho mọi thứ rõ ràng hơn. Nếu bất kỳ điều nào trong số này trở nên phổ biến, chắc chắn chúng tôi sẽ thông báo cho bạn.

Các mô hình AI mở và mã nguồn mở tốt nhất

Dưới đây là danh sách tất cả các mô hình mở và mã nguồn mở đáng biết đến hiện nay. Vị trí của chúng trên thang đo từ mã nguồn mở đến mở vẫn còn đang được tranh luận cho đến khi chúng ta có một định nghĩa tốt hơn.

Mô hình AI

Nhà phát triển

Loại mô hình

Giấy phép

Tham số

Ghi chú

Llama 3.1

Meta

LLM

Tùy chỉnh

8B, 70B, 405B

Các hạn chế về sử dụng và số lượng người dùng

Gemma 2

Google

LLM

Tùy chỉnh

2B, 9B, 27B

Người dùng bị hạn chế

Phi-3

Microsoft

LLM

MIT

3.8B, 7B, 14B

 

Mixtral 8x7B

Mistral

LLM

Apache 2.0

8x7B

 

Mistral 7B

Mistral

LLM

Apache 2.0

7B

 

DBRX

Databricks/Mosaic

LLM

Tùy chỉnh

Tương đương 36B

Mixture of Experts, số lượng tham số rất phức tạp.

OLMo 7B

Allen Institute for AI

LLM

Apache 2.0

7B

Mô hình AI mã nguồn mở tốt nhất có thể tìm thấy

FLUX.1 [schnell]

Black Forest Labs

Trình tạo ảnh

Tùy chỉnh

N/A

Sử dụng phi thương mại

FLUX.1 [dev]

Black Forest Labs

Trình tạo ảnh

Apache 2.0

N/A

 

Stable Diffusion

Stability AI

Trình tạo ảnh

Tùy chỉnh

N/A

Các phiên bản trước của Stable Diffusion, bao gồm 1.5, 2.1 và SDXL, đều có sẵn theo giấy phép mở

Nên sử dụng mô hình AI mở hay mã nguồn mở?

Mặc dù không có nhiều mô hình AI mã nguồn mở hàng đầu như mong muốn, nhưng các mô hình mở tốt nhất lại có khả năng cạnh tranh đáng kinh ngạc với những lựa chọn thay thế độc quyền. Ví dụ, Llama 3 405B và FLUX.1 có thể cạnh tranh sòng phẳng với GPT-4o và DALL·E 3. Nếu có đủ kỹ năng kỹ thuật để sử dụng một mô hình mã nguồn mở, bạn có thể đạt được hiệu suất tương tự với chi phí thấp hơn nhiều và với nhiều sự tự do hơn.

Thứ Bảy, 27/06/2026 11:11
51 👨 2
Xác thực tài khoản!

Theo Nghị định 147/2024/ND-CP, bạn cần xác thực tài khoản trước khi sử dụng tính năng này. Chúng tôi sẽ gửi mã xác thực qua SMS hoặc Zalo tới số điện thoại mà bạn nhập dưới đây:

Số điện thoại chưa đúng định dạng!
Số điện thoại này đã được xác thực!
Bạn có thể dùng Sđt này đăng nhập tại đây!
Lỗi gửi SMS, liên hệ Admin
0 Bình luận
Sắp xếp theo
❖ AI cho người mới