GPT4All là gì? GPT4All hoạt động như thế nào?

Các mô hình GPT của OpenAI đã cách mạng hóa quá trình xử lý ngôn ngữ tự nhiên (NLP), nhưng trừ khi bạn trả tiền để có quyền truy cập cao cấp vào các dịch vụ của OpenAI, bạn sẽ không thể tinh chỉnh và tích hợp các mô hình GPT của chúng vào những ứng dụng của mình. Hơn nữa, OpenAI sẽ có quyền truy cập vào tất cả các cuộc trò chuyện của bạn, đây có thể là vấn đề bảo mật nếu bạn sử dụng ChatGPT cho công việc kinh doanh và những lĩnh vực nhạy cảm khác trong cuộc sống của mình. Nếu không thích điều này, bạn có thể dùng thử GPT4All.

Vậy chính xác thì GPT4All là gì? Nó hoạt động như thế nào? Tại sao lại sử dụng nó trên ChatGPT?

GPT4All là gì?

Trang web chính thức của GPT4All
Trang web chính thức của GPT4All

GPT4All là một hệ sinh thái mã nguồn mở dùng để tích hợp LLM vào các ứng dụng mà không phải trả phí đăng ký nền tảng hoặc phần cứng. Nó được tạo ra bởi Nomic AI, một công ty bản đồ thông tin nhằm mục đích cải thiện khả năng tiếp cận các tài nguyên AI.

GPT4All được thiết kế để chạy trên các PC từ hiện đại đến tương đối hiện đại mà không cần kết nối Internet hay thậm chí là GPU! Điều này có thể thực hiện được vì hầu hết các model do GPT4All cung cấp đã được lượng tử hóa ở mức nhỏ chỉ vài gigabyte, chỉ cần 4 – 16GB RAM để chạy.

Điều này cho phép các doanh nghiệp nhỏ hơn, những tổ chức và các nhà nghiên cứu độc lập sử dụng và tích hợp LLM cho những ứng dụng cụ thể. Và với GPT4All có thể cài đặt dễ dàng thông qua trình cài đặt bằng một cú nhấp chuột, giờ đây mọi người có thể sử dụng GPT4All và nhiều LLM của nó để tạo nội dung, viết code, hiểu tài liệu và thu thập thông tin.

Cách thức hoạt động của GPT4All

Như đã thảo luận trước đó, GPT4All là một hệ sinh thái được sử dụng để đào tạo và triển khai LLM cục bộ trên máy tính của bạn, đây là một kỳ tích đáng kinh ngạc! Thông thường, load LLM 25 - 30GB tiêu chuẩn sẽ cần 32GB RAM và GPU cấp doanh nghiệp.

Để so sánh, các LLM bạn có thể sử dụng với GPT4All chỉ yêu cầu bộ nhớ 3GB - 8GB và có thể chạy trên 4GB – 16GB RAM. Điều này giúp có thể chạy toàn bộ LLM trên thiết bị edge mà không cần GPU hoặc hỗ trợ đám mây bên ngoài.

Yêu cầu phần cứng để chạy LLM trên GPT4All đã giảm đáng kể nhờ lượng tử hóa mạng nơ-ron. Bằng cách giảm trọng lượng chính xác và kích hoạt trong mạng nơ-ron, nhiều model do GPT4All cung cấp có thể chạy trên hầu hết các máy tính tương đối hiện đại.

Dữ liệu đào tạo được sử dụng trong một số mô hình có sẵn được thu thập thông qua "pile", đây chỉ là dữ liệu được loại bỏ từ nội dung được phát hành công khai trên Internet. Dữ liệu sau đó được gửi đến cơ sở dữ liệu Atlas AI của Nomic AI, có thể được nhìn thấy dựa trên các mối tương quan trên bản đồ vector 2D dễ nhìn (còn được gọi là cơ sở dữ liệu vector AI).

Minh họa về cách thức hoạt động của Atlas
Minh họa về cách thức hoạt động của Atlas

Bằng cách Nomic AI đào tạo mô hình Groovy và sử dụng dữ liệu có sẵn công khai, Nomic AI có thể phát hành mô hình trên giấy phép GPL mở cho phép mọi người sử dụng nó, ngay cả đối với các ứng dụng thương mại.

Cách cài đặt GPT4All

Việc cài đặt GPT4All rất đơn giản và giờ đây GPT4All phiên bản 2 đã được phát hành, điều đó thậm chí còn dễ dàng hơn! Cách tốt nhất để cài đặt GPT4All 2 là tải xuống trình cài đặt bằng một cú nhấp chuột:

Các hướng dẫn sau đây dành cho Windows nhưng bạn có thể cài đặt GPT4All trên từng hệ điều hành chính.

Sau khi tải xuống, nhấp đúp vào trình cài đặt và chọn Install. Windows Defender có thể coi cài đặt là độc hại vì quá trình Microsoft cung cấp chữ ký hợp lệ cho các ứng dụng bên thứ ba có thể mất nhiều thời gian. Tuy nhiên, điều này cần sớm được khắc phục. Ở thời điểm bài viết, miễn là bạn đã tải xuống ứng dụng GPT4All từ trang web chính thức, thì bạn sẽ an toàn. Nhấp vào Install Anyway để cài đặt GPT4All.

Sau khi mở ứng dụng, bạn sẽ cần chọn một model để sử dụng. GPT4ALL cung cấp cho bạn một số model, tất cả đều có điểm mạnh và điểm yếu. Để biết nên tải xuống mô hình nào, đây là bảng chỉ ra điểm mạnh và điểm yếu của từng model.

Model

Kích thước

Ghi chú

Thông số

Loại

Lượng tử hóa

Hermes

7.58 GB

    • Dựa trên hướng dẫn
    • Trả lời dài
    • Được quản lý với 300.000 hướng dẫn không bị kiểm duyệt
    • Không thể được sử dụng thương mại

13 tỷ

LLaMA

q4_0

GPT4All Falcon

3.78 GB

    • Phản hồi nhanh
    • Dựa trên hướng dẫn
    • Được cấp phép sử dụng thương mại

7 tỷ

Falcon

q4_0

Groovy

8 GB

    • Phản hồi nhanh
    • Phản hồi sáng tạo
    • Dựa trên hướng dẫn
    • Được cấp phép sử dụng thương mại

7 tỷ

GPT-J

q4_0

ChatGPT-3.5 Turbo

Tối thiểu

    • Yêu cầu API cá nhân
    • Sẽ gửi các cuộc trò chuyện của bạn tới OpenAI
    • GPT4All chỉ được sử dụng để giao tiếp với OpenAI

?

GPT

NA

ChatGPT-4

Tối thiểu

    • Yêu cầu API cá nhân
    • Sẽ gửi các cuộc trò chuyện của bạn tới OpenAI
    • GPT4All chỉ được sử dụng để giao tiếp với OpenAI

?

GPT

NA

Snoozy

7.58 GB

    • Dựa trên hướng dẫn
    • Chậm hơn Groovy nhưng có phản hồi chất lượng cao hơn
    • Không thể được sử dụng thương mại

13 tỷ

LLaMA

q4_0

MPT Chat

4.52 GB

    • Phản hồi nhanh
    • Dựa trên trò chuyện
    • Không thể được sử dụng thương mại

7 tỷ

MPT

q4_0

Orca

3.53 GB

    • Dựa trên hướng dẫn
    • Giải thích bộ dữ liệu điều chỉnh
    • Phương pháp xây dựng tập dữ liệu của Orca Research Paper
    • Được cấp phép sử dụng thương mại

7 tỷ

OpenLLaMA

q4_0

Vicuna

3.92 GB

    • Dựa trên hướng dẫn
    • Không thể được sử dụng thương mại

7 tỷ

LLaMA

q4_2

Wizard

3.92 GB

    • Dựa trên hướng dẫn
    • Không thể được sử dụng thương mại

7 tỷ

LLaMA

q4_2

Wizard Uncensored

7.58 GB

    • Dựa trên hướng dẫn
    • Không thể được sử dụng thương mại

13 tỷ

LLaMA

q4_0

Hãy nhớ rằng các mô hình được cung cấp có những mức độ hạn chế khác nhau. Không phải tất cả các mô hình đều có thể được sử dụng miễn phí cho mục đích thương mại; một số mô hình sẽ cần nhiều tài nguyên phần cứng hơn, trong khi những mô hình khác sẽ cần API key. Các mô hình ít hạn chế nhất có sẵn trong GPT4All là Groovy, GPT4All Falcon và Orca.

Thứ Bảy, 15/07/2023 09:56
55 👨 824
0 Bình luận
Sắp xếp theo
    ❖ Trí tuệ nhân tạo (AI)