Cách xây dựng ChatGPT tùy chỉnh bằng dữ liệu của riêng bạn

Cung cấp công nghệ GPT trong một chatbot mạnh mẽ và dễ sử dụng, ChatGPT đã trở thành công cụ AI phổ biến nhất thế giới. Nhiều người sử dụng ChatGPT để cung cấp các cuộc trò chuyện hấp dẫn, trả lời những truy vấn, đưa ra các đề xuất sáng tạo cũng như hỗ trợ tạo code và viết lách. Tuy nhiên, ChatGPT bị hạn chế vì bạn không thể lưu trữ dữ liệu của mình để sử dụng lâu dài cho mục đích cá nhân và điểm giới hạn dữ liệu kiến thức là vào tháng 9 năm 2021.

Một giải pháp thay thế là sử dụng API của OpenAI và LangChain để cung cấp cho ChatGPT dữ liệu tùy chỉnh và thông tin cập nhật trước năm 2021 nhằm tạo phiên bản ChatGPT tùy chỉnh.

Bước 1: Cài đặt và tải xuống phần mềm và script tạo sẵn

Xin lưu ý rằng các hướng dẫn sau đây dành cho máy Windows 10 hoặc Windows 11.

Để cung cấp dữ liệu tùy chỉnh cho ChatGPT, bạn cần cài đặt và tải xuống Python3, Git, Microsoft C++ mới nhất và script ChatGPT-retrieval từ GitHub. Nếu bạn đã cài đặt một số phần mềm trên PC, hãy đảm bảo rằng chúng được cập nhật lên phiên bản mới nhất để tránh bất kỳ trục trặc nào trong quá trình này.

Bắt đầu bằng cách cài đặt:

Ghi chú cài đặt Python3 và Microsoft C++

Khi cài đặt Python3, hãy đảm bảo rằng bạn đánh dấu tùy chọn Add python.exe to PATH trước khi nhấp vào Install Now. Điều này rất quan trọng vì nó cho phép bạn truy cập Python trong bất kỳ thư mục nào trên máy tính của bạn.

Thêm Python vào PATH
Thêm Python vào PATH

Khi cài đặt Microsoft C++, trước tiên bạn sẽ muốn cài đặt Microsoft Visual Studio Build Tools. Sau khi cài đặt, bạn có thể tích vào tùy chọn Desktop development with C++ và nhấn Install với tất cả các công cụ tùy chọn được tự động chọn trên thanh bên phải.

Cài đặt Microsoft C++ thông qua các công cụ build
Cài đặt Microsoft C++ thông qua các công cụ build

Bây giờ, bạn đã cài đặt các phiên bản mới nhất của Python3, Git và Microsoft C++, bạn có thể tải xuống script Python để dễ dàng truy vấn dữ liệu cục bộ tùy chỉnh.

Để tải xuống script, nhấp vào Code, sau đó chọn Download ZIP. Điều này sẽ tải xuống script Python vào thư mục mặc định hoặc đã chọn của bạn.

Tải xuống script Python trên GitHub
Tải xuống script Python trên GitHub

Sau khi tải xuống, giờ đây bạn có thể thiết lập môi trường cục bộ.

Bước 2: Thiết lập môi trường cục bộ

Để thiết lập môi trường, bạn cần mở một terminal trong thư mục chatgpt-retrieval-main mà bạn đã tải xuống. Để làm điều đó, hãy mở thư mục chatgpt-retrieval-main, nhấp chuột phải và chọn Open in Terminal.

Mở terminal trong thư mục chatgpt-retrieval-main
Mở terminal trong thư mục chatgpt-retrieval-main

Khi terminal được mở, hãy sao chép và dán lệnh này:

pip install langchain openai chromadb tiktoken unstructured

Lệnh này sử dụng trình quản lý gói của Python để tạo và quản lý môi trường ảo Python cần thiết.

Sau khi tạo môi trường ảo, bạn cần cung cấp key API OpenAI để truy cập các dịch vụ của họ. Trước tiên, bạn cần tạo key API từ trang web key API OpenAI bằng cách nhấp vào Create new secret key, thêm tên cho key, sau đó nhấn nút Create secret key button.

Tạo key API bí mật
Tạo key API bí mật

Bạn sẽ được cung cấp một chuỗi ký tự. Đây là key API OpenAI của bạn. Sao chép nó bằng cách nhấp vào biểu tượng sao chép ở bên cạnh key API. Hãy lưu ý rằng key API này phải được giữ bí mật. Không chia sẻ nó với người khác trừ khi bạn thực sự có ý định để họ sử dụng key chung với bạn.

Sau khi sao chép, hãy quay lại thư mục chatgpt-retrieval-main và mở các hằng số bằng Notepad. Bây giờ hãy thay thế trình giữ chỗ bằng key API của bạn. Nhớ lưu file lại nhé!

Thêm key API làm biến môi trường
Thêm key API làm biến môi trường

Bây giờ, bạn đã thiết lập thành công môi trường ảo của mình và thêm key API OpenAI làm biến môi trường. Giờ đây, bạn có thể cung cấp dữ liệu tùy chỉnh của mình cho ChatGPT.

Bước 3: Thêm dữ liệu tùy chỉnh

Để thêm dữ liệu tùy chỉnh, hãy đặt tất cả dữ liệu văn bản tùy chỉnh của bạn vào thư mục dữ liệu trong chatgpt-retrieval-main. Định dạng của dữ liệu văn bản có thể ở dạng PDF, TXT hoặc DOC.

Thêm dữ liệu tùy chỉnh cho ChatGPT
Thêm dữ liệu tùy chỉnh cho ChatGPT

Như bạn có thể thấy từ ảnh chụp màn hình ở trên, ví dụ đã thêm một file văn bản chứa lịch trình cá nhân đã tạo sẵn, một bài báo viết về Instinct AI Accelerators của AMD và một tài liệu PDF.

Bước 4: Truy vấn ChatGPT qua Terminal

Script Python cho phép bạn truy vấn dữ liệu từ dữ liệu tùy chỉnh đã thêm vào thư mục dữ liệu và Internet. Nói cách khác, bạn sẽ có quyền truy cập vào ChatGPT backend thông thường và tất cả dữ liệu được lưu trữ cục bộ trong thư mục dữ liệu.

Để sử dụng script, hãy chạy script python chatgpt.py rồi thêm câu hỏi hoặc truy vấn của bạn làm đối số.

python chatgpt.py "YOUR QUESTION"

Đảm bảo đặt câu hỏi của bạn trong dấu ngoặc kép.

Để kiểm tra xem đã cung cấp thành công dữ liệu ChatGPT của mình hay chưa, ví dụ sẽ hỏi một câu hỏi cá nhân liên quan đến file Personal Sched.txt.

Thử nghiệm ChatGPT với dữ liệu tùy chỉnh
Thử nghiệm ChatGPT với dữ liệu tùy chỉnh

Mọi thứ hoạt động! Điều này có nghĩa là ChatGPT có thể đọc Personal Sched.txt được cung cấp trước đó. Bây giờ, hãy xem liệu bạn đã cung cấp thành công thông tin mà ChatGPT không biết do ngày giới hạn kiến thức của nó hay chưa.

Hỏi ChatGPT tùy chỉnh về chủ đề bên ngoài phạm vi dữ liệu
Hỏi ChatGPT tùy chỉnh về chủ đề bên ngoài phạm vi dữ liệu

Như bạn có thể thấy, nó mô tả chính xác AMD Instinct MI250x, được phát hành sau ngày giới hạn kiến thức của ChatGPT -3.

Thứ Hai, 17/07/2023 08:11
51 👨 730
0 Bình luận
Sắp xếp theo
    ❖ Trí tuệ nhân tạo (AI)