Ishan Anand, một nhà phát triển phần mềm đã thành công ‘nhét’ GPT-2 - tiền thân của ChatGPT được OpenAI ra mắt năm 2019 - vào một bảng tính Microsoft Excel. Đây là một dự án đầy thú vị, cho phép người dùng hiểu cách một mô hình ngôn ngữ lớn (LLM) hoạt động).
Anand đã "đóng gói" GPT-2 vào định dạng tệp nhị phân XLSB của Microsoft Excel cho phép bất kỳ ai dù không phải lập trình viên chỉ cần sử dụng bảng tính, đều có thể khám phá và trực tiếp tương tác với cách thức hoạt động của 'bộ chuyển đổi' thực tế bên trong, ít trừu tượng hóa nhất có thể. Anand đặt tên cho bảng tính này là "Spreadsheets-are-all-you-need" (tạm dịch: Chỉ cần bảng tính là đủ).
Bảng tính này yêu cầu phiên bản Excel mới nhất để chạy (không hỗ trợ Excel phiên bản web), hoàn toàn "offline" và không thực hiện bất kỳ kết nối nào đến dịch vụ AI đám mây.
Với bảng tính này, người dùng không thể trò chuyện với nó như ChatGPT mà phải nhập các từ vào các ô khác và xem kết quả dự đoán được hiển thị trong các ô khác gần như ngay lập tức.
Các mô hình ngôn ngữ như GPT-2 được thiết kế để dự đoán ký tự tiếp theo, có thể là sự tiếp tục của một câu hoặc bất kỳ tác vụ dựa trên văn bản nào khác, chẳng hạn như mã nguồn phần mềm. Với các sheet khác nhau trong tệp Excel của Anand, người dùng nắm bắt hoạt động bên trong khi những dự đoán này diễn ra.
"Spreadsheets-are-all-you-need" chỉ hỗ trợ 10 token đầu vào, rất nhỏ so với cửa sổ ngữ cảnh 128.000 token của GPT-4 Turbo, nhưng đủ để trình diễn một số nguyên tắc cơ bản về cách hoạt động của LLM.
Bảng tính của Anand sử dụng phiên bản "GPT-2 Small" với 124 triệu tham số, vào năm 2019 được coi là rất tiên tiến.
"Spreadsheets-are-all-you-need" nặng khoảng 1,2GB có thể khiến Excel bị treo thường xuyên, đặc biệt trên máy Mac. Vì vậy, Anand khuyên nên chạy bảng tính trên Windows. Hiện tại bạn có thể tải xuống bảng tính tích hợp GPT-2 trên GitHub.
Tải về "Spreadsheets-are-all-you-need" tại đây.