OpenAI gần đây đã công bố mô hình đa phương thức end-to-end, ChatGPT 4o, và cung cấp miễn phí cho tất cả mọi người. Không chỉ vậy, người dùng miễn phí còn nhận được nhiều tính năng cao cấp trước đây chỉ dành riêng cho người dùng ChatGPT Plus. Vì vậy, bài viết hôm nay sẽ so sánh mô hình ChatGPT 4o và ChatGPT 4 để tìm ra sự khác biệt giữa ChatGPT miễn phí và ChatGPT Plus.
Sự khác biệt giữa ChatGPT miễn phí và ChatGPT Plus
Dưới đây là những điểm khác biệt giữa ChatGPT 4o và ChatGPT 4, có trên phiên bản miễn phí của ChatGPT và ChatGPT Plus. Một số bài kiểm tra lý luận cũng được thực hiện để hiểu sự khác biệt về khả năng của chúng.
ChatGPT Free | ChatGPT Plus | |
---|---|---|
Mô hình | GPT-4o GPT-3.5 | GPT-4o GPT-4 GPT-3.5 |
Truy cập Internet | Có | Có |
Upload file và tài liệu | Có | Có |
Phân tích dữ liệu và tạo biểu đồ | Có | Có |
Upload và phân tích hình ảnh | Có | Có |
Truy cập GPT tùy chỉnh | Có | Có |
Tạo GPT tùy chỉnh | Không | Có |
Khám phá GPT Store | Có | Có |
Bộ nhớ | Có | Có |
Giới hạn message |
| Giới hạn message nhiều hơn gấp 5 lần so với người dùng miễn phí trên GPT-4o |
Trò chuyện bằng giọng nói | Chế độ giọng nói cũ | Hội thoại bằng giọng nói tự nhiên (Sắp có) |
Truy cập vào các mô hình sắp tới | Không | Có |
1. Tìm thời gian phơi khô
Trong thử nghiệm đầu tiên, ChatGPT 4o và ChatGPT 4 đã hoạt động giống nhau. Mặc dù có quyền truy cập vào trình thông dịch code, nhưng không có mô hình nào sử dụng nó để tính toán và trả lời thẳng bằng cách suy luận logic.
If it takes 1 hour to dry 15 towels under the Sun, how long will it take to dry 20 towels?
Tạm dịch: Nếu phơi khô 15 chiếc khăn dưới ánh mặt trời mất 1 giờ thì phơi 20 chiếc khăn mất bao lâu?
Tùy chọn chiến thắng: ChatGPT 4o và ChatGPT 4
2. Bài kiểm tra thang máy
Ở bài kiểm tra lý luận lần 2, ChatGPT 4o và ChatGPT 4 đã trả lời đúng và đưa ra kết luận đúng. Cả hai mô hình đều trả lời tầng 4.
There is a tall building with a magic elevator in it. When stopping on an even floor, this elevator connects to floor 1 instead. Starting on floor 1, I take the magic elevator 3 floors up. Exiting the elevator, I then use the stairs to go 3 floors up again. Which floor do I end up on?
Tạm dịch: Có một tòa nhà cao tầng với thang máy thần kỳ bên trong. Khi dừng ở tầng chẵn, thang máy này sẽ kết nối với tầng 1. Bắt đầu từ tầng 1, tôi đi thang máy thần kỳ lên 3 tầng. Ra khỏi thang máy, tôi dùng cầu thang bộ để đi lên 3 tầng nữa. Cuối cùng tôi sẽ ở tầng nào?
Tùy chọn chiến thắng: ChatGPT 4o và ChatGPT 4
Bài kiểm tra thang máy trên ChatGPT 4o
3. Tìm trọng lượng
Thử nghiệm tiếp theo được chứng minh là một thách thức đối với nhiều LLM, nhưng cả ChatGPT 4o và ChatGPT 4 đều vượt qua mà không gặp vấn đề gì. Cả hai mô hình đều cho biết “Một kg lông vũ nặng hơn một pound thép”. Trong so sánh gần đây giữa ChatGPT 4o và Gemini 1.5 Pro, mô hình AI của Google không trả lời chính xác câu hỏi này.
What's heavier, a kilo of feathers or a pound of steel?
Tạm dịch: Cái nào nặng hơn, một cân lông vũ hay một cân thép?
Tùy chọn chiến thắng: ChatGPT 4o và ChatGPT 4
4. Làm theo hướng dẫn
Tác giả bài viết đã yêu cầu ChatGPT 4o và ChatGPT 4 tạo 10 câu kết thúc bằng từ “deep learning” và cả hai mô hình đều làm đúng 10 trên 10. Theo đúng hướng dẫn, ChatGPT 4o và GPT-4 đã cùng Llama 3 70B hiểu người dùng ý định và thể hiện sự liên kết tuyệt vời.
Generate 10 sentences that end with the word "deep learning"
Tạm dịch: Tạo 10 câu kết thúc bằng từ "deep learning"
Tùy chọn chiến thắng: ChatGPT 4o và ChatGPT 4
Kiểm tra khả năng làm theo hướng dẫn trên ChatGPT 4o
5. Cuộc thử nghiệm số lượng táo
Câu hỏi cuối cùng được đưa ra để quyết định xem liệu cả hai mô hình có thể hiện mức độ thông minh tương tự nhau hay không. Và quả thực, ChatGPT 4o và ChatGPT 4 đều đưa ra đáp án đúng với lý luận rõ ràng. Cảm ơn OpenAI vì đã làm cho mô hình Omni nhanh hơn gấp 2 lần so với GPT 4 nhưng vẫn cung cấp cùng mức độ thông minh.
I have 3 apples today, yesterday I ate an apple. How many apples do I have now?
Tạm dịch: Hôm nay tôi có 3 quả táo, hôm qua tôi đã ăn một quả táo. Bây giờ tôi có bao nhiêu quả táo?
Tùy chọn chiến thắng: ChatGPT 4o và ChatGPT 4
Sau khi thử nghiệm với cả hai mô hình, có thể thấy ChatGPT 4o thực sự là mô hình đẳng cấp GPT-4. Cả hai đều thực hiện một cách thông minh và khá giống nhau trong cách suy luận và liên kết. Trên thực tế, kết quả benchmark của OpenAI cho thấy ChatGPT 4o tốt hơn một bậc so với mô hình ChatGPT 4. Bảng xếp hạng LMSYS cũng chỉ ra điều tương tự.
ChatGPT 4o đạt 88,7 điểm MMLU và GPT-4 mới nhất (gpt-4-turbo-2024-04-09) đạt 86,5. Xu hướng này cũng tương tự trong các bài kiểm tra benchmark HumanEval, MATH và GPQA. Điểm khác biệt duy nhất là tốc độ hoạt động của ChatGPT 4o. Nó nhanh hơn gấp 2 lần và rẻ hơn 50% so với GPT-4.
Đối với người dùng ChatGPT miễn phí, có thể nói rằng giới hạn 10 message cứ sau 5 giờ là khá tốt. Bạn có thể truy cập miễn phí mô hình ChatGPT 4o hiện đại (ngoài ra còn rất nhiều tính năng cao cấp khác).
Nếu bạn là người dùng thành thạo và thường xuyên sử dụng ChatGPT cho công việc hàng ngày thì việc đăng ký sẽ là lựa chọn tốt hơn. Gần đây một số người đã có quyền truy cập ChatGPT 4o trên tài khoản miễn phí nhưng hiệu suất của nó không đạt yêu cầu. Vì vậy, đối với người dùng nâng cao, hãy tiếp tục và đăng ký ChatGPT Plus.