So sánh ChatGPT 4o và ChatGPT 4

OpenAI gần đây đã công bố mô hình đa phương thức end-to-end, ChatGPT 4o, và cung cấp miễn phí cho tất cả mọi người. Không chỉ vậy, người dùng miễn phí còn nhận được nhiều tính năng cao cấp trước đây chỉ dành riêng cho người dùng ChatGPT Plus. Vì vậy, bài viết hôm nay sẽ so sánh mô hình ChatGPT 4o và ChatGPT 4 để tìm ra sự khác biệt giữa ChatGPT miễn phí và ChatGPT Plus.

Sự khác biệt giữa ChatGPT miễn phí và ChatGPT Plus

Dưới đây là những điểm khác biệt giữa ChatGPT 4o và ChatGPT 4, có trên phiên bản miễn phí của ChatGPT và ChatGPT Plus. Một số bài kiểm tra lý luận cũng được thực hiện để hiểu sự khác biệt về khả năng của chúng.

ChatGPT FreeChatGPT Plus
Mô hìnhGPT-4o
GPT-3.5
GPT-4o
GPT-4
GPT-3.5
Truy cập Internet
Upload file và tài liệu
Phân tích dữ liệu và tạo biểu đồ
Upload và phân tích hình ảnh
Truy cập GPT tùy chỉnh
Tạo GPT tùy chỉnhKhông
Khám phá GPT Store
Bộ nhớ
Giới hạn message
  • 10 truy vấn trên GPT-4o (tùy theo tải hệ thống)
  • Reset sau mỗi 5 giờ
  • Phần còn lại của truy vấn trên GPT-3.5
Giới hạn message nhiều hơn gấp 5 lần so với người dùng miễn phí trên GPT-4o
Trò chuyện bằng giọng nóiChế độ giọng nói cũHội thoại bằng giọng nói tự nhiên (Sắp có)
Truy cập vào các mô hình sắp tớiKhông

1. Tìm thời gian phơi khô

Trong thử nghiệm đầu tiên, ChatGPT 4o và ChatGPT 4 đã hoạt động giống nhau. Mặc dù có quyền truy cập vào trình thông dịch code, nhưng không có mô hình nào sử dụng nó để tính toán và trả lời thẳng bằng cách suy luận logic.

If it takes 1 hour to dry 15 towels under the Sun, how long will it take to dry 20 towels?

Tạm dịch: Nếu phơi khô 15 chiếc khăn dưới ánh mặt trời mất 1 giờ thì phơi 20 chiếc khăn mất bao lâu?

Tùy chọn chiến thắng: ChatGPT 4o và ChatGPT 4

Kiểm tra lý luận giữa ChatGPT 4o và ChatGPT 4
Kiểm tra lý luận giữa ChatGPT 4o và ChatGPT 4

2. Bài kiểm tra thang máy

Ở bài kiểm tra lý luận lần 2, ChatGPT 4o và ChatGPT 4 đã trả lời đúng và đưa ra kết luận đúng. Cả hai mô hình đều trả lời tầng 4.

There is a tall building with a magic elevator in it. When stopping on an even floor, this elevator connects to floor 1 instead. Starting on floor 1, I take the magic elevator 3 floors up. Exiting the elevator, I then use the stairs to go 3 floors up again. Which floor do I end up on?

Tạm dịch: Có một tòa nhà cao tầng với thang máy thần kỳ bên trong. Khi dừng ở tầng chẵn, thang máy này sẽ kết nối với tầng 1. Bắt đầu từ tầng 1, tôi đi thang máy thần kỳ lên 3 tầng. Ra khỏi thang máy, tôi dùng cầu thang bộ để đi lên 3 tầng nữa. Cuối cùng tôi sẽ ở tầng nào?

Tùy chọn chiến thắng: ChatGPT 4o và ChatGPT 4

Bài kiểm tra thang máy trên ChatGPT 4o

3. Tìm trọng lượng

Thử nghiệm tiếp theo được chứng minh là một thách thức đối với nhiều LLM, nhưng cả ChatGPT 4o và ChatGPT 4 đều vượt qua mà không gặp vấn đề gì. Cả hai mô hình đều cho biết “Một kg lông vũ nặng hơn một pound thép”. Trong so sánh gần đây giữa ChatGPT 4o và Gemini 1.5 Pro, mô hình AI của Google không trả lời chính xác câu hỏi này.

What's heavier, a kilo of feathers or a pound of steel?

Tạm dịch: Cái nào nặng hơn, một cân lông vũ hay một cân thép?

Tùy chọn chiến thắng: ChatGPT 4o và ChatGPT 4

Trắc nghiệm suy luận kinh điển giữa ChatGPT 4o và ChatGPT 4
Trắc nghiệm suy luận kinh điển giữa ChatGPT 4o và ChatGPT 4

4. Làm theo hướng dẫn

Tác giả bài viết đã yêu cầu ChatGPT 4o và ChatGPT 4 tạo 10 câu kết thúc bằng từ “deep learning” và cả hai mô hình đều làm đúng 10 trên 10. Theo đúng hướng dẫn, ChatGPT 4o và GPT-4 đã cùng Llama 3 70B hiểu người dùng ý định và thể hiện sự liên kết tuyệt vời.

Generate 10 sentences that end with the word "deep learning"

Tạm dịch: Tạo 10 câu kết thúc bằng từ "deep learning"

Tùy chọn chiến thắng: ChatGPT 4o và ChatGPT 4

Kiểm tra khả năng làm theo hướng dẫn trên ChatGPT 4o

5. Cuộc thử nghiệm số lượng táo

Câu hỏi cuối cùng được đưa ra để quyết định xem liệu cả hai mô hình có thể hiện mức độ thông minh tương tự nhau hay không. Và quả thực, ChatGPT 4o và ChatGPT 4 đều đưa ra đáp án đúng với lý luận rõ ràng. Cảm ơn OpenAI vì đã làm cho mô hình Omni nhanh hơn gấp 2 lần so với GPT 4 nhưng vẫn cung cấp cùng mức độ thông minh.

I have 3 apples today, yesterday I ate an apple. How many apples do I have now?

Tạm dịch: Hôm nay tôi có 3 quả táo, hôm qua tôi đã ăn một quả táo. Bây giờ tôi có bao nhiêu quả táo?

Tùy chọn chiến thắng: ChatGPT 4o và ChatGPT 4

Thử nghiệm đếm số lượng táo trên ChatGPT 4 và 4o
Thử nghiệm đếm số lượng táo trên ChatGPT 4 và 4o

Sau khi thử nghiệm với cả hai mô hình, có thể thấy ChatGPT 4o thực sự là mô hình đẳng cấp GPT-4. Cả hai đều thực hiện một cách thông minh và khá giống nhau trong cách suy luận và liên kết. Trên thực tế, kết quả benchmark của OpenAI cho thấy ChatGPT 4o tốt hơn một bậc so với mô hình ChatGPT 4. Bảng xếp hạng LMSYS cũng chỉ ra điều tương tự.

ChatGPT 4o đạt 88,7 điểm MMLU và GPT-4 mới nhất (gpt-4-turbo-2024-04-09) đạt 86,5. Xu hướng này cũng tương tự trong các bài kiểm tra benchmark HumanEval, MATH và GPQA. Điểm khác biệt duy nhất là tốc độ hoạt động của ChatGPT 4o. Nó nhanh hơn gấp 2 lần và rẻ hơn 50% so với GPT-4.

Đối với người dùng ChatGPT miễn phí, có thể nói rằng giới hạn 10 message cứ sau 5 giờ là khá tốt. Bạn có thể truy cập miễn phí mô hình ChatGPT 4o hiện đại (ngoài ra còn rất nhiều tính năng cao cấp khác).

Nếu bạn là người dùng thành thạo và thường xuyên sử dụng ChatGPT cho công việc hàng ngày thì việc đăng ký sẽ là lựa chọn tốt hơn. Gần đây một số người đã có quyền truy cập ChatGPT 4o trên tài khoản miễn phí nhưng hiệu suất của nó không đạt yêu cầu. Vì vậy, đối với người dùng nâng cao, hãy tiếp tục và đăng ký ChatGPT Plus.

Thứ Năm, 23/05/2024 15:28
51 👨 303
0 Bình luận
Sắp xếp theo
    ❖ Trí tuệ nhân tạo (AI)