6 điều thú vị ChatGPT 4o có thể làm

OpenAI gần đây đã phát hành model hàng đầu tiếp theo GPT-4o và trình diễn một số bản demo thú vị. Trò chuyện bằng giọng nói giống con người đã trở thành tính năng nổi bật, nhưng nó còn làm được nhiều điều hơn thế nữa. OpenAI không nêu bật nhiều điều thú vị mà ChatGPT 4o có thể làm được. Hãy cùng tìm hiểu những khả năng mới thú vị của ChatGPT 4o qua bài viết sau đây!

1. Tạo văn bản chính xác trong hình ảnh

Các mô hình Diffusion gặp khó khăn trong việc tạo văn bản trên hình ảnh. Dall -E 3 vẫn không tạo được hình ảnh với văn bản đã cho. Tuy nhiên, mô hình ChatGPT 4o là mô hình đa phương thức từ đầu đến cuối, có thể hiển thị văn bản một cách chính xác. OpenAI đã không đề cập đến điều này trong bài thuyết trình. Tuy nhiên, có thể tìm thấy ví dụ trên trang của OpenAI nơi công ty khám phá các khả năng của mô hình.

Khả năng hiển thị văn bản GPT-4o trong việc tạo hình ảnh
Khả năng hiển thị văn bản GPT-4o trong việc tạo hình ảnh

Nó có thể tạo và thêm văn bản vào hình ảnh một cách dễ dàng. Tính nhất quán trong nhiều mẫu rất đáng chú ý. Bạn cũng có thể đính kèm hình ảnh và yêu cầu tạo hình ảnh từ các góc khác nhau của cùng một nhân vật và ChatGPT 4o duy trì tính nhất quán trong tất cả các tình huống. Nó cũng có thể tạo chế độ xem 3D của các đối tượng, có thể kết hợp để tạo kết xuất 3D. Chưa kể ChatGPT 4o còn có thể tạo phông chữ nữa.

Hãy nhớ rằng những khả năng này chưa có trên ChatGPT. Nó vẫn sử dụng Dall -E 3 để tạo hình ảnh. OpenAI có thể mở khóa các tính năng này trong tương lai gần.

2. GPT-4o cũng có thể xử lý video

ChatGPT 4o xử lý video
ChatGPT 4o xử lý video

OpenAI không đề cập đến việc GPT-4o cũng có thể xử lý video. Trên trang mô hình, OpenAI đã chứng minh rằng bạn có thể upload một video lên và yêu cầu GPT-4o tóm tắt video đó. Từ phiên âm đến tóm tắt gạch dòng, ChatGPT 4o thực hiện mọi thứ. Vì vậy, có vẻ như Gemini 1.5 Pro không phải là model duy nhất có thể xử lý video.

3. GPT-4o có thể là gia sư của bạn

Trong buổi thuyết trình với Sal Khan của Khan Academy, OpenAI đã giới thiệu một bản demo hấp dẫn sử dụng mô hình GPT-4o. Về cơ bản, trên iPad, bạn có thể chia sẻ màn hình của mình với ChatGPT 4o và nó có thể xem mọi thứ trên màn hình của bạn.

Bây giờ, bạn có thể yêu cầu nó giải thích và giúp tìm giải pháp cho một vấn đề. Có thể là toán học, khoa học, biểu đồ, bản đồ hay bất cứ thứ gì khác, ChatGPT 4o sẽ là giáo viên riêng hướng dẫn bạn trong suốt buổi học. Đó quả là một ứng dụng tuyệt vời của AI, được hỗ trợ bởi khả năng thị giác đa phương thức của GPT-4o. Nhân tiện, nó cũng hoạt động với ứng dụng desktop ChatGPT dành cho macOS.

4. ChatGPT 4o có thể là người bạn đồng hành trong cuộc họp

Trong một trong các bản demo, OpenAI đã giới thiệu rằng người dùng có thể sử dụng ChatGPT 4o làm người bạn đồng hành trực tiếp trong các cuộc họp. Bạn có thể chia sẻ màn hình với ChatGPT 4o để nó có thể xem và nghe thấy tất cả những người tham gia. Nó cũng có thể cung cấp thông tin đầu vào và người tham gia cũng có thể đặt câu hỏi cho mô hình GPT-4o. ChatGPT 4o trả lời một cách tự nhiên và tiếp tục tham gia vào cuộc trò chuyện. Cuối cùng, bạn có thể yêu cầu nó tóm tắt lại cuộc họp. Thật tuyệt vời phải không?

5. Cải thiện hiệu suất ngôn ngữ không phải tiếng Anh

OpenAI không chỉ cải thiện hiệu suất của GPT-4o bằng tiếng Anh mà còn cải thiện hiệu suất bằng các ngôn ngữ khác. Nó đã cải thiện đáng kể khả năng cho phép mô hình nén các ngôn ngữ không phải tiếng Anh để phù hợp với nhiều token hơn.

Cải tiến token ngôn ngữ GPT-4o
Cải tiến token ngôn ngữ GPT-4o

Để đưa ra một số ví dụ, ngôn ngữ Gujarati chiếm ít token hơn 4,4 lần, token tiếng Hindi ít hơn 2,9 lần, token tiếng Telugu ít hơn 3,5 lần, token tiếng Urdu ít hơn 2,5 lần, token tiếng Nga ít hơn 1,7 lần, v.v... Về cơ bản, đối với các ngôn ngữ khác không phải tiếng Anh, ChatGPT 4o thậm chí còn trở nên mạnh mẽ hơn.

6. ChatGPT 4o đánh bại tất cả các mô hình AI khác

OpenAI không thảo luận về các con số chuẩn và tập trung vào việc mang lại những trải nghiệm mới. Tuy nhiên, ChatGPT 4o làm lu mờ tất cả các mô hình AI khác của Google, Anthropic, Meta, v.v... Trên thực tế, nó hoạt động tốt hơn so với mô hình GPT-4 Turbo của chính OpenAI được phát hành vài tháng trước.

Hiệu suất benchmark ChatGPT 4o
Hiệu suất benchmark ChatGPT 4o

Từ MMLU đến HumanEval, GPQA và DROP, ChatGPT 4o vượt trội hơn cả mô hình độc quyền và nguồn mở. Trong đấu trường LMSYS cũng vậy, mô hình ChatGPT 4o đã đạt được điểm ELO tổng thể là 1310, cao hơn nhiều so với các mô hình AI khác.

Thứ Hai, 20/05/2024 14:59
55 👨 2.523
0 Bình luận
Sắp xếp theo
    ❖ Trí tuệ nhân tạo (AI)