OpenAI đang tung ra GPT-4o, một phiên bản khác của mô hình GPT-4 hỗ trợ sản phẩm tiêu biểu của hãng, ChatGPT. Mô hình cập nhật “nhanh hơn nhiều”, cải thiện “khả năng về văn bản, hình ảnh và âm thanh”, CTO Mira Murati của OpenAI cho biết trong một thông báo phát trực tiếp vào thứ Hai vừa qua. Murati cho biết thêm, nó sẽ miễn phí cho tất cả người dùng và người dùng trả phí sẽ tiếp tục “có giới hạn dung lượng gấp 5 lần” so với người dùng miễn phí.
OpenAI phát hành mô hình GPT-4o
Trong một bài đăng trên blog của công ty, OpenAI cho biết các khả năng của GPT-4o “sẽ được triển khai dần qua các phiên bản”, nhưng khả năng văn bản và hình ảnh của nó sẽ bắt đầu được đưa vào ChatGPT ngay hôm nay.
Giám đốc điều hành OpenAI Sam Altman đã đăng rằng mô hình này “có tính chất đa phương thức”, nghĩa là mô hình có thể tạo ra nội dung hoặc hiểu các lệnh bằng giọng nói, văn bản hoặc hình ảnh. Các nhà phát triển muốn thử nghiệm GPT-4o sẽ có quyền truy cập vào API, với mức giá chỉ bằng một nửa và nhanh gấp đôi so với GPT-4 Turbo.
Các tính năng mới sắp có trong chế độ giọng nói của ChatGPT như một phần của mô hình mới. Ứng dụng sẽ có thể hoạt động như một trợ lý giọng nói giống như Her, phản hồi theo thời gian thực và quan sát thế giới xung quanh bạn. Chế độ giọng nói hiện tại bị hạn chế hơn, chỉ phản hồi từng prompt một và hoạt động với những gì nó có thể nghe thấy.
Altman đã phản ánh về quỹ đạo của OpenAI trong một bài đăng trên blog sau sự kiện phát trực tiếp. Ông cho biết tầm nhìn ban đầu của công ty là “tạo ra mọi loại lợi ích cho thế giới”, nhưng ông thừa nhận rằng tầm nhìn đó đã thay đổi. OpenAI đã bị chỉ trích vì không cung cấp nguồn mở cho các mô hình AI tiên tiến của mình. Vì vậy, trọng tâm của công ty đã thay đổi sang hướng cung cấp các mô hình AI cho những nhà phát triển thông qua các API trả phí và các bên thứ ba. “Thay vào đó, giờ đây có vẻ như chúng tôi sẽ tạo ra AI và sau đó những người khác sẽ sử dụng nó để tạo ra nhiều thứ tuyệt vời mà tất cả chúng ta đều được hưởng lợi”.
Trước khi ra mắt GPT-4o ngày hôm nay, các báo cáo trái ngược nhau đã dự đoán rằng OpenAI đang công bố một công cụ tìm kiếm AI để cạnh tranh với Google và Perplexity, một trợ lý giọng nói được đưa vào GPT-4 hoặc một mô hình hoàn toàn mới và cải tiến, GPT-5. Tất nhiên, OpenAI chắc chắn đã ấn định thời điểm ra mắt này ngay trước Google I/O, hội nghị hàng đầu của gã khổng lồ công nghệ, nơi chúng ta mong đợi sẽ thấy sự ra mắt của nhiều sản phẩm AI khác nhau từ nhóm Gemini.
Khả năng của GPT-4o thật đáng kinh ngạc!
Bài phát biểu đàm thoại của GPT-4o thực sự xuất sắc. GPT-4o có thể tổ chức các cuộc trò chuyện phù hợp với bạn, thậm chí cho phép ngắt lời, thay đổi trọng tâm cuộc trò chuyện, thay đổi chủ đề, v.v..., gần như không bỏ sót một nhịp nào.
Khả năng trò chuyện nhanh chóng của nó mang lại rất nhiều ứng dụng mới. Mặc dù ChatGPT đã có chức năng thoại nhưng bị hạn chế vì trước tiên nó phải viết phản hồi để sau đó có thể nói với bạn. Bạn cũng có thể tương tác với ChatGPT bằng giọng nói của mình nhưng sẽ mất thời gian để xử lý yêu cầu.
Giờ đây, giọng nói thời gian thực của GPT-4o gần như liền mạch. Hơn nữa, nó có thể thể hiện cảm xúc và phong cách cụ thể, điều mà trước bản cập nhật này là không thể.
Điều này cũng có thể áp dụng cho dịch thuật trực tiếp, trong đó GPT-4o đã cho thấy sự cải tiến vượt bậc. Bất cứ điều gì giúp việc giao tiếp trở nên dễ dàng hơn khi ở nước ngoài sẽ là một lợi ích to lớn, đặc biệt là với tốc độ dịch thuật. Bản dịch trực tiếp của GPT-4o sẽ vô cùng hữu ích!
Viết code và dạy kèm
GPT-4o cũng mang đến những nâng cấp đáng kể về khả năng giải thích và hỗ trợ code bằng cách sử dụng các khả năng đa phương thức của nó. Tương tự như các công cụ khác, đúng vậy, ChatGPT đã có thể hoạt động với một số dữ liệu, nhưng mô hình mới đã cải thiện đáng kể điều này.
Khả năng gỡ lỗi code chỉ bằng giọng nói thật đáng chú ý. Tuy nhiên, công dụng thực sự của nó sẽ chỉ trở nên rõ ràng khi các lập trình viên và nhà phát triển thực sự bắt đầu sử dụng công cụ này. Mặc dù khả năng viết code của ChatGPT rất hữu ích nhưng chúng chỉ hữu ích khi có kiến thức của người dùng, giống như hầu hết các công cụ Generative AI.
Khi nào GPT-4o ra mắt? GPT-4o có miễn phí không?
GPT-4o sẽ khả dụng ngay lập tức cho những người đăng ký ChatGPT Plus trả phí hàng tháng 20 USD. Tuy nhiên, trong một thời điểm quan trọng khác đối với Generative AI, OpenAI đã tiết lộ rằng GPT-4o sẽ ra mắt cho tất cả người dùng - bao gồm cả người dùng miễn phí - vào thời điểm thích hợp.
Không có ngày cụ thể để GPT-4o khả dụng cho tài khoản ChatGPT miễn phí, nhưng với tốc độ triển khai khác, sẽ không mất quá nhiều thời gian. Các khía cạnh khác của mô hình mới cũng vẫn chưa có.
GPT-4o cũng sẽ mang đến phiên bản desktop ChatGPT đã được chờ đợi từ lâu, bắt đầu với macOS, nhưng một lần nữa, nó vẫn chưa ra mắt.