Trong một cuộc họp báo diễn ra hồi tháng 5, OpenAI đã tiết lộ một sự bổ sung rất thú vị đang được hãng lên kế hoạch triển khai: Voice Mode (Chế độ giọng nói) mới cho mô hình AI tạo ChatGPT nổi tiếng. Trong các bản demo được chia sẻ, người dùng có thể nói chuyện với ChatGPT bằng cách sử dụng lệnh thoại tự nhiên, và mô hình AI có thể phản hồi cũng bằng giọng nói của chính nó. Kế hoạch ban đầu của công ty là ra mắt Voice Mode cho người dùng ChatGPT Plus tại một số quốc gia và khu vực vào cuối tháng 6.
Mới đây, trong một bài đăng chính thức trên tài khoản mạng xã hội X, OpenAI đã đưa ra thông báo trì hoãn việc ra mắt ChatGPT Voice Mode thêm ít nhất một tháng nữa, tức là cho đến cuối tháng 7. Công ty giải thích lý do cho sự chậm trễ này như sau:
Chúng tôi đang cải thiện khả năng phát hiện và từ chối một số nội dung nhất định của mô hình. Chúng tôi cũng đang nỗ lực cải thiện trải nghiệm người dùng và chuẩn bị cơ sở hạ tầng để mở rộng quy mô lên hàng triệu người dùng đồng thời, trong khi vẫn đảm bảo duy trì khả năng phản hồi theo thời gian thực với độ chính xác cao.
Kế hoạch hiện tại của OpenAI là cho phép một nhóm nhỏ người dùng Plus thử nghiệm Voice Mode vào cuối tháng 7. Sau đó, công ty cho biết tất cả những người người dùng đã đăng ký gói thuê bao trả phí ChatGPT Plus đều sẽ có thể sử dụng Voice Mode nói trong mùa thu năm nay.
Bản demo ChatGPT Voice Mode được tiết lộ hồi tháng 5 đã khiến nhiều người cho rằng giọng nói do OpenAI tạo ra nghe rất giống của Scarlett Johansson, diễn viên lồng tiếng cho chatbot AI hư cấu Samantha trong bộ phim Her năm 2013. Vài ngày sau, chính Scarlett Johansson cũng đăng tải một tuyên bố, cho biết OpenAI đã cố gắng tuyển dụng cô để số hóa giọng nói cho ChatGPT Voice Mode, nhưng cô đã từ chối.
Về phần mình, OpenAI đã phủ nhận rằng giọng nói "Sky" được sử dụng trong bản demo ChatGPT Voice Mode được lấy mẫu theo giọng của Johansson. Tuy nhiên, hiện tại công ty vẫn quyết định tạm dừng việc sử dụng giọng nói kỹ thuật số đó.