Tacotron 2, hệ thống trí tuệ nhân tạo của Google có thể biến các dòng chữ vô hồn thành giọng nói giống hệt người. Đây được coi là bước tiến vượt bậc của Google, giúp AI trở nên gần gũi với người dùng hơn.
Để làm được như vậy, Tacotron 2 sử dụng 2 trí thông minh nhân tạo có vai trò khác nhau, cái đầu tiên sẽ tập trung vào việc chuyển đổi chữ thành âm phổ (spectrogram - biểu đồ âm thanh), cái thứ 2 (WaveNet) sẽ biến những dữ liệu đó thành âm thanh.
Cùng trải nghiệm sức mạnh vượt trội của hệ thống AI mới của Google bằng cách nghe thử các cặp file âm thanh giống hệt nhau do con người và Tacotron 2 tạo ra. Bạn có thể phân biệt được đó là giọng của máy hay con người không?
“George Washington was the first President of the United States."
"That girl did a video about Star Wars lipstick."
"The buses aren’t the problem, they actually provide a solution."
"The buses aren’t the PROBLEM, they actually provide a SOLUTION."
"Generative adversarial network or variational auto-encoder."
"Basilar membrane and otolaryngology are not auto-correlations."
"He has read the whole thing."
"He reads books".
Theo các công bố hiện tại thì Tacotron 2 có thể xử lý những từ rất khó phát âm mà có thể con người chưa từng gặp qua bao giờ, có thể phân tích để tìm ra trọng tâm cần nhấn trong câu, nhấn mạnh những gì viết hoa hay tự phân tích để phát hiện những lỗi sai chính tả cơ bản.
Hệ thống Tacotron 2 hiện mới chỉ tạo ra được một giọng nữ duy nhất, nói tiếng Anh và được sử dụng để trao đổi với trợ lý ảo Google Assistant. Chắc chắn sau này, Google sẽ tạo thêm các giọng nói khác nữa và Tacotron 2 sẽ được ứng dụng lên rất nhiều nền tảng khác nhau.
Xem thêm: