Google Assistant được bổ sung thêm nhiều tùy chọn giọng nói mới do AI tạo ra

Google Assistant là một trong những trợ lý ảo được sử dụng phổ biến và yêu thích nhất hiện nay nhờ sự thông minh, hài hước, và kho tùy chọn giọng nói tuyệt vời mà nó hỗ trợ. Trợ lý AI này hiện có thể nói và hát như nam ca sĩ John Legend ở Hoa Kỳ, đồng thời có thể tương tác với con người bằng hơn 30 ngôn ngữ ở 80 quốc gia khác nhau trên toàn thế giới (với xuất phát điểm là 8 loại ngôn ngữ và 14 quốc gia trong năm 2017). Ngoài ra, sau một thời gian dài đào tạo, công cụ AI của Google hiện đã có thể tạo ra các tùy chọn giọng mới mới với độ chân thực ở mức cao, hứa hẹn mang đến cho người dùng nhiều trải nghiệm thú vị hơn.

Google Assistant là một trong những trợ lý ảo được sử dụng phổ biến và yêu thích nhất trên thế giớiGoogle Assistant là một trong những trợ lý ảo được sử dụng phổ biến và yêu thích nhất trên thế giới

Để nâng cao trải nghiệm người dùng với trợ lý ảo Assistant ở một số quốc gia ngoài Hoa Kỳ, Google mới đây đã bổ sung thêm một tùy chọn giọng nói thứ hai với nhịp điệu độc đáo hơn cho các gói ngôn ngữ tiếng Anh (Ấn Độ), tiếng Pháp, tiếng Đức, tiếng Nhật, tiếng Hà Lan, tiếng Na Uy, tiếng Hàn và tiếng Ý. Đặc biệt, đây đều là các tùy chọn giọng nói do chính công cụ AI của Google tạo ra. Trước đó, AI cũng đã tạo ra 11 tùy giọng nói tiếng Anh, 6 trong số đó được giới thiệu tại hội nghị nhà phát triển Google I/O 2018.

Giám đốc sản phẩm Google Assistant, ông Brant Ward, cho biết mỗi tùy chọn giọng nói đều được tổng hợp bởi một hệ thống máy học - WaveNet - được phát triển và quản lý bởi DeepMind, một công ty chuyên nghiên cứu và ứng dụng trí tuệ nhân tạo cũng thuộc tập đoàn Alphabet. Cách thức WaveNet sáng tạo ra một tùy chọn giọng nói mới, về cơ bản, cũng không quá phức tạp. Yếu tố cốt lõi ở đây chính là ngữ điệu trong từng tình huống cụ thể, làm sao để tự nhiên và chân thực nhất như được nói bởi con người. WaveNet sáng tạo ngữ điệu bằng cách xác định các mẫu âm trong dữ liệu lời nói mà nó được đào tạo, từ đó tổng hợp và tạo ra các tùy chọn mới.

WaveNet sáng tạo ngữ điệu bằng cách xác định các mẫu âm trong dữ liệu lời nói mà nó được đào tạoWaveNet sáng tạo ngữ điệu bằng cách xác định các mẫu âm trong dữ liệu lời nói mà nó được đào tạo

Ngoài việc có thể tạo ra các đoạn hội thoại với ngữ điệu chuẩn xác hơn nhiều so với những mô hình AI trước đây, WaveNet còn tỏ ra hiệu quả hơn về cả khía cạnh “năng suất sáng tạo”. Mô hình AI này chạy trên các đơn vị xử lý tenor của Google (TPU), hoặc các con chip tùy chỉnh được tích hợp trên những mạch tối ưu hóa đặc biệt cho các tác vụ liên quan đến đào tạo mô hình AI. Nhờ đó, WaveNet chỉ mất 50 mili giây để khởi tạo một mẫu giọng nói với độ dài cơ bản.

Khả năng hỗ trợ đa ngôn ngữ của Google Assistant đã được cải thiện đáng kểKhả năng hỗ trợ đa ngôn ngữ của Google Assistant đã được cải thiện đáng kể

Vào tháng 2 năm nay, Google cũng đã tăng cường khả năng hỗ trợ đa ngôn ngữ của Google Assistant - cho phép trợ lý ảo này có thể nhận ra nhiều loại ngôn ngữ trong các cuộc hội thoại đa chiều - tiếng Hàn, tiếng Hindi, tiếng Thụy Điển, tiếng Na Uy, tiếng Đan Mạch và tiếng Hà Lan. Trong một tin tức khác, Google cũng vừa giới thiệu Interpreter Mode (tạm dịch: Chế độ thông dịch viên) đối với các bản dịch từ hàng chục ngôn ngữ khác nhau, tuyên bố giảm 29% lỗi nhận dạng giọng nói.

Thứ Năm, 19/09/2019 21:50
54 👨 267
0 Bình luận
Sắp xếp theo
    ❖ Chuyện công nghệ