Mozilla tung ra engine nhận diện giọng nói mã nguồn mở đầu tiên

Mozilla ra mắt Common Voice vào giữa tháng Sáu, dự án này hiện vẫn đang trong giai đoạn đào tạo, người dùng sẽ giúp “dạy” cho engine bằng cách đọc các đoạn văn bản ngắn hoặc xác minh độ chính xác của các đoạn ghi âm trước đó.

Mozilla muốn giọng nói của bạn dạy cho engine nhận diện giọng nói

Mục tiêu của việc này là thu thập ít nhất 10.000 giờ ghi âm giọng nói, như vậy các kỹ sư của Mozilla cho là đủ để dạy cho hệ thống nhận diện giọng nói. Mozilla nói rằng họ lên kế hoạch tung ra cơ sở dữ liệu của Common Voice dưới dạng mã nguồn mở vào cuối năm 2017.

Lý do khiến họ tham gia dự án này là do hệ thống nhận diện giọng nói mã nguồn mở vẫn còn rất thiếu vắng trên thị trường. Hiện tại, tất cả các engine này đều là sản phẩm riêng của từng công ty, như Amazon (Alexa), Apple (Siri) hay Microsofot (Cortana), đó chỉ là một vài cái tên.

Common Voice là dự án engine nhận diện giọng nói mã nguồn mở đầu tiên
Common Voice là dự án engine nhận diện giọng nói mã nguồn mở đầu tiên

Engine nhận diện giọng nói mã nguồn mở sẽ giúp các nhà phát triển nhỏ

“Tôi cho rằng điều này sẽ khuyến khích sự sáng tạo”, Mozilla nói, “nên chúng tôi tạo ra dự án Common Voice, một dự án giúp đưa nhận diện giọng nói đến với mọi người”.

Common Voice sẽ mang đến công nghệ nhận diện giọng nói cho tất cả mọi người, kể cả những nhà phát triển bình thường, vốn không thể chi trả hàng triệu đô-la vào những công nghệ như Cortana.

Những người muốn đóng góp giọng nói của mình cho cơ sở dữ liệu của Common Voice có thể tham gia tại địa chỉ website của dự án. https://voice.mozilla.org/ Bạn không cần phải có microphone xịn hay căn phòng cách âm để đọc những đoạn văn bản mẫu này. Các kỹ sư của Mozilla nói rằng họ muốn thu thập dữ liệu từ môi trường thực nên ngay cả khi có chút ồn hay giọng nói có phương ngữ cũng không sao. Các đoạn văn bản được đọc đều là văn bản tiếng Anh.

Thứ Ba, 01/08/2017 13:47
31 👨 147
0 Bình luận
Sắp xếp theo