Mozilla tung ra engine nhận diện giọng nói mã nguồn mở đầu tiên

Vũ An

Mozilla ra mắt Common Voice vào giữa tháng Sáu, dự án này hiện vẫn đang trong giai đoạn đào tạo, người dùng sẽ giúp “dạy” cho engine bằng cách đọc các đoạn văn bản ngắn hoặc xác minh độ chính xác của các đoạn ghi âm trước đó.

Mozilla muốn giọng nói của bạn dạy cho engine nhận diện giọng nói

Mục tiêu của việc này là thu thập ít nhất 10.000 giờ ghi âm giọng nói, như vậy các kỹ sư của Mozilla cho là đủ để dạy cho hệ thống nhận diện giọng nói. Mozilla nói rằng họ lên kế hoạch tung ra cơ sở dữ liệu của Common Voice dưới dạng mã nguồn mở vào cuối năm 2017.

Lý do khiến họ tham gia dự án này là do hệ thống nhận diện giọng nói mã nguồn mở vẫn còn rất thiếu vắng trên thị trường. Hiện tại, tất cả các engine này đều là sản phẩm riêng của từng công ty, như Amazon (Alexa), Apple (Siri) hay Microsofot (Cortana), đó chỉ là một vài cái tên.

Common Voice là dự án engine nhận diện giọng nói mã nguồn mở đầu tiên

Engine nhận diện giọng nói mã nguồn mở sẽ giúp các nhà phát triển nhỏ

“Tôi cho rằng điều này sẽ khuyến khích sự sáng tạo”, Mozilla nói, “nên chúng tôi tạo ra dự án Common Voice, một dự án giúp đưa nhận diện giọng nói đến với mọi người”.

Common Voice sẽ mang đến công nghệ nhận diện giọng nói cho tất cả mọi người, kể cả những nhà phát triển bình thường, vốn không thể chi trả hàng triệu đô-la vào những công nghệ như Cortana.

Những người muốn đóng góp giọng nói của mình cho cơ sở dữ liệu của Common Voice có thể tham gia tại địa chỉ website của dự án. https://voice.mozilla.org/ Bạn không cần phải có microphone xịn hay căn phòng cách âm để đọc những đoạn văn bản mẫu này. Các kỹ sư của Mozilla nói rằng họ muốn thu thập dữ liệu từ môi trường thực nên ngay cả khi có chút ồn hay giọng nói có phương ngữ cũng không sao. Các đoạn văn bản được đọc đều là văn bản tiếng Anh.

Thứ Năm, 20/07/2017 14:47

5 ★ 1 👨 228

Bạn nên đọc

Xác thực tài khoản!

Theo Nghị định 147/2024/ND-CP, bạn cần xác thực tài khoản trước khi sử dụng tính năng này. Chúng tôi sẽ gửi mã xác thực qua SMS hoặc Zalo tới số điện thoại mà bạn nhập dưới đây:

Số điện thoại chưa đúng định dạng!

0 Bình luận

Sắp xếp theo

Xóa Đăng nhập để Gửi

Công nghệ mới

Cũ vẫn chất

Xem thêm

Giấy phép số 362/GP-BTTTT. Bộ Thông tin và Truyền thông cấp ngày 30/06/2016. Cơ quan chủ quản: CÔNG TY CỔ PHẦN MẠNG TRỰC TUYẾN META. Địa chỉ: 56 Duy Tân, Phường Cầu Giấy, Hà Nội. Điện thoại: 024 2242 6188. Email: info@meta.vn. Chịu trách nhiệm nội dung: Lê Ngọc Lam.

Mozilla tung ra engine nhận diện giọng nói mã nguồn mở đầu tiên

Vũ An

Mozilla muốn giọng nói của bạn dạy cho engine nhận diện giọng nói

Engine nhận diện giọng nói mã nguồn mở sẽ giúp các nhà phát triển nhỏ

Bạn nên đọc

Công cụ kiểm tra phần cứng laptop Surface hiện đã có mặt trong Windows Store

10 siêu máy tính nhanh nhất thế giới 2026

Một mũi tên trúng hai đích: Mozilla muốn vừa chia sẻ vừa muốn mã hóa tập tin

Microsoft phát hành ứng dụng LinkedIn hoàn toàn mới cho Windows 10

Cảm biến siêu nhỏ không thể nhìn thấy bằng mắt thường này giúp giải quyết vấn đề quá nhiệt của chip máy tính

Sự ảnh hưởng "đáng sợ" của AI trong xung đột hiện đại

AI đang được triển khai hiệu quả trong chiến tranh hiện đại, nhưng sẽ không thể thay thế con người

Kỷ nguyên chiến tranh qua chatbot dần hé mở: Khi AI thương mại bước vào lĩnh vực quân sự

Đột phá pin ion canxi có thể thay thế lithium trong lưu trữ năng lượng sạch

Cũ vẫn chất

Những bài thơ tán gái theo tên, thơ làm quen bạn gái vừa duyên vừa mặn

Kí tự đặc biệt ϟ, ✿, \˚ㄥ˚\, ☎,☂, ☁ ký tự đặc biệt hay

Công thức tính diện tích xung quanh hình nón, diện tích toàn phần hình nón, thể tích hình nón, V nón

Lời chúc sinh nhật cho bản thân, stt viết cho ngày sinh nhật của mình

Cách tạo Slide Master trên PowerPoint

Cách tạo bảng trong Canva

Hướng dẫn 5 cách chuyển số thành chữ trong Excel

Những ứng dụng hoán đổi khuôn mặt tốt nhất

Cách tính điểm trung bình môn HK 1, HK 2, cả năm

6 cách siêu dễ thêm phụ đề, caption vào video