Cách chuyển giọng nói thành văn bản bằng Speech to Text của Viettel

Nhận diện giọng nói

Cổng trải nghiệm trí tuệ nhân tạo VTCC.AI của Viettel mới đây đã cho ra mắt 3 dịch vụ nhận dạng giọng nói, khi sử dụng trí tuệ nhân tạo tiên tiến. Speech to Text chuyển giọng nói thành văn bản là một trong những dịch vụ của VTCC.AI. Người dùng tiến hành thu âm giọng nói của mình và dịch vụ sẽ chuyển thành văn bản với độ chính xác cao, khi sử dụng mạng noron sâu kết hợp các giải pháp cho đặc thù tiếng Việt.

Hiện tại dịch vụ Speech to Text đã được áp dụng ở nhiều lĩnh vực, hỗ trợ đa dạng đầu vào, gồm thu âm trực tiếp hoặc thu âm qua điện thoại, qua tổng đài. Bài viết dưới đây sẽ hướng dẫn bạn đọc cách sử dụng dịch vụ Speech to Tex để chuyển giọng nói thành văn bản.

Hướng dẫn dùng dịch vụ Speech to Text của Viettel

Bước 1:

Để có thêm tùy chọn quản lý nội dung bạn đọc có thể tạo tài khoản. Các bước tạo tài khoản người dùng thực hiện theo bài viết Cách chuyển văn bản thành giọng nói Text to Speech của Viettel.

Hoặc người dùng truy cập luôn vào link dưới đây để sử dụng dịch vụ Speech to Text, chuyển giọng nói thành văn bản.

https://vtcc.ai/asr

Bước 2:

Ở giao diện của dịch vụ nhấn vào nút Record Audio để tiến hành ghi âm.

Thu âm giọng nói

Khi đó dịch vụ yêu cầu người dùng cho phép dùng micro trên trình duyệt, nhấn Cho phép để tiến hành thu âm giọng nói.

Dùng micro

Bước 3:

Quá trình thu âm giọng diễn ra ngay sau đó. Những từ bạn nói tự động được chuyển sang tài liệu ngay bên cạnh. Người dùng lưu ý cần phải đọc to, rõ ràng từng từ, chậm để dịch vụ phân tích giọng nói của bạn.

Để dừng thu âm giọng nói nhấn nút Stop ở bên dưới.

Thu âm giọng nói

Kết quả văn bản chuyển từ giọng nói hiện trong khung màu trắng. Dịch vụ sẽ giới hạn thời gian chúng ta thu âm nên bạn cần chú ý.

Kết quả văn bản

Bước 4:

Dịch vụ cũng hỗ trợ tải file ghi âm có sẵn với file định dạng mp3, wav và flac, tối đa thời gian ghi âm không quá 20 giây. Tuy nhiên tính năng này đôi khi bị lỗi hệ thống, không tải được file âm thanh lên máy chủ.

Tải file có sẵn

Nhìn chung việc nhận dạng giọng nói để chuyển thành văn bản của dịch vụ Speech to Text của VTCC.AI hoạt động tương đối hiệu quả, độ chính xác cao về chính tả và ngữ pháp.

Chúc các bạn thực hiện thành công!

Thứ Tư, 27/05/2020 08:07
3,97 👨 29.027
0 Bình luận
Sắp xếp theo