Cổng trải nghiệm trí tuệ nhân tạo VTCC.AI của Viettel mới đây đã cho ra mắt 3 dịch vụ nhận dạng giọng nói, khi sử dụng trí tuệ nhân tạo tiên tiến. Speech to Text chuyển giọng nói thành văn bản là một trong những dịch vụ của VTCC.AI. Người dùng tiến hành thu âm giọng nói của mình và dịch vụ sẽ chuyển thành văn bản với độ chính xác cao, khi sử dụng mạng noron sâu kết hợp các giải pháp cho đặc thù tiếng Việt.
Hiện tại dịch vụ Speech to Text đã được áp dụng ở nhiều lĩnh vực, hỗ trợ đa dạng đầu vào, gồm thu âm trực tiếp hoặc thu âm qua điện thoại, qua tổng đài. Bài viết dưới đây sẽ hướng dẫn bạn đọc cách sử dụng dịch vụ Speech to Tex để chuyển giọng nói thành văn bản.
- Cách chuyển giọng nói bằng Modulate
- Cách chuyển văn bản thành giọng nói bằng SpeechTexter
- Những ứng dụng speech-to-text tốt nhất cho Android
- Kích hoạt tính năng Speech-to-Text trên Android
Hướng dẫn dùng dịch vụ Speech to Text của Viettel
Bước 1:
Để có thêm tùy chọn quản lý nội dung bạn đọc có thể tạo tài khoản. Các bước tạo tài khoản người dùng thực hiện theo bài viết Cách chuyển văn bản thành giọng nói Text to Speech của Viettel.
Hoặc người dùng truy cập luôn vào link dưới đây để sử dụng dịch vụ Speech to Text, chuyển giọng nói thành văn bản.
https://vtcc.ai/asr
Bước 2:
Ở giao diện của dịch vụ nhấn vào nút Record Audio để tiến hành ghi âm.
Khi đó dịch vụ yêu cầu người dùng cho phép dùng micro trên trình duyệt, nhấn Cho phép để tiến hành thu âm giọng nói.
Bước 3:
Quá trình thu âm giọng diễn ra ngay sau đó. Những từ bạn nói tự động được chuyển sang tài liệu ngay bên cạnh. Người dùng lưu ý cần phải đọc to, rõ ràng từng từ, chậm để dịch vụ phân tích giọng nói của bạn.
Để dừng thu âm giọng nói nhấn nút Stop ở bên dưới.
Kết quả văn bản chuyển từ giọng nói hiện trong khung màu trắng. Dịch vụ sẽ giới hạn thời gian chúng ta thu âm nên bạn cần chú ý.
Bước 4:
Dịch vụ cũng hỗ trợ tải file ghi âm có sẵn với file định dạng mp3, wav và flac, tối đa thời gian ghi âm không quá 20 giây. Tuy nhiên tính năng này đôi khi bị lỗi hệ thống, không tải được file âm thanh lên máy chủ.
Nhìn chung việc nhận dạng giọng nói để chuyển thành văn bản của dịch vụ Speech to Text của VTCC.AI hoạt động tương đối hiệu quả, độ chính xác cao về chính tả và ngữ pháp.
Chúc các bạn thực hiện thành công!