Khám phá cổng trải nghiệm trí tuệ nhân tạo VTCC.Ai của Trung tâm không gian mạng

Nơi người dùng có thể trải nghiệm với 3 dịch vụ về xử lý tiếng nói

Cổng trải nghiệm trí tuệ nhân tạo VTCC.Ai là nơi giới thiệu, quảng bá các dịch vụ trí tuệ nhân tạo (Ai - Artificial Intelligence) của Trung tâm Không Gian mạng Viettel. Đây là sản phẩm được nghiên cứu bởi những kỹ sư hàng đầu tại Viettel Cyberspace Center (VTCC), được chính thức “mở cửa” từ 10/10/2018. Tại đây, bất kỳ ai cũng có thể tham gia trải nghiệm, khám phá các dịch vụ trí tuệ nhân tạo của VTCC.

Cổng trải nghiệm trí tuệ nhân tạo VTCC.Ai

Tại VTCC.AI, các bạn có thể trải nghiệm 3 dịch vụ xử lí tiếng nói bao gồm:

  • Nhận dạng tiếng nói (Speech to Text): Dịch vụ tự động chuyển đổi tiếng nói thành văn bản Tiếng Việt với chính tả và ngữ pháp có độ chính xác cao.
  • Tổng hợp tiếng nói (Text to Speech): Phần mềm sẽ tự động chuyển đổi văn bản mà người dùng nhập vào thành tiếng nói tiếng Việt với ngữ điệu tự nhiên. Có 5 giọng đọc gồm 3 giọng miền Bắc (2 nữ, 1 nam) và 2 giọng miền Nam (1 nam, 1 nữ) cho người dùng lựa chọn.
  • Voice wake-up: Hệ thống lắng nghe các khẩu lệnh cụ thể, ngắn gọn để đánh thức, khởi động một hệ thống khác.

Tổng hợp tiếng nói (Text to Speech)Nhận dạng tiếng nói (Speech to Text)Voice wake-up

Để trải nghiệm các dịch vụ này của VTCC.AI, các bạn có thể truy cập tại trang web: https://vtcc.ai/tts.

Công nghệ xử lý tiếng nói của VTCC.Ai đã được giải nhất trong cuộc thi xử lý ngôn ngữ tiếng Việt (VLSP 2018) với số điểm vượt trội (4.5/5) so với các đối thủ cả về độ tự nhiên lẫn mức độ rõ ràng. Sản phẩm nhận được đánh giá cao từ các chuyên gia.

Để sản sinh ra tiếng nói Tiếng Việt với ngữ điệu tự nhiên, đa dạng và tích hợp dễ dàng trên các hệ thống, các kỹ sư nhóm xử lý tiếng nói của VTCC đã sử dụng công nghệ hiện đại nhất trong lĩnh vực trí tuệ nhân tạo như công nghệ học sâu (deep learning) tiên tiến thay vì áp dụng các kỹ thuật truyền thống như HMM (Hidden Markov Model) hay ghép nối các từ…

Sản phẩm của VTCC có thể được ứng dụng trên nhiều nền tảng khác nhau như ứng dụng trong sách nói, đọc báo tự động trên trình duyệt Sfive, ứng dụng trong hệ thống chăm sóc khách hàng tự động.

Dịch vụ nhận dạng tiếng nói của VTCC vượt trội so với Google về độ chính xác. Vào năm 2018, các kỹ sư VTCC đã thực hiện bài kiểm tra vào nhiều thời điểm khác nhau trên cùng một 1 tập dữ liệu và trong cùng 1 khoảng thời gian, kết quả cho thấy độ chính xác của hệ thống Google chỉ đạt 55% trong khi đó dịch vụ nhận dạng tiếng nói của Viettel đạt 82% .

Không chỉ vượt trội về chất lượng, dịch vụ của Viettel còn có chi phí vận hành rất thấp, chỉ bằng 1/10 Google.

Thứ Hai, 03/06/2019 11:57
53 👨 166