xAI đang nâng cao khả năng nhận diện giọng nói của Grok lên một tầm cao mới với tính năng Sao chép giọng nói sắp ra mắt. Tính năng này cho phép người dùng ghi âm giọng nói của chính mình bằng cách đọc một đoạn văn bản cụ thể, sau đó Grok sẽ thu thập và xử lý bản ghi âm để tạo ra một hồ sơ giọng nói cá nhân.
Giọng nói được sao chép đó sau đó có thể được sử dụng trong chế độ giọng nói hiện có của Grok hoặc chia sẻ với người khác thông qua một liên kết. Khi ai đó mở một liên kết giọng nói được chia sẻ, họ cũng có tùy chọn lưu lại để sử dụng riêng.

Điều này đưa xAI vượt xa việc chỉ cung cấp các giọng nói được thiết lập sẵn. Công ty đã ra mắt API Grok Voice Agent, tạo hội thoại nhanh nhất trên thị trường với thời gian phản hồi dưới 700ms, và hiện API này cũng được sử dụng trong các xe Tesla. Nhân bản giọng nói sẽ là một bước mở rộng, chuyển sản phẩm từ các thiết lập sẵn có sang âm thanh được cá nhân hóa.
Cơ chế chia sẻ đặc giọng nói trên Grok biệt đáng chú ý. Mô hình phân phối giọng nói dựa trên liên kết có thể tạo tiền đề cho một thị trường giọng nói phi chính thức hình thành và phát triển, điều mà một số báo cáo đã từng dự báo khi các nền tảng bắt đầu triển khai các tùy chọn giọng nói tùy chỉnh trong những năm trước.

Tính năng này vẫn đang trong quá trình phát triển, chưa có thời gian phát hành chính thức, mặc dù tốc độ phát hành gần đây của xAI đối với Grok cho thấy tính năng này ra mắt không còn xa nữa.
Học IT










Công nghệ
Microsoft Word 2013
Microsoft Word 2007
Microsoft Excel 2019
Microsoft Excel 2016
Microsoft PowerPoint 2019
Google Sheets
Lập trình Scratch
Bootstrap
Prompt
Ô tô, Xe máy