Meta trình làng Voicebox, mô hình AI hỗ trợ xử lý âm thanh cho nhà sáng tạo

Phạm Hải

Sau vô số tin đồn, Meta cuối cùng cũng đã chính thức công bố mô hình AI thế hệ mới nhất của mình với tên gọi Voicebox. Mô hình này được thiết kế để hỗ trợ các nhà sáng tạo nội dung xử lý hiện quả những tác vụ liên quan đến tạo giọng nói như chỉnh sửa âm thanh, lấy mẫu và cách điệu, ngay cả khi nó không được được đào tạo cụ thể thông qua dữ liệu trong ngữ cảnh.

Meta tự tin khẳng định mô hình AI mới này sẽ “mang lại lợi ích cho nhiều người trên toàn thế giới” chứ không chỉ riêng trong lĩnh vực sáng tạo nội dung. Chẳng hạn như giúp người khiếm thị nghe được tin nhắn bằng văn bản bằng giọng nói, cũng như cho phép mọi người nói tiếng nước ngoài bằng chính giọng nói của họ.

Bản thân Voicebox còn được quảng cáo là có thể tạo cả clip âm thanh chất lượng cao và chỉnh sửa các đoạn âm thanh được ghi trước để loại bỏ những chi tiết gián đoạn không mong muốn, chẳng hạn như tiếng còi ô tô, trong khi vẫn giữ nguyên nội dung và phong cách đa ngôn ngữ, (tạo ra lời nói bằng sáu ngôn ngữ khác nhau). Các phát triển trong tương lai đã được Meta lên kế hoạch cho mô hình bao gồm cung cấp giọng nói tự nhiên cho trợ lý hình ảnh hoặc nhân vật trong các trò chơi trong metaverse.

Meta cũng đã so sánh Voicebox với các mô hình AI hỗ trợ xử lý âm thanh khác hiện có trên thị trường, cụ thể là các đối thủ cạnh tranh chính như Vall-E và YourTTS. Nhìn chung, mô hình của Meta tiên tiến và vượt trội hơn cả đối thủ khi so sánh tỷ lệ lỗi Word và sự tương đồng về Style.

meta trinh lang voicebox mo hinh ai ho tro xu ly am thanh1*284019

meta trinh lang voicebox mo hinh ai ho tro xu ly am thanh2*284018

Voicebox được xây dựng trên Flow Matching. Đây là mô hình tổng quát không tự hồi quy mới nhất của Meta, có thể xử lý ánh xạ không xác định cao giữa văn bản và lời nói. Điều này cho phép Voicebox có thể học tập từ nhiều loại dữ liệu giọng nói khác nhau mà không cần phải dán nhãn cẩn thận, qua đó có cơ hội tiếp cận với lượng dữ liệu đào tạo đa dạng và trên quy mô lớn hơn. Cho đến nay, Voicebox đã được đào tạo trên hơn 50.000 giờ ghi âm bài phát biểu và bản chép lời từ sách nói bằng tiếng Anh, tiếng Pháp, tiếng Tây Ban Nha, tiếng Đức, tiếng Ba Lan và tiếng Bồ Đào Nha.

Mặc dù công nghệ này có thể mở ra một kỷ nguyên mới về trí tuệ nhân tạo AI trong xử lý âm thanh, nhưng Meta thừa nhận rằng nó có thể mang đến khả năng lạm dụng và gây hại ngoài ý muốn. Trong tài liệu nghiên cứu mà Meta chia sẻ về Voicebox sẽ bao gồm thông tin chi tiết về cách công ty xây dựng bộ phân loại hiệu quả cao, có thể phân biệt giữa giọng nói xác thực và giọng nói do Voicebox tạo ra.

Meta sẽ không cung cấp chương trình AI Voicebox cho công chúng sử dụng, cũng như sẽ không phát hành mã nguồn, ít nhất là ở thời điểm hiện tại.

Thứ Hai, 19/06/2023 17:24

3 ★ 4 👨 345

Bạn nên đọc

Xác thực tài khoản!

Theo Nghị định 147/2024/ND-CP, bạn cần xác thực tài khoản trước khi sử dụng tính năng này. Chúng tôi sẽ gửi mã xác thực qua SMS hoặc Zalo tới số điện thoại mà bạn nhập dưới đây:

Số điện thoại chưa đúng định dạng!

0 Bình luận

Sắp xếp theo

Xóa Đăng nhập để Gửi

Cũ vẫn chất

Xem thêm

Giấy phép số 362/GP-BTTTT. Bộ Thông tin và Truyền thông cấp ngày 30/06/2016. Cơ quan chủ quản: CÔNG TY CỔ PHẦN MẠNG TRỰC TUYẾN META. Địa chỉ: 56 Duy Tân, Phường Cầu Giấy, Hà Nội. Điện thoại: 024 2242 6188. Email: info@meta.vn. Chịu trách nhiệm nội dung: Lê Ngọc Lam.

Meta trình làng Voicebox, mô hình AI hỗ trợ xử lý âm thanh cho nhà sáng tạo

Phạm Hải

Bạn nên đọc

OpenAI cảnh báo Microsoft về việc đưa GPT-4 vào Bing Chat quá sớm

Train-to-Test Scaling là gì? Cách tối ưu chi phí AI từ training đến inference

Bing Chat hiện đã có mặt dưới dạng Widget trên iPhone và iPad

Thay thế Windows Mail và Calendar cũ bằng ứng dụng Outlook mới

Nếu AI có thể làm mọi thứ, tại sao chúng ta vẫn cần học?

Hướng dẫn chuyển file PDF kiểm tra thành slide bài giảng bằng Gemini

Mẹo nhập Context hiệu quả trong Cursor

Cách tạo sổ ghi chú mới ngay trong Gemini

Cách tạo website cơ bản trên Cursor

Cũ vẫn chất

6 cách siêu dễ thêm phụ đề, caption vào video

Cách tạo Slide Master trên PowerPoint

Những bài thơ tán gái theo tên, thơ làm quen bạn gái vừa duyên vừa mặn

Hướng dẫn 5 cách chuyển số thành chữ trong Excel

Cách tạo bảng trong Canva

Công thức tính diện tích xung quanh hình nón, diện tích toàn phần hình nón, thể tích hình nón, V nón

Cách tính điểm trung bình môn HK 1, HK 2, cả năm

Những ứng dụng hoán đổi khuôn mặt tốt nhất

Cap đi du lịch hay, stt du lịch hay giúp bạn ghi lại nhật ký hành trình của mình

Cách sửa lỗi gõ tiếng Việt trên Word, Excel