Vào tháng 8 năm 2023, Facebook đã giới thiệu công cụ AI có thể hỗ trợ dịch gần 100 ngôn ngữ cho văn bản và 36 ngôn ngữ cho lời nói.
Mark Zuckerberg chia sẻ trên trang cá nhân Facebook cho biết, công cụ AI SeamlessM4T có khả năng chuyển giọng nói thành văn bản, chuyển văn bản thành giọng nói, dịch văn bản thành văn bản, chuyển giọng nói thành giọng nói và hỗ trợ gần 100 ngôn ngữ khác nhau. Ông cho biết thêm, những tiến bộ AI này trong dịch thuật và phiên âm sẽ được tích hợp dần vào Facebook, Instagram, WhatsApp, Messenger và Threads.
Với phiên bản SeamlessM4T mới được cải tiến hoàn thiện hơn công cụ này sẽ giúp các bản dịch đàm thoại trở nên tự nhiên và biểu cảm hơn.
Tính năng "SeamlessExpressive" của SeamlessM4T hỗ trợ chuyển giọng nói của bạn sang một ngôn ngữ khác. Ở phiên bản mới, tính năng này sẽ tự tùy chỉnh độ cao, âm lượng, giai điệu cảm xúc (phấn khích, buồn bã hoặc thì thầm), tốc độ nói và tạm dừng của giọng nói trong video. Đây có thể là bước đột phá bởi các bài phát biểu được dịch luôn có vẻ giống robot.
SeamlessExpressive hỗ trợ tiếng Anh, tiếng Tây Ban Nha, tiếng Đức, tiếng Pháp, tiếng Ý và tiếng Trung.
Tính năng "SeamlessStreaming", dịch bài phát biểu theo thời gian thực trong khi người nói vẫn đang nói, độ trễ ngắn dưới 2 giây cho phép bạn nghe bản dịch nhanh hơn.
Meta cho biết, công ty phải phát triển một thuật toán dành riêng cho việc nghiên cứu phần âm thanh đầu vào do các ngôn ngữ khác nhau sẽ có cấu trúc câu khác nhau. Điều này sẽ giúp SeamlessM4T quyết định xem có đủ ngữ cảnh để bắt đầu tạo bản dịch hay tiếp tục nghe.
Hiện tại người dùng có thể trải nghiệm thử công cụ AI của Facebook - SeamlessM4T. Đầu tiên, bạn truy cập vào đây, bấm Try to demo và lựa chọn ngôn ngữ của mình và ngôn ngữ cần dịch. Cuối cùng, bạn chỉ cần nói nội dung, công cụ AI của Facebook sẽ tự động dịch giọng nói sang ngôn ngữ đích.Hiện tại, công cụ này mới chỉ hỗ trợ Anh, tiếng Tây Ban Nha, tiếng Đức, tiếng Pháp.