Công ty khởi nghiệp mới nổi trong lĩnh vực trí tuệ nhân tạo ElevenLabs vừa chính thức công bố Turbo 2.5, một mô hình ngôn ngữ hỗ trợ chuyển văn bản thành giọng nói theo thời gian thực với độ trễ thấp và độ chính xác cao. Turbo 2.5 hiện hoạt động với 32 ngôn ngữ khác nhau. Bản cập nhật mới bổ sung hỗ trợ cho tiếng Việt, tiếng Hungary và tiếng Na Uy. Ba ngôn ngữ này đang lần lượt được sử dụng bởi 85 triệu người, 13 triệu người và 5,3 triệu người trên toàn thế giới.
Thông qua mô hình Turbo 2.5 mới, các nhà phát triển bên thứ ba có thể xây dựng những dịch vụ hỗ trợ đàm thoại được hỗ trợ bởi các mô hình ngôn ngữ lớn, tích hợp chúng vào phần cứng như kính thông minh có thể đọc văn bản hoặc sử dụng trong trò chơi điện tử để làm cho nhân vật trở nên sống động hơn.
Với Turbo 2.5, tiếng Hindi, tiếng Pháp, tiếng Tây Ban Nha, tiếng Quan Thoại và 27 ngôn ngữ khác đã có tốc độ chuyển đổi nhanh hơn ba lần, trong khi tiếng Anh nhanh hơn 25%. Để bắt đầu sử dụng API Turbo 2.5 trong các sản phẩm và dịch vụ, nhà phát triển cần truy cập trang API ElevenLabs để xin cấp quyền. Đối với các doanh nghiệp muốn truy cập số lượng lớn, có thể liên hệ trực tiếp với ElevenLabs.
Đầu tháng này, ElevenLab cũng đã ra mắt API Voice Isolator cho các nhà phát triển bên thứ ba sử dụng. Đúng như tên gọi, công cụ này sử dụng trí tuệ nhân tạo để loại bỏ tiếng ồn xung quanh khỏi các clip âm thanh và mang lại cho người nghe đoạn hội thoại rõ ràng nhất có thể.