OpenAI phát triển công nghệ tái tạo giọng nói chỉ từ đoạn ghi âm 15 giây

Vào ngày 29/3, OpenAI đã giới thiệu phần mềm Voice Engine, sử dụng trí tuệ nhân tạo để tạo ra giọng nói dựa trên các đoạn ghi âm ngắn chỉ 15 giây và có khả năng đọc văn bản. Nó cũng có thể tái tạo giọng nói bằng ngôn ngữ nước ngoài, thậm chí ngay cả với những mẫu ghi âm chỉ sử dụng tiếng Anh.

Voice Engine đã được OpenAI phát triển từ năm 2022 và đã được thử nghiệm với một nhóm khách hàng vào cuối năm 2023. Trong đó, phần mềm đã thể hiện khả năng hỗ trợ đọc, dịch nội dung giữa các ngôn ngữ khác nhau và tạo giọng nói cho những người mất khả năng nói.

open ai giong noi

Tuy nhiên, OpenAI cũng nhấn mạnh về nguy cơ tiềm tàng của công nghệ bắt chước giọng nói, đặc biệt là trong bối cảnh các cuộc bầu cử tổng thống tại Mỹ. Đây là một phần lý do mà họ quyết định hạn chế quyền truy cập và không mở rộng rãi công nghệ này.

Theo công ty sở hữu ChatGPT, việc công bố Voice Engine nhằm khuyến khích các quản lý và công chúng tăng cường cảnh giác với những trò lừa đảo sử dụng trí tuệ nhân tạo. Các nhà phát triển cũng cảnh báo về việc tội phạm có thể sử dụng phần mềm giả giọng để đánh cắp thông tin cá nhân hoặc xâm nhập vào các hệ thống an ninh tại ngân hàng.

OpenAI chia sẻ, "Quan trọng là mọi người phải hiểu rõ hướng đi của sản phảm công nghệ này, dù chúng tôi có phát hành nó rộng rãi hay không".

open ai giong noi

Công nghệ giả giọng bằng trí tuệ nhân tạo gây chú ý sau khi một bản ghi âm bắt chước giọng của Tổng thống Mỹ Joe Biden kêu gọi người dân "không tham gia bầu cử sơ bộ của đảng Dân chủ ở New Hampshire", được lan truyền trên mạng xã hội vào tháng 1.

Pindrop Security, một công ty chuyên phát hiện lừa đảo qua giọng nói, sau đó đã phân tích bản ghi và kết luận rằng đây là deepfake sử dụng công nghệ của ElevenLabs - một startup phát triển phần mềm trí tuệ nhân tạo tạo ra giọng nói bằng hơn 20 ngôn ngữ.

Theo tạp chí Fortune, deepfake giọng của ông Biden khiến nhiều chuyên gia và quan chức phụ trách bầu cử Mỹ lo ngại, gọi đó là "nỗ lực can thiệp bầu cử được hỗ trợ bởi trí tuệ nhân tạo". Một số đánh giá cho thấy việc phát tán deepfake âm thanh không chỉ dễ dàng, mà còn có nguy cơ kẻ xấu sử dụng công nghệ này để ảnh hưởng đến kết quả bầu cử và ngăn cản cử tri đi bỏ phiếu.

Chủ Nhật, 31/03/2024 12:49
31 👨 183
0 Bình luận
Sắp xếp theo
    ❖ Trí tuệ nhân tạo (AI)