Hướng dẫn chuyển âm thanh thành văn bản trên Gemini 1.5 Pro

Gemini 1.5 Pro mới cập nhật thêm tính năng nghe các tệp âm thanh và sau đó xử lý rồi trích xuất thông tin văn bản từ những đoạn âm thanh đó. Gemini có khả năng xử lý các loại âm thanh khác nhau thành văn bản, với nhiều ngôn ngữ khác nhau để giúp người dùng dễ dàng có được nội dung mình cần. Dưới đây là hướng dẫn chuyển âm thanh thành văn bản trên Gemini 1.5 Pro.

Cách chuyển âm thanh thành văn bản trên Gemini 1.5 Pro

Bước 1:

Đầu tiên bạn cần truy cập vào trang web xử lý âm thanh của Gemini theo link dưới đây.

Tiếp đến bạn nhìn ở cạnh phải mục Model và chọn Gemini 1.5 Pro để sử dụng.

Gemini 1.5 Pro

Bước 2:

Tiếp đến người dùng nhấn vào tab Audio ở bên trên để tải file âm thanh muốn chuyển sang văn bản.

Gemini 1.5 Pro Audio

Lúc này người dùng sẽ nhìn thấy các tùy chọn tải âm thanh lên Gemini 1.5 Pro để sử dụng. Bạn chọn Drive để thực hiện tải âm thanh từ Google Drive.

Tùy chọn tải âm thanh lên Gemini 1.5 Pro

Lúc này người dùng cần đồng ý để Google AI Studio truy cập tài khoản Google của bạn.

Google AI Studio truy cập tài khoản Google

Bước 3:

Người dùng tải file âm thanh cần xử lý lên Gemini 1.5 Pro rồi nhập yêu cầu muốn thực hiện, sau đó nhấn biểu tượng gửi hình tròn màu xanh. Lưu ý, mỗi một tài khoản sẽ có số lượng token riêng và mỗi khi tải file âm thanh sẽ cần một số token khác nhau để xử lý file đăng lên.

Tải âm thanh lên Gemini 1.5 Pro

Bước 4:

Ngay sau đó bạn sẽ thấy nội dung được chuyển từ âm thanh trên Gemini 1.5 Pro như hình dưới đây. Nội dung được viết rõ chi tiết, cụ thể theo giờ để người dùng dễ dàng theo dõi.

Chuyển âm thanh thành văn bản trên Gemini 1.5 Pro

Tính năng mới này trên Gemini 1.5 Pro được áp dụng cho tất cả các tài khoản của Google mà bạn không cần phải đăng ký gì khác.

Thứ Hai, 15/04/2024 17:05
31 👨 693
0 Bình luận
Sắp xếp theo