Mistral ra mắt AI phiên âm chạy trên thiết bị: nhanh hơn và riêng tư hơn

Phạm Hải

Mistral AI vừa giới thiệu hai mô hình chuyển giọng nói thành văn bản mới là Voxtral Mini Transcribe 2 và Voxtral Realtime, được thiết kế để chạy trực tiếp trên thiết bị. Điều này đồng nghĩa với việc các cuộc trò chuyện của bạn không cần gửi lên trung tâm dữ liệu, giúp đảm bảo quyền riêng tư tốt hơn.

Có những lúc bạn cần ghi âm và chép lại nội dung, nhưng lại không muốn dữ liệu “trôi nổi” trên internet, nơi có thể trở thành mục tiêu của hacker. Đó có thể là cuộc trò chuyện với bác sĩ, luật sư, hay một buổi phỏng vấn nhạy cảm của nhà báo. Trong những trường hợp như vậy, quyền kiểm soát và bảo mật là yếu tố then chốt.

Chính nhu cầu này là một trong những lý do khiến Mistral AI, công ty AI đến từ Pháp, xây dựng các mô hình chuyển giọng nói đủ nhỏ để chạy ngay trên thiết bị. Các mô hình này có thể hoạt động trên điện thoại, laptop, hoặc nếu cần, vẫn có thể triển khai trên đám mây.

Voxtral Mini Transcribe 2

Nhỏ gọn để nhanh hơn và riêng tư hơn

Voxtral Mini Transcribe 2, một trong hai mô hình mới được công bố hôm thứ Tư, được mô tả là “siêu, siêu nhỏ”, theo lời Pierre Stock, Phó chủ tịch phụ trách vận hành khoa học của Mistral AI. Mô hình còn lại, Voxtral Realtime, có khả năng làm điều tương tự nhưng theo thời gian thực, giống như phụ đề trực tiếp (closed captioning).

Quyền riêng tư không phải là lý do duy nhất. Khi chạy trực tiếp trên thiết bị, các mô hình này còn mang lại tốc độ xử lý nhanh hơn. Không còn cảnh phải chờ file âm thanh được gửi qua internet tới trung tâm dữ liệu rồi lại trả kết quả về.

“Thứ bạn muốn là quá trình chuyển giọng nói thành văn bản diễn ra càng gần bạn càng tốt,” Stock nói. “Và thứ gần nhất với bạn chính là các thiết bị biên (edge devices) như laptop, điện thoại, hay thậm chí là thiết bị đeo như đồng hồ thông minh.”

Độ trễ thấp – yếu tố sống còn cho phiên âm thời gian thực

Độ trễ thấp (tức tốc độ cao) đặc biệt quan trọng với phiên âm thời gian thực. Theo Stock, Voxtral Realtime có độ trễ dưới 200 mili-giây, đủ nhanh để bạn đọc gần như song song với lời người nói. Không còn tình trạng phải chờ 2–3 giây để phụ đề “đuổi kịp” cuộc trò chuyện.

Hiện tại, Voxtral Realtime đã có mặt thông qua API của Mistral và trên Hugging Face, kèm theo bản demo cho phép người dùng trải nghiệm trực tiếp.

Quá trình thử nghiệm ban đầu cho thấy mô hình tạo kết quả khá nhanh (dù chưa nhanh như khi chạy hoàn toàn trên thiết bị) và phiên âm khá chính xác tiếng Anh, kể cả khi có xen lẫn một chút tiếng Tây Ban Nha. Theo Mistral, mô hình hiện hỗ trợ 13 ngôn ngữ.

Nhanh và ổn định, nhưng vẫn có nhược điểm

Voxtral Mini Transcribe 2 cũng được cung cấp qua API và có thể dùng thử trong Mistral AI Studio. Kết quả cho thấy tốc độ nhanh và độ tin cậy khá tốt, nhưng mô hình vẫn gặp khó với tên riêng. Ví dụ, “Mistral AI” bị phiên âm thành Mr. Lay Eye , còn “Voxtral” thành VoxTroll . Đúng vậy, AI còn… đọc sai chính tên của mình.

Tuy nhiên, Stock cho biết người dùng có thể tùy biến mô hình để nhận diện tốt hơn các từ chuyên ngành, tên riêng hoặc thuật ngữ đặc thù, nếu dùng cho những tác vụ cụ thể.

Theo Stock, thách thức lớn nhất khi xây dựng các mô hình AI nhỏ và nhanh là vẫn phải đảm bảo độ chính xác cao. Mistral cho biết các mô hình Voxtral đạt kết quả tốt trên các benchmark, với tỷ lệ lỗi thấp hơn so với nhiều đối thủ.

“Không đủ nếu chỉ nói rằng ‘OK, tôi sẽ làm một mô hình nhỏ’,” Stock nói. “Điều bạn thực sự cần là một mô hình nhỏ nhưng có chất lượng ngang với các mô hình lớn.”

Thứ Ba, 10/02/2026 07:55

3 ★ 1 👨 118

Bạn nên đọc

Xác thực tài khoản!

Theo Nghị định 147/2024/ND-CP, bạn cần xác thực tài khoản trước khi sử dụng tính năng này. Chúng tôi sẽ gửi mã xác thực qua SMS hoặc Zalo tới số điện thoại mà bạn nhập dưới đây:

Số điện thoại chưa đúng định dạng!

0 Bình luận

Sắp xếp theo

Xóa Đăng nhập để Gửi

Chuyện công nghệ

Cũ vẫn chất

Xem thêm

Giấy phép số 362/GP-BTTTT. Bộ Thông tin và Truyền thông cấp ngày 30/06/2016. Cơ quan chủ quản: CÔNG TY CỔ PHẦN MẠNG TRỰC TUYẾN META. Địa chỉ: 56 Duy Tân, Phường Cầu Giấy, Hà Nội. Điện thoại: 024 2242 6188. Email: info@meta.vn. Chịu trách nhiệm nội dung: Lê Ngọc Lam.

Mistral ra mắt AI phiên âm chạy trên thiết bị: nhanh hơn và riêng tư hơn

Phạm Hải

Nhỏ gọn để nhanh hơn và riêng tư hơn

Độ trễ thấp – yếu tố sống còn cho phiên âm thời gian thực

Nhanh và ổn định, nhưng vẫn có nhược điểm

Bạn nên đọc

Ưu và nhược điểm của Internet

Thời điểm Microsoft ngừng hỗ trợ các phiên bản Windows 10 và những thông tin cần biết

Bão Mặt Trời có thể đánh sập hệ thống Internet toàn cầu

YouTube ReVanced 19.09.37 mới nhất, chặn quảng cáo mà không sợ YouTube

Trung Quốc gấp rút chuẩn bị hệ điều hành riêng trong bối cảnh doanh số Mac tăng mạnh

Trải nghiệm tự thay pin iPhone tại nhà với bộ công cụ trong 2 chiếc vali nặng 35 kg của Apple

Cũ vẫn chất

'Giấu giếm' hay 'dấu diếm' đúng chính tả

Cách xóa tùy chọn khởi động cũ trong boot menu trên Windows 10

Hướng dẫn xóa định dạng bảng trong Excel

46 Stt mệt mỏi với công việc, cuộc sống

Các cách kiếm Spin trong Coin Master, kiếm lượt quay Coin Master

Đội hình Song Đấu DTCL mùa 15, Song Đấu TFT mùa 15

Cách in file PDF trên máy tính, lap top, điện thoại hoặc máy tính bảng

Cách cập nhật iPhone lên phiên bản iOS mới nhất

Điều kiện EXISTS trong SQL Server

Cách chặn kết nối Internet phần mềm, ứng dụng Windows 10