Google vừa công bố một bộ mô hình dịch thuật mã nguồn mở mới, được phát triển dựa trên Gemma 3 – mô hình open-weight của hãng. Google gọi đây là một “bước tiến lớn trong dịch thuật mã nguồn mở”. Bộ mô hình mới mang tên TranslateGemma, hỗ trợ tối đa 55 ngôn ngữ, bao gồm các ngôn ngữ phổ biến như Tây Ban Nha, Pháp, Trung Quốc và Hindi.
Đáng chú ý, thông báo này được đưa ra chỉ vài giờ sau khi OpenAI ra mắt ChatGPT Translate. Trong khi ChatGPT Translate tập trung vào việc dịch sát ngữ cảnh và giọng điệu, thay vì chỉ dịch từng từ một, thì TranslateGemma lại hướng nhiều hơn tới hiệu năng, độ chính xác và khả năng triển khai linh hoạt cho nhà phát triển.
TranslateGemma hiện có ba phiên bản với quy mô tham số khác nhau: 4B, 12B và 27B. Theo Google, mô hình 12B thậm chí còn vượt qua Gemma 3 27B bản gốc khi đánh giá bằng chuẩn WMT24++. Với giới phát triển, việc đạt hiệu suất cao từ một mô hình có chưa đến một nửa số tham số đồng nghĩa với tốc độ xử lý tốt hơn, độ trễ thấp hơn, trong khi vẫn giữ được độ chính xác.

Google cho biết phiên bản 4B được tối ưu cho suy luận trên thiết bị di động, còn bản 12B phù hợp với laptop phổ thông. Riêng mô hình 27B yêu cầu phần cứng mạnh hơn, chẳng hạn như một GPU NVIDIA H100 trên nền tảng đám mây.
Trong các bài kiểm tra với bộ benchmark Vistra về dịch văn bản trong hình ảnh, TranslateGemma cho kết quả khá ấn tượng. Dù không được tinh chỉnh chuyên biệt cho dịch ảnh, mô hình vẫn thể hiện khả năng dịch văn bản trong hình tốt hơn so với nhiều đối thủ.
Google cũng chia sẻ rằng hiệu quả này đến từ quy trình huấn luyện hai giai đoạn đặc biệt. Ở giai đoạn đầu, hãng sử dụng Supervised Fine-Tuning, huấn luyện các mô hình Gemma 3 trên dữ liệu dịch do con người thực hiện, kết hợp với dữ liệu tổng hợp chất lượng cao do các mô hình Gemini tạo ra.
Sau đó là giai đoạn Reinforcement Learning, nơi Google sử dụng nhiều mô hình đánh giá (reward models) khác nhau, cùng các thước đo nâng cao như MetricX-QE và AutoMQM, nhằm hướng mô hình tới các bản dịch tự nhiên hơn và đúng ngữ cảnh hơn.
Hiện tại, các mô hình TranslateGemma đã được phát hành công khai trên Kaggle và Hugging Face, cho phép bất kỳ ai tải về, thử nghiệm hoặc phát triển các ứng dụng dịch thuật dựa trên nền tảng này.
Học IT










Công nghệ
Microsoft Word 2013
Microsoft Word 2007
Microsoft Excel 2019
Microsoft Excel 2016
Microsoft PowerPoint 2019
Google Sheets
Lập trình Scratch
Bootstrap
Hướng dẫn
Ô tô, Xe máy