Tại I/O 2024, Google đã công bố một số mô hình AI mới, các dự án sắp ra mắt và vô số tính năng AI sẽ có trên các sản phẩm của mình. Tuy nhiên, điều đáng chú ý là mô hình Gemini 1.5 Flash. Đây là một mô hình nhanh và hiệu quả ấn tượng, mang lại khả năng đa phương thức và khoảng thời gian ngữ cảnh lên tới 1 triệu token (2 triệu thông qua danh sách chờ).
Mặc dù Gemini 1.5 Flash có kích thước nhỏ - Google chưa tiết lộ kích thước thông số - nhưng nó đạt được điểm số cao trên tất cả các phương thức - văn bản, hình ảnh và âm thanh. Trong báo cáo kỹ thuật Gemini 1.5, Google tiết lộ rằng Gemini 1.5 Flash vượt trội hơn nhiều so với các mô hình lớn hơn như 1.0 Ultra và 1.0 Pro về nhiều mặt. Chỉ ở khả năng nhận dạng và dịch giọng nói, nó tụt hậu so với các mô hình lớn hơn.
Không giống như Gemini 1.5 Pro là mô hình MoE (Mixture of Experts), Gemini 1.5 Flash là mô hình dày đặc, được chắt lọc trực tuyến từ mô hình 1.5 Pro lớn hơn để cải thiện chất lượng. Về tốc độ, mô hình Flash vượt trội hơn tất cả các mô hình nhỏ hơn hiện có, bao gồm cả Claude 3 Haiku, chạy trên TPU tùy chỉnh của Google.
Và giá của nó thấp đến mức không thể tin được. Gemini 1.5 Flash có giá 0,35 USD cho đầu vào và 0,53 USD cho đầu ra để xử lý 128K token, 0,70 USD và 1,05 USD cho 1 triệu token. Nó rẻ hơn nhiều so với Llama 3 70B, Mistral Medium, GPT-3.5 Turbo và tất nhiên là các mô hình lớn hơn.
Nếu là nhà phát triển và cần suy luận đa phương thức với cửa sổ ngữ cảnh lớn hơn với giá rẻ, bạn chắc chắn nên xem qua mô hình Flash. Đây là cách có thể dùng thử Gemini 1.5 Flash miễn phí.
Cách sử dụng Flash Gemini 1.5 miễn phí
1. Hãy truy cập aistudio.google.com và đăng nhập bằng tài khoản Google của bạn. Không có danh sách chờ để sử dụng mô hình Flash.
2. Tiếp theo, chọn mô hình “Gemini 1.5 Flash” trong menu drop-down.
3. Bây giờ, bạn có thể bắt đầu trò chuyện với mô hình Flash. Bạn cũng có thể upload lên hình ảnh, video, clip âm thanh, file và thư mục.
Ấn tượng đầu tiên về Gemini 1.5 Flash
Tuy Gemini 1.5 Flash không phải là model hiện đại nhưng ưu điểm của nó là tốc độ chóng mặt, hiệu quả và chi phí thấp. Nó xếp dưới Gemini 1.5 Pro về khả năng và các mô hình lớn hơn khác từ OpenAI và Anthropic. Tuy nhiên, tác giả đã thử một số gợi ý lý luận được dùng để so sánh ChatGPT 4o và Gemini 1.5 Pro.
Nó chỉ có thể tạo ra một câu trả lời đúng trong số 5 câu hỏi. Nó có thể không thông minh lắm về mặt lý luận thông thường, nhưng đối với các ứng dụng khác yêu cầu khả năng đa phương thức và cửa sổ ngữ cảnh lớn, nó có thể phù hợp với trường hợp sử dụng của bạn. Ngoài ra, mô hình Gemini rất giỏi trong các nhiệm vụ sáng tạo có thể mang lại giá trị cho nhà phát triển và người dùng.
Nói một cách đơn giản, không có mô hình AI nào nhanh, hiệu quả, cung cấp đa phương thức và có cửa sổ ngữ cảnh lớn với khả năng gần như hoàn hảo. Trên hết, nó cực kỳ rẻ.
Ý kiến của bạn về mô hình Flash mới nhất của Google là gì? Chia sẻ ý kiến trong phần bình luận bên dưới nhé!