Mistral công bố Large 2: LLM hàng đầu với 123 tỷ tham số

Công ty khởi nghiệp mới nổi trong lĩnh vực trí tuệ nhân tạo Mistral AI của Pháp hôm nay đã công bố phát hành Large 2, mô hình ngôn ngữ lớn (LLM) hàng đầu có khả năng tạo mã, tính toán toán học và lý luận cao hơn đáng kể. Mistral cũng đã bổ sung thêm tính năng hỗ trợ đa ngôn ngữ được cải thiện và hàng loạt chức năng nâng cao với Large 2.

Nếu bạn chưa biết thì mô hình ngôn ngữ lớn là một mô hình ngôn ngữ với khả năng tổng quát trong việc tạo ngôn ngữ và các tác vụ xử lý ngôn ngữ tự nhiên khác. LLM có được khả năng này bằng cách học các mối quan hệ thống kê từ các văn bản trong quá trình huấn luyện tự giám sát và bán giám sát có độ phức tạp tính toán cao.

Mô hình Mistral Large 2 có 123 tỷ tham số, cho phép nó chạy trên một nút H100 duy nhất với thông lượng cao. LLM này có thể hỗ trợ toàn diện với các ngôn ngữ tiếng Pháp, tiếng Đức, tiếng Tây Ban Nha, tiếng Ý, tiếng Bồ Đào Nha, tiếng Ả Rập, tiếng Hindi, tiếng Nga, tiếng Trung, tiếng Nhật và tiếng Hàn. Về mặt mã hóa, Large 2 hỗ trợ hơn 80 ngôn ngữ lập trình khác nhau, bao gồm Python, Java, C, C++, JavaScript và Bash…

Large 2 hiện hiện khả dụng để truy cập mở, nhưng chỉ được Mistral cung cấp miễn phí cho mục đích nghiên cứu và phi thương mại. Để sử dụng cho mục đích thương mại, người dùng cần phải có giấy phép sử dụng chuyên biệt.

Với 123 tỷ tham số (123B), hiệu suất của Mistral Large 2 có thể so sánh với GPT-4o, Claude Opus 3 của OpenAI và Llama 3.1 405B của Meta được phát hành gần đây về khả năng mã hóa. Trên các thang đánh giá Wild Bench, Arena Hard và MT Bench, Large 2 vượt trội hơn Llama 3.1 405B và Claude 3 Opus. Trên tiêu chuẩn MMLU phổ biến, model mới này hoạt động tốt hơn Llama 3.1 70B và có thể so sánh với Llama 3.1 405B.

Ở góc độ các nhà phát triển, Mistral Large 2 hiện sở hữu các kỹ năng gọi và truy xuất chức năng được cải thiện. Giờ đây, mô hình có thể thực hiện cả lệnh gọi hàm song song và tuần tự, cho phép các nhà phát triển xây dựng các ứng dụng AI kinh doanh phức tạp.

Với việc phát hành Large 2, hệ sinh thái LLM của Mistral hiện tương đối đa dạng, bao gồm Mistral Nemo, Mistral Large, và hai model chuyên dụng: Codestral và Embed. Mistral sẽ ngừng cung cấp các model Apache (Mistral 7B, Mistral 8x7B và 8x22B, Codestral Mamba, Mathstral) trong tương lai.

Microsoft và Mistral đã có quan hệ đối tác để tích hợp các model của Mistral trên Azure. Hiện nay, Mistral đang mở rộng quan hệ đối tác với Google để đưa sản phẩm của mình vào Google Cloud.

Các bản phát hành liên tiếp của Mistral Large 2 và Llama 3.1 đánh dấu một cột mốc quan trọng cho hệ sinh thái AI mở, cung cấp hai mô hình cấp độ GPT-4 mạnh mẽ cho nghiên cứu và phát triển. Sự tiến bộ nhanh chóng này thúc đẩy động lực ngày càng tăng hướng tới một hệ sinh thái AI cởi mở và hợp tác hơn.

Thứ Năm, 25/07/2024 10:15
31 👨 106
0 Bình luận
Sắp xếp theo
    ❖ Chuyện công nghệ