Bảng xếp hạng các chatbot AI thông minh nhất hiện nay

LMSYS, một tổ chức chuyên đánh giá và xếp hạng khả năng của các mô hình ngôn ngữ lớn, đã đưa ra bảng xếp hạng các chatbot thông minh nhất hiện nay - "Chatbot Arena".

Theo bảng xếp hạng "Chatbot Arena" của LMSYS, ChatGPT bị "soán ngôi", không còn là chatbot AI thông minh nhất hiện nay. Đứng đầu danh sách hiện nay là mô hình ngôn ngữ lớn Claude 3 Opus được sử dụng để phát triển chatbot Claude AI do Anthropic, công ty khởi nghiệp có trụ sở tại San Francisco phát triển.

Cách đây một năm, LMSYS ra mắt bảng xếp hạng "Chatbot Arena". Bảng xếp hạng này liên tục được cập nhật và GPT của OpenAI luôn ở vị trí đứng đầu. Tuy nhiên, hiện nay ChatGPT đã bị "soán ngôi".

Danh sách 10 mô hình ngôn ngữ lớn được đánh giá thông minh nhất hiện nay.
Danh sách 10 mô hình ngôn ngữ lớn được đánh giá thông minh nhất hiện nay.

Bảng xếp hạng cho thấy, có sự chênh lệch rất ít về điểm số đánh giá về 3 mô hình ngôn ngữ lớn dẫn đầu trong bảng xếp hạng. Điều này cho thấy mức độ thông minh của các chatbot xây dựng trên 3 mô hình ngôn ngữ này là tương đương nhau.

8 vị trí dẫn đầu trong top 10 mô hình ngôn ngữ lớn thông minh nhất đều thuộc về các công ty của Mỹ. Góp mặt ở 2 vị trí thứ 9 và 10 là mô hình ngôn ngữ Mistral-Large-2402 của hãng công nghệ Pháp Mistral và Qwen1.5-72B-Chat của hãng công nghệ Trung Quốc Alibaba.

Các chuyên gia dự đoán ChatGPT sẽ sớm trở lại vị trí dẫn đầu trên cuộc đua chatbot tích hợp AI khi OpenAI ra mắt mô hình ngôn ngữ GPT-5 hoàn toàn mới, với nhiều cải tiến so với GPT-4 hiện nay.

LMSYS (Large Model Systems) Organization là một tổ chức nghiên cứu về các hệ thống AI và đánh giá về các mô hình ngôn ngữ lớn, được thành lập bởi các chuyên gia về AI tại Đại học California Berkeley, Đại học California San Diego và Đại học Carnegie Mellon.

"Chatbot Arena" là một bảng xếp hạng các mô hình ngôn ngữ lớn phổ biến và được sử dụng rộng rãi nhất hiện nay dựa trên đánh giá từ các chuyên gia và đánh giá từ cộng đồng người dùng khi sử dụng các chatbot trong thực tế.

Thứ Tư, 03/04/2024 09:55
31 👨 483
0 Bình luận
Sắp xếp theo
    ❖ Chuyện công nghệ