Le Chat của Mistral đã và đang thu hút được sự chú ý trong cộng đồng chatbot AI, trong đó một số người coi nó là đối thủ tiềm năng của ChatGPT.
Nhưng liệu chatbot AI non trẻ này có thực sự xứng đáng với danh hiệu này? Le Chat của Mistral liệu có tốt hơn ChatGPT không?
Le Chat của Mistral AI là gì?
Le Chat là một chatbot AI đàm thoại được phát triển bởi công ty startup Mistral AI của Pháp. Nó được hỗ trợ bởi một số mô hình ngôn ngữ lớn do Mistral sở hữu, bao gồm Mistral Large, Mistral Small và Mistral Next, tất cả những mô hình này bạn có thể chọn sử dụng khi tương tác với chatbot AI. Mặc dù là một công ty tương đối mới tham gia vào lĩnh vực chatbot AI nhưng nó được đánh giá cao nhờ hiệu suất của các mô hình AI mặc dù quy mô nhỏ hơn khi so sánh với những đối thủ nặng ký trong ngành như Gemini và GPT-4.
Để hiểu điều này có nghĩa là gì, hãy tưởng tượng bạn đang chơi với các building block. Bạn càng có nhiều block thì bạn càng có thể xây dựng các cấu trúc phức tạp và chi tiết hơn, phải không? Các mô hình Ngôn ngữ AI cũng hơi giống như vậy. Chúng có nhiều kích cỡ, thường được biểu thị bằng số lượng tham số. Vì vậy, bạn có thể đã nghe các thuật ngữ như “tham số 7B” hoặc “tham số 70B” trong các mô hình AI. Số lượng tham số giống như số lượng building block mà mô hình phải hiểu và tạo ra phản hồi. Vì vậy, nếu một mô hình ngôn ngữ có nhiều tham số hơn, nó có thể hiểu và tạo ra các phản hồi phức tạp và tốt hơn.
Hiện tại, trong khi GPT-4 ước tính có khoảng 1,76 nghìn tỷ tham số thì Mistral AI được ước tính có từ 7 đến 56 tỷ tham số. Bạn có thấy sự khác biệt về số lượng không? Điều này là một trong những lý do dẫn đến sự cường điệu về khả năng của chatbot AI này.
Mặc dù Le Chat không được hưởng mức độ quảng bá rộng rãi như ChatGPT cũng như giá trị thương hiệu như Gemini, nhưng nó vẫn lọt vào cuộc trò chuyện bất cứ khi nào một cuộc cạnh tranh ChatGPT tiềm năng được thảo luận. Nhưng liệu nó có xứng đáng có một vị trí trên bàn cân?
So sánh Le Chat và ChatGPT
Khả năng sáng tạo
Tính sáng tạo là một trong những thước đo quan trọng nhất để đánh giá hiệu suất của chatbot AI đàm thoại. Hãy nhớ rằng, mục đích của chatbot AI là tái tạo hoặc bắt chước khả năng đàm thoại và sáng tạo của con người trên quy mô lớn. Điều này khiến khả năng sáng tạo trở thành một thế mạnh rất quan trọng đối với bất kỳ chatbot AI nào. Thế giới đã thử nghiệm ChatGPT trong hơn một năm và khả năng sáng tạo của nó là không thể phủ nhận. Nhưng còn Le Chat thì sao? Hãy đưa cả hai chatbot vào một loạt thử nghiệm về tính sáng tạo!
Bắt đầu bằng cách hỏi cả hai chatbot: "How would you describe yourself to an artist?" để kiểm tra khả năng sử dụng các từ ngữ sáng tạo và giàu trí tưởng tượng để tự khái niệm hóa.
Đây là cách ChatGPT sẽ mô tả chính nó:
Và đây cũng là cách Le Chat mô tả chính nó:
Cả hai câu trả lời đều phù hợp theo những cách riêng của chúng. ChatGPT được đầu tư nhiều hơn vào việc sử dụng hình ảnh và phép ẩn dụ sống động để mô tả chính nó, thể hiện sự tinh tế sáng tạo. Mặt khác, phản hồi của Le Chat rất giàu thông tin và tập trung vào việc mô tả bản chất của nó là một chatbot AI. Một số người có thể nói rằng nó thiếu sự tinh tế sáng tạo và cách tiếp cận nghệ thuật mà phản hồi của ChatGPT thể hiện. Tuy nhiên, nhiều người sẽ thích câu trả lời dễ hình dung hơn của Le Chat hơn là mô tả trừu tượng của ChatGPT.
Sau đó, tác giả bài viết yêu cầu ChatGPT và Le Chat viết một bài rap về việc trở nên giàu có nhờ trồng dưa chuột - một yêu cầu khó để kiểm tra khả năng sáng tạo của các chatbot khác. Bạn có thể tìm thấy bao nhiêu bài rap về dưa chuột trên mạng?
Đây là phản hồi của ChatGPT:
Và đây là phản hồi của Le Chat:
Đây có thể là một vấn đề chủ quan, nhưng phản hồi của ChatGPT có vẻ là lựa chọn tốt hơn ở đây. Lời bài hát của Le Chat có vẻ khá dài dòng và không thực sự giống thứ gì đó mà một rapper sẽ tạo ra. Để kiểm tra xem cả hai lời bài hát sẽ có giai điệu như thế nào nếu chúng được chuyển thành nhạc, tác giả bài viết đã sử dụng trình tạo nhạc Suno AI để tạo nhạc từ lời bài hát. Cả 3 lần thử, lời bài hát của ChatGPT nghe hay hơn nhiều. Dưới đây là sample từ cả hai chatbot AI, bạn có thể đánh giá xem chatbot nào hoạt động tốt hơn.
Các sample được tạo từ lời bài hát của ChatGPT
Sample 1:
Sample 2:
Các sample được tạo từ lời bài hát của Mistral Le Chat
Sample 1:
Sample 2:
Tác giả đã thử một số nhiệm vụ sáng tạo khác, như làm thơ, viết bài và soạn thảo các email công việc phức tạp bằng chatbot AI. Mặc dù thể hiện nhiều hứa hẹn nhưng Le Chat rõ ràng kém hơn ChatGPT trong mọi trường hợp. Điều quan trọng cần chỉ ra là một lĩnh vực mà Le Chat đặc biệt mạnh là viết bài, mặc dù có một số phong cách gợi ý phức tạp. Tuy nhiên, xét về khả năng sáng tạo toàn diện, chiến thắng thuộc về ChatGPT.
Kỹ năng lập trình
Thành thạo việc viết code đã trở thành một yêu cầu quan trọng đối với các chatbot AI lớn. Viết code tốt là một kỹ năng cơ bản, nhưng để thực sự nổi bật trong số những người ưu tú, một chatbot AI phải thể hiện khả năng tạo code có thể giải quyết hiệu quả nhiều vấn đề phức tạp. Trước đây, chúng ta đã xây dựng toàn bộ ứng dụng web từ đầu bằng ChatGPT, điều này thể hiện khả năng vượt trội của nó như một công cụ lập trình. Nhưng Le Chat viết code giỏi đến mức nào?
Tác giả đã giao nhiệm vụ cho cả hai chatbot viết một ứng dụng danh sách việc cần làm đơn giản bằng CSS, HTML và JavaScript. ChatGPT không gặp khó khăn gì khi tạo ra kết quả tốt. Tác giả đã sao chép code được tạo và xem trước code đó trên trình duyệt và đây là những gì ChatGPT đã tạo:
Mỗi lần lặp lại lời nhắc, ChatGPT sẽ tạo một ứng dụng danh sách việc cần làm giàu chức năng với các kiểu khác nhau. Không có trường hợp nào code được tạo không hoạt động.
Khi thử lời nhắc tương tự với Le Chat, nó tạo ra dòng code có vẻ dễ hiểu nhưng khi thử chạy nó trên trình duyệt thì nó không hoạt động. Sau khi lặp lại lời nhắc 3 lần, không có phiên bản nào tạo ra code có thể hoàn thành nhiệm vụ đã đặt ra. Le Chat đã thất bại ở một trong những nhiệm vụ mã hóa cơ bản nhất!
Tất nhiên, ta sẽ không đánh giá Le Chat chỉ bằng một bài kiểm tra thất bại. Tiếp theo, tác giả yêu cầu cả hai chatbot tạo code JavaScript và PHP để mã hóa và giải mã văn bản. Trong thử nghiệm thứ hai này, cả ChatGPT và Le Chat đều tạo ra code có thể thực hiện nhiệm vụ đã đặt ra. Tuy nhiên, phiên bản của Le Chat có vẻ giống như phiên bản mà một lập trình viên mới vào nghề thiếu kinh nghiệm sẽ viết. Mặt khác, code của ChatGPT hoàn thiện hơn và có vẻ như được viết bởi một lập trình viên có kinh nghiệm.
Tác giả đã lặp lại một số thử nghiệm lập trình khác liên quan đến việc tìm và sửa lỗi. Kết quả là ChatGPT luôn hoạt động tốt hơn Le Chat. Trong một số trường hợp, Le Chat thậm chí còn không biết mình phải làm gì. Rất có khả năng Le Chat có thể sánh ngang với ChatGPT ở một số lĩnh vực, nhưng kỹ năng viết code dường như không phải là một trong số đó.
Nhận thức chung và lý luận logic
Một điểm thú vị của chatbot AI là khả năng giải quyết các nhiệm vụ phức tạp một cách dễ dàng nhưng lại thất bại ở những nhiệm vụ đơn giản đòi hỏi nhận thức chung cơ bản để hoàn thành. Nhiều chatbot, cả những chatbot đã có uy tín như ChatGPT và những chatbot mới có mặt như Le Chat, đều gặp khó khăn khi giải quyết các nhiệm vụ đòi hỏi ý thức chung và lý luận logic theo phong cách con người. Vậy Le Chat và ChatGPT so sánh như thế nào về mặt này?
Tác giả bài viết hỏi cả hai chatbot: "If you have a 3-litre bottle and a 5-litre bottle. How can you measure 4 litres of water by using the 3-litre and 5-litre bottles?" (Nếu bạn có chai 3 lít và chai 5 lít. Làm thế nào để đo được 4 lít nước bằng cách sử dụng chai 3 lít và 5 lít?)
ChatGPT đã giải quyết vấn đề một cách tinh tế:
Le Chat đã thử thực hiện thao tác tương tự và đã giải quyết được vấn đề, mặc dù sử dụng một cách tiếp cận khác.
Cả hai chatbot đều cho kết quả tương đương nhau trong bài kiểm tra này.
Tiếp theo, tác giả hỏi cả hai chatbot một câu hỏi mẹo: "If a spaceship from Mars breaks into two, with one part crashing into the Atlantic Ocean near Brazil and the other into the Pacific Ocean near Japan, where do you bury the survivors?" (Nếu một con tàu vũ trụ từ Sao Hỏa vỡ làm hai, trong đó một phần đâm xuống Đại Tây Dương gần Brazil và phần còn lại rơi xuống Thái Bình Dương gần Nhật Bản, bạn sẽ chôn những người sống sót ở đâu?)
ChatGPT đã nhìn thấu thủ đoạn này và phản hồi tương ứng:
Le Chat cũng đã nhìn thấu thủ đoạn này và cũng trả lời tương ứng:
Tác giả đã thử nhiều câu hỏi mẹo hơn, có vẻ như cả ChatGPT và Le Chat đều khá thành thạo trong việc xử lý các gợi ý suy luận logic và thông thường. Tuy nhiên, với những câu hỏi logic phức tạp hơn, chỉ ChatGPT mới có thể đưa ra câu trả lời phù hợp.
Mặc dù Le Chat đã tạo ra một số tiếng vang với tư cách là đối thủ tiềm năng của ChatGPT, nhưng thử nghiệm cho thấy nó vẫn còn phải làm nhiều việc nữa trước khi có thể thực sự đối đầu với các đối thủ nặng ký của thế giới chatbot AI. Mặc dù Le Chat đã thể hiện những khả năng ấn tượng trong các lĩnh vực như lý luận thông thường, nhưng kỹ năng viết code và sản phẩm sáng tạo của nó lại tụt hậu đáng kể so với ChatGPT.
Giống như nhiều ứng cử viên đầy tham vọng trước đó, Le Chat cần tiếp tục sàng lọc và đào tạo trước khi sẵn sàng cho các giải đấu lớn. Hiện tại, các chatbot AI như ChatGPT rõ ràng vẫn là những vị vua không thể tranh cãi của thế giới chatbot AI. Nhưng sân chơi của các đối thủ ngày càng đông đúc nên những người dẫn đầu không thể ngủ quên trên chiến thắng của mình.