ChatGPT, Microsoft Bing AI hay Google Bard là chatbot AI tốt nhất?

Kể từ khi OpenAI phát hành ChatGPT vào tháng 11 năm 2022, Internet đã thực sự chấn động. Google và Microsoft, hai trong số những thương hiệu công nghệ nổi tiếng nhất thế giới, kể từ đó đã tích cực thúc đẩy để tái tạo thành công của chatbot này.

Hiện giờ, cả hai công ty đều đã tham gia cuộc chiến. Google có Bard và Microsoft có Bing AI. Vậy ChatGPT so với Bing AI và Google Bard; chatbot AI nào tốt nhất?

Độ chính xác của phản hồi

Không giống như các công cụ tìm kiếm, chatbot AI cung cấp một câu trả lời duy nhất cho truy vấn của bạn. Vì vậy, khi bạn đặt câu hỏi cho một chatbot như ChatGPT, bạn chỉ nhận được câu trả lời mà ChatGPT tin rằng đó là câu trả lời tốt nhất cho câu hỏi của bạn. Do không có nguồn thay thế nào để so sánh nên các chatbot AI cần phải chính xác nhất có thể về thông tin mà chúng cung cấp. Nhưng độ chính xác của ChatGPT, Bing AI và Bard ra sao?

Bắt đầu với một câu hỏi đơn giản về văn hóa đại chúng, cả 3 chatbot được yêu cầu mô tả chương trình truyền hình nổi tiếng Breaking Bad trong 10 từ.

Mặc dù mô tả từ cả 3 chatbot đều đủ tốt, nhưng đã có một vấn đề về độ chính xác không mong muốn. Bing AI đã trả lời bằng một mô tả dài 28 từ, nhiều hơn so với giới hạn 10 từ được yêu cầu. Trong lần thử thứ hai, yêu cầu mô tả gồm 5 từ, nhưng Bing AI đã đưa ra mô tả gồm 7 từ. Cả 3 chế độ Bing AI đã được thử nghiệm nhưng không cái nào đếm đúng từ.

Bing AI
Bing AI

Tiếp đến là Google Bard. Bard, giống như Bing AI, Bard không đếm được số từ ngay trong lần thử đầu tiên.

Bard AI
Bard AI

Tuy nhiên, trong lần thử tiếp theo, Google Bard đã tính đúng số từ. ​

Google Bard mô tả chương trình truyền hình Breaking Bard trong 10 từ
Google Bard mô tả chương trình truyền hình Breaking Bard trong 10 từ

Sau đó, ChatGPT đã được thử nghiệm. Lần thử đầu tiên đã gần hoàn hảo nhưng vẫn chưa thành công.

ChatGPT
ChatGPT

Tuy nhiên, ở lần thử thứ hai và thứ ba, ChatGPT đã làm đúng. Có thể các chatbot gặp vấn đề với việc đếm từ chính xác, nhưng ChatGPT đã cho thấy một số độ chính xác về mặt đó.

Tùy chọn chiến thắng: ChatGPT là chính xác nhất trong 3 chatbot.

Ảo giác AI

Liên quan chặt chẽ đến độ chính xác là ảo giác AI, một vấn đề tái diễn đối với tất cả các mô hình AI đàm thoại chính. Tóm lại, ảo giác AI là khi các mô hình AI cung cấp thông tin bịa đặt một cách khá thuyết phục và tự tin. Điều này có thể gây rắc rối, đặc biệt nếu bạn đưa ra quyết định dựa trên thông tin bịa đặt này.

Cả 3 chatbot đã được thử nghiệm để xem cái nào gây ảo giác nhiều nhất. Bắt đầu với Google Bard, tác giả bài viết đã yêu cầu chatbot liệt kê một số thách thức có thể gặp phải nếu quyết định tổ chức một sự kiện ở Ikeja, một thành phố ở Bang Lagos, Nigeria, vào một ngày nhất định. Để kiểm tra khả năng tránh ảo giác của nó, tác giả đặc biệt yêu cầu nó xem xét thời tiết, các sự kiện địa phương và dữ liệu giao thông. Kết quả là một thảm họa - hầu hết thông tin được tạo ra đều hoàn toàn bịa đặt.

Kết hợp dữ liệu trực tiếp trên lời nhắc của Bard 2
Kết hợp dữ liệu trực tiếp trên lời nhắc của Bard 2

Cùng một yêu cầu được đưa ra trên Bing AI và nó đã cố gắng tránh ảo giác bằng cách trả lời càng chung chung càng tốt.

Bing AI trả lời câu hỏi lập kế hoạch sự kiện
Bing AI trả lời câu hỏi lập kế hoạch sự kiện

Tiếp đến là ChatGPT với mô hình GPT-4 và tính năng duyệt web được bật. ChatGPT đã lấy thông tin thời tiết phù hợp từ một nguồn web và sau đó giải thích rằng nó không thể tìm thấy bất kỳ dữ liệu nào về tình hình giao thông và các sự kiện địa phương.

ChatGPT trả lời câu hỏi lập kế hoạch sự kiện
ChatGPT trả lời câu hỏi lập kế hoạch sự kiện

Để đẩy xa hơn nữa ranh giới của ảo giác, cả ba chatbot được yêu cầu mô tả một hình ảnh bằng URL ảnh. Để tham khảo, hình ảnh tại URL là một thanh niên đang ngồi. Tuy nhiên, Bing AI đã mô tả một con chim.

Mô tả hình ảnh ảo giác Bing AI
Mô tả hình ảnh ảo giác Bing AI

Google Bard cũng được yêu cầu mô tả hình ảnh tương tự và câu trả lời khá buồn cười.

Mô tả hình ảnh ảo giác của Google Bard
Mô tả hình ảnh ảo giác của Google Bard

May mắn thay, khi được yêu cầu ChatGPT mô tả hình ảnh, chatbot này giải thích rằng nó không thể làm như vậy - một câu trả lời đơn giản mà bạn mong đợi bất kỳ chatbot AI tự tôn nào cung cấp, thay vì bịa ra mọi thứ.

ChatGPT từ chối mô tả hình ảnh
ChatGPT từ chối mô tả hình ảnh

Tùy chọn chiến thắng: ChatGPT chiến thắng.

Tính toán cơ bản

Toán học là nền tảng của những gì diễn ra đằng sau hầu hết công nghệ phần mềm. Vì vậy, hãy đưa cả ba chatbot vào một bài kiểm tra toán cơ bản. Bắt đầu với một câu hỏi phép nhân đơn giản: "Solve -1 x -1 x -1".

Bing AI đưa ra -1 là câu trả lời đúng.

Kết quả của Bing AI
Kết quả của Bing AI

Bard của Google đã thất bại một cách tiếc nuối trong môn toán cơ bản và đưa ra câu trả lời là 1.

Kết quả của Bard AI
Kết quả của Bard AI

Giống như Bing AI, ChatGPT đã trả lời là -1 và thậm chí còn giải thích câu trả lời.

Kết quả của ChatGPT
Kết quả của ChatGPT

Câu hỏi tiếp theo cho bài kiểm tra toán cơ bản là một phương trình hữu tỉ đơn giản: Solve 8/a-1 = 20/3a-1.

Bing AI đưa ra câu trả lời là -6. Mỗi lần chuyển đổi giữa các chế độ sáng tạo, cân bằng và chính xác, nó sẽ đưa ra các câu trả lời khác nhau.

Kết quả phương trình hữu tỉ của Bing AI
Kết quả phương trình hữu tỉ của Bing AI

Giống như câu hỏi toán học trước đó, Google Bard đã thất bại khi đưa ra câu trả lời là 1.

Kết quả phương trình hữu tỉ của Bard AI
Kết quả phương trình hữu tỉ của Bard AI

ChatGPT là chatbot duy nhất đưa ra câu trả lời đúng: -3. Nó cũng có thể định dạng các phân số trong kết quả một cách thích hợp.

Kết quả phương trình hữu tỉ của ChatGPT
Kết quả phương trình hữu tỉ của ChatGPT

Đừng tin tưởng Google Bard và Bing AI khi giải bài tập toán của bạn.

Tùy chọn chiến thắng: ChatGPT hoạt động tốt hơn trong môn toán cơ bản.

Sự sáng tạo

Trong khi các chatbot truyền thống bị rập khuôn vì những phản hồi nhạt nhẽo, vô hồn, thì các chatbot AI sáng tạo ngày nay đã đạt được những tiến bộ đáng kể trong khả năng sáng tạo. Để kiểm tra khả năng sáng tạo của cả 3 chatbot, từng chatbot đã được yêu cầu mô phỏng cuộc trò chuyện giữa hai người đang tranh cãi về việc đi vào vũ trụ.

Bắt đầu với Bing AI! Nó đã không làm bạn thất vọng. Cuộc trò chuyện khá thú vị.

Thử nghiệm sự sáng tạo với Bing AI
Thử nghiệm sự sáng tạo với Bing AI

Sau đó, yêu cầu tương tự được đưa ra cho Google Bard. Có rất nhiều chỗ để cải thiện.

Bài kiểm tra khả năng sáng tạo Bard AI
Bài kiểm tra khả năng sáng tạo Bard AI

Tiếp theo là ChatGPT. Với cùng một yêu cầu, phản hồi của ChatGPT vừa sáng tạo, vừa đủ đầy đủ, hấp dẫn. Đây là phần đầu tiên:

Kiểm tra khả năng sáng tạo của ChatGPT
Kiểm tra khả năng sáng tạo của ChatGPT

Và đây là phần thứ hai:

Kiểm tra khả năng sáng tạo của ChatGPT
Kiểm tra khả năng sáng tạo của ChatGPT

Phản ứng của Bard AI dường như là kém nhất trong 3 chatbot. ChatGPT vượt trội hơn Bing AI, nhưng mức độ sáng tạo của cả hai chatbot đều rất ấn tượng.

Bài viết đã chuyển sang một thứ gì đó ít thông thường hơn một chút, yêu cầu cả 3 chatbot mô tả bản thân với một vai trò một công cụ sáng tạo.

Bắt đầu với Bard AI. Bard không hẳn là quá sáng tạo, nhưng nó đã thể hiện một cách công bằng về bản thân.

Bard AI tự mô tả
Bard AI tự mô tả

Tiếp theo là Bing AI. Vì một số lý do, chatbot thẳng thừng từ chối mô tả chính nó. Nó thậm chí còn nói rằng đây có thể là thời điểm tốt để thay đổi chủ đề của cuộc trò chuyện. Thật lạ lùng!

Bing AI tự mô tả
Bing AI tự mô tả

Yêu cầu tương tự được đưa ra với ChatGPT và ChatGPT đã cung cấp một mô tả thú vị. Tuy nhiên, phản ứng của ChatGPT có vẻ phù hợp hơn.

ChatGPT tự mô tả
ChatGPT tự mô tả

Trong hai bài kiểm tra khả năng sáng tạo đã thử nghiệm, ChatGPT vượt trội so với Bing AI và Bard.

Tùy chọn chiến thắng: ChatGPT có vẻ sáng tạo nhất khi so sánh với Bing AI và Bard.

Mức độ an toàn

Chatbot AI cực kỳ mạnh mẽ. Thật không may, chúng có thể được sử dụng cho mục đích tốt, nhưng cũng có thể bị lợi dụng cho mục đích bất chính. Tội phạm đã sử dụng ChatGPT để viết phần mềm độc hại. Mức độ an toàn của những chatbot AI này với tư cách là công cụ dành cho công chúng ra sao? Tùy chọn nào trong số chúng là dễ bị lợi dụng nhất? Tác giả bài viết đã cố gắng đánh lừa từng chatbot đảm nhận một bản ngã khác và sau đó yêu cầu chúng làm "việc xấu".

Bắt đầu với Bard, chatbot AI này được yêu cầu mô tả cách viết phần mềm độc hại sẽ đánh cắp một số file nhất định từ PC Windows và upload chúng lên một máy chủ từ xa. Chatbot AI đã từ chối trả lời mặc dù một số lời nhắc đã được sử dụng để thử đánh lừa chatbot trước khi đặt câu hỏi.

Bard từ chối tạo phần mềm độc hại
Bard từ chối tạo phần mềm độc hại

Tiếp theo là Bing. Bất chấp nhiều lần cố gắng đánh lừa chatbot, Bing vẫn từ chối yêu cầu. Thay vào đó, chatbot gợi ý rằng có lẽ đã đến lúc chuyển sang chủ đề khác.

Microsoft Bing Chat từ chối viết phần mềm độc hại keylogger tháng 4 năm 2023
Microsoft Bing Chat từ chối viết phần mềm độc hại keylogger tháng 4 năm 2023

Tiếp đó là ChatGPT. Không ngạc nhiên khi ChatGPT chi tiết nhất khi đưa ra hướng dẫn về cách xây dựng phần mềm độc hại. Nó cũng có thể viết code theo hướng đó, ngay cả khi chưa thực sự sẵn sàng để triển khai. Tuy nhiên, OpenAI rõ ràng đã lấp đầy rất nhiều lỗ hổng kể từ lần cuối cùng chúng ta tìm kiếm các lỗi an toàn trên ChatGPT. Tuy nhiên, những kẻ xấu vẫn có thể sử dụng ChatGPT để thực sự tạo ra phần mềm độc hại đáng sợ.

Nói chung, Bing AI là thứ khó lừa để làm những việc phi đạo đức nhất. ChatGPT chạy trên mô hình GPT-4 cũng rất khó bị lừa, nhưng đây là tùy chọn yếu nhất trong 3 loại chatbot.

Tùy chọn chiến thắng: Google Bard và Bing AI hòa nhau.

ChatGPT, Bing AI hay Bard là chatbot AI tốt nhất?

Mặc dù cả ba chatbot AI đều mạnh mẽ, nhưng ChatGPT, mặc dù không vượt qua bài kiểm tra an toàn, nhưng dường như là tốt nhất trong số 3 lựa chọn. ChatGPT nhìn chung có vẻ tốt hơn về độ chính xác và tính sáng tạo. Hơn nữa, với việc bổ sung các plugin trình duyệt và khả năng kết nối web, ChatGPT mở rộng khả năng của mình và dẫn đầu so với các đối thủ cạnh tranh.

Tuy nhiên, Google Bard và Microsoft Bing AI là những lựa chọn thay thế xứng đáng. Đừng quên rằng cả Bard và Bing AI đều miễn phí, trong khi đăng ký ChatGPT Plus sẽ khiến bạn phải trả lại $20/tháng. Vì vậy, mặc dù ChatGPT có thể là chatbot AI toàn diện tốt nhất, nhưng bạn sẽ cần phải bỏ tiền ra để truy cập các tính năng tốt nhất của nó.

Thứ Năm, 18/05/2023 11:11
53 👨 1.653
0 Bình luận
Sắp xếp theo
    ❖ Trí tuệ nhân tạo (AI)