ChatGPT, Microsoft Bing AI hay Google Bard là chatbot AI tốt nhất?

Chàng trai nhạt nhẽo

Kể từ khi OpenAI phát hành ChatGPT vào tháng 11 năm 2022, Internet đã thực sự chấn động. Google và Microsoft, hai trong số những thương hiệu công nghệ nổi tiếng nhất thế giới, kể từ đó đã tích cực thúc đẩy để tái tạo thành công của chatbot này.

Hiện giờ, cả hai công ty đều đã tham gia cuộc chiến. Google có Bard và Microsoft có Bing AI. Vậy ChatGPT so với Bing AI và Google Bard; chatbot AI nào tốt nhất?

Độ chính xác của phản hồi

Không giống như các công cụ tìm kiếm, chatbot AI cung cấp một câu trả lời duy nhất cho truy vấn của bạn. Vì vậy, khi bạn đặt câu hỏi cho một chatbot như ChatGPT, bạn chỉ nhận được câu trả lời mà ChatGPT tin rằng đó là câu trả lời tốt nhất cho câu hỏi của bạn. Do không có nguồn thay thế nào để so sánh nên các chatbot AI cần phải chính xác nhất có thể về thông tin mà chúng cung cấp. Nhưng độ chính xác của ChatGPT, Bing AI và Bard ra sao?

Bắt đầu với một câu hỏi đơn giản về văn hóa đại chúng, cả 3 chatbot được yêu cầu mô tả chương trình truyền hình nổi tiếng Breaking Bad trong 10 từ.

Mặc dù mô tả từ cả 3 chatbot đều đủ tốt, nhưng đã có một vấn đề về độ chính xác không mong muốn. Bing AI đã trả lời bằng một mô tả dài 28 từ, nhiều hơn so với giới hạn 10 từ được yêu cầu. Trong lần thử thứ hai, yêu cầu mô tả gồm 5 từ, nhưng Bing AI đã đưa ra mô tả gồm 7 từ. Cả 3 chế độ Bing AI đã được thử nghiệm nhưng không cái nào đếm đúng từ.

Tiếp đến là Google Bard. Bard, giống như Bing AI, Bard không đếm được số từ ngay trong lần thử đầu tiên.

Tuy nhiên, trong lần thử tiếp theo, Google Bard đã tính đúng số từ.

Google Bard mô tả chương trình truyền hình Breaking Bard trong 10 từ

Sau đó, ChatGPT đã được thử nghiệm. Lần thử đầu tiên đã gần hoàn hảo nhưng vẫn chưa thành công.

Tuy nhiên, ở lần thử thứ hai và thứ ba, ChatGPT đã làm đúng. Có thể các chatbot gặp vấn đề với việc đếm từ chính xác, nhưng ChatGPT đã cho thấy một số độ chính xác về mặt đó.

Tùy chọn chiến thắng: ChatGPT là chính xác nhất trong 3 chatbot.

Ảo giác AI

Liên quan chặt chẽ đến độ chính xác là ảo giác AI, một vấn đề tái diễn đối với tất cả các mô hình AI đàm thoại chính. Tóm lại, ảo giác AI là khi các mô hình AI cung cấp thông tin bịa đặt một cách khá thuyết phục và tự tin. Điều này có thể gây rắc rối, đặc biệt nếu bạn đưa ra quyết định dựa trên thông tin bịa đặt này.

Cả 3 chatbot đã được thử nghiệm để xem cái nào gây ảo giác nhiều nhất. Bắt đầu với Google Bard, tác giả bài viết đã yêu cầu chatbot liệt kê một số thách thức có thể gặp phải nếu quyết định tổ chức một sự kiện ở Ikeja, một thành phố ở Bang Lagos, Nigeria, vào một ngày nhất định. Để kiểm tra khả năng tránh ảo giác của nó, tác giả đặc biệt yêu cầu nó xem xét thời tiết, các sự kiện địa phương và dữ liệu giao thông. Kết quả là một thảm họa - hầu hết thông tin được tạo ra đều hoàn toàn bịa đặt.

Kết hợp dữ liệu trực tiếp trên lời nhắc của Bard 2

Cùng một yêu cầu được đưa ra trên Bing AI và nó đã cố gắng tránh ảo giác bằng cách trả lời càng chung chung càng tốt.

Bing AI trả lời câu hỏi lập kế hoạch sự kiện

Tiếp đến là ChatGPT với mô hình GPT-4 và tính năng duyệt web được bật. ChatGPT đã lấy thông tin thời tiết phù hợp từ một nguồn web và sau đó giải thích rằng nó không thể tìm thấy bất kỳ dữ liệu nào về tình hình giao thông và các sự kiện địa phương.

ChatGPT trả lời câu hỏi lập kế hoạch sự kiện

Để đẩy xa hơn nữa ranh giới của ảo giác, cả ba chatbot được yêu cầu mô tả một hình ảnh bằng URL ảnh. Để tham khảo, hình ảnh tại URL là một thanh niên đang ngồi. Tuy nhiên, Bing AI đã mô tả một con chim.

Google Bard cũng được yêu cầu mô tả hình ảnh tương tự và câu trả lời khá buồn cười.

May mắn thay, khi được yêu cầu ChatGPT mô tả hình ảnh, chatbot này giải thích rằng nó không thể làm như vậy - một câu trả lời đơn giản mà bạn mong đợi bất kỳ chatbot AI tự tôn nào cung cấp, thay vì bịa ra mọi thứ.

Tùy chọn chiến thắng: ChatGPT chiến thắng.

Tính toán cơ bản

Toán học là nền tảng của những gì diễn ra đằng sau hầu hết công nghệ phần mềm. Vì vậy, hãy đưa cả ba chatbot vào một bài kiểm tra toán cơ bản. Bắt đầu với một câu hỏi phép nhân đơn giản: "Solve -1 x -1 x -1".

Bing AI đưa ra -1 là câu trả lời đúng.

Bard của Google đã thất bại một cách tiếc nuối trong môn toán cơ bản và đưa ra câu trả lời là 1.

Giống như Bing AI, ChatGPT đã trả lời là -1 và thậm chí còn giải thích câu trả lời.

Câu hỏi tiếp theo cho bài kiểm tra toán cơ bản là một phương trình hữu tỉ đơn giản: Solve 8/a-1 = 20/3a-1.

Bing AI đưa ra câu trả lời là -6. Mỗi lần chuyển đổi giữa các chế độ sáng tạo, cân bằng và chính xác, nó sẽ đưa ra các câu trả lời khác nhau.

Giống như câu hỏi toán học trước đó, Google Bard đã thất bại khi đưa ra câu trả lời là 1.

ChatGPT là chatbot duy nhất đưa ra câu trả lời đúng: -3. Nó cũng có thể định dạng các phân số trong kết quả một cách thích hợp.

Đừng tin tưởng Google Bard và Bing AI khi giải bài tập toán của bạn.

Tùy chọn chiến thắng: ChatGPT hoạt động tốt hơn trong môn toán cơ bản.

Sự sáng tạo

Trong khi các chatbot truyền thống bị rập khuôn vì những phản hồi nhạt nhẽo, vô hồn, thì các chatbot AI sáng tạo ngày nay đã đạt được những tiến bộ đáng kể trong khả năng sáng tạo. Để kiểm tra khả năng sáng tạo của cả 3 chatbot, từng chatbot đã được yêu cầu mô phỏng cuộc trò chuyện giữa hai người đang tranh cãi về việc đi vào vũ trụ.

Bắt đầu với Bing AI! Nó đã không làm bạn thất vọng. Cuộc trò chuyện khá thú vị.

Sau đó, yêu cầu tương tự được đưa ra cho Google Bard. Có rất nhiều chỗ để cải thiện.

Tiếp theo là ChatGPT. Với cùng một yêu cầu, phản hồi của ChatGPT vừa sáng tạo, vừa đủ đầy đủ, hấp dẫn. Đây là phần đầu tiên:

Và đây là phần thứ hai:

Phản ứng của Bard AI dường như là kém nhất trong 3 chatbot. ChatGPT vượt trội hơn Bing AI, nhưng mức độ sáng tạo của cả hai chatbot đều rất ấn tượng.

Bài viết đã chuyển sang một thứ gì đó ít thông thường hơn một chút, yêu cầu cả 3 chatbot mô tả bản thân với một vai trò một công cụ sáng tạo.

Bắt đầu với Bard AI. Bard không hẳn là quá sáng tạo, nhưng nó đã thể hiện một cách công bằng về bản thân.

Tiếp theo là Bing AI. Vì một số lý do, chatbot thẳng thừng từ chối mô tả chính nó. Nó thậm chí còn nói rằng đây có thể là thời điểm tốt để thay đổi chủ đề của cuộc trò chuyện. Thật lạ lùng!

Yêu cầu tương tự được đưa ra với ChatGPT và ChatGPT đã cung cấp một mô tả thú vị. Tuy nhiên, phản ứng của ChatGPT có vẻ phù hợp hơn.

Trong hai bài kiểm tra khả năng sáng tạo đã thử nghiệm, ChatGPT vượt trội so với Bing AI và Bard.

Tùy chọn chiến thắng: ChatGPT có vẻ sáng tạo nhất khi so sánh với Bing AI và Bard.

Mức độ an toàn

Chatbot AI cực kỳ mạnh mẽ. Thật không may, chúng có thể được sử dụng cho mục đích tốt, nhưng cũng có thể bị lợi dụng cho mục đích bất chính. Tội phạm đã sử dụng ChatGPT để viết phần mềm độc hại. Mức độ an toàn của những chatbot AI này với tư cách là công cụ dành cho công chúng ra sao? Tùy chọn nào trong số chúng là dễ bị lợi dụng nhất? Tác giả bài viết đã cố gắng đánh lừa từng chatbot đảm nhận một bản ngã khác và sau đó yêu cầu chúng làm "việc xấu".

Bắt đầu với Bard, chatbot AI này được yêu cầu mô tả cách viết phần mềm độc hại sẽ đánh cắp một số file nhất định từ PC Windows và upload chúng lên một máy chủ từ xa. Chatbot AI đã từ chối trả lời mặc dù một số lời nhắc đã được sử dụng để thử đánh lừa chatbot trước khi đặt câu hỏi.

Tiếp theo là Bing. Bất chấp nhiều lần cố gắng đánh lừa chatbot, Bing vẫn từ chối yêu cầu. Thay vào đó, chatbot gợi ý rằng có lẽ đã đến lúc chuyển sang chủ đề khác.

Microsoft Bing Chat từ chối viết phần mềm độc hại keylogger tháng 4 năm 2023

Tiếp đó là ChatGPT. Không ngạc nhiên khi ChatGPT chi tiết nhất khi đưa ra hướng dẫn về cách xây dựng phần mềm độc hại. Nó cũng có thể viết code theo hướng đó, ngay cả khi chưa thực sự sẵn sàng để triển khai. Tuy nhiên, OpenAI rõ ràng đã lấp đầy rất nhiều lỗ hổng kể từ lần cuối cùng chúng ta tìm kiếm các lỗi an toàn trên ChatGPT. Tuy nhiên, những kẻ xấu vẫn có thể sử dụng ChatGPT để thực sự tạo ra phần mềm độc hại đáng sợ.

Nói chung, Bing AI là thứ khó lừa để làm những việc phi đạo đức nhất. ChatGPT chạy trên mô hình GPT-4 cũng rất khó bị lừa, nhưng đây là tùy chọn yếu nhất trong 3 loại chatbot.

Tùy chọn chiến thắng: Google Bard và Bing AI hòa nhau.

ChatGPT, Bing AI hay Bard là chatbot AI tốt nhất?

Mặc dù cả ba chatbot AI đều mạnh mẽ, nhưng ChatGPT, mặc dù không vượt qua bài kiểm tra an toàn, nhưng dường như là tốt nhất trong số 3 lựa chọn. ChatGPT nhìn chung có vẻ tốt hơn về độ chính xác và tính sáng tạo. Hơn nữa, với việc bổ sung các plugin trình duyệt và khả năng kết nối web, ChatGPT mở rộng khả năng của mình và dẫn đầu so với các đối thủ cạnh tranh.

Tuy nhiên, Google Bard và Microsoft Bing AI là những lựa chọn thay thế xứng đáng. Đừng quên rằng cả Bard và Bing AI đều miễn phí, trong khi đăng ký ChatGPT Plus sẽ khiến bạn phải trả lại $20/tháng. Vì vậy, mặc dù ChatGPT có thể là chatbot AI toàn diện tốt nhất, nhưng bạn sẽ cần phải bỏ tiền ra để truy cập các tính năng tốt nhất của nó.

Thứ Năm, 18/05/2023 11:11

5 ★ 3 👨 1.683

#ChatGPT

Bạn nên đọc

Xác thực tài khoản!

Theo Nghị định 147/2024/ND-CP, bạn cần xác thực tài khoản trước khi sử dụng tính năng này. Chúng tôi sẽ gửi mã xác thực qua SMS hoặc Zalo tới số điện thoại mà bạn nhập dưới đây:

Số điện thoại chưa đúng định dạng!

0 Bình luận

Sắp xếp theo

Xóa Đăng nhập để Gửi

Cũ vẫn chất

Xem thêm

Giấy phép số 362/GP-BTTTT. Bộ Thông tin và Truyền thông cấp ngày 30/06/2016. Cơ quan chủ quản: CÔNG TY CỔ PHẦN MẠNG TRỰC TUYẾN META. Địa chỉ: 56 Duy Tân, Phường Cầu Giấy, Hà Nội. Điện thoại: 024 2242 6188. Email: info@meta.vn. Chịu trách nhiệm nội dung: Lê Ngọc Lam.

ChatGPT, Microsoft Bing AI hay Google Bard là chatbot AI tốt nhất?

Chàng trai nhạt nhẽo

Độ chính xác của phản hồi

Ảo giác AI

Tính toán cơ bản

Sự sáng tạo

Mức độ an toàn

ChatGPT, Bing AI hay Bard là chatbot AI tốt nhất?

Bạn nên đọc

Cách tạo website cơ bản trên Cursor

Hướng dẫn tạo website cơ bản trên Cursor

HuggingChat hay Bing Chat là giải pháp thay thế ChatGPT tốt hơn?

ChatGPT Plus hay Perplexity là chatbot AI tốt hơn?

Nếu AI có thể làm mọi thứ, tại sao chúng ta vẫn cần học?

5 điểm khác biệt chính giữa GPT-4 và GPT-3.5

Sự khác biệt giữa Google PaLM 2 và OpenAI GPT-4

Hướng dẫn chuyển file PDF kiểm tra thành slide bài giảng bằng Gemini

Train-to-Test Scaling là gì? Cách tối ưu chi phí AI từ training đến inference

Cũ vẫn chất

Cách tạo bảng trong Canva

Những bài thơ tán gái theo tên, thơ làm quen bạn gái vừa duyên vừa mặn

Cách tính điểm trung bình môn HK 1, HK 2, cả năm

Hướng dẫn 5 cách chuyển số thành chữ trong Excel

Những ứng dụng hoán đổi khuôn mặt tốt nhất

6 cách siêu dễ thêm phụ đề, caption vào video

Công thức tính diện tích xung quanh hình nón, diện tích toàn phần hình nón, thể tích hình nón, V nón

Cách tạo Slide Master trên PowerPoint

Cách sửa lỗi gõ tiếng Việt trên Word, Excel

Cap đi du lịch hay, stt du lịch hay giúp bạn ghi lại nhật ký hành trình của mình