ChatGPT và Google Gemini là những chatbot AI rất có năng lực với khả năng tạo văn bản, code và hình ảnh vượt trội. Phiên bản miễn phí thực hiện tốt các tác vụ cơ bản nhưng phiên bản trả phí thậm chí còn có nhiều tính năng hơn.
Tuy nhiên, việc lựa chọn giữa ChatGPT và Google Gemini không phải là điều dễ dàng, đặc biệt là khi GPT-4 và Gemini Advanced (những mô hình ngôn ngữ lớn cao cấp hỗ trợ các chatbot AI) hoạt động tương tự nhau trong một số lĩnh vực.
Hãy cùng so sánh ChatGPT Plus và Google Gemini Advanced để xem chúng khác nhau như thế nào!
Giao diện người dùng
Cả hai đều có giao diện người dùng tương tự nhau, sử dụng phong cách đàm thoại. Cả người dùng cấp cơ bản và nâng cao đều sẽ thấy giao diện dễ sử dụng và đầy đủ chức năng, đồng thời có sự tương đồng đáng chú ý giữa chúng.
Tuy nhiên, phong cách trò chuyện lại khác. ChatGPT xuất ra từng từ một, trong khi Gemini xuất ra từng dòng một. Hy vọng sẽ có cài đặt cấu hình cho tùy chọn xuất này trong tương lai. Còn hiện tại, không thể thay đổi điều này.
Nếu không hài lòng với kết quả đầu ra và muốn câu hỏi của mình được trả lời khác đi, bạn có thể yêu cầu ChatGPT tạo lại đầu ra (Regenerate). Gemini tạo trước một số bản nháp để dễ dàng lựa chọn.
Ngoài ra, Gemini còn có thêm một số điều khiển được tạo sẵn để kiểm soát chi tiết đầu ra. Bạn có thể chọn câu trả lời ngắn, dài, giản dị hoặc chuyên nghiệp hơn. Gemini sẽ điều chỉnh cài đặt và tạo ra đầu ra phù hợp.
Người dùng có thể truy vấn cả hai nguồn thông tin được trình bày. ChatGPT sẽ hiển thị nguồn ở cuối mỗi đoạn, trong khi Gemini sẽ hiển thị nguồn thông tin ngay sau mỗi câu. Cách làm này là một cách hay để ghi công cho tác giả ban đầu của nội dung.
Mặc dù cả hai giao diện đều giống nhau nhưng các tính năng bổ sung mang lại cho Gemini một chút lợi thế so với ChatGPT. Vì vậy, Gemini thắng hiệp này với tỷ số 2-1.
ChatGPT 4 và Gemini Advanced có thể trả lời câu hỏi tốt đến mức nào?
Để trả lời tốt một câu hỏi, GPT cần hiểu câu hỏi đó, lý do nó được tạo và xây dựng kết quả đầu ra. Nếu không đáp ứng cả ba, bạn sẽ không có được kết quả đầu ra phù hợp.
Tạo một bản tóm tắt trang web
Tác giả bài viết đã yêu cầu cả hai chatbot tóm tắt một trang trên Wikipedia, vì cả ChatGPT và Gemini đều có thể truy cập các URL bên ngoài và việc tóm tắt văn bản là điểm mạnh của cả hai. Trong cả hai trường hợp, bản tóm tắt đều chính xác.
Tóm tắt hình ảnh
Khi được yêu cầu tóm tắt một hình ảnh, cả hai đều thể hiện việc không thể tìm nạp hình ảnh qua Internet.
Khi cùng một hình ảnh được upload lên dưới dạng file, cả hai đều thực hiện công việc tuyệt vời trong việc xác định từng chi tiết của hình ảnh.
Nhận dạng ký tự quang học
Thử nghiệm trước cho thấy văn bản có thể được trích xuất từ hình ảnh. Nhưng cả hai sẽ hoạt động như thế nào khi được trình bày với văn bản có kích thước và màu sắc khác nhau?
Cả hai chatbot đều bắt đầu khá tốt. Nhưng tới cuối cùng, ChatGPT tạo ra kết quả đầu ra rất chính xác trong khi Gemini bỏ dở giữa chừng. Rõ ràng Gemini Advanced đã mất một điểm ở đây.
ChatGPT 4 & Gemini Advanced có thể tóm tắt video không?
Cũng giống như hình ảnh, bạn có thể tóm tắt video được không? Không có quy định nào cho việc upload video lên ChatGPT. Khi cố gắng thêm liên kết video, ứng dụng cho biết nó không thể cung cấp bản transcript của video trực tuyến trên YouTube. Tuy nhiên, ChatGPT có thư viện GPT của bên thứ ba, với các công cụ như Full Video Transcript GPT có thể sử dụng để tạo bản transcript hoàn hảo.
Mặt khác, YouTube được coi là sân nhà của Gemini và nó có một plugin dành riêng cho YouTube. Nhưng một lần nữa, nó lại làm chệch hướng nhiệm vụ và bắt đầu tóm tắt video thay vì cung cấp bản transcript toàn văn. Gemini cần hoàn thành câu trả lời trước khi thể hiện kỹ năng tóm tắt của mình.
Tuy nhiên, đây chỉ là video YouTube. Gemini không thể lấy video từ các dịch vụ video trực tuyến khác.
Để tìm hiểu sâu hơn về mức độ hiểu nội dung video của GPT, tác giả đã đặt một câu hỏi cụ thể và mốc thời gian của nó. ChatGPT sai mốc thời gian nhưng lại trả lời đúng câu hỏi. Gemini không tìm được câu trả lời trong video nên ChatGPT lại ghi thêm điểm.
So sánh ứng dụng di động
Điện thoại di động, với camera và micro tích hợp, cho phép thực hiện các chức năng nâng cao trong ứng dụng tương ứng của mỗi chatbot. Tác giả bài viết đang sử dụng điện thoại Google Pixel cho các thử nghiệm này.
Nhận dạng hình ảnh
Để kiểm tra khả năng của ứng dụng di động ChatGPT và Gemini Advanced, tác giả đã dùng một headphone và bắt đầu đặt câu hỏi cho từng ứng dụng. Đầu tiên, tại sao headphone lại có cổng USB thay vì jack 3.5mm thông thường? Cả hai đều giải thích khá rõ ràng và khi được hỏi cách kết nối chúng với điện thoại để phát âm thanh, cả hai đều trả lời đúng.
Khi được yêu cầu nhận dạng headphone, Gemini đã đưa ra câu trả lời. Hơn nữa, nó cung cấp các liên kết mua hàng cho sản phẩm. Gemini 2-1.
Nhận dạng giọng nói
Một tính năng quan trọng của ứng dụng di động là khả năng nhận dạng giọng nói. ChatGPT lắng nghe cho đến khi bạn tạm dừng rồi chuyển nó thành văn bản và kết quả đầu ra rất chính xác.
Google đã làm chủ được khía cạnh này và tính năng nhận dạng giọng nói của Gemini Advanced rất trực tiếp, liền mạch và chính xác.
ChatGPT được tích hợp sẵn tính năng đàm thoại bằng giọng nói. Nó có thể nói và dịch sang ngôn ngữ được yêu cầu. +1 cho ChatGPT.
Tính toán và lý luận
Công dụng lý tưởng của GPT là giải quyết các vấn đề phức tạp. Cung cấp hàng tấn dữ liệu và nó có thể đưa ra câu trả lời với tốc độ cực nhanh. Vì vậy, cách tốt nhất để kiểm tra ChatGPT Plus và Gemini Advanced là để chúng giải quyết vấn đề?
Một câu hỏi toán học đơn giản
Câu hỏi được đặt cho cả hai công cụ: "Một số học sinh lên kế hoạch đi dã ngoại. Ngân sách dành cho thực phẩm là $24. Vì có 4 học sinh không tham gia nên chi phí ăn uống cho mỗi học sinh tăng thêm 1 đô la. Vậy có bao nhiêu học sinh tham dự buổi dã ngoại?".
Cả ChatGPT 4 và Gemini Advanced đều trả lời 12, điều này sai. Đó là logic đơn giản. Nếu 12 người chi 2 USD mỗi người thì họ sẽ phải trả 24 USD. Nếu 4 người không tham gia, 8 người còn lại sẽ chi thêm $1, nghĩa là mỗi người phải đóng $3. Vì vậy, 8 mới là câu trả lời đúng.
ChatGPT đã sử dụng code Python để đưa ra câu trả lời và Gemini sử dụng các phương trình. Trong toán học, độ chính xác là yếu tố then chốt. Cả hai đều không hiểu đúng, vì vậy tỷ số là 0-0.
Điều đáng chú ý là Gemini đã đưa ra câu trả lời 8 trong một bản nháp. Vậy là nó đã tính toán và đưa ra đáp án khác rồi, nhưng lại không kiểm tra lại câu trả lời chính.
ChatGPT 4 Turbo
ChatGPT đã phát hành GPT-4 Turbo mới. Nó tuyên bố là mình giỏi tính toán hơn, và dự thật đúng như vậy.
Câu hỏi khó
Thế còn một câu hỏi khó thì sao? Câu hỏi được đưa ra là về những con chim đậu trên dây và tác giả muốn kiểm tra khả năng đánh giá những tác động trong thế giới thực. ChatGPT đã trả lời đúng, trong khi Gemini chỉ đơn thuần đưa ra tính toán máy móc.
Đồ thị
Tiếp theo, tác giả đưa dữ liệu cho cả hai chatbot và yêu cầu chúng vẽ biểu đồ. Cả ChatGPT và Gemini đều có khả năng vẽ đồ thị chính xác. Gemini có một số lựa chọn tùy chỉnh được tạo sẵn để thay đổi kiểu biểu đồ. Bạn cũng có thể làm tương tự với ChatGPT, thông qua việc tạo prompt.
Lập trình
Lập trình là điểm mạnh của AI và việc biến ý tưởng của người bình thường thành hiện thực là một quá trình đỉnh cao. Khi được yêu cầu viết code để trì hoãn việc nhập văn bản, cả ChatGPT và Gemini Advanced đều làm rất tốt. Phải mất thêm vài lần tùy chỉnh code cho phù hợp với mục đích nhưng cuối cùng nó đã hoạt động. Mỗi công cụ nhận được một điểm về khía cạnh này.
Viết nội dung sáng tạo
Tác giả đã yêu cầu cả hai công cụ viết một câu chuyện 100 từ. Hầu hết các công cụ GPT và AI đều giỏi viết những câu chuyện sáng tạo và cả hai đều làm tốt nhiệm vụ này.
Tạo hình ảnh
Khả năng tạo hình ảnh của GPT luôn được cải thiện. Kết quả đầu ra trông thực tế hơn so với hình ảnh hoạt hình của các phiên bản trước. ChatGPT hiện có một công cụ chỉnh sửa, cho phép chọn vùng quan tâm trong hình ảnh được tạo và sửa đổi nó bằng prompt.
Mặt khác, Gemini không có những công cụ như vậy và tạo ra một bộ hình ảnh mới hoàn toàn. Tỷ số 2-1 nghiêng về ChatGPT trong khía cạnh này.
Giá cả và hạn chế
Cả ChatGPT Plus và Google Gemini đều có giá 20 USD/tháng. ChatGPT có giới hạn 40 message sau mỗi 3 giờ, trong khi Gemini cho phép tới 50 message. Thêm một điểm ở đây dành cho Gemini.
ChatGPT cho phép người dùng tạo GPT tùy chỉnh, mở ra phạm vi cải thiện những gì OpenAI đã xây dựng. Ví dụ, ChatGPT có thể chơi game nhưng cũng có rất nhiều game trong GPT Store. Ngược lại, Gemini có số lượng tiện ích mở rộng hạn chế, chủ yếu là các sản phẩm khác của Google. ChatGPT ghi điểm ở đây.
ChatGPT Plus hay Gemini Advanced tốt hơn? Nên chọn cái nào?
Tổng hợp tất cả mọi thứ, chúng ta có điểm số cuối cùng:
ChatGPT 4 | Gemini Advanced | |
---|---|---|
Giao diện người dùng | 1 | 2 |
Tóm tắt trang web | 1 | 1 |
Tóm tắt hình ảnh | 1 | 1 |
OCR | 2 | 1 |
Tạo transcript video | 2 | 1 |
Xác định đối tượng | 1 | 2 |
Nhận dạng giọng nói | 1 | 1 |
Cuộc trò chuyện bằng giọng nói | 1 | 0 |
Làm toán đơn giản | 0+1 | 0 |
Câu hỏi khó | 1 | 0 |
Vẽ đồ thị | 1 | 2 |
Lập trình | 1 | 1 |
Viết nội dung sáng tạo | 1 | 1 |
Tạo hình ảnh | 2 | 1 |
Giá cả | 1 | 1 |
Giới hạn message | 1 | 2 |
Extension | 2 | 1 |
Tổng điểm | 21 | 18 |
Từ kết quả cho thấy, ChatGPT giành chiến thắng, nhưng Gemini cũng không kém quá xa. Tuy nhiên, nếu buộc phải lựa chọn, hãy sử dụng ChatGPT Plus.