ChatGPT có đạo văn không?

Mặc dù ChatGPT có thể trả lời bất kỳ câu hỏi nào nhưng một số người dùng thắc mắc liệu câu trả lời của nó có chứa nội dung đạo văn không. Để tìm câu trả lời cho câu hỏi này, bài viết đã tạo 4 loại văn bản khác nhau bằng ChatGPT và sau đó đánh giá tính nguyên bản của chúng bằng nhiều công cụ phát hiện đạo văn khác nhau.

Đạo văn chính xác là gì và LLM hoạt động như thế nào?

Để xác định xem ChatGPT có đạo văn hay không, trước tiên nên hiểu điều gì cấu thành đạo văn. Đạo văn liên quan đến việc sử dụng từ ngữ, ý tưởng hoặc tác phẩm của người khác mà không có sự ghi công chính xác. Điều này bao gồm việc sao chép trực tiếp văn bản từ một nguồn mà không trích dẫn hoặc diễn giải chặt chẽ ý tưởng của người khác mà không ghi nhận.

ChatGPT, giống như các mô hình ngôn ngữ lớn (LLM) khác, được đào tạo trên các tập dữ liệu lớn, chủ yếu là từ nội dung có sẵn công khai. Tuy nhiên, việc thu thập lượng dữ liệu khổng lồ như vậy đặt ra các câu hỏi về đạo đức, vì những người sáng tạo ban đầu không đồng ý việc công sức của họ được sử dụng để đào tạo LLM. Điều này dẫn đến các cuộc tranh luận về đạo đức và tính hợp pháp của những hoạt động đó.

Mặc dù ChatGPT tạo ra phản hồi dựa trên lời nhắc mà nó nhận được, nhưng vấn đề nằm ở bối cảnh rộng hơn về cách OpenAI (nhà phát triển ChatGPT) lấy được dữ liệu dùng để đào tạo, liên quan đến việc sử dụng nội dung mà không có sự đồng ý thích hợp. Nhiều người coi đây là đạo văn và đối với nhiều trang web, đây là hành vi trộm cắp nội dung. Tuy nhiên, việc xác định chính xác nguồn gốc của đạo văn là rất khó.

Phần còn lại của bài viết này sẽ tập trung vào việc liệu ChatGPT có đạo văn kết quả đầu ra từ các nguồn khác hay không và không đi sâu vào chi tiết cụ thể về nguồn phản hồi của nó. Hãy kiểm tra tính nguyên bản của các phản hồi từ ChatGPT bằng nhiều công cụ phát hiện đạo văn khác nhau để xem liệu chatbot có sử dụng văn bản trực tiếp từ các nguồn trực tuyến hay không.

ChatGPT có đạo văn các bài luận không?

Ví dụ đầu tiên này đã giao cho ChatGPT nhiệm vụ soạn một bài luận dài 300 từ về các vấn đề sức khỏe tâm thần.

Tiểu luận về các vấn đề sức khỏe tâm thần do ChatGPT tạo ra.
Tiểu luận về các vấn đề sức khỏe tâm thần do ChatGPT tạo ra.

Sau đó, tác giả đã sử dụng nhiều công cụ phát hiện đạo văn khác nhau để đánh giá tính nguyên bản của bài luận do chatbot tạo ra. Những công cụ này bao gồm trình kiểm tra đạo văn Quetext, trình kiểm tra đạo văn tích hợp của Microsoft Word, trình kiểm tra đạo văn của Grammarly và trình quét đạo văn Duplichecker.

Trình kiểm tra đạo văn tích hợp của Microsoft cho thấy độ tương tự là 0% với các nguồn trực tuyến. Mức độ đạo văn được các công cụ khác phát hiện cũng ở mức tối thiểu: Công cụ phát hiện đạo văn của Grammarly cho kết quả 4%, công cụ phát hiện đạo văn của QueText tìm thấy 5% và công cụ quét đạo văn của Duplichecker cho kết quả 0%.

Xem xét tỷ lệ phần trăm nhỏ đạo văn được phát hiện, có vẻ như ChatGPT không sao chép trực tiếp các bài luận từ những nguồn hiện có.

ChatGPT có đạo code không?

Để đánh giá xem ChatGPT có đạo code hay không, chatbot đã được giao nhiêm vụ viết code cho máy tính bằng Python.

Code được tạo bởi ChatGPT bằng ngôn ngữ Python.
Code được tạo bởi ChatGPT bằng ngôn ngữ Python.

Sau đó, tác giả đã tiến hành kiểm tra đạo văn trên code bằng cách sử dụng trình kiểm tra đạo văn lập trình chuyên dụng có tên Dolos, công cụ này đã phát hiện ra độ tương tự bằng 0%. Ngoài ra, khi kiểm tra code bằng các công cụ phát hiện đạo văn chung được đề cập ở trên, kết quả rất nhất quán, hầu như không có chương trình nào phát hiện ra hơn 4% tỷ lệ đạo văn.

Khi yêu cầu ChatGPT tạo code cho máy tính từ các tài khoản khác nhau, những phản hồi sẽ xuất hiện khác nhau. Quan sát này và kết quả từ việc kiểm tra đạo văn cho thấy ChatGPT không sao chép code từ các nguồn trực tuyến. Thay vào đó, nó dựa trên tập dữ liệu đã được đào tạo để tạo code một cách độc lập.

ChatGPT có đạo văn các giải pháp toán học không?

Thử nghiệm thứ ba đã giao nhiệm vụ cho chatbot giải một bài toán và đưa ra lý luận chi tiết cho từng bước.

Giải pháp cho một câu hỏi tích hợp kèm theo lời giải thích do ChatGPT tạo ra.
Giải pháp cho một câu hỏi tích hợp kèm theo lời giải thích do ChatGPT tạo ra.

Để kiểm tra tính nguyên gốc của phản hồi, tác giả đã kiểm tra kết quả đầu ra bằng cách sử dụng một số công cụ phát hiện đạo văn dành riêng cho học thuật, bao gồm trình kiểm tra đạo văn PapersOwl, trình quét đạo văn Trinka được hỗ trợ bởi AI cũng như các công cụ kiểm tra đạo văn chung như Grammarly, Duplichecker và QueText.

Trình phát hiện đạo văn của PapersOwl chỉ ra sự giống nhau gần 46% giữa lý luận do chatbot tạo ra và các nguồn trực tuyến. Tương tự, công cụ phát hiện đạo văn Trinka báo cáo mức độ giống nhau hơn 10%. Ngoài ra, trình phát hiện đạo văn của Grammarly đã phát hiện thấy độ tương tự là 14%, QueText cho kết quả 17% và Duplichecker là 7%.

Việc phát hiện tỷ lệ đạo văn cao trong câu trả lời được tạo không có nghĩa là chatbot sao chép trực tiếp lý luận cho các câu hỏi toán học từ những nguồn trực tuyến. Điều này chủ yếu là do lời giải và cách giải các bài toán thường theo tiêu chuẩn và được phổ biến rộng rãi trên mạng.

Vì vậy, mặc dù ChatGPT đưa ra phản hồi của riêng mình, việc tìm kiếm các câu trả lời và lý luận tương tự trực tuyến vẫn có thể xảy ra, điều này dẫn đến tỷ lệ phát hiện đạo văn ở mức cao.

ChatGPT có sử dụng nội dung từ blog không?

Để kiểm tra xem ChatGPT có sử dụng nội dung từ blog trực tuyến hay không, tác giả đã yêu cầu chatbot cung cấp các mẹo để duy trì tình trạng pin của laptop.

Mẹo giữ pin laptop luôn khỏe do ChatGPT tạo ra.
Mẹo giữ pin laptop luôn khỏe do ChatGPT tạo ra.

Microsoft Word đã phát hiện 10% đạo văn trong văn bản được tạo. Công cụ Duplichecker cho thấy 4%, công cụ kiểm tra đạo văn của Grammarly cho thấy 14%, nhưng Quetext phát hiện 58% đạo văn trong nội dung. Khi tìm hiểu sâu hơn, một số văn bản trong phản hồi của chatbot khớp với nội dung trên một vài blog.

Để kiểm tra kỹ xem việc phát hiện đạo văn cao có phải là ngẫu nhiên hay không, tác giả đã hỏi chatbot thêm một số câu hỏi về thông tin có sẵn trực tuyến. Tỷ lệ đạo văn trong các câu trả lời được tạo ra cao hơn nhiều. Dựa trên thử nghiệm, có vẻ như chatbot đôi khi sử dụng các cụm từ và văn bản từ những nguồn trực tuyến, điều này khá đáng ngạc nhiên.

Thứ Năm, 16/05/2024 11:50
31 👨 194
0 Bình luận
Sắp xếp theo
    ❖ Trí tuệ nhân tạo (AI)