Các công cụ phát hiện nội dung được tạo bởi ChatGPT rất dễ bị đánh lừa

Chàng trai nhạt nhẽo

Với sự gia tăng của các chương trình Generative AI mà công chúng có thể truy cập miễn phí, chẳng hạn như ChatGPT cho văn bản và Midjourney cho hình ảnh, việc phát hiện văn bản do con người hay AI tạo ra trở nên khó khăn hơn.

Các công cụ phát hiện ChatGPT rất dễ bị đánh lừa

Trí tuệ nhân tạo (AI) - hệ thống máy tính tự động, thuật toán và Machine Learning - từ lâu đã được sử dụng trong mạng xã hội, nghiên cứu khoa học, quảng cáo, nông nghiệp và công nghiệp, hầu như không được chú ý. Nhưng sự trỗi dậy của ChatGPT từ OpenAI đã châm ngòi cho một cuộc chạy đua ở những địa điểm như lớp học, nơi học sinh tìm đến chương trình này để gian lận, viết ra toàn bộ các bài luận có vẻ giống con người viết. Các giáo viên đã triển khai phần mềm phát hiện với hy vọng bắt được những kẻ đạo văn.

Trong một nghiên cứu mới, được công bố trên tạp chí Patterns vào thứ Hai, các nhà nghiên cứu từ Đại học Stanford đã kiểm tra mức độ đáng tin cậy của những công cụ phát hiện này trong việc xác định xem văn bản được viết bởi con người hay AI. Nhóm nghiên cứu đã rất ngạc nhiên khi nhận ra rằng một số công cụ phát hiện GPT phổ biến nhất, được xây dựng để phát hiện văn bản do các ứng dụng như ChatGPT tạo ra, thường xuyên phân loại sai văn bản của những người không nói tiếng Anh là do AI tạo.

Nhóm đã lấy 91 bài luận TOEFL (Test of English as a Foreign Language) từ một diễn đàn Trung Quốc và 88 bài luận được viết bởi học sinh lớp 8 của Hoa Kỳ, chạy chúng qua 7 công cụ phát hiện GPT có sẵn, bao gồm công cụ phát hiện của OpenAI và GPTZero, và chỉ thấy 5,1% bài luận của sinh viên Hoa Kỳ được phân loại là "do AI tạo ra". Mặt khác, 61% các bài luận TOEFL do con người viết đã bị phân loại sai. Thậm chí một công cụ trong số này đã đánh dấu 97,8% bài luận TOEFL do AI tạo ra.

Tất cả 7 công cụ đã đánh dấu 18 trong số 91 bài luận TOEFL là do AI tạo. Khi các nhà nghiên cứu tìm hiểu sâu hơn về 18 bài tiểu luận này, họ nhận thấy lý do có thể là do "độ phức tạp của văn bản" thấp hơn. Sự phức tạp là một loại thước đo đại diện cho tính hay thay đổi hoặc tính ngẫu nhiên trong một văn bản nhất định. Những người viết tiếng Anh không phải là người bản ngữ trước đây đã được chứng minh là có vốn từ vựng và khả năng sử dụng ngữ pháp kém phong phú hơn. Điều này, đối với công cụ phát hiện GPT, khiến nó có vẻ như được viết bởi AI.

Về cơ bản, nếu bạn đang sử dụng văn bản dài dòng và hoa mỹ, nội dung đó sẽ ít có khả năng bị phân loại là do AI tạo. Nhưng điều này cho thấy một sự thiên vị đáng lo ngại và làm dấy lên mối lo ngại rằng những người không có tiếng mẹ đẻ là tiếng Anh có thể chịu tác động xấu, chẳng hạn như trong khi tham gia tuyển dụng việc làm hoặc các kỳ thi ở trường, vì văn bản của họ bị đánh giá là do AI tạo.

ChatGPT và “ngôn ngữ văn học”

Các nhà nghiên cứu đã thực hiện một thí nghiệm thứ hai. Lần này, họ muốn xem phần mềm phát hiện có phân loại chính xác văn bản do AI tạo ra hay không.

Nhóm đã sử dụng ChatGPT để tạo câu trả lời cho truy vấn bài luận tuyển sinh đại học Hoa Kỳ năm 2022-2023. Họ đã chạy các bài luận do ChatGPT tạo thông qua 7 công cụ của mình và nhận thấy rằng, những phần mềm này đã phát hiện ra 70% các bài luận do AI tạo. Nhưng khi nhóm nghiên cứu quay lại ChatGPT, tạo một lời nhắc bổ sung khác, yêu cầu này đã tạo ra các bài tiểu luận khiến những công cụ phát hiện GPT bối rối - chúng chỉ có thể phân loại chính xác 3,3% văn bản là do AI tạo. Kết quả cũng tương tự khi nhóm yêu cầu ChatGPT viết tóm tắt khoa học.

James Zou, nhà khoa học dữ liệu y sinh tại Đại học Stanford và đồng tác giả của nghiên cứu mới cho biết: “Chúng tôi không ngờ rằng những phần mềm phát hiện thương mại này lại hoạt động kém như vậy đối với văn bản từ những người không phải người bản ngữ hoặc dễ bị GPT đánh lừa như vậy”.

Bởi vì chúng dễ bị đánh lừa nên điều này có thể khiến những người không có tiếng Anh là tiếng mẹ đẻ bắt đầu sử dụng ChatGPT thường xuyên hơn, nhằm giúp tác phẩm của họ giống như được viết bởi một người nói tiếng Anh bản xứ.

Cuối cùng, theo các nhà nghiên cứu, hai thí nghiệm đặt ra một câu hỏi then chốt: Nếu việc đánh lừa các công cụ phát hiện quá dễ dàng và văn bản do con người tạo thường xuyên bị phân loại sai, thì rốt cuộc chúng mang lại ích lợi gì?

Làm thế nào để khắc phục vấn đề này?

Cho dù đó là phân loại sai văn bản của con người là do AI tạo hay chỉ đơn giản là bị đánh lừa, thì rõ ràng những công cụ này có vấn đề. Zou đề cập rằng một cơ chế đầy hứa hẹn để tăng cường khả năng phát hiện có thể là so sánh nhiều bài viết về cùng một chủ đề, bao gồm cả phản hồi của con người và AI, sau đó xem liệu chúng có thể được nhóm lại hay không. Điều này có thể cho phép một cách tiếp cận mạnh mẽ và công bằng hơn.

Và công cụ phát hiện nội dung do AI tạo có thể hữu ích theo những cách mà chúng ta chưa thấy. Các nhà nghiên cứu đề cập rằng nếu một công cụ phát hiện GPT được xây dựng để làm nổi bật những cụm từ và cấu trúc được sử dụng quá mức, nó thực sự có thể dẫn đến sự sáng tạo và độc đáo hơn trong văn bản.

Nhóm ủng hộ việc nghiên cứu thêm và nhấn mạnh rằng tất cả các bên bị ảnh hưởng bởi những mô hình Generative AI như ChatGPT nên tham gia vào cuộc thảo luận về việc sử dụng chatbot AI.

Cho đến thời điểm đó, nhóm nhấn mạnh "cần hết sức thận trọng đối với việc sử dụng công cụ phát hiện GPT trong môi trường đánh giá hoặc giáo dục, đặc biệt là khi đánh giá công việc của những người không nói tiếng Anh bản ngữ".

Thứ Sáu, 14/07/2023 11:40

5 ★ 1 👨 269

#ChatGPT #MidJourney

Bạn nên đọc

Xác thực tài khoản!

Theo Nghị định 147/2024/ND-CP, bạn cần xác thực tài khoản trước khi sử dụng tính năng này. Chúng tôi sẽ gửi mã xác thực qua SMS hoặc Zalo tới số điện thoại mà bạn nhập dưới đây:

Số điện thoại chưa đúng định dạng!

0 Bình luận

Sắp xếp theo

Xóa Đăng nhập để Gửi

Cũ vẫn chất

Xem thêm

Giấy phép số 362/GP-BTTTT. Bộ Thông tin và Truyền thông cấp ngày 30/06/2016. Cơ quan chủ quản: CÔNG TY CỔ PHẦN MẠNG TRỰC TUYẾN META. Địa chỉ: 56 Duy Tân, Phường Cầu Giấy, Hà Nội. Điện thoại: 024 2242 6188. Email: info@meta.vn. Chịu trách nhiệm nội dung: Lê Ngọc Lam.

Các công cụ phát hiện nội dung được tạo bởi ChatGPT rất dễ bị đánh lừa

Chàng trai nhạt nhẽo

Các công cụ phát hiện ChatGPT rất dễ bị đánh lừa

ChatGPT và “ngôn ngữ văn học”

Làm thế nào để khắc phục vấn đề này?

Bạn nên đọc

3 kỹ năng lãnh đạo cần có trong kỷ nguyên AI agent

Hơn 100.000 dữ liệu của tài khoản ChatGPT bị đánh cắp và rao bán trên dark web

5 tác động tiêu cực đối với sức khỏe tiềm ẩn của công nghệ Generative AI

So sánh Gemma 4 và Qwen trong kiểm thử thâm nhập AI

Tại sao tin tặc nhắm mục tiêu vào tài khoản ChatGPT?

Hướng dẫn tạo video AI ngắn bằng Google Vids

Hướng dẫn thiết lập quy tắc trên Cursor

So sánh giá ChatGPT, Gemini, Claude, Grok…: nên chọn gói AI nào?

5 lý do khiến các công ty cấm ChatGPT

Cũ vẫn chất

Cách đóng băng, ẩn hàng và cột trong Google Sheets

Hướng dẫn tải video Youtube đơn giản, nhanh

Luyện gõ 10 ngón bằng Mario Teaches Typing online, game luyện đánh máy cực hấp dẫn

Cách thay đổi hướng slide theo chiều dọc trong PowerPoint

Roleplay là gì? Roleplayer là gì?

Các cách fake IP máy tính hiệu quả, tốt nhất

12/4 là ngày gì?

Cách sửa lỗi “No Boot Device Found Press Any Key to Reboot the Machine“ trên Windows

Những bài thơ về tiền hay và sâu sắc khiến bạn phải suy ngẫm

Hàm printf() trong C