Khi các mô hình ngôn ngữ như GPT tiếp tục được cải tiến, việc phân biệt giữa văn bản do AI tạo ra và con người viết ngày càng trở nên khó khăn hơn. Tuy nhiên, trong một số trường hợp, chẳng hạn như trong học thuật, cần phải đảm bảo rằng văn bản không được viết bởi AI.
Đây là lúc những công cụ phát hiện văn bản AI phát huy tác dụng. Mặc dù hiện tại không có công cụ nào phát hiện một cách hoàn toàn chắc chắn, một số công cụ trong số này cung cấp kết quả khá chính xác. Bài viết hôm nay sẽ liệt kê 8 công cụ phát hiện văn bản AI chính xác nhất mà bạn có thể thử ở thời điểm hiện tại.
1. GPTZero
GPTZero được xây dựng để giúp giáo viên xác định xem bài tập mà học sinh của mình nộp có được tạo ra bằng AI hay không. Nhưng vì GPTZero phát hiện chính xác nội dung do ChatGPT tạo nên bạn không nhất thiết phải là giáo viên mới có thể hưởng lợi từ nội dung đó.
GPTZero phân tích văn bản và cho biết nó được viết bởi con người hay AI, highlight các câu cụ thể mà nó tin là do AI tạo ra. Nhìn chung, GPTZero phát hiện văn bản AI rất tốt nhưng đôi khi cũng tạo ra kết quả cảnh báo không chính xác. Nó cũng có tính năng Batch File Upload cho phép bạn quét nhiều file chỉ bằng một cú nhấp chuột. Bên cạnh gói miễn phí, GPTZero còn có hai gói trả phí với các tính năng bổ sung và giới hạn cao hơn.
2. Winston AI
Winston AI tuyên bố có thể phát hiện nội dung do AI tạo ra với độ chính xác 99,6%. Mặc dù không thể xác minh tuyên bố này nhưng Winston AI đã hoạt động tốt trong các thử nghiệm.
Đầu tiên, nó phát hiện Soldier's Home : Người lính trở về của Hemingway là do con người viết 100%. Tương tự như vậy, nó gắn nhãn văn bản AI là 0% do con người viết. Tốt hơn nữa, nó đánh dấu sự kết hợp giữa AI và văn bản của con người là 35% con người, highlight gần như chính xác tất cả các câu do AI tạo ra.
Winston AI cũng hiển thị điểm dễ đọc và đạo văn (nếu bạn nâng cấp lên bất kỳ gói trả phí nào). Nó cung cấp bản dùng thử miễn phí chỉ 2000 từ, sau đó bạn sẽ phải chuyển sang tài khoản trả phí.
3. Content at Scale AI Detector
Content at Scale là một trình tạo văn bản AI tập trung vào việc tạo ra nội dung dạng dài chỉ bằng một vài cú nhấp chuột. Nó cũng có một công cụ phát hiện AI ấn tượng.
Content at Scale AI Detector cung cấp điểm số về xác suất, kiểu mẫu và khả năng dự đoán cùng với điểm tổng thể. Chúng được thể hiện dưới dạng phần trăm. Tỷ lệ phần trăm càng cao thì càng có nhiều khả năng văn bản được viết bởi con người. Công cụ này cũng highlight các câu mà nó tin là do AI viết. Công cụ này miễn phí và mang lại kết quả khá giống với GPTZero.
4. Originality AI
Originality AI là trình phát hiện văn bản AI phổ biến được tuyên bố là có thể phát hiện chính xác văn bản do GPT 3, GPT 3.5 và ChatGPT tạo ra. Nó đưa ra tỷ lệ phần trăm khả năng văn bản được tạo ra bởi con người hoặc AI và làm nổi bật các câu có khả năng do AI tạo ra.
Mô hình Originality AI 2.0 Detection (phiên bản nâng cấp của công cụ gốc) đã highlight văn bản do con người viết là 100% có khả năng được viết bởi con người, điều này khá ấn tượng. Tương tự, Originality AI đã phát hiện chính xác câu trả lời của ChatGPT và gắn nhãn đó là 100% AI. Khi được yêu cầu phân tích sự kết hợp giữa văn bản do con người và AI tạo ra, Originality đã kết luận nó là 68% AI và 32% con người.
Không giống như hầu hết các công cụ khác cung cấp gói miễn phí, Originality AI là một công cụ trả phí. Nó cũng có thể kiểm tra nội dung xem có đạo văn hay không, nhưng sẽ tốn thêm credit.
5. Writefull GPT Detector
Writefull nhằm mục đích làm cho quá trình viết học thuật trở nên dễ dàng hơn. Để đạt được mục đích đó, Writefull có một số công cụ AI, bao gồm cả GPT Detector. Công cụ này được sử dụng miễn phí và mã hóa dữ liệu để đảm bảo quyền riêng tư.
Writefull GPT Detector có thể xác định nội dung được viết bởi GPT-3 cũng như ChatGPT. Sau khi phân tích, nó đưa ra điểm số cho biết xác suất nội dung đó được viết bởi AI. Công cụ này cung cấp khả năng tích hợp với Word và Overleaf, đồng thời có API cho GPT Detector.
6. Hive Moderation Text Detection
Hive Moderation không chỉ có công cụ phát hiện văn bản mà còn phát hiện được cả các hình ảnh do AI tạo ra.
Công cụ đã phân tích chính xác văn bản do con người viết là “có khả năng chứa 0% văn bản AI”. Tương tự, văn bản do AI tạo ra cũng được xác định như vậy. Nhưng giống như hầu hết những công cụ khác, nó không thể phát hiện chính xác văn bản kết hợp cả nội dung do con người và AI tạo ra.
Trên trang web của Hive Moderation, bạn có thể sử dụng công cụ demo miễn phí mà không cần đăng ký. Nhưng bạn sẽ phải liên hệ với nhà phát triển để có toàn quyền truy cập. Tương tự, công cụ phát hiện hình ảnh có thể giúp bạn phát hiện các hình ảnh được tạo bởi những công cụ AI như DALL-E 2 hoặc Midjourney.
7. Crossplag
Crossplag là một công cụ kiểm tra đạo văn phổ biến khác với công cụ phát hiện AI. Nó có giao diện đơn giản cho phép bạn dán văn bản và kiểm tra xem nó có được tạo bởi AI hay không.
Bên cạnh việc cho biết khả năng một đoạn văn bản được tạo ra bởi AI, Crossplag nêu bật những câu cụ thể mà nó tin là do AI tạo ra.
Trong quá trình thử nghiệm, Crossplag đã xác định chính xác văn bản do ChatGPT và con người viết. Tuy nhiên, khi được yêu cầu quét nội dung hỗn hợp, Crossplag đã gắn nhãn nhầm nội dung đó là 100% do con người tạo.
Mặc dù trình phát hiện đạo văn của Crossplag yêu cầu nâng cấp lên gói trả phí nhưng công cụ phát hiện AI của Crossplag có thể sử dụng miễn phí.
8. AI Content Detector by Copyleaks
Copyleaks, một trong những công cụ phát hiện đạo văn phổ biến nhất, có một công cụ khác để phát hiện ChatGPT, GPT-3 và các mô hình ngôn ngữ tương tự khác. Điều khiến công cụ này trở nên nổi bật là nó có thể phát hiện nội dung được viết bằng các ngôn ngữ khác, như tiếng Tây Ban Nha và tiếng Pháp.
Công cụ này có thể xác định chính xác truyện ngắn của Ernest là do con người viết với xác suất khoảng 98,8%. Tương tự, nó đã phát hiện văn bản AI với độ chắc chắn 83,9%. Tuy nhiên, công cụ đã mắc lỗi ở nội dung kết hợp giữa AI và con người, vì nó phán đoán văn bản có 67,2% khả năng là do con người tạo.
AI Content Detector by Copyleaks có tiện ích mở rộng cho Chrome. Điều tuyệt vời nhất là nó cung cấp tích hợp API và LMS.