OpenAI cân nhắc việc thêm watermark vào văn bản do ChatGPT tạo

Theo The Wall Street Journal, OpenAI đã có một hệ thống tạo watermark cho văn bản do ChatGPT tạo và một công cụ để phát hiện watermark đã sẵn sàng trong khoảng một năm. Nhưng công ty đang tranh luận nội bộ về việc có nên phát hành nó hay không. Một mặt, đó có vẻ là việc làm có trách nhiệm; mặt khác, nó có thể làm tổn hại đến lợi nhuận của công ty.

Việc thêm watermark của OpenAI được mô tả là điều chỉnh cách mô hình dự đoán các từ và cụm từ có khả năng xảy ra nhất sau những từ và cụm từ trước đó, tạo ra một mẫu có thể phát hiện được.

Đưa ra bất kỳ cách nào để phát hiện tài liệu do AI viết là một lợi ích tiềm năng cho các giáo viên đang cố gắng ngăn cản học sinh dùng AI để làm bài tập. Tạp chí báo cáo rằng công ty nhận thấy watermark không ảnh hưởng đến chất lượng đầu ra văn bản của chatbot. Trong một cuộc khảo sát mà công ty ủy quyền, "mọi người trên toàn thế giới ủng hộ ý tưởng về công cụ phát hiện AI với tỷ lệ 4:1", Journal viết.

Sau khi Journal xuất bản câu chuyện của mình, OpenAI xác nhận rằng mình đã thúc đẩy việc thêm watermark văn bản trong một bản cập nhật bài đăng trên blog ngày hôm nay được TechCrunch phát hiện. Trong đó, công ty cho biết phương pháp của họ rất chính xác ("hiệu quả 99,9%", theo các tài liệu mà Journal đã thấy) và có khả năng chống lại "sự giả mạo, chẳng hạn như paraphrase". Công ty cũng cho biết họ lo ngại về sự kỳ thị về tính hữu ích của các công cụ AI đối với những người không phải là người bản xứ.

Nhưng có vẻ như OpenAI cũng lo lắng rằng việc sử dụng watermark có thể làm mất lòng người dùng ChatGPT. Theo khảo sát, gần 30% trong số họ đã nói với công ty rằng họ sẽ sử dụng phần mềm ít hơn nếu tính năng watermark được triển khai.

Mặc dù vậy, một số nhân viên vẫn cảm thấy rằng tính năng watermark sẽ có hiệu quả. Tuy nhiên, trước những cảm xúc khó chịu của người dùng, Journal cho biết một số phương pháp thử được đề xuất "có thể ít gây tranh cãi giữa người dùng nhưng chưa được chứng minh". Trong bản cập nhật bài đăng trên blog ngày hôm nay, công ty cho biết họ đang “ở giai đoạn đầu” khám phá việc nhúng siêu dữ liệu, và vẫn còn "quá sớm" để biết tính năng mới sẽ hoạt động tốt như thế nào, nhưng vì nó được ký bằng mật mã nên sẽ không có kết quả phát hiện không chính xác.

Thứ Hai, 05/08/2024 11:25
31 👨 115
0 Bình luận
Sắp xếp theo
    ❖ Chuyện công nghệ