Hai nhà nghiên cứu Jessica Rumbelow và Matthew Watkins, mới đây đã phát hiện một danh sách chứa các từ khóa được gom lại với nhau có thể khiến ChatGPT trở nên rối loạn.
Danh sách này gồm những từ như "SolidGoldMagikarp", "StreamerBot" và "TheNitromeFan", được phát hiện khi họ nghiên cứu bộ mã của mô hình AI GPT.
Khi nhập những từ khóa này vào ChatGPT và những mô hình GPT cũ hơn của OpenAI, chúng đưa ra những câu trả lời lảng tránh, kỳ quái, thậm chí xúc phạm lại người hỏi.
Cụ thể, khi trong yêu cầu của người dùng có từ khóa "TheNitromeFan", ChatGPT không thể trả lời chính xác và luôn nhắc đến con số bí ẩn 182. Hay cụm từ "SolidGoldMagikarp" được AI này hiểu thành một từ không liên quan là "distribute".
Thậm chí, một mô hình GPT cũ hơn đã phản hồi lại "Bạn là một kẻ khốn" khi được hỏi về từ khóa "StreamBot".
Các từ trên được Rumbelow và Watkins gọi là từ khóa "không thể nói được" của ChatGPT và được coi là "hộp đen" bí ẩn. Đồng thời, chúng cũng có thấy siêu AI này có thể gặp lỗi ngay cả với những yêu cầu đơn giản.
Sau khi nghiên cứu thêm, các nhà nghiên cứu phát hiện ra một điều thú vị là một phần trong số các cụm từ bí ẩn này trùng với tên tài khoản của một số người dùng Reddit. Họ có điểm chung là cùng tham gia vào một thử thách khá nổi trên mạng xã hội là "đếm số", khi các thành viên tham gia sẽ bình luận bằng những con số tăng dần kéo dài tới vô tận. Sau 10 năm, các thành viên tham gia thử thách này đã cùng nhau "đếm" đến số 5.000.000 sau gần 10 năm và TheNitromeFan, SolidGoldMagikarp, Smartstocks... là những tài khoản tích cực trong chủ đề này.
Lý giải cho điều này, các nhà nghiên cứu cho rằng OpenAI có thể đã lấy cả các cụm từ xuất hiện trên Reddit trong quá trình thu thập dữ liệu thô. Sau đó, các dữ liệu cũng được quản lý chặt chẽ hơn và mô hình AI được đào tạo kỹ hơn nên các cụm từ đó bị “bỏ xó”. Vì vậy, khi được hỏi AI không biết phải làm gì với chúng.
Tuy nhiên, giải thích trên vẫn chưa thể lý giải đầy đủ sự kỳ lạ của các phản hồi từ AI.
Theo Rumbelow và Watkins, điều này cho thấy ChatGPT vẫn tồn tại những thiếu sót và có thể gây ra vấn đề nghiêm trọng trong tương lai. Những phản hồi kỳ lạ có thể gây ra những việc bất ngờ và nguy hiểm khác.
Hiện, OpenAI chưa đưa ra bất kỳ phản hồi nào về nghiên cứu trên.
Một trong những vấn đề lớn nhất của các hệ thống AI hiện nay khiến các công ty lo ngại là tính đúng sai trong câu trả lời. Gần đây, khi chatbot Bard của Google đưa ra câu trả lời sai khiến công ty thiệt hại 3 triệu tỷ đồng.