Ảo giác AI là gì mà các hãng công nghệ chưa thể giải quyết?

Tim Cook thừa nhận Apple Intelligence chưa thể loại bỏ hoàn toàn tình trạng ảo giác AI. Hiện tượng mà các AI của Google, Microsoft hay Meta cũng từng gây tranh cãi.

Ảo giác AI là gì

Theo IBM, ảo giác AI (hallucination) là hiện tượng mô hình ngôn ngữ lớn (LLM) nhận mẫu dữ liệu không tồn tại hoặc không thể nhận dạng với con người, từ đó tạo kết quả vô nghĩa hoặc sai lệch.

Ảo giác AI

Hay hiểu một cách đơn giản, trong một số trường hợp AI đưa ra kết quả không chính xác, tạo phản hồi ‘ảo giác’ khi nhận được yêu cầu của người dùng. Hiện tượng này ra do nhiều yếu tố như quá khớp (overfitting), dữ liệu đào tạo sai lệch và sự phức tạp của mô hình.

Ví dụ, chatbot Bard của Google từng nói rằng James Webb phóng vào 2021 là kính viễn vọng đầu tiên chụp ảnh hành tinh ngoài Hệ Mặt Trời nhưng thực tế hình ảnh đầu tiên về ngoại hành tinh đã chụp từ năm 2004.

Hay công cụ Bing của Microsoft ghi sai về ca sĩ Billie Eilish hoặc ChatGPT bịa ra hàng loạt vụ án không có thật trong lúc giúp luật sư viết tóm tắt pháp lý nộp lên tòa.

Vì sao AI lại ảo giác

Những chatbot như ChatGPT dựa trên LLM được đào tạo dựa trên dữ liệu lấy từ các nguồn lớn như trang tin tức, sách báo, Wikipedia và lịch sử chat. Mô hình sẽ phân tích mẫu quan sát và tạo kết quả bằng cách dự đoán từ dựa trên xác suất, không phải độ chính xác.

Emily Bender, Giám đốc Phòng thí nghiệm Ngôn ngữ học tính toán - Đại học Washington giải thích, nếu thầy từ 'mèo' (cat), chúng ta sẽ nghĩ tới những những thứ liên quan đến mèo. Còn với mô hình ngôn ngữ, đó là chuỗi ký tự 'cat' nên nó có thể lấy thông tin những từ ngữ, chuỗi ký tự xuất hiện cùng.

Do Internet còn nhiều thông tin sai lệch nên việc chatbot mắc sai lầm hoàn toàn có thể xảy ra.

Theo nghiên cứu vào tháng 11/2023 của Vectara, một startup thành lập bởi các cựu nhân viên Google, chatbot vẫn có 3% khả năng bịa thông tin, và cao nhất đến 27%.

Các nhà nghiên cứu tại Vectara cho rằng rất khó tính chính xác tỷ lệ ảo giác bởi sẽ phải kiểm tra tất cả thông tin trên thế giới do chatbot có thể phản hồi gần như mọi thông tin theo cách không giới hạn.

Kết quả nghiên cứu của Vectara cho thấy, tỷ lệ ảo giác của chatbot cao hơn với những tác vụ khác, ông nghệ của OpenAI có tỷ lệ ảo giác thấp nhất (khoảng 3%), tiếp đến là Meta (khoảng 5%), Claude 2 của Anthropic (8%) và PaLM của Google (27%).

Tỷ lệ vi phạm "nội dung có hại, chủ đề nhạy cảm và thông tin sai lệch" của Apple Intelligence khi chạy trên máy chủ là 6,6% trong tổng số yêu cầu, khá thấp so với những mô hình khác.

Vectara hy vọng rằng, nghiên cứu này sẽ khiến người dùng tăng cường cảnh giác với thông tin đến từ chatbot, kể cả dịch vụ cho người dùng phổ thông lẫn doanh nghiệp.

Thứ Hai, 17/06/2024 09:29
2,54 👨 304
0 Bình luận
Sắp xếp theo
    ❖ Chuyện công nghệ