Google muốn lọc triệt để các nội dung spam của AI khỏi kết quả tìm kiếm

Không quá khi nói rằng trải nghiệm tìm kiếm trên web ngày càng trở nên tồi tệ hơn thời gian gần đây. Một phần nguyên do bắt nguồn từ vấn nạn spam tràn lan các nội dung do AI tạo, xuất hiện dày đặc trên trang kết quả tìm kiếm. Google hiện đang cố gắng khắc phục vấn đề này bằng một bản cập nhật được tung ra cho Google Search, nhằm mục đích giảm các kết quả “chất lượng thấp”.

Sự phổ biến và khả năng ngày càng được nâng cao của các công cụ AI tổng hợp đã cho phép các trang web tung ra hàng trăm hoặc hàng nghìn bài viết mỗi ngày, làm tràn ngập các kết quả tìm kiếm trên web liên quan đến một chủ đề phổ biến nào đó theo trend. Hiện nay, việc gặp phải các bài báo do AI viết (ít nhất một phần) trong kết quả tìm kiếm là điều khá phổ biến. Những bài viết này thường chứa rất nhiều lỗi về cả nội dung cũng như văn phong do rất ít sự giám sát, kiểm duyệt. Google trước đây đã nói rằng họ cho phép nội dung do AI tạo ra được xuất hiện trong kết quả tìm kiếm, nhưng tất cả những bài viết dạng này đều phải tuân theo cùng tiêu chuẩn chất lượng, và nội dung spam sẽ bị từ chối. Tuy nhiên, thực tế là Google Search hiện vẫn tràn ngập nội dung rác do AI tạo ra, với nội dung chứa đầy thông tin sai lệch.

Để giải quyết vấn đề, các thuật toán của Google Search hiện đã được cập nhật để tăng khả năng lọc và giảm những kết quả có chất lượng thấp và không nguyên bản. Công ty cho biết trong một bài đăng trên blog:

Ngày nay, các phương pháp tạo nội dung theo quy mô phức tạp hơn và liệu nội dung có được tạo hoàn toàn thông qua tự động hóa hay không không phải lúc nào cũng rõ ràng. Để giải quyết tốt hơn những vấn đề này, chúng tôi đang củng cố chính sách của mình để tập trung vào hành vi lạm dụng — spam nội dung trên quy mô lớn để tăng thứ hạng tìm kiếm — cho dù có liên quan đến tự động hóa, con người hay sự kết hợp giữa cả hai. Điều này sẽ cho phép chúng tôi thực hiện hành động đối phù hợp và kịp thời với nhiều loại nội dung có ít hoặc không có giá trị được tạo trên quy mô lớn, mà không cung cấp thông tin hữu ích.

 Google

Vẫn còn phải xem những thay đổi này có hiệu quả hay không. Các trang web spam có thể chỉ cần cắt giảm số lượng nội dung để tránh bị phát hiện hoặc chúng có thể thử các cách “lách luật” khác. Ngoài ra, Google cũng không trực tiếp giải quyết những nội dung do AI tạo ra có lỗi thực tế, mà chỉ đề cập nến những thông tin nói chung là không hữu ích. Tin tốt là thử nghiệm nội bộ của công ty cho thấy nội dung chất lượng thấp đã giảm 40% sau khi áp dụng những thay đổi trong thuật toán Google Search.

Google cũng đang cố gắng thực hiện hành động đối với hành vi “lạm dụng danh tiếng của trang web”, trong đó các trang web xuất bản nội dung của bên thứ ba khác rất nhiều so với nội dung thông thường của họ, để bên thứ ba có thể hưởng lợi từ danh tiếng và thứ hạng hiện có của trang web đó. Việc xếp hạng nội dung như vậy ở vị trí cao trên trang kết quả tìm kiếm có thể gây nhầm lẫn hoặc đánh lừa khách truy cập. Công ty hiện cũng coi các miền hết hạn và được sử dụng lại đăng nội dung chất lượng thấp là spam.

Tính năng phát hiện thư rác cải tiến đang được triển khai như một phần trong bản cập nhật cốt lõi của Google Search vào tháng 3 năm 2024.

Thứ Bảy, 09/03/2024 13:32
31 👨 105
0 Bình luận
Sắp xếp theo
    ❖ Chuyện công nghệ