38% nội dung trên Internet đã 'biến mất' trong vòng 10 năm trở lại đây

Theo nghiên cứu mới được Pew Research Center mới chia sẻ, có tới 38% nội dung được đưa lên Internet trên những trang web từ 2013 đã không còn tồn tại.

Thời điểm cuối của nghiên cứu, giai đoạn năm 2023, 8% số nội dung được tạo ra cũng đã biến mất chỉ trong 1 năm. Hiện tượng này được nhóm tác giả đặt tên là "digital decay".

Cụ thể, 23% các trang tin tức, có ít nhất 1 đường link bị gãy. Dữ liệu được các nhà nghiên cứu đưa ra sau khi khảo sát hơn 500 nghìn trang của hơn 2 nghìn web được phân loại là trang tin tức.

Mất dữ liệu

Với những trang web của chính phủ thì con số này là 21%. Trong đó, những trang địa phương nhỏ, như cấp huyện hay thành phố thường xuất hiện hiện tượng gãy link nhiều nhất. Hầu hết xảy ra ở những trang có chế độ bảo mật nhất định như https://, 6% trong đó liên quan đến 1 file pdf nào đó, 16% được trỏ đến 1 URL khác không đúng với nội dung được ghi nhận ban đầu.

Với các trang thông tin miễn phí như Wikipedia thì tình trạng gãy link còn cao hơn rất nhiều. 54% trong số 50 nghìn trang thông tin bị gãy ở phần Tham khảo.

Tình trạng digital decay còn diễn ra mạnh hơn ở những mạng xã hội. Ví dụ, Twitter hay giờ là X gần 1/5 bài tweet không còn được đặt ở chế độ xem tự do "public" chỉ sau vài tháng. 60% trong số đó có thể do chủ tài khoản bị khóa, xóa hay được chuyển sang chế độ riêng tư. 40% còn lại là chủ tài khoản tự xóa bài viết của mình.

Cụ thể hơn, 1% số tweet được xóa ngay chỉ sau 1 giờ đăng tải, 3% bị xóa sau 1 ngày, 10% bị xóa sau 1 tuần và 15% bị xóa sau 1 tháng.

Dưới đây là các lỗi nhóm thấy thường gặp nhất

  • 204 No Content
  • 400 Bad Request
  • 404 Not Found
  • 410 Gone
  • 500 Internal Server Error
  • 501 Not Implemented
  • 502 Bad Gateway
  • 503 Service Unavailable
  • 523 Origin Is Unreachable
Thứ Tư, 22/05/2024 16:29
3,25 👨 907
0 Bình luận
Sắp xếp theo
    ❖ Chuyện công nghệ