Kho kiến thức và thông tin trên Internet là nguồn tài nguyên vô tận mà chúng ta nên tận dụng để phục vụ trong cuộc sống. Bạn có thể truy cập vào hầu như mọi thứ trên Internet 24 giờ một ngày, 7 ngày mỗi tuần chỉ với một nút bấm. Tuy nhiên, các nội dung trên Internet cũng sẽ không ngừng được biến đổi, có thể là cập nhật mới hoặc xóa đi mà không hề thông báo trước. Do đó, việc làm thế nào để lưu trữ một nội dung xuất hiện trên Internet nhằm phục vụ sử dụng lâu dài đôi khi cũng rất cần thiết. Nói một cách hoa mỹ, việc lưu trữ các trang web có giá trị cũng là một cách bảo tồn văn hóa của con người, giống như cách chúng ta bảo vệ và quản lý sách hoặc các tác phẩm nghệ thuật. Ngoài ra, trong thực tế, việc lưu trang web có thể cho phép chúng ta tham khảo lại các thông tin quan trọng một cách nhanh chóng.
Chúng ta đã biết được sự cần thiết của việc tham khảo các thông tin trên Internet rồi, nhưng điều gì xảy ra khi liên kết mà chúng ta nhấp vào chỉ đưa đến một thông báo lỗi error 404? Vào năm 2013, một nghiên cứu của Đại học Harvard đã phát hiện ra rằng 49% các trang web được tham chiếu trong các quyết định của tòa án tối cao ở Mỹ giờ đây đã bị xóa bỏ hoặc biến mất. Vậy thì làm thế nào chúng ta có thể ngăn chặn việc thất thoát các thông tin quan trọng như vậy? Hay nói đúng hơn là làm thế nào để lưu trữ một trang web?
May mắn thay, các kỹ sư ở Internet Archive đã phát triển một công cụ có thể giúp chúng ta lập chỉ mục và lưu trữ các trang web. Họ gọi nó là Wayback Machine và công cụ này đã bắt tay vào lưu trữ các trang web kể từ năm 2001. Cho đến nay, Wayback Machine đã lưu được hơn 304 tỷ trang web trên Internet.
Có vô số lý do mà người ta muốn lưu trữ một trang web, và Wayback Machine làm cho công việc này trở nên dễ dàng hơn. Dưới đây là những cách mà bạn có thể sử dụng Wayback Machine cho tất cả các nhu cầu lưu trữ trang web của mình.
Những trang web sẽ được phân loại thế nào?
Rất nhiều trang web phổ biến sẽ được Wayback Machine lưu trữ tự động. Tuy nhiên, bạn cũng hoàn toàn có thể sử dụng Wayback Machine để lưu trữ thủ công hầu như bất kỳ trang nào mà mình muốn. Các trang web thường bị bỏ rơi hoặc thay đổi hoàn toàn, do đó, Wayback Machine sẽ hoạt động như một công cụ giúp “bảo tồn văn hóa” của Internet bằng cách giữ một bản sao kỹ thuật số cứng của một trang web. Hãy lưu ý rằng văn bản và hình ảnh sẽ được giữ nguyên, tuy nhiên, một số liên kết ngoài và các mục được nhúng (ví dụ: video) thì không.
Một điều quan trọng khác cần lưu ý là Wayback Machine sẽ chỉ quét và lưu trữ các trang web public, tức là các trang web có thể truy cập tự do. Điều này có nghĩa là các trang web được bảo vệ bằng mật khẩu hoặc các trang web nằm trên máy chủ riêng tư sẽ không thể lưu trữ được. Ngoài ra, nếu một trang web được thiết lập ẩn trước các công cụ tìm kiếm, Wayback Machine cũng sẽ không thể lưu trữ nó.
Cách sử dụng Wayback Machine
Có hai phương pháp mà bạn có thể sử dụng để bắt đầu lưu trữ trang web bằng Wayback Machine, cả hai đều siêu dễ và không yêu cầu bất kỳ “bí quyết” đặc biệt nào. Đầu tiên, bạn đặt con trỏ trước URL trong thanh địa chỉ của trình duyệt, nhập địa chỉ web.archive.org/save/ và nhấn Enter. Một hộp thoại sẽ xuất hiện trên màn hình của bạn thông báo cho bạn rằng Wayback Machine đang bắt đầu lưu trang.
Cách thứ hai để lưu trữ một trang web là sử dụng trực tiếp trang web lưu trữ của Wayback Machine. Đầu tiên, hãy điều hướng đến một trang web bạn muốn lưu và sao chép URL của trang web đó. Sau đó, hãy di chuyển đến trang web lưu trữ Wayback Machine. Ở bên phải của trang này, bạn sẽ thấy một có một tiêu đề là Save Page Now. Hãy dán URL của trang web bạn muốn lưu vào hộp văn bản ở phía dưới và nhấp vào nút Save Page.
Bất kể bạn sử dụng phương pháp nào, kết quả đều sẽ giống nhau. Ngoài ra, hãy lưu ý rằng việc lưu trang có thể mất một lúc, vì vậy hãy kiên nhẫn chờ đợi Wayback Machine làm việc.
Tiện ích mở rộng trình duyệt Wayback Machine
Wayback Machine cũng đã xuất hiện dưới dạng tiện ích mở rộng trình duyệt chính thức cho Google Chrome. Bạn có thể sử dụng nó để lưu trữ các trang web trong khi sử dụng Google Chrome một cách cực kỳ dễ dàng. Chỉ cần điều hướng đến một trang mà bạn muốn lưu trữ, nhấp vào biểu tượng Wayback Machine trên thanh công cụ và sau đó nhấp vào Save Page Now.
Ngoài việc làm cho quá trình lưu các trang trở nên dễ dàng hơn, tiện ích mở rộng trình duyệt của Wayback Machine còn hỗ trợ một thủ thuật tiện lợi khác. Bạn đã bao giờ nhấp vào một liên kết chỉ để gặp phải một thông báo lỗi 404 mơ hồ? Cho dù nguồn thông tin trên trang web đó có thực sự cần thiết với bạn hay không thì lỗi này vẫn có thể gây khó chịu vô cùng. Với tiện ích mở rộng Wayback Machine được cài đặt sẵn, sự thất vọng đó của bạn có thể biến thành một tiếng thở phào nhẹ nhõm. Khi trình duyệt của bạn chạy vào “ngõ cụt”, tiện ích mở rộng Wayback Machine sẽ tự động tìm kiếm trong kho lưu trữ của mình để xem xem liệu có bản sao nào của trang web đó được lưu trên Wayback Machine hay không. Nếu có, nó sẽ hỏi bạn có muốn ghé thăm trang web đó không.
Nếu bạn đang không sử dụng Chrome thì cũng đừng quá băn khoăn. Các nhà phát triển cũng đang xây dựng một tiện ích mở rộng trình duyệt Wayback Machine cho Firefox. Ngoài ra, họ cũng có kế hoạch phát triển tiện ích mở rộng này cho cả người dùng Safari.
Tải về tiện ích mở rộng Wayback Machine cho Chrome.
Archive-It
Bạn hoặc tổ chức của bạn có đang có nhu cầu lập chỉ mục và lưu trữ thường xuyên một trang web nào đó không? Nếu có, việc lưu trữ thủ công từng trang web riêng lẻ bằng các phương pháp trên có thể vô cùng tẻ nhạt và tốn kém thời gian. May mắn thay, Internet Archive có cung cấp một dịch vụ có tên là Archive-It, công cụ này có thể giúp tự động hóa quá trình lưu trữ cho bạn. Đương nhiên dịch vụ này sẽ không miễn phí, tuy nhiên, nó sẽ rất lý tưởng cho những ai muốn sao lưu nội dung với quy mô lớn hoặc sử dụng trong môi trường doanh nghiệp, có nhu cầu lưu trữ nội dung web của họ một cách thường xuyên.
Bạn có sử dụng Wayback Machine không? Nếu có thì bạn truy cập nó hoàn toàn để cho vui hay bạn thấy nó là một công cụ hữu ích? Có cách nào khác để sao lưu nội dung trên Web không? Hãy vui lòng chia sẻ cho chúng tôi ở phần bình luận bên dưới nhé. Hy vọng các thông tin trong bài hữu ích đối với bạn!
Xem thêm: