Sao lưu dữ liệu là một quy trình bắt buộc và có ý nghĩa cực kỳ quan trọng đối với bất cứ tổ chức, doanh nghiệp nào trong thời đại số hóa như hiện nay. Đối với các cơ sở giáo dục, nghiên cứu khoa học, việc đồng bộ và sao lưu dữ liệu càng có ý nghĩa quan trọng hơn. Tuy nhiên, chỉ lên kế hoạch hay đưa ra lộ trình sao lưu dữ liệu hợp lý thôi là chưa đủ, việc làm thế nào để quy trình sao lưu diễn ra chính xác, an toàn cũng là một vấn đề đáng quan tâm.
Đại học Kyoto, một trong những cơ sở nghiên cứu khoa học hàng đầu tại Nhật Bản, vừa gặp phải một “thảm họa” tồi tệ khi mất phần lớn các tài liệu lưu trữ do một sự cố bất ngờ xuất hiện trong hệ thống siêu máy tính Hewlett-Packard chịu trách nhiệm sao lưu dữ liệu của trường.
Cụ thể, một sự cố mang tính hệ thống đã bất ngờ xảy ra trong khoảng thời gian từ ngày 14 đến ngày 16 tháng 12 năm 2021, khiến 77 TB dữ liệu của Đại học Kyoto vô tình bị tình xóa sạch trong quá trình sao lưu thông thường mà họ vẫn thực hiện định kỳ. Lượng dữ liệu này này tương đương với khoảng 34 triệu tệp tin tài liệu, đến từ 14 nhóm nghiên cứu khác nhau. Tất cả đã bị xóa khỏi hệ thống.
Kết quả điều tra sơ bộ cho biết dữ liệu của ít nhất 4 nhóm nghiên cứu sẽ hoàn toàn không thể khôi phục được. Đây là một tổn thất nặng nề và cực kỳ đáng tiếc với không chỉ Đại học Kyoto, mà còn cả lĩnh vực khoa học nói chung, bởi đây là một trong những cơ sở nghiên cứu lớn nhất Châu Á, thường xuyên nhận được các khoản tài trợ lớn để phục vụ cho mục đích nghiên cứu khoa học. Mỗi năm, Đại học Kyoto đều có những công trình nghiên cứu đóng góp rất lớn trong hàng loạt lĩnh vực cốt lõi như sinh học, dược học, miễn dịch học, khoa học vật liệu và vật lý học.
Hiện tại, quá trình sao lưu đã bị tạm dừng để thực hiện các quy trình kiểm tra, đánh giá chuyên sâu, tránh sự cố mất dữ liệu diễn ra một lần nữa:
“Dù đã xử lý sự cố này, nhưng rất có thể chúng tôi đã để mất đến 100TB dữ liệu và sẽ tiếp tục điều tra thêm về mức độ ảnh hưởng mà nó gây ra”.
Quy trình lưu trữ dữ liệu của Đại học Kyoto hiện được thực hiện bởi siêu máy tính Hewlett Packard Cray và hệ thống lưu trữ DataDirect ExaScaler. Đây vốn đều là những hệ thống rất nhiều tổ chức, cơ sở nghiên cứu khác nhau sử dụng trong các quy trình quản lý dữ liệu của mình. Do đó, sự cố này không chỉ là câu chuyên của riêng Đại học Kyoto.
Một khía cạnh khác cần nói tới là chi phí vận hành các hệ thống siêu máy tính này cho mục đích sao lưu dữ liệu cũng không hề rẻ. Chỉ tính riêng việc vận hành siêu máy tính đã tiêu tốn tới hàng trăm USD mỗi giờ.
Tuy nhiên, cũng giống như các loại máy móc, thiết bị điện tử khác, siêu máy tính hoàn toàn có thể gặp sự cố trong trong quá trình vận hành. Mặc dù điều này không thường xuyên xảy ra, nhưng thiệt hại mà nó mang đến thường sẽ là rất lớn.