“Drama” lớn nhất thế giới công nghệ trong vài giờ qua có lẽ là sự cố “màn hình xanh chết chóc” (BSOD) trên PC Windows, đã làm gián đoạn hoạt động của nhiều lĩnh vực khác nhau, trong đó đặc biệt ảnh hưởng đến các hãng hàng không, ngân hàng và dịch vụ y tế trên toàn thế giới trong nhiều giờ liên tục. Kết quả đánh giá sơ bộ cho thấy sự cố xảy ra do tệp tin có vấn đề được phân phối qua bản cập nhật từ nhà cung cấp dịch vụ an ninh mạng đám mây hàng đầu thế giới CrowdStrike. CrowdStrike sau đó đã xác nhận rằng sự cố này không ảnh hưởng đến PC Mac hoặc Linux, mà chỉ xảy ra với người dùng Windows.
CrowdStrike là công ty an ninh mạng lớn có trụ sở tại Mỹ, hoạt động chủ yếu trong lĩnh vực cung ứng dịch vụ phần mềm phòng thủ, quản trị rủi ro trước các cuộc tấn công mạng và phần mềm độc hại ở cấp độ doanh nghiệp. Tuy nhiên, sự cố ngày 19/07 vừa qua lại do chính phần mềm của công ty gây ra, khiến hàng triệu máy tính trên toàn thế giới không thể hoạt động, ảnh hưởng nặng nề đến hoạt động của hàng trăm ngàn công ty.
Mặc dù nhiều người có thể coi đây là một sự cố cá biệt, nhưng trên thực tế, CrowdStrike các đây vài tháng cũng đã gây ra sự cố tương tự trên một số nền tảng Linux, chỉ là do quy mô người dùng nhỏ hơn nhiều so với Windows nên chẳng mấy ai quan tâm.
Trên thực tế, người dùng Debian và Rocky Linux mới đây cũng gặp phải sự gián đoạn đáng kể do các bản cập nhật CrowdStrike, gây ra mối lo ngại nghiêm trọng về quy trình kiểm tra và cập nhật phần mềm của công ty.
Theo đó, vào tháng 4, một bản cập nhật CrowdStrike đã khiến tất cả máy chủ Debian Linux trong một phòng thí nghiệm công nghệ dân sự tại Hoa Kỳ gặp sự cố đồng thời và từ chối khởi động. Bản cập nhật tỏ ra không tương thích với phiên bản ổn định mới nhất của Debian, mặc dù cấu hình Linux được cho là có hỗ trợ. Đội ngũ IT của phòng thí nghiệm ban đầu không nắm được nguyên nhân gây ra vấn đề, nhưng sau đó tình cờ phát hiện ra rằng việc gỡ bỏ CrowdStrike đã cho phép máy khởi động, và lập tức báo cáo sự việc.
Một thành viên trong nhóm IT liên quan đến vụ việc bày tỏ sự không hài lòng với phản hồi chậm trễ của CrowdStrike. Họ phải mất nhiều tuần để tìm ra nguyên nhân gốc rễ sau khi thừa nhận vấn đề một ngày sau đó. Phân tích cho thấy cấu hình Debian Linux không được đưa vào ma trận thử nghiệm của CrowdStrike. Thay vào đó, công ty chỉ đơn giản là “đẩy” phần mềm vào hệ thống máy tính của đối tác.
Đây không phải là sự cố cá biệt. Người dùng CrowdStrike cũng báo cáo vấn đề tương tự sau khi nâng cấp lên RockyLinux 9.4, khiến máy chủ của họ gặp sự cố do lỗi kernel. Nhóm hỗ trợ Crowdstrike đã thừa nhận vấn đề này, nêu bật mô hình thử nghiệm không đầy đủ và chưa lường trước đối với các vấn đề tương thích trên nhiều hệ điều hành khác nhau.
Để tránh các sự cố tương tự trong tương lai, CrowdStrike nên ưu tiên thử nghiệm nghiêm ngặt trên tất cả các cấu hình được hỗ trợ. Ngoài ra, các tổ chức nên tiếp cận bản cập nhật CrowdStrike một cách thận trọng và có sẵn kế hoạch dự phòng để giảm thiểu sự cố gián đoạn có thể xảy ra.