Nhóm nghiên cứu bảo mật đến từ tổ chức an ninh mạng Comparitech mới đây đã bất ngờ tìm thấy một cơ sở dữ liệu chứa 235 triệu hồ sơ người dùng thuộc các nền tảng truyền thông xã hội lớn bao gồm Instagram, TikTok và YouTube. Đáng chú ý, kho dữ liệu này được bảo mật cực kỳ lỏng lẻo, khiến số dữ liệu nêu trên hoàn toàn có thể bị tiếp cận và rơi vào tay kẻ gian. Comparitech gọi đây là một “vụ rò rỉ khổng lồ”.
Vụ việc này đã làm tăng thêm lo ngại về vấn đề bảo mật thông tin cá nhân của người dùng trên các nền tảng dịch vụ trực tuyến cũng như mạng xã hội. Gần đây, đã có không ít báo cáo liên quan đến việc dữ liệu tài khoản mạng xã hội cá nhân được giao dịch qua lại trên các diễn đàn tội phạm mạng dark web. Theo ước tính, hiện có 15 tỷ thông tin đăng nhập rò rỉ từ hơn 100.000 vụ vi phạm, và 386 triệu bộ dữ liệu đang được tin tặc chia sẻ miễn phí trên các diễn đàn dark web. Lượng dữ liệu này hoàn toàn có thể được sử dụng để triển khai các chiến dịch tấn công lừa đảo (phishing), chiếm đoạt tài khoản cá nhân, gây thiệt hại không nhỏ.
Cơ sở dữ liệu không an toàn - vấn đề đáng lo ngại
Cơ sở dữ liệu không được bảo mật chặt chẽ đang ngày càng trở thành vấn đề lớn trong lĩnh vực an ninh mạng, mà vụ việc của Comparitech vào ngày 1/8 vừa qua là minh chứng rõ ràng nhất. Tuy chứa đựng thông tin cá nhân của gần 235 triệu tài khoản Instagram, TikTok và YouTube nhưng cơ sở dữ liệu này được bảo vệ lỏng lẻo đến mức gần như bất kỳ ai cũng có thể tiếp cận và download dữ liệu. Trong đó bao gồm nhiều tệp dữ liệu con, chứa tổng cộng gần 200 triệu thông tin thu thập góp từ các tài khoản được cho là của Instagram, và một tệp dữ liệu lớn khác chứa thông tin của gần 42 triệu người dùng TikTok cùng 4 triệu tài khoản YouTube.
Theo phân tích của Comparitech dựa trên các thu thập được, cứ 5 bộ hồ sơ dữ liệu lại có một bộ có chứa số điện thoại hoặc địa chỉ email cá nhân. Đa số các bộ dữ liệu đều bao gồm một hoặc tất cả thông tin cơ bản như tên, tuổi, giới tính, ảnh đại diện của người dùng. Đặc biệt, còn có những thống kê về mức độ tương tác của chủ tài khoản, bao gồm:
- Số người theo dõi
- Tỷ lệ tương tác
- Tỷ lệ tăng trưởng người theo dõi
- Thống kê giới tính người theo dõi
- Thống kê về tuổi của khán giả
- Thông tin vị trí của người theo dõi
Truy gốc dữ liệu rò rỉ
Vậy tất cả dữ liệu này bắt nguồn từ đâu? Từ các bằng chứng, thu được, các nhà nghiên cứu đã tìm thấy một công ty có tên là Deep Social. Tuy nhiên, Deep Social đã bị cả Facebook và Instagram cấm vào năm 2018 sau khi có hành vi thu thập dữ liệu hồ sơ người dùng. Công ty này đã gần như không còn hoàn động kể từ thời điểm đó.
Phía Comparitech đã liên hệ với Deep Social để xác nhận thông tin về vụ việc. Các quản trị viên của Deep Social sau đó đã chuyển tiếp yêu cầu của Comparitech cho một công ty tiếp thị dữ liệu có ảnh hưởng trên mạng xã hội tên Social Data. Công ty này đã lập tức đóng cơ sở dữ liệu chỉ 3 giờ sau khi nhận được yêu cầu.
Hiện tại, các nền tảng liên quan đến vụ việc vẫn chưa đưa ra bất cứ bình luận nào. Về cơ bản, người dùng nên tự nâng cao cảnh giác với những chiêu thức lừa đảo qua email hoặc dưới dạng bình luận để tránh trở thành nạn nhân của tội phạm mạng.