Một vụ vi phạm cơ sở dữ liệu không được bảo vệ trực tuyến rò rỉ mới đây ở quốc gia đông dân nhất thế giới đã cho thấy một danh sách các thông tin “rùng rợn”, được thu thập trên hơn 1.8 triệu phụ nữ ở đất nước này. Cơ sở dữ liệu này đáng sợ ở chỗ ngoài những thông tin cơ bản như tên, tuổi, địa chỉ… nó còn chứa đựng cả dữ liệu liệt kê tình trạng “sẵn sàng sinh sản” của những người phụ nữ.
Bên cạnh đó, cơ sở dữ liệu mở này cũng chứa đựng một số thông tin tương đối riêng tư khác như số điện thoại, tọa độ GPS, URL tới ảnh, địa chỉ, số ID, tình trạng hôn nhân, hay các chi tiết liên quan đến chính trị và giáo dục. Kết hợp lại với nhau, tất cả các chi tiết này đã vẽ nên một bức tranh u ám đến mức đáng báo động về các hoạt động thu thập dữ liệu “quá mức cho phép” ở Trung Quốc.
Victor Gevers, một nhà nghiên cứu bảo mật nổi tiếng người Hà Lan đã tình cờ phát hiện ra kho dữ liệu đáng sợ này vào hôm thứ 6, 8/3 vừa qua trong khi tiến hành những cuộc tìm kiếm hướng đến kho cơ sở dữ liệu không được bảo vệ ở Trung Quốc. Chuyên gia bảo mật giàu kinh nghiệm này đã không giấu nổi sự sửng sốt và ngay lập tức đăng tải một bài Tweet về vấn đề này:
“Tại Trung Quốc đang thiếu phụ nữ. Vì vậy, một tổ chức đã bắt đầu xây dựng cơ sở dữ liệu cá nhân của hơn 1.8 triệu người phụ nữ với tất cả các loại thông tin chi tiết như số điện thoại, địa chỉ, tình trạng giáo dục, địa điểm, số ID, tình trạng hôn nhân và tệ hơn là cả trạng thái “BreedReady” (sẵn sàng sinh sản). Điều này thật khó mà chấp nhận!”
Bằng cách chia sẻ phát hiện của mình, Victor Gevers hy vọng có thể kịp đưa ra lời cảnh báo cho những người có tên trong danh sách để họ có thể có các biện pháp đối phó thích hợp.
Nhìn chung thì trong cơ sở dữ liệu này, trường dữ liệu gây tranh cãi nhất chính là BreedReady (có thể chỉ ra rằng người phụ nữ đó có đang ở độ tuổi sinh đẻ hay không). Nhiều khả năng mục đích đứng sau danh sách này là để thống kê xem có bao nhiêu người phụ nữ vẫn đang có khả năng sinh sản.
Phát hiện của Victor Gevers cũng cho thấy rằng cô gái trẻ nhất “có mặt” trong cơ sở dữ liệu này mới chỉ 15 tuổi, trong đó, người phụ nữ trẻ nhất có trạng thái BreedReady là 18 tuổi, độ tuổi trung bình là trên 32 tuổi và người phụ nữ nhiều tuổi nhất được đánh dấu tình trạng BreedReady là 39. Danh sách cơ sở dữ liệu gồm những phụ nữ từ 0-95 tuổi, bao gồm tình trạng độc thân là 89%, đã ly dị là 10%, và 1% góa phụ. Khoảng 82% sống ở Bắc Kinh. Những người có khả năng sinh sản sẽ được đánh giá trạng thái BreedReady = “1”.
- Đã có 12.449 vụ vi phạm dữ liệu nghiêm trọng được ghi nhận trong năm 2018, tăng 424% so với năm 2017
Hiện nhà nghiên cứu người Hà Lan vẫn chưa thể xác định rõ chủ sở hữu của cơ sở dữ liệu mở này, nhưng phát hiện của ông đã gây chấn động lớn đối với giới quan sát, đặc biệt là trong lĩnh vực nhân quyền. Sau khi bị rò rỉ, cơ sở dữ liệu này đã bị khóa và không còn có thể truy cập qua internet được nữa.
Không ai có thể phủ nhận về mức độ nghiêm trọng liên quan đến quyền riêng tư đối với các thông tin được lưu trữ trong cơ sở dữ liệu này. Một số người lạc quan thì cho rằng đây rất có thể là danh sách thông tin cần thiết được thu thập bởi một dịch vụ hẹn hò trực tuyến phù hợp với những người ở Bắc Kinh, theo các tiêu chí và chi tiết được cung cấp bởi chính người tham gia.
Tuy nhiên, cũng có không ít ý kiến lại cho rằng đây có thể là một hoạt động thu thập dữ liệu cá nhân với mục đích tiêu cực, đặc biệt là trong các vấn đề liên quan đến dân số khi mà tỉ lệ mất cân bằng giới do chính sách 1 con ở Trung Quốc ngày càng gia tăng bởi quan niệm dành sự ưu tiên cho trẻ em nam được coi là có khả năng hỗ trợ cha mẹ tốt hơn khi về già, dẫn đến việc 60 triệu người đàn ông ở quốc gia này có thể sẽ không lấy được vợ.
Đây không phải là lần đầu tiên Victor Gevers phanh phui ra được những vụ vi phạm dữ liệu ở đất nước đông dân nhất thế giới. Trước đó chỉ hơn một tuần, nhà nghiên cứu bảo mật người Hà Lan cũng đã tìm thấy 18 cơ sở dữ liệu không được bảo vệ, với dữ liệu xuất phát từ 6 nền tảng mạng xã hội lớn ở Trung Quốc. Các nội dung bao gồm thông tin về tên, số ID và ảnh, vị trí GPS, thông tin mạng, các cuộc trò chuyện công khai, riêng tư và số điện thoại. Trên thực tế, Trung Quốc chỉ đứng sau Hoa Kỳ về số lượng cơ sở dữ liệu mở dạng này có thể được tìm thấy thông qua các truy tìm trực tuyến, một hiện thực đáng báo động cho vấn đề an toàn thông tin và quyền riêng tư.