Trong vụ rò rỉ dữ liệu của hơn 50 triệu tài khoản Facebook, thuật toán được sử dụng đã vơ vét gần như mọi thông tin cá nhân của người dùng, thậm chí cả những thông tin nhạy cảm như xu hướng tình dục, trí thông minh và những tổn thương tâm lý từ thuở nhỏ qua những nút "like" mà người dùng Facebook vẫn hay sử dụng.
Cách đây 5 năm, các nhà nghiên cứu tâm lý học đã chỉ ra rằng, từ một vài các kiểu mẫu vô hình đối với người đang quét qua các trang cá nhân có thể đưa ra những tính cách phức tạp. Chỉ một vài nút like tưởng như hoàn toàn ngẫu nhiên nhưng lại là cơ sở để định hình những cá tính bên trong.
Không cần phải phân tích từng tin nhắn, bài đăng, cập nhật trạng thái, hình ảnh hay những thông tin khác, chỉ vần vài chục nút “like” là đủ để thuật toán này dự đoán về mọi thông tin của người dùng như giới tính, xu hướng quan hệ tình dục đồng giới hay khác giới, bỏ phiếu cho Đảng nào, hoàn cảnh gia đình…
Khả năng dự đoán các thuộc tính cá nhân từ những hồ sơ hành vi kỹ thuật số có thể dễ dàng được áp dụng trên một lượng lớn người dùng mà không được họ đồng ý hay thậm chí là không hề nhận ra. Đây sẽ là một tiềm năng kinh doanh rất lớn đối với các công ty thương mại, các tổ chức chính phủ…
Đầu năm 2014, Giám đốc điều hành Alexander Nix của Cambridge Analytica đã ký hợp đồng với Aleksandr Kogan, giảng viên của Cambridge về một dự án thương mại tư nhân.
Công việc của Kogan là tạo ra một ứng dụng gồm các câu hỏi về thông tin cá nhân. Những người tham gia trả lời sẽ được Cambridge Analytica trả tiền (đã có khoảng 27.000 người tham gia) đồng thời họ còn quảng cáo ứng dụng này trên nhiều nền tảng, như Mechanical Turk của Amazon. Những người tham gia được yêu cầu cho phép họ tiếp cận một số thông tin như tên tuổi, vị trí địa lý, giới tính, những trang họ "like" và cả danh sách bạn bè của họ.
Aleksandr Kogan, người tạo ra ứng dụng đã "gây đại họa" cho Facebook.
Các kết quả của mỗi câu hỏi đều được ứng dung ghi lại, thậm chí nó còn thu thập dữ liệu của tài khoản Facebook người thực hiện, và chiết xuất dữ liệu của cả bạn bè của tài khoản đó. Sau đó, các kết quả sẽ được đem ra so sánh với dữ liệu Facebook của những người tham gia trả lời để tìm ra điểm chung. Dựa vào kết quả thu được sẽ xây dựng thuật toán để dự đoán kết quả của những người dùng Facebook khác. Thuật toán này sẽ sử dụng các trang các nhân để thử nghiệm công thức đồng thời thu thập dữ liệu để giúp cho nó trở nên đáng giá về mặt chính trị.
Để có thể tham gia trả lời, người dùng phải là công dân Mỹ đã đủ điều kiện để bỏ phiếu và có một tài khoản Facebook. Do đó với hàng chục triệu trang cá nhân chắc chắn sẽ có sức ảnh hưởng rất lớn đến cuộc bầu cử. Chỉ từ 1.000 tài khoản "hạt giống", các nhà nghiên cứu đã thu về được hơn 160.000 hồ sơ, và con số cứ thế tăng theo cấp số nhân.
Về lý thuyết, Kogan chỉ được phép thu thập và sử dụng dữ liệu vào mục đích nghiên cứu chứ không được dùng dưới hình thức thương mại. Tức là hành động này của Kogan là vi phạm quy tắc của Facebook. Việc bán những dữ liệu đó hay sử dụng chúng vào các mục đích khác bị cấp tuyệt đối.
Ngoài ra, theo các bộ luật bảo vệ dữ liệu của Vương quốc Anh, cấm mua bán và sử đụng dữ liệu cá nhân khi chưa được chủ nhân của chúng cho phép bao gồm cả các vụ việc khi đồng thuận vào một mục đích nhưng dữ liệu lại được dùng cho mục đích khác thì hành động của Kogan là vi phạm pháp luật.
Mặc dù các tài khoản tham gia trả lời đã đồng ý với các điều khoản của ứng dụng của Kogan nhưng không ai trong số họ biết và đồng ý với việc dữ liệu của họ bị lạm dụng để tạo ra một công cụ tiếp thị chính trị, hay được đặt trong cơ sở dữ liệu của các chiến dịch tranh cử.
Nhưng Kogan lại khẳng định mình không làm sai. Facebook đã không có ý kiến gì khi anh thực hiện thay đổi mục đích của ứng dụng từ "nghiên cứu" sang "thương mại".
Facebook cũng khẳng định đây không phải là một vụ rò rỉ thông tin mà là một vụ làm dụng các quy tắc của họ.
Chỉ trong vài tháng, Kogan và Cambridge Analytica đã thu thập được một cơ sở dữ liệu khổng lồ gồm hàng chục triệu cử tri Mỹ. Dùng thuật toán mà họ đã phát triền để phân tích tính cách và quan điểm chính trị chọn những mục tiêu nhất định và tạo ra những tin nhắn hấp dẫn với họ - một hình thức tiếp cận chính trị còn được gọi là "micro-targetting".
Cách đây 3 năm, Facebook được cho là đã biết về vụ việc nhưng họ không công bố với người dùng và các cơ quan chức năng mà chỉ thực hiện những sự thay đổi để ngăn chuyện này không tái diễn trong tương lai. Điều này đã khiến người dùng giận dữ và kêu gọi tiến hành “tẩy chay” mạng xã hội lớn nhất thế giới này.
Xem thêm: