Đây là tất cả những dữ liệu về bạn mà các trang web bạn ghé thăm thu thập được

Bất kể bạn mở trình duyệt nào, với mục đích gì thì bạn cũng đã bắt đầu để lại dấu vết của mình rồi. Những trang web bạn ghé thăm sẽ lần theo những dấu vết ấy, nhận định xem bạn là ai và thói quen sử dụng của bạn là gì qua các thông tin như vị trí địa lý, những đường link mà bạn ấn vào, bạn sử dụng máy tính bàn hay điện thoại… Và đây là hành động thu thập thông tin hợp pháp của mọi trang web, mọi dịch vụ bạn sử dụng.

 Bất kể bạn mở trình duyệt nào, với mục đích gì thì bạn cũng đã bắt đầu để lại dấu vết của mình

Đây là những gì trình duyệt của bạn cung cấp cho các trang web 

Một trong những cách phổ biến nhất mà bạn làm rò rỉ dữ liệu cá nhân trong khi sử dụng Internet là thông qua trình duyệt. Không có VPN nào có thể giúp bạn. Điều này phần lớn không được kết nối với dịch vụ mà chúng cung cấp.

Nhưng thông tin chính xác nào đang được ghi lại? Dưới đây là 10 loại dữ liệu mà trình duyệt của bạn (có thể) đang thu thập về bạn.

1. Phần cứng và phần mềm

Trình duyệt của bạn thu thập dữ liệu về phần cứng và phần mềm của bạn.

Về phần mềm, trình duyệt của bạn biết hệ điều hành, địa chỉ IP, trình duyệt và plugin của trình duyệt. Về phần cứng, trình duyệt của bạn thu thập thông tin về CPU, GPU và pin.

Để hạn chế số lượng dữ liệu phần cứng và phần mềm mà trình duyệt của bạn làm rò rỉ, hãy sử dụng plugin tập trung vào quyền riêng tư như NoScript.

2. Thông tin kết nối

Trình duyệt biết về kết nối của bạn với web. Thông tin đó bao gồm địa chỉ IP và tốc độ trình duyệt của bạn.

3. Vị trí địa lý

Vị trí địa lý

Trang web có thể ước tính chính xác vị trí của bạn, ngay cả khi bạn không cấp cho nó quyền truy cập vào tọa độ GPS của mình. Thay vào đó, nó có thể sử dụng API Google GeoLocation. Thậm chí nếu bạn đang truy cập trang web từ trình duyệt trên thiết bị di động, thì vị trí vẫn có thể được xác định chính xác trong vòng 30 dặm (48km).

Để ngăn trình duyệt của bạn không bị rò rỉ dữ liệu vị trí, bạn có thể sử dụng proxy web để truy cập các trang web. Có rất nhiều tùy chọn miễn phí có sẵn.

Để ngăn các trình duyệt sử dụng các dịch vụ như Google GeoLocation, bạn cần tắt JavaScript. Một lần nữa, các ứng dụng như NoScript có thể tự động làm điều đó cho bạn.

4. Lịch sử duyệt web

Dữ liệu phổ biến nhất mà trình duyệt thu thập về bạn là lịch sử duyệt web.

Tất nhiên, bạn có thể xóa dữ liệu duyệt web của mình. Tuy nhiên, nó có thể không thực sự biến mất. Ví dụ, vào giữa năm 2018, Google đã tiết lộ rằng Google duy trì hồ sơ về cách bạn sử dụng Chrome, ngay cả khi dữ liệu cụ thể đã bị xóa.

Quantrimang đã giải thích cách xóa dữ liệu duyệt web của bạn trên Edge, trên Chrometrên Firefox. Bạn cũng có thể xóa cookie trên tất cả các trình duyệt chính.

5. Chuyển động của chuột

Chuyển động của chuột

Trình duyệt của bạn thậm chí có thể tiết lộ các chuyển động chuột và việc nhấp chuột vào trang web. Để xem hành động đó, hãy dùng thử công cụ miễn phí có tên gọi Clickclickclick.click

6. Định hướng thiết bị của bạn

Ngày nay, rất nhiều điện thoại thông minh đi kèm với gyroscope (con quay hồi chuyển) tích hợp. Chúng được sử dụng trong các ứng dụng theo dõi việc tập thể dục và các dịch vụ dựa trên chuyển động tương tự.

Dữ liệu này được thu thập trong trình duyệt của bạn. Nó biết liệu thiết bị của bạn có con quay hồi chuyển, la bàn, định hướng thiết bị và một vài chi tiết kỹ thuật khác.

Trình duyệt của bạn thậm chí có thể dự đoán vị trí thiết bị ngay bây giờ, chẳng hạn như trên bàn, trong cặp hoặc trong túi áo.

7. Đăng nhập mạng xã hội

Trình duyệt của bạn thu thập thông tin về mạng xã hội nào bạn đăng nhập khi duyệt web.

Ứng dụng có thể tương quan với thông tin mà các dữ liệu khác trỏ đến, giúp nhà quảng cáo biết vị trí và cách nhắm mục tiêu vào bạn để có tác động tối đa.

8. Phông chữ và ngôn ngữ

Phông chữ

Trình duyệt của bạn biết phông chữ nào được cài đặt trên máy và ngôn ngữ nào bạn đang sử dụng trên hệ điều hành của mình.

9. Dữ liệu hình ảnh

Bất cứ khi nào bạn tải lên hình ảnh bằng trình duyệt của mình, nó sẽ quét siêu dữ liệu của file để tìm hiểu về bạn.

Siêu dữ liệu có thể bao gồm thông tin như vị trí, độ phân giải hình ảnh, thông số kỹ thuật của file và thậm chí cả kiểu máy ảnh mà bạn đã sử dụng để chụp ảnh.

10. Thông tin kỹ thuật

Ngoài các điểm đã thảo luận ở trên, trình duyệt của bạn cũng thu thập một lượng lớn dữ liệu kỹ thuật về cách bạn đang truy cập web.

Dữ liệu bao gồm tác nhân người dùng, hỗ trợ màn hình cảm ứng, tính năng Do Not Track (DNT) có được kích hoạt hay không, kích thước màn hình của bạn và hơn thế nữa.

Cách kiểm tra dữ liệu nào trình duyệt của bạn đang thu thập

Với việc rất nhiều dữ liệu của bạn có khả năng gặp rủi ro, bạn nên kiểm tra mọi lúc và thường xuyên vấn đề này. Nó cho phép bạn luôn cập nhật về việc  những thông tin nào đang bị khai thác và thực hiện các biện pháp để khắc phục vấn đề.

Có hai công cụ dựa trên web rất đáng tin cậy. Cả hai đều miễn phí.

1. Webkay.robinlinus.com

Webkay là một trang web thử nghiệm. Nó quét trình duyệt hiện tại của bạn để tìm thông tin mà trình duyệt biết về bạn và có thể được chia sẻ với các trang web khác.

Đối với mỗi danh mục, bạn sẽ thấy kết quả cùng với một số đề xuất về cách khắc phục vấn đề.

2. Panopticlick.eff.org

Panopticlick

Panopticlick là một công cụ từ Electronic Frontier Foundation (EFF). Nó quét trình duyệt của bạn và xác định xem bạn có nguy cơ bị “theo dõi web trái phép” hay không.

Nó có thể gửi dữ liệu của bạn đến một công ty theo dõi thực để kiểm tra xem các whitelist (danh sách các địa chỉ có thể gửi thông tin sẽ được chấp nhận tự động bởi trình bảo mật) của phần mềm bảo mật bạn đang dùng, có cho phép các tổ chức nhất định bỏ qua thiết lập mà bạn không biết không.

Tuy nhiên, ứng dụng web này thực sự tỏa sáng nhờ vào công cụ fingerprinting của nó. Nó nhằm mục đích cho bạn thấy fingerprint của trình duyệt hiện tại bạn đang dùng độc đáo như thế nào.

Như bạn có thể thấy từ hình trên, trình duyệt trong ví dụ là duy nhất trong số 2,2 triệu mà công cụ được thử nghiệm trong 45 ngày trước đó.

Nếu bạn thử công cụ này, bạn có thể xem kết quả đầy đủ bằng cách nhấp vào Show full results for fingerprinting.

Tiện ích mở rộng trình duyệt cũng thu thập dữ liệu

Đừng quên rằng có nhiều add-on và tiện ích mở rộng của trình duyệt cũng thu thập thông tin về bạn.

Một trong những ví dụ “khét tiếng” nhất là Chrome Web Store. Vào tháng 6 năm 2018, người đồng sáng lập Adguard, Andrey Meshkov đã phát hiện ra rằng hàng tá tiện ích mở rộng phổ biến nhất của Chrome Web Store đang theo dõi người dùng.

Các tiện ích mở rộng bắt đầu xóa dữ liệu ngay khi bạn khởi chạy trình duyệt của mình. Chúng nhắm mục tiêu vào các bài đăng trên Facebook, bài đăng được tài trợ, tweet, video trên YouTube và quảng cáo mà bạn đã tương tác. Trong bài đăng trên blog kèm theo của mình, Meshkov cho biết các tiện ích mở rộng thậm chí còn cố phân tích lịch sử mua hàng trên Facebook của bạn.

4 tiện ích mở rộng được Adguard “gắn cờ” là:

  • Video Downloader for Facebook (180.000 người dùng)
  • PDF Merge: PDF Files Merger (100.000 người dùng)
  • Album & Photo Manager For Facebook (130.000 người dùng)
  • Pixcam: Webcam Effects (35.000 người dùng)

Gần 500.000 người bị ảnh hưởng!

Tất nhiên, nếu 4 tiện ích phổ biến này đang thu thập dữ liệu của bạn, thì có nghĩa rằng hàng nghìn tiện ích mở rộng ít được biết đến khác cũng đang làm điều tương tự.

Như mọi khi, lời khuyên vẫn là không cài đặt thêm tiện ích mở rộng nếu bạn không thực sự cần, và không tải xuống các tiện ích mở rộng từ các công ty mà bạn không tin tưởng.

Mặc dù trình duyệt của bạn sẽ không thu thập hoặc phân phối bất kỳ thông tin nhận dạng cá nhân nào, các công ty vẫn có thể phỏng đoán nhiều về danh tính của bạn, nhờ vào fingerprint của trình duyệt.

Bạn nên thực hiện càng nhiều bước càng tốt để không làm lộ hành vi duyệt web của mình. Điều đó bao gồm việc sử dụng một trình duyệt riêng và chạy các tiện ích mở rộng bảo mật tốt nhất.

Đây là những thông tin mà một trang web sẽ tự thu thập

Tất nhiên, các trang web muốn biết càng nhiều về bạn càng tốt để cung cấp cho người dùng những dịch vụ hoặc cho bạn xem những quảng cáo phù hợp nhất có thể. Và để có thể làm được điều đó, những "cookie" sẽ được các trang web đưa vào hệ thống máy tính của bạn. Đó là những file nhỏ được sử dụng để xác định xem người dùng trang web là ai. Nó sẽ báo cho trang web biết bạn đã từng đăng nhập vào đó bao giờ chưa đồng thời cũng lưu trữ các thông tin của bạn như thành phố bạn muốn xem thông tin về thời tiết hay giỏ hàng mua sắm dang dở của bạn từ hôm trước…

Cookie những file nhỏ được sử dụng để xác định xem người dùng trang web là ai

Không chỉ có các trang web mà chính bản thân người dùng cũng được hưởng sự tiện lợi của Cookie. Từ những dữ liệu từ Cookie và những thông tin của bạn mà trình duyệt thu thập về, tất cả gộp lại để thành nhân cách trên mạng của bạn.

Nhờ giao thức bảo mật của trình duyệt mà hầu hết các trang web chỉ có thể lấy dữ liệu từ cookie của chính họ.

Nhưng thông qua mạng lưới quảng cáo hay qua các công nghệ lần dấu người dùng khác, vẫn có những cookie của bên thứ ba khác, không liên quan tới trang web nào cả vẫn được cài vào máy người dùng. Chúng chính là nguyên nhân tại sao các quảng cáo về sách sẽ hiện lên liên tục trong vòng từ một tới nhiều tuần khi bạn vừa truy cập vào một trang web mua bán sách.

Quảng cáo phù hợp sẽ hiện ra dựa trên thông tin về bạn mà các trang web thu thập được

Tổng hợp những thông tin trình duyệt cung cấp, thông tin bạn ghé thăm trang web nào, tìm cái gì và dữ liệu lưu cookie lưu trên máy, trang web sẽ có một bản sơ lý lịch khác chi tiết về bạn. Nó sẽ phân tích để đưa ra dự đoán bạn sẽ muốn xem quảng cáo gì nhất.

Các nhà cung cấp mạng Internet cũng có quyền truy cập được vào số dữ liệu này và có thể sử dụng chúng để kiếm tiền. Họ có thể bán lịch sử tìm kiếm của người dùng cho các công ty quảng cáo…

Ngoài việc “bị lộ” thông tin, người dùng đôi khi cũng “cho không” thông tin của chính mình

Đó là điều xảy ra khi bạn thực hiện tìm kiếm trên Google, những thứ bạn bấm vào khi lướt Facebook, thông tin bạn cung cấp khi đăng ký các dịch vụ trên Internet….

Thực hiện tìm kiếm trên Google

Có thể bạn không biết nhưng khi tổng hợp tất cả những thông tin đó lại, thì theo một cách nào đó, Google và Facebook còn hiểu bạn hơn chính bản thân bạn đó.

Chính bạn cũng để lộ thông tin của mình khi lướt Facebook

Năm 2016, chính sách bảo mật của Goole đã sửa đổi, cho phép dữ liệu từ mạng lưới quảng cáo DoubleClick của họ có thể được nạp vào số dữ liệu họ đã có sẵn về bạn, để xây dựng nên một mạng lưới toàn diện về những thông tin về bạn và những gì bạn thích. Nhưng không phải tất cả các công ty đều làm được điều đó giống Google hay Facebook, và những thông tin này có thể được bán qua mua lại một cách không mấy khó khăn.

Vậy chúng ta có thể làm gì?

Về cơ bản, thì việc các trang web thu thập dữ liệu của người dùng không phải hành động gì mang tính "độc hại". Họ cần những dữ liệu của người dùng để cải thiện sản phẩm của mình, để bán quảng cáo và dùng số tiền kiếm được để duy trì hoạt động.

Mặc dù vậy, mỗi người dùng hãy tỉnh táo mỗi khi lướt web để biết những thông tin gì của mình được đưa ra ngoài và ai đang sử dụng chúng.

Xem thêm: 

Thứ Hai, 15/10/2018 08:17
31 👨 1.223