Google Chrome có đang nghe lén bạn?

Đã có những cáo buộc rằng trình duyệt web phổ biến, Google Chrome, có khả năng nghe lén cả bạn và nội dung media bạn xem, để thu hút nhiều người ủng hộ hơn. Điều quan trọng là phải kiểm tra những gì Google Chrome đang làm trong nền và xác định xem nó có đang giám sát các hoạt động của bạn hay không.

Vì vấn đề này có liên quan đến sự an toàn và quyền riêng tư của mọi người nên nó cần phải được xem xét kỹ hơn.

Google Chrome và dự án Chromium

Chromium là một dự án nền tảng trình duyệt web mã nguồn mở được phát triển bởi Google. Một nhóm các nhà phát triển làm việc tại Google đã phát triển Chromium theo giấy phép BSD. Mục tiêu cơ bản của dự án là tạo ra một trình duyệt web nhanh và đáng tin cậy. Google sử dụng phần mềm nguồn mở được phát triển theo dự án này, như giấy phép của nó cho phép và thêm các thành phần độc quyền của mình để tạo trình duyệt web Google Chrome.

Dự án Chromium không chỉ được sử dụng bởi Google Chrome mà còn bởi nhiều ứng dụng và thư viện khác như Yandex Browser, Qt Web Engine, v.v... Ngoài ra, các bản phân phối Linux khác nhau như Debian và Ubuntu có gói trình duyệt web tên là Chromium, tương tự như dự án Chromium nhưng khác với Google Chrome.

Google Chrome không phải là phần mềm miễn phí. Nhưng bằng cách sử dụng ứng dụng Chromium đi kèm với các bản phân phối Linux thay vì Google Chrome, bạn có thể tránh các thành phần độc quyền do Google thêm vào.

Vấn đề được phát hiện như thế nào?

Một thiết bị di động sử dụng Google Chrome

Vào ngày 26 tháng 5 năm 2015, Yoshino Yoshihito đã đăng tải một báo cáo lỗi trên Debian Bug Tracking System. Trong báo cáo lỗi này, anh ấy đã tóm tắt rằng sau khi cập nhật ứng dụng Chromium lên phiên bản 43, hệ thống đã tải xuống tiện ích mở rộng có tên "Chrome Hotword Shared Module" mà không có sự đồng ý của Yoshihito và khi Yoshihito nhập chrome://voicesearch vào thanh địa chỉ của trình duyệt để nhận thêm thông tin về tiện ích mở rộng, nó cho biết rằng tiện ích mở rộng này có quyền "Cho phép ghi lại âm thanh" và do đó có quyền truy cập vào micro.

Sau khi báo cáo lỗi này được công bố, nhiều người đã chia sẻ thông tin xác nhận tình trạng tương tự. Vậy tất cả những điều này có nghĩa là gì, và vấn đề bắt đầu từ đâu?

Chúng ta biết gì về công nghệ tìm kiếm bằng giọng nói của Google?

Rất có thể bạn đã thử tính năng tìm kiếm bằng giọng nói của Google trên máy tính hoặc điện thoại di động của mình. Tính năng này bắt đầu hoạt động khi bạn bấm vào nút cho biết bạn muốn thực hiện tìm kiếm bằng giọng nói hoặc khi bạn mở một ứng dụng đặc biệt được thiết kế cho mục đích này trên điện thoại của mình.

Các máy chủ của Google ghi lại và phân tích giọng nói của bạn từ micro và so sánh giọng nói đó với những mẫu được lưu trữ trước đó. Hiện tại, việc chạy các chức năng nhận dạng giọng nói nâng cao trực tiếp trên máy tính cá nhân hoặc điện thoại di động là không thực tế. Do đó, việc sử dụng các cụm máy chủ dựa trên đám mây để phân tích là điều tất yếu.

Google sử dụng các mô hình mạng nơ-ron nhân tạo, lấy cảm hứng từ phương pháp xử lý thông tin của bộ não con người, để nhận thức tốt hơn mẫu giọng nói được ghi lại trong công nghệ nhận dạng giọng nói của mình.

Người phụ nữ nói chuyện trên điện thoại

Google tận dụng lợi thế từ dữ liệu khổng lồ của mình, bao gồm nội dung web được phân tích trước đó và các truy vấn được tìm kiếm thường xuyên, để cải thiện quy trình nhận dạng giọng nói bằng mô hình N-gram. Mô hình N-gram được phát triển cho các trường hợp xác suất của từ thứ N được biết dựa trên (N-1) từ trước đó. Ví dụ, nếu có một từ thứ ba sau 2 từ chẳng hạn như "afternoon tea", xác suất từ này là "mathematics" hoặc "breakfast" sẽ khác biệt. Để tăng tỷ lệ thành công trong việc dự đoán từ thứ ba trong ví dụ, chúng ta cần dữ liệu để cung cấp cho mô hình 3-gram.

Theo số liệu do Google cung cấp, vào năm 2012, hãng đã sử dụng mô hình 5-gram (tức là tối đa năm từ liên tiếp) và tổng cộng khoảng 12 tỷ bộ N-gram cho công nghệ nhận dạng giọng nói. Mặc dù không thể chắc chắn về mức độ mà những con số này đã đạt được ngày hôm nay, nhưng hoàn toàn có thể cho rằng chúng đã tăng lên đáng kể. Ngoài ra, điều đáng chú ý đây không phải là một mô hình tĩnh và vẫn đang tiếp tục học hỏi.

Chi tiết này là cần thiết để hiểu tại sao giọng nói đã ghi lại được gửi đến máy chủ của Google. Các thuật toán tiếp tục học hỏi trên bộ dữ liệu lớn nói trên có thể tạo ra phản hồi nhanh, nhưng điều này chỉ có thể thực hiện được bằng cách chạy trên nhiều máy chủ. Ngay cả khi máy tính cá nhân của bạn đạt được sức mạnh xử lý cần thiết vào một ngày nào đó, Google sẽ luôn có lợi thế hơn vì bạn không có cơ sở dữ liệu lớn cần thiết để phân tích.

Tìm kiếm bằng giọng nói có thực sự nguy hiểm?

Trình duyệt Chrome trên máy tính bảng Samsung hiển thị trang chủ Google

Tìm kiếm bằng giọng nói đã là một sản phẩm của Google từ lâu, nhưng với Google Chrome phiên bản 43 trở lên, quá trình này đã tiến thêm một bước và được hỗ trợ bởi một mô hình mới có tên OK Google. Tính năng này hoạt động khi bạn vào trang chủ Google của trình duyệt hoặc mở một tab mới trong Google Chrome để đi đến một địa chỉ. Tất cả những gì bạn cần làm là nói những từ bạn muốn tìm kiếm sau khi nói "OK Google". Vì vậy, thay vì nhấp vào một nút đặc biệt để thực hiện tìm kiếm bằng giọng nói, bạn kích hoạt quá trình nhận dạng giọng nói bằng cách phát âm các từ OK Google. Bạn có thể đặt một số câu hỏi thú vị và hữu ích bằng cách sử dụng OK Google, điều này cuối cùng sẽ giúp cuộc sống của bạn dễ dàng hơn.

Để tính năng này hoạt động, hệ thống của bạn cần liên tục lắng nghe âm thanh môi trường và nắm bắt từ khóa OK Google. Phân tích ở đây được thực hiện trên máy tính của bạn vì số lượng từ chỉ có hai và nó chứa một mẫu âm thanh cụ thể và không có dữ liệu nào được gửi đến máy chủ của Google. Nhưng phân tích tiếp theo yêu cầu máy chủ. Do đó, cách Google Chrome giúp bạn tìm kiếm nhanh hơn là liên tục lắng nghe bạn. Hơn nữa, bạn không nhận được thông báo rằng micro của mình đang được sử dụng trong quá trình nghe này.

Với việc phát hành Google Chrome phiên bản 46, tính năng OK Google hiện đã biến mất. Vì vậy, liệu có công nghệ nào khác thay thế nó không, hoặc nếu có thì công nghệ này có hại như thế nào đối với người dùng, chúng ta có thể tin tưởng vào Google không?

Ngay cả khi Google được cho là một trong những công ty công nghệ an toàn nhất trên thế giới, nếu tin tặc ác ý tìm thấy điểm yếu trong công nghệ như vậy, chúng có thể khai thác nó. Do đó, cách thức hoạt động của một công nghệ như vậy có thể là việc lắng nghe môi trường được kích hoạt đối với một số người nhất định vào những thời điểm mong muốn và tiếp tục hoạt động bình thường trong thời gian còn lại.

Ngoài ra, chính sách bảo mật của Google nêu rõ rằng Google sử dụng giọng nói của người dùng để phát triển công nghệ nhận dạng giọng nói. Tất nhiên, chỉ Google mới có thể biết về những giọng nói này. Hoặc Google thậm chí có thể sử dụng nó để truy bắt tội phạm cùng với cảnh sát. Tuy nhiên, đó là một tình huống mà người dùng bình thường nên biết.

Vậy chúng ta có thể làm gì?

Google là một công ty thực sự hùng mạnh về công nghệ. Nó cũng có gần như tất cả lưu lượng truy cập web trên thế giới. Điều này làm cho Google trở thành một siêu cường. Google là một trong những nhà đầu tư của nhiều thuật toán phân tích và tìm kiếm bằng giọng nói đã phát triển qua nhiều năm. Đó là lý do tại sao điều quan trọng là phải nghi ngờ liệu Google Chrome có đang nghe lén bạn hay không.

Bởi vì đằng sau những công ty lớn như vậy, có những khoản đầu tư tài chính nghiêm túc, sự hỗ trợ của chính phủ và cổ phiếu được giao dịch công khai, điều bạn cần làm ở đây là tự bảo vệ mình thay vì chờ đợi những công ty lớn như vậy bảo vệ bạn.

Thứ Bảy, 27/05/2023 10:48
51 👨 245
0 Bình luận
Sắp xếp theo
    ❖ Chuyện công nghệ