Nhiều năm trước, để chứng minh mình không phải là robot, người dùng chỉ cần một dấu tích đơn giản vào ô trống. Nhưng ngày nay, bạn phải chọn ra đúng hình ảnh ô tô, biển báo, vạch kẻ đường, cửa hàng… mới tỏ rõ được mình là người.
Thế nhưng độ khó của các bài kiểm tra này vẫn chưa dừng lại, những hình ảnh bạn cần nhận biết càng khó nhìn hơn khi biển báo bắt đầu lẩn sau tán cây, sương buổi sớm che mất ngôi nhà đằng xa, cửa hiệu hiển thị ngôn ngữ loằng ngoằng nào đó không phải tiếng Anh.
Những bài kiểm tra lằng nhằng này, chúng ta vẫn thường gọi với cái tên CAPTCHA, viết tắt cho Completely Automated Public Turing test to tell Computers and Humans Apart - Bài thử Turing công khai hoàn toàn tự động để Phân biện Máy tính và Con người. Trong quá khứ, cảnh ngộ "càng ngày càng khó" này cũng đã từng xuất hiện.
Đầu những năm 2000, các hệ thống spam tự động – các spambot gặp khó khăn ngay cả với một dòng chữ đơn giản. Nhưng khi Google hợp tác với các nhà nghiên cứu từ Carnegie Mellon vào năm 2010 và mua lại chương trình đọc sách nhằm số hóa dịch vụ Google Books thì để chống spambot, các bài thử liên quan tới chữ phải uốn éo hơn, khó đọc hơn. Con người cũng phải tiến hóa để thích ứng với sự thông minh của máy tính.
CAPTCHA là công cụ dạy AI tuyệt vời, số lượng bài thử muốn bao nhiêu cũng có, mỗi bài là một phương án nhất thời. Cuộc đua giữa người và máy rồi sẽ kết thúc, đáng buồn là con người không phải là kẻ chiến thắng. Trong năm 2014, trong một cuộc thi đọc CAPTCHA giữa con và thuật toán machine learning của Google, con người chỉ đúng được 33%, máy tính đúng 99,8% số lần thử.
Thấy không ổn, Google chuyển sang sử dụng NoCaptcha ReCaptcha, đọc dữ liệu và quan sát hành vi người dùng. Và để có thể chứng minh mình không phải là robot, người dùng chỉ cần kích vào ô trống. Nhưng chẳng bao lâu, các hệ thống tự động cũng học được cách vượt qua được các bài thử này của Google. Chắc hẳn khi cần chứng minh mình là người, các bạn từng nhìn thấy hình ảnh cửa hiệu xuất hiện. Đây chính là bước cuối cùng trong cuộc đua xem ai sẽ vươn lên làm bá chủ khía cạnh đọc CAPTCHA, máy hay người.
Người phải chịu trách nhiệm cho việc CAPTCHA ngày một khó lên chính là Jason Polakis, giáo sư ngành khoa học máy tính tại Đại học Illinois. Chính ông là người đã tạo ra hệ thống nhận dạng hình ảnh sẵn có trên Internet vào năm 2016 để giải mã các bài thử CAPTCHA của Google. Hệ thống của ông đạt độ chính xác 70%. Một số nhà nghiên cứu khác cũng đạt được thành tựu tương tự khi sử dụng chính phần mềm nhận dạng âm thanh của Google để vượt qua bài thử CAPTCHA âm thanh của Google.
Theo nhận định của Polakis, machine learning đã giỏi ngang tầm con người, thậm chí là hơn khi xét tới việc đọc chữ cơ bản, hình ảnh đơn giản và nhận dạng giọng nói.
Nhằm tìm ra được thứ mà con người rất giỏi nhưng đủ khó khăn đối với máy móc, các nhà nghiên thậm chí đã nghĩ tới chuyện sử dụng nhận dạng khuôn mặt, giới tính hay sắc tộc. Nhưng đây là một vấn đề nhạy cảm và có thể nảy sinh nhiều rắc rối về sau.
Một số ý tưởng khác cũng được đưa ra như bài thử mang tính văn hóa sử dụng các bài hát ru con địa phương để làm CAPTCHA. Bài thử này không chỉ nhắm tới những con bot mà còn giúp ngăn những người điền CAPTCHA thủ công để kiếm tiền bởi họ không thể biết một đứa trẻ ở nền văn hóa khác hát cái gì.
Những hình ảnh đã được biến tấu cũng được sử dụng để làm CAPTCHA. Ví dụ như những hình khắc đá trên vách hang cổ đại, xác định hình ảnh hoạt họa của một con heo đeo kính, máy tính không có trí tưởng tượng nên chúng rất “dốt” trong việc này.
Nhiều người còn đề xuất ý kiến mới mẻ hơn như lồng ghép trò chơi vào CAPTCHA. Người dùng sẽ phải chọn giá trị đúng hay lắp ghép hình mà không có chỉ dẫn…
Tuy nhiên, con bot vẫn có thể vượt qua những bài thử như vậy. Vấn đề không phải là các con bot quá thông minh mà là bởi con người chưa thể tìm ra một bài thử có thể thỏa mãn vài tỷ biến số. Con người ở đây là chỉ chung toàn nhân loại, từng cá nhân lại có một trải nghiệm khác nhau.
Cuối cùng, dù biết khả năng xử lý và nhận dạng hình ảnh của máy tính ngày càng tiến bộ nhưng CAPTCHA vẫn phải lại trở lại với bài thử xử lý hình ảnh xưa kia.
Việc giải đáp các bài thử CAPTCHA khiến nhiều người đưa ra các thắc mắc: con người được xác định bằng tính chất nào, có thể cho máy móc xem bao nhiêu mà chúng không bao giờ học được? Máy móc sẽ có cảm giác gì khi tồn tại dưới dạng "một con người"?
Trong trường hợp này, bản chất con người được xác định thông qua sự “tiến hóa" dọc theo chiều dài phát triển của Internet.
Nhà nghiên cứu bảo mật Ghosemajumder cho rằng bất kỳ loại CAPTCHA nào rồi cùng sẽ bị máy móc hóa giải. Ông cho biết, con người không thể di chuyển chuột thực hiện nhiều thao tác cùng lúc, trong khi đó một con bot có thể tương tác với trang web mà không cần động đến chuột, hay sử dụng chuột một cách cực kỳ chính xác. Chính vì vậy, con người luôn có những “khoảng hỗn loạn” rất khó để làm giả. Cái này được ông gọi là "xác nhận liên tục – continuous authentication", quan sát mọi hành động của người sử dụng Internet để nhận biết chuỗi hành động tự động.
Có chung suy nghĩ với Ghosemajumder, đội ngũ CAPTCHA của Google đã đưa ra phiên bản mới nhất reCaptcha v3 vào cuối năm ngoái, xác định một hành động có đáng nghi không bằng cách sử dụng cơ chế "phân tích rủi ro thích nghi tùy tình huống".
Trong mớ hổ lốn của cookie trang web, lượng truy cập khổng lồ từ nhiều nguồn, đặc tính riêng của mỗi trình duyệt… các nhà nghiên cứu bảo mật sẽ phải xác định xem những hành động nào là bình thường để suy ra những hành động được xem là bất bình thường. Tuy nhiên khi sử dụng phương pháp này, bạn sẽ bị nghi ngờ là một con bot nếu sử dụng những công cụ giấu địa chỉ như VPN hay những phần mềm chống theo dõi.
Tóm lại, CAPTCHA có thể sẽ phải tiến hóa trong tương lai, dựa trên những lỗi lầm người dùng hay mắc phải khi duyệt web thay vì chọn ra đúng hình ảnh hay dòng chữ như hiện này nữa.