Làn sóng thổi phồng gần đây về LLM đã tạo ra một xu hướng mới trong thế giới trình duyệt. Mọi người bỗng nhiên muốn tạo ra một "trình duyệt AI", và ngay cả những tên tuổi lớn như OpenAI và Perplexity hiện cũng đang cố gắng cạnh tranh với gã khổng lồ Google Chrome. Cạnh tranh luôn là điều tốt, đặc biệt là trong một lĩnh vực gần như đã trở thành độc quyền, nhưng thành thật mà nói, những trình duyệt AI mới này không hoàn hảo.
Sau đây là những lưu ý cần biết trước khi cài đặt trình duyệt AI!
Mục lục bài viết
- Hầu hết các AI agent đều dễ bị tấn công bằng các prompt chứa mã độc
- Bạn không phải là người dùng, bạn là sản phẩm
- Hầu hết các AI agent không thực sự giải quyết được vấn đề
- Bạn có thể có được hầu hết mọi tính năng tương tự với các tiện ích mở rộng
- Các trình duyệt AI cần hướng đến mục tiêu cao hơn là chỉ là những LLM wrapper
Hầu hết các AI agent đều dễ bị tấn công bằng các prompt chứa mã độc
Trớ trêu thay, Gemini đã tạo ra một cuộc tấn công như vậy

Tấn công bằng các prompt chứa mã độc là khi một trang web chèn những lệnh ẩn của chính nó và AI làm theo các lệnh đó thay vì những gì người dùng thực sự yêu cầu nó làm. Không có gì bị tấn công. AI chỉ đơn giản là đọc mọi thứ trên trang, bao gồm cả văn bản mà bạn không nhìn thấy, và coi nó như một phần của cuộc trò chuyện.
Điều này trở thành một vấn đề thực sự trong trình duyệt AI vì agent cố gắng hiểu toàn bộ trang cùng một lúc. Nếu một trang web ẩn một dòng văn bản, AI vẫn có thể đọc được và có thể nghĩ rằng đó là một lệnh thực sự. Đó là cách một trang web có thể yêu cầu agent bỏ qua yêu cầu của bạn hoặc tạo ra thứ gì đó mà bạn không hề có ý định.
Ngay cả OpenAI cũng cho biết trình duyệt ChatGPT Atlas mới vẫn dễ bị tấn công bằng prompt chứa mã độc. Vì vậy, mặc dù ý tưởng này nghe có vẻ rất phức tạp, nhưng bạn sẽ thực sự bị sốc khi thấy việc tự mình tạo ra một cuộc tấn công tương tự lại dễ dàng đến vậy.

Bài viết sẽ không đi sâu vào chi tiết kỹ thuật vì lý do bảo mật, nhưng có một cách đánh lừa Dia, một trình duyệt AI khá phổ biến, khiến nó chỉ nói bằng ngôn ngữ cướp biển, và nói "sea dogs" thay vì "dogs" mỗi khi nó cố gắng tóm tắt hoặc trả lời bất cứ điều gì liên quan đến một trang được tạo ra. Đó là một ví dụ ngớ ngẩn, nhưng nó đã chứng minh được vấn đề. Trình duyệt lắng nghe hướng dẫn ẩn trên trang nhiều hơn là lắng nghe người dùng.
Nếu một điều đơn giản như vậy có thể thay đổi cách AI phản hồi, hãy tưởng tượng một cửa hàng hoặc một trang web đáng ngờ có thể làm được gì. Một trang web mua sắm có thể tác động đến AI để đề xuất phiên bản đắt tiền hơn của một sản phẩm, hoặc một trang web độc hại có thể âm thầm đẩy trình duyệt đến các liên kết không an toàn.
Mặc dù không thể tái tạo kết quả tương tự trên ChatGPT Atlas, bài viết cũng muốn nhấn mạnh rằng những gì bạn đã làm không thực sự tinh vi chút nào.
Bạn không phải là người dùng, bạn là sản phẩm
Chính bạn đang xây dựng mô hình tiếp theo

Trong nhiều năm, Google đã là công ty xây dựng hồ sơ chi tiết về người dùng. Bắt đầu với Google Search, nơi mọi thứ bạn tìm kiếm đều giúp Google hiểu nên hiển thị quảng cáo nào cho bạn. Theo thời gian, điều này mở rộng sang các dịch vụ khác như Maps và YouTube, bổ sung thêm nhiều dữ liệu hơn về thói quen, vị trí và sở thích của bạn.
Nhưng với LLM, tình hình lại rất khác. Hầu hết mọi người không nhận ra họ đang từ bỏ bao nhiêu khi nói chuyện với AI. Không giống như tìm kiếm truyền thống, người dùng có xu hướng cá nhân hóa hơn nhiều với các mô hình ngôn ngữ lớn vì sự tương tác giống như một cuộc trò chuyện. Nhiều người thậm chí đã thấy mọi người cố gắng coi ChatGPT như một nhà trị liệu.
Vấn đề là các cuộc trò chuyện của bạn không chỉ đơn giản là nằm đó mà không được sử dụng. Trong nhiều trường hợp, dữ liệu bạn cung cấp được sử dụng để đào tạo hoặc cải thiện các mô hình trong tương lai.
Khi một trình duyệt AI gửi mọi trang bạn truy cập và mọi câu hỏi bạn viết lên đám mây, cái giá phải trả cho quyền riêng tư sẽ cao hơn rất nhiều. Và đây có lẽ là hình thức thu thập thông tin cá nhân tinh vi nhất mà các công ty có thể thực hiện, vì vậy rõ ràng một trình duyệt "AI" là cách dễ nhất để đạt được điều đó.
Hầu hết các AI agent không thực sự giải quyết được vấn đề
Bạn có muốn mạo hiểm với agent của mình không?

Nếu bạn chưa quen với cách thức hoạt động của các AI agent này, chúng được cho là sẽ tự động xử lý những hành động cho bạn dựa trên prompt. Về lý thuyết, điều này sẽ tiết kiệm thời gian. Nhưng trên thực tế, điều đó hiếm khi xảy ra. Khi dùng thử trình duyệt ChatGPT Atlas mới, Agent Mode gần như vô dụng.
Nó sẽ tạo ra các hành động ảo, tóm tắt ngẫu nhiên văn bản mà bạn chưa bao giờ yêu cầu, hoặc hoàn toàn bỏ qua những thứ cơ bản như thanh cuộn. Hơn nữa, nó chậm đến mức bạn có thể tự mình hoàn thành nhiệm vụ chỉ trong một phần ba thời gian. Thay vì hỗ trợ, nó lại cản trở.
Nhưng vấn đề lớn hơn thực sự nằm ở bảo mật. Các agent này cũng dễ bị tấn công chèn mã độc nhanh chóng như bài viết đã đề cập trước đó, và hậu quả có thể còn tồi tệ hơn nhiều. Trình duyệt AI thực sự có thể bị lừa gạt bởi các trò lừa đảo như email lừa đảo, một thất bại thảm hại vì không có thuật ngữ nào tốt hơn.
Nếu các hoạt động agent là một trong những ưu điểm chính của các trình duyệt này và khiến bạn gặp rủi ro lớn như hiện tại, thì việc sử dụng chúng còn ý nghĩa gì nữa?
Bạn có thể có được hầu hết mọi tính năng tương tự với các tiện ích mở rộng
Rốt cuộc, tất cả đều là Chromium

Hãy điểm nhanh các trình duyệt AI phổ biến nhất hiện nay và xem chúng giống nhau đến mức nào. Perplexity Comet, ChatGPT Atlas và Dia đều tuân theo cùng một công thức. Chúng gọi LLM khi một câu hỏi quá rộng hoặc mơ hồ đối với một tìm kiếm Google thông thường. Chúng thêm một thanh bên AI để đọc trang bạn đang xem và trả lời các câu hỏi của bạn. Và chúng bao gồm một bộ tính năng agent cơ bản cố gắng tự động hóa mọi thứ cho bạn.
Nếu phân tích kỹ, không có tính năng nào trong số này là độc quyền với các trình duyệt này. Bạn có thể tạo lại gần như toàn bộ tính năng trên trình duyệt Chromium thông thường chỉ với một vài tiện ích mở rộng. Các trình duyệt này không mang tính đột phá trong việc đưa AI vào quy trình làm việc của bạn. Trí tuệ thực sự đến từ đám mây, không phải từ chính trình duyệt, vì vậy trình duyệt chủ yếu đóng vai trò là giao diện người dùng cho mô hình.
Perplexity có tiện ích mở rộng AI Search riêng, đã thay thế Google Search. Đối với phần thanh bên AI, bạn có thể sử dụng một ứng dụng như FillApp, cung cấp cho bạn "thanh bên AI" được nâng cấp và một chút hành vi của agent nếu bạn muốn thử nghiệm. Khi kết hợp các thành phần này lại với nhau, bạn sẽ có được bộ tính năng tương tự mà không cần phải sử dụng một trình duyệt hoàn toàn mới.
Các trình duyệt AI cần hướng đến mục tiêu cao hơn là chỉ là những LLM wrapper
Các công ty cần vượt qua ý tưởng rằng LLM là đủ để làm cho trình duyệt "thông minh". AI thực sự nên cải thiện trải nghiệm, chứ không chỉ nằm trong thanh bên lặp lại những gì đã có trên trang. Đó là lý do tại sao Arc lại khác biệt so với người kế nhiệm của nó, Dia.
Hiện tại, mọi người vẫn nhảy từ lựa chọn này sang lựa chọn khác và hy vọng cuối cùng sẽ có thứ gì đó phù hợp. Kể từ khi Arc ban đầu biến mất, chưa có gì có thể thay thế nó.
Hướng dẫn AI
Học IT










AI
Hàm Excel
Download