Alexa, Siri và Google Assistant có sử dụng AI không?

Nếu bạn có một ngôi nhà thông minh, rất có thể bạn đã sử dụng trợ lý như Alexa, Google Assistant hoặc Siri. Nhưng những trợ lý gia đình phổ biến này có sử dụng AI để hoạt động không và nếu có thì bằng cách nào?

Trợ lý ảo như Alexa có sử dụng AI không?

Loa Echo Alexa có đèn vòng màu xanh đang hoạt động
Loa Echo Alexa có đèn vòng màu xanh đang hoạt động

Vì trợ lý ảo có thể nghe lệnh thoại nên chúng được hưởng lợi từ việc xử lý ngôn ngữ dựa trên AI, vì nó giúp họ hiểu và phản hồi tốt hơn các lệnh thoại cũng như câu hỏi.

Tất cả các trợ lý ảo đều khác nhau và loại AI mà chúng sử dụng cũng khác nhau. Tuy nhiên, Machine Learning là công nghệ phổ biến được hầu hết các trợ lý ảo sử dụng. Siri, Alexa và Google Assistant đều sử dụng AI và Machine Learning để diễn giải các yêu cầu và thực hiện nhiệm vụ.

Alexa sử dụng Machine Learning và NLP (xử lý ngôn ngữ tự nhiên) để thực hiện các yêu cầu. “Ngôn ngữ tự nhiên” là ngôn ngữ được sử dụng trong các cuộc trò chuyện của con người, diễn ra một cách tự nhiên. Để xử lý tốt nhất các lệnh thoại, trợ lý ảo dựa vào NLP để hiểu đầy đủ những gì được yêu cầu.

Tuy nhiên, chính Amazon gọi khả năng hiểu ngôn ngữ tự nhiên này là NLU. Amazon tuyên bố rằng họ sử dụng NLU để "suy ra ý nghĩa thực sự của người nói chứ không chỉ những từ họ nói". Amazon sử dụng một ví dụ ở đây, nói rằng NLU giúp Alexa cung cấp dự báo thời tiết nếu người dùng hỏi bên ngoài như thế nào. Dù không nói cụ thể là "dự báo thời tiết", nhưng NLU vẫn cho phép Alexa nhận ra những gì người dùng đang yêu cầu.

Hơn nữa, Amazon tuyên bố rằng NLU "hoàn toàn nhằm mục đích cung cấp cho máy tính bối cảnh cần thiết đằng sau những gì chúng ta nói và khả năng linh hoạt để hiểu nhiều biến thể trong cách chúng ta nói về những điều giống hệt nhau". Nói tóm lại, NLU cung cấp các phương tiện để xác định rõ hơn những gì người dùng đang yêu cầu khi họ giao tiếp bằng lời nói.

Google Assistant sử dụng NLP và một số thuật toán phức tạp để xử lý các yêu cầu bằng giọng nói và tham gia vào những cuộc trò chuyện hai chiều. Các tính năng như Look and Talk, được ra mắt vào năm 2022, sử dụng các thuật toán này để xác định xem bạn, với tư cách là người dùng, chỉ đi ngang qua Nest Hub hay có ý định tương tác với Nest Hub.

Kể từ đó, Google Assistant đã trải qua một số bản cập nhật. Vào tháng 1 năm 2024, Google thông báo rằng họ sẽ loại bỏ các tính năng ít được sử dụng, chẳng hạn như cảnh báo media và điều khiển bằng giọng nói trên Google Play Books.

Cuối cùng là Siri của Apple. Siri hiện đang sử dụng AI cho các chức năng của mình, sử dụng cả NLP và Machine Learning. Giống như hai trợ lý ảo khác đang được thảo luận ở đây, Siri nhận dạng các trình kích hoạt bằng giọng nói và có thể nhận cụm từ kích hoạt "Hey Siri" bằng cách sử dụng mạng nơ-ron hồi quy.

Trợ lý AI cũng đang hướng tới việc sử dụng Generative AI. Đây là loại AI mới hơn hiện đang được sử dụng trong các công cụ như ChatGPT.

Cả Google và Alexa hiện đang phát triển các khả năng Generative AI cho trợ lý giọng nói của mình. Google đang sử dụng Gemini, mô hình ngôn ngữ lớn (LLM) của riêng mình. Mặt khác, Amazon đang phát triển LLM của riêng mình mà hiện được gọi là "Alexa AI".

Như Amazon đã nêu, Alexa AI sẽ cho phép một số đặc quyền, bao gồm các cuộc trò chuyện tiếp tục mà không cần lặp lại lời đánh thức, phản hồi được cá nhân hóa hơn và kiểm soát nhiều thiết bị được kết nối thông qua một yêu cầu.

Vào tháng 7 năm 2023, có thông báo rằng Apple đang phát triển LLM của riêng mình, được gọi là Ajax, sẽ được sử dụng trong chatbot của họ, Apple GPT. Vào đầu năm 2024, các báo cáo bắt đầu xuất hiện về việc Apple đang nỗ lực cải thiện Siri bằng cách sử dụng Generative AI. Trong báo cáo của Bloomberg Power On, có tuyên bố rằng Apple đang "lên kế hoạch đại tu" cho Siri.

Cụ thể hơn, có thông tin cho rằng Apple đang phát triển code AI, cho cả Siri và dịch vụ Apple Care. Năm 2024 có thể tiết lộ thêm thông tin về những phát triển này.

Siri, Alexa và Google Assistant có nên được coi là AI không?

Dựa trên mức độ phụ thuộc của trợ lý ảo vào AI, thông qua NLP hoặc Machine Learning, việc phân loại chúng hoàn toàn là AI là điều tự nhiên. Các trợ lý giọng nói như Alexa, Google Assistant và Siri thường được gọi là các công cụ AI do chúng thường xuyên sử dụng NLP và Machine Learning.

Mặc dù các trợ lý ảo này có nhiều tính năng khác không sử dụng AI nhưng chúng phụ thuộc rất nhiều vào AI để hoạt động. Vì vậy, chúng có thể được coi là AI.

Tương lai của AI trong trợ lý ảo

Một điểm chung của nhiều nhà cung cấp trợ lý ảo là họ hiện đang nỗ lực sử dụng Generative AI trong hệ thống của mình.

Generative AI là một lĩnh vực cụ thể của AI sử dụng mạng nơ-ron nhân tạo và Deep Learning để tạo văn bản hoặc nội dung media dựa trên lời nhắc của người dùng (cũng có thể ở dạng văn bản hoặc hình ảnh). Việc giới thiệu Generative AI trong trợ lý ảo đang được thực hiện thông qua việc tích hợp LLM.

Trong tương lai, AI có thể tạo ra có thể cung cấp cho trợ lý ảo những khả năng sau:

  • Cá nhân hóa hơn nữa trải nghiệm của người dùng (dựa trên vị trí, sở thích, v.v...).
  • Đưa ra lời khuyên và đề xuất cho các vấn đề hàng ngày.
  • Mang đến những cuộc trò chuyện có ý nghĩa hơn với người dùng

Khi AI tiếp tục trở nên phức tạp hơn, chúng ta có thể thấy trợ lý giọng nói đáng tin cậy của mình sẽ trở nên có năng lực cao hơn, giúp đỡ chúng ta trong mọi việc. AI có tiềm năng đưa các công nghệ hiện có vào một thời đại khả năng mới và trợ lý giọng nói cũng không ngoại lệ.

Thứ Tư, 03/04/2024 08:54
32 👨 135
0 Bình luận
Sắp xếp theo
    ❖ Trí tuệ nhân tạo (AI)