Alexa của Amazon sắp thoát ra khỏi vỏ bọc của nó và những gì xuất hiện có thể rất thú vị. Tại sự kiện phần cứng hôm thứ Tư vừa qua, công ty đã tiết lộ một trợ lý giọng nói Alexa hoàn toàn mới được hỗ trợ bởi mô hình ngôn ngữ lớn của mình. Theo ông Dave Limp, SVP hiện tại cho thiết bị và dịch vụ của Amazon, Alexa mới này có thể hiểu các cụm từ hội thoại và phản hồi phù hợp, diễn giải ngữ cảnh hiệu quả hơn và hoàn thành nhiều yêu cầu từ một lệnh.
Trợ lý giọng nói cần một sự thay đổi. Sự thiếu đổi mới nói chung và những cải tiến hầu như không đáng kể về khả năng hiểu đã biến chúng thành những công cụ cơ bản, kém tiên tiến như mong đợi khi chúng xuất hiện hơn một thập kỷ trước.
Generative AI có vẻ như là cơ hội tốt nhất để các trợ lý giọng nói tồn tại trong một thời gian. Nhưng mặc dù những trợ lý kỹ thuật số này luôn có yếu tố AI, nhưng chúng lại thiếu khả năng xử lý phức tạp và tương tác giống con người mà AI có thể tạo ra. Đây là một thời điểm quan trọng đối với smarthome (nhà thông minh), vì nó có thể đưa khả năng tự động hóa ngôi nhà lên một tầm cao mới, chuyển từ trải nghiệm điều khiển từ xa sang một ngôi nhà thực sự thông minh.
Trong một cuộc phỏng vấn với The Verge trước sự kiện, Limp giải thích rằng Alexa LLM mới “là một mô hình ngôn ngữ lớn có thể khái quát hóa thực sự và được tối ưu hóa rất tốt cho trường hợp sử dụng Alexa; đó không giống với những gì bạn tìm thấy với Bard hay ChatGPT hay bất kỳ chatbot AI nào khác”.
Tuy nhiên, Alexa hoàn toàn mới này sẽ không được tung ra ở mọi nơi, cho tất cả mọi người cùng một lúc. Công ty đang triển khai nó một cách chậm rãi thông qua một chương trình preview “trong những tháng tới” - và chỉ ở Hoa Kỳ. Rõ ràng, đã có bài học được rút ra từ những sai lầm của Microsoft và Google, Amazon đang tiến hành một cách thận trọng.
Đương nhiên, Alexa siêu mạnh này không miễn phí. Ông Limp nói rằng hiện tại Alexa sẽ vẫn tạm miễn phí, nhưng “ý tưởng về một trợ lý siêu phàm có thể tăng tốc cho ngôi nhà thông minh của bạn và hơn thế nữa, thay mặt bạn thực hiện các nhiệm vụ phức tạp, có thể cung cấp đầy đủ tiện ích sau này sẽ được tính phí".
Thay đổi lớn đầu tiên: Alexa mới sẽ là một trợ lý đàm thoại nhiều hơn, một trợ lý có thể hiểu nhiều hơn những gì bạn nói và yêu cầu ít điều kiện cụ thể hơn để thực hiện những gì bạn yêu cầu. Đây là một trong những nguyên nhân phổ biến nhất gây ra sự thất vọng với trợ lý giọng nói.
Với Alexa mới, bạn có thể nói một cụm từ như “Alexa, I’m cold” và trợ lý sẽ tăng nhiệt độ trên bộ điều nhiệt được kết nối của bạn.
Ông Limp cho biết, chính các API là chìa khóa. “Chúng tôi đã đưa một số lượng lớn API nhà thông minh (hơn 200) vào LLM của mình”. Dữ liệu này, kết hợp với kiến thức của Alexa về thiết bị nào trong nhà bạn và phòng bạn đang ở dựa trên loa Echo mà bạn đang nói chuyện, sẽ cung cấp cho Alexa bối cảnh cần thiết để quản lý ngôi nhà thông minh của bạn một cách chủ động và liền mạch hơn.
Sự hiểu biết theo ngữ cảnh này sẽ mở rộng ra ngoài việc biết những thiết bị được kết nối nào khác mà bạn có thể muốn kiểm soát đối với những việc như suy luận khi có điều gì đó thay đổi trong nhà bạn. “Nếu bạn thêm một thiết bị mới vào nhà, bạn có thể nói, ‘Alexa, turn on the new light’ và nó sẽ biết đèn mới là gì. Alexa sẽ làm rõ mọi thứ, vì vậy nếu bạn lắp phích cắm hoặc đèn thông minh mới vào, nó sẽ dễ điều khiển hơn”, ông Limp giải thích.
Một khả năng mới khác là đáp ứng nhiều yêu cầu cùng một lúc. Đây không chỉ là những việc cơ bản mà nó có thể làm (ở một mức độ nào đó), chẳng hạn như “Alexa turn off the lights and lock the door”. Điều này tiên tiến hơn - ông Limp nói: “Bạn có thể nói, ‘Alexa, turn on the sprinklers and open my garage door, and turn off the outside lights’ và nó sẽ giải quyết tất cả những điều đó”.
Khả năng này sẽ mở rộng đến việc tạo các quy trình hoàn toàn bằng giọng nói mà không cần lập trình thủ công trong ứng dụng Alexa. Ông Limp cho biết ban đầu, tính năng nhiều lệnh sẽ chỉ hoạt động với một tập hợp con các loại thiết bị - bao gồm đèn, phích cắm thông minh và một số loại thiết bị khác. Nhưng nhóm phát triển đang nỗ lực bổ sung mọi thứ.
Roomba có thể sắp thuộc sở hữu của Amazon đang sử dụng các khả năng AI mới của Alexa nhờ một chương trình dành cho nhà phát triển mới, cho phép các nhà sản xuất thiết bị thăm dò khả năng LLM của nó để cho phép thực hiện nhiều lệnh đàm thoại hơn.
Các nhà phát triển cũng sẽ có thể tận dụng các chức năng nhận thức mới của Alexa. Amazon đang giới thiệu hai công cụ cho phép Alexa mới kiểm soát một số tính năng độc đáo nhất định của các sản phẩm của nhà sản xuất bên thứ ba không nhất thiết phải có trong bộ công cụ hệ sinh thái nhà thông minh của Amazon. Chúng được gọi là Dynamic Controller và Action Controller.
Dynamic Controller sẽ cho phép các tính năng như cảnh dựng sẵn để điều khiển ánh sáng được hiển thị tự nhiên hơn. Vì vậy, nếu bạn có bóng đèn màu GE Cync và nói: “Alexa, make it look spooky in here”, Alexa sẽ biết phải làm gì mà không cần bạn phải lập trình quy trình hoặc nhập cảnh vào ứng dụng Alexa.
Tương tự, Action Controller cho phép nhà phát triển thêm các hành động đơn giản mà Alexa có thể thực hiện. Ví dụ, nếu bạn nói: “Alexa, the floor is dirty”, trợ lý sẽ biết bạn muốn robot hút bụi hoạt động.
Amazon cho biết họ đã hợp tác với GE Cync, Philips, GE Appliances, iRobot, Roborock và Xiaomi về các tính năng này và đang mở rộng chương trình tới nhiều nhà phát triển hơn. Amazon chưa cung cấp thông tin chi tiết về cách thức hoặc thời điểm các nhà phát triển sẽ có quyền truy cập vào những công cụ này.
Ông Limp cho biết đây chỉ là khởi đầu cho hành trình mới của Alexa. Ông nói: “Chúng tôi đã xây dựng một LLM AI thế hệ mới, theo thời gian, sẽ cung cấp năng lượng cho nhiều lĩnh vực của Alexa, bao gồm nhiều trải nghiệm nhà thông minh mới”. “Nhiệm vụ đầu tiên là cố gắng đơn giản hóa những công việc hàng ngày này”. Những bước tiếp theo sẽ là một cuộc hành trình thú vị.
Trợ lý giọng nói mới được hỗ trợ bởi Alexa LLM sẽ ra mắt bản xem trước đầu tiên ở Hoa Kỳ và có sẵn cho bất kỳ ai có thiết bị Echo. Amazon chưa công bố ngày xem trước và các tính năng nhà thông minh mới do Alexa LLM cung cấp sẽ là một phần của bản xem trước bổ sung chỉ dành cho người được mời. Bạn có thể yêu cầu lời mời sau khi tham gia bản xem trước. Amazon cho biết những thứ đó sẽ có sẵn vào một ngày sau đó.