Khi nói đến trợ lý AI, mọi người thường nghĩ đến các chatbot trả lời câu hỏi bằng văn bản. Lingguang, được Ant Group thuộc Alibaba ra mắt, thuộc một nhánh tham vọng hơn: Nó viết code, dựng giao diện và vận chuyển các ứng dụng nhỏ hoạt động chỉ trong khoảng 30 giây từ một prompt duy nhất.
Thay vì trả lời bằng một đoạn văn, Lingguang thường trả lời bằng phần mềm. Hỏi "帮我做一个新年倒计时小工具" và bạn không chỉ nhận được hướng dẫn - mà còn có một ứng dụng đếm ngược trực tiếp chạy bên trong cuộc trò chuyện. Đối với những người không phải là nhà phát triển, điều này giống như việc có một kỹ sư cấp dưới trực điện thoại hơn là nói chuyện với công cụ tìm kiếm.
Lingguang là gì?
Lingguang là một ứng dụng AI mới ra mắt của Ant Group, đã trở thành một trong những sản phẩm công nghệ bùng nổ nhất Trung Quốc năm 2025, vượt qua hai triệu lượt tải xuống chỉ sau 6 ngày. Sự phổ biến rộng rãi của ứng dụng đã giúp nó vượt qua giai đoạn đầu của ChatGPT và Sora, đánh dấu một bước ngoặt lớn trong cuộc đua AI đang diễn ra mạnh mẽ tại Trung Quốc. Ứng dụng được cho là đã vươn lên vị trí thứ 6 trên Apple App Store của Trung Quốc và leo lên vị trí hàng đầu trong bảng xếp hạng tiện ích miễn phí.

Điều gì làm cho Lingguang khác biệt so với các chatbot AI khác?
Hầu hết các công cụ LLM phổ biến đều thuộc một trong hai nhóm sau:
- Chatbot ưu tiên văn bản – tuyệt vời cho các bài luận, tóm tắt, bản dịch, nhưng chúng chỉ dừng lại ở văn xuôi.
- Hỗ trợ lập trình – mạnh mẽ trong các IDE, nhưng đòi hỏi kỹ năng và công cụ của nhà phát triển.
Lingguang có 3 đặc tính nổi bật:
1. Trả lời dựa trên code theo mặc định
Lingguang không chỉ mô tả mà thường triển khai một giải pháp. Một prompt như "Cách hẹn giờ luộc trứng lòng đào" có thể mang lại:
- Giao diện người dùng đơn giản (nhập kích thước trứng, độ chín mong muốn),
- Logic back-end để tính toán thời gian luộc,
- Bộ đếm thời gian hoạt động được nhúng trong cuộc trò chuyện.
2. Đa phương thức ngay từ ngày đầu tiên
Trợ lý viết JavaScript cũng có thể:
- Tạo biểu đồ từ dữ liệu người dùng,
- Kết xuất hình ảnh hoặc biểu tượng,
- Diễn giải ảnh chụp màn hình hoặc dữ liệu camera,
- Nhúng hình ảnh trực quan 3D vào ứng dụng nhỏ.
Kết quả không phải là một mô hình tĩnh mà là một bảng điều khiển tương tác, trong đó văn bản, đồ họa và điều khiển được kết nối chặt chẽ.
3. Trải nghiệm người dùng ứng dụng Flash: Ý tưởng → công cụ trong khoảng 30 giây
Ant Group đặt tên cho các ứng dụng nhỏ tức thì này là ứng dụng Flash. Từ góc nhìn của người dùng:
- Nhập hoặc nói một yêu cầu ngắn.
- Chờ nửa phút.
- Nhận một ứng dụng có thể chạy được mà bạn có thể nhấp, chỉnh sửa và chia sẻ.
Sự chuyển đổi từ "trả lời câu hỏi" sang "công cụ chuyển đổi" chính là lý do Lingguang trở nên quan trọng. Nó định hình lại AI của người dùng từ giao diện Hỏi & Đáp thành một nền tảng ứng dụng gọn nhẹ.
Lingguang biến ngôn ngữ tự nhiên thành ứng dụng Flash như thế nào?
Hướng dẫn từng bước: từ ý tưởng đến ứng dụng nhỏ trong vòng chưa đầy 30 giây. Về cơ bản, Lingguang hoạt động không giống một mô hình đơn khối mà giống một nhóm được sắp xếp hợp lý hơn:
1. Phân tích ý định
Trước tiên, trợ lý sẽ diễn giải những gì người dùng thực sự muốn:
- Đây là máy tính, trình theo dõi, bài kiểm tra, game nhỏ hay giải thích trực quan?
- Nội dung đầu vào và đầu ra được ngụ ý là gì (số, ngày tháng, văn bản, thanh trượt, biểu đồ)?
2. Phân tích tác vụ
Yêu cầu được chia nhỏ thành một kế hoạch nhỏ:
- Bố cục giao diện người dùng (các trường, nút, nhãn),
- Logic tính toán (công thức, cập nhật trạng thái),
- Nguồn dữ liệu tùy chọn (giá trực tiếp, bản đồ, mô hình AI),
- Tài sản trực quan (biểu tượng, biểu đồ, hình minh họa).
3. Các mô hình chuyên biệt tiếp quản
Lingguang dựa trên dòng mô hình Ling AI của Ant Group:
- Mô hình ngôn ngữ với khoảng 1 nghìn tỷ tham số (Ling-1T) xử lý code, toán học và hội thoại trôi chảy.
- Một dòng suy luận chuyên dụng (sê-ri Ring) hỗ trợ giải quyết vấn đề từng bước.
- Một dòng đa phương thức (sê-ri Ming) xử lý và tạo hình ảnh, sơ đồ và các media khác.
Lingguang đóng vai trò là người dẫn đường, định tuyến từng tác vụ con đến đúng "chuyên gia" và hợp nhất kết quả đầu ra của họ.
4. Tổng hợp và thực thi code
Mô hình ngôn ngữ tạo ra code ứng dụng nhỏ (thường là HTML/JS hoặc định dạng portable tương tự), bao gồm:
- Được xác thực nhanh chóng,
- Được thực thi trong môi trường thử nghiệm,
- Được trình bày dưới dạng live widget trong cuộc trò chuyện.
5. Theo dõi và giải thích đa phương thức
Cùng với ứng dụng, Lingguang thường hiển thị:
- Giải thích ngắn gọn về những gì nó đã xây dựng,
- Các công thức hoặc giả định được sử dụng,
- Đôi khi là sơ đồ hoặc hình ảnh động hướng dẫn cách sử dụng công cụ.
"Dấu vết" này giúp ứng dụng ít mang tính "hộp đen" hơn và cung cấp cho người dùng điểm khởi đầu để tinh chỉnh.
Tại sao đầu ra đa phương thức dựa trên code lại quan trọng?
Việc tạo ra hàng trăm dòng code không lỗi từ một prompt chỉ bằng một câu không hề đơn giản. Các kỹ sư của Ant đã:
- Tối ưu hóa việc tạo code sao cho độ trễ chỉ trong vài giây bất chấp quy mô của mô hình.
- Giới thiệu các biện pháp bảo vệ để phát hiện những lỗi rõ ràng trước khi ứng dụng được hiển thị.
- Yêu cầu trợ lý giải thích các lựa chọn của riêng nó để những người không phải nhà phát triển có thể phát hiện ra sự không khớp ("Tại sao bạn lại sử dụng công thức này?").
Kết quả không phải là một kỹ sư hoàn hảo, mà là một công cụ tạo mẫu nhanh có tiềm năng, có thể:
- Biến những ý tưởng mơ hồ thành giao diện cụ thể,
- Gắn hình ảnh vào các khái niệm,
- Và chạy logic ngay lập tức để người dùng có thể "cảm nhận" hành vi, chứ không chỉ tưởng tượng.
Học IT
Công nghệ
Microsoft Word 2013
Microsoft Word 2007
Microsoft Excel 2019
Microsoft Excel 2016
Microsoft PowerPoint 2019
Google Sheets
Lập trình Scratch
Bootstrap
Hướng dẫn
Ô tô, Xe máy