So với GPT-3 - một trong những AI tốt nhất hiện nay của Mỹ, "siêu AI" Wu Dao của Trung Quốc có sức mạnh vượt trội hơn hẳn.
Wu Dao 1.0
Tháng 5/2020, GPT-3 được trình làng với lời giới thiệu là AI thông minh nhất từ trước đến nay. GPT-3 được phát triển bởi Open AI - phòng nghiên cứu có trụ sở tại San Francisco do tỷ phú Elon Musk, Peter Thiel và công ty Microsoft sáng lập.
Khi đó, GPT-3 với 175 tỷ tham số cấu thành là mô hình đào tạo AI có quy mô lớn nhất, có khả năng tuyệt vời trong nhiều tác vụ xử lý ngôn ngữ tự nhiên (NLP). GPT-3 có thể tự sáng tác thơ, tự học và viết văn, sản xuất âm nhạc chuyên nghiệp như con người.
Tuy nhiên, GPT-3 vẫn thiếu các khả năng nhận thức linh hoạt, không thể thực hiện nhiều tác vụ đồng thời, khó thực hiện các nhiệm vụ lý luận phức tạp, như đối thoại mở, hỏi đáp dựa trên kiến thức...
Để giải quyết vấn đề này, các nhà nghiên cứu tại Học viện Trí tuệ nhân tạo Bắc Kinh (BAAI) đã phát triển một AI có tên gọi Wu Dao (Ngộ Đạo) có thể tự động thực hiện mọi thứ như con người.
Wu Dao (Ngộ Đạo) phiên bản 1.0 ra đời vào tháng 3 là kết quả đóng góp của BAAI cùng hơn 100 nhà khoa học AI khác từ các trường đại học và viện nghiên cứu.
Wu Dao 1.0 đã khởi xướng các dự án nghiên cứu quy mô lớn ở các lĩnh vực khác nhau thông qua bốn mô hình gồm Wu Dao - Wen Yuan, Wu Dao - Wen Lan, Wu Dao - Wen Hui và Wu Dao - Wen Su.
Wu Dao - Wen Yuan
Đây là mô hình tiền đào tạo ngôn ngữ với khả năng xử lý tiếng Trung và tiếng Anh tốt nhất như phân loại văn bản, phân tích tình cảm, suy luận ngôn ngữ tự nhiên, đọc hiểu… như một người bình thường.
Wu Dao - Wen Yuan với 2,6 tỷ tham số có thể đạt hiệu suất trong các hoạt động nhận thức, như ghi nhớ, hiểu, truy xuất, tính toán số, đa ngôn ngữ như GPT-3.
Wu Dao - Wen Lan
Đây là mô hình đào AI chuyên về đồ họa đa phương tiện. Wen Lan có hơn 1 tỷ tham số, có khả năng tự học tập và phân tích dựa trên sự kết hợp của đồ họa, văn bản và video. Nó được đào tạo trên 50 triệu dữ liệu đồ họa thu thập từ các nguồn mở và có khả năng tạo ra các mô hình và ứng dụng đồ họa cấp công nghiệp của Trung Quốc.
Wu Dao - Wen Hui
Mục tiêu của Wu Dao - Wen Hui là phát triển và nâng cao nhận thức dựa trên logic, ý thức và khả năng lý luận của các mô hình AI cũ hơn.
Đạt 11,3 tỷ tham số, Wen Hui hiện có thể tự tạo video, vẽ hình, truy xuất văn bản, thực hiện các bài luận phức tạp và sáng tác thơ.
Wu Dao - Wen Su
Đây là mô hình AI quy mô lớn về dự đoán cấu trúc phân tử sinh học có khả năng xử lý các cấu trúc phân tử sinh học siêu dài với hiệu suất cực nhanh.
Wen Su được đào tạo về dữ liệu gen trên 5 đến 100.000 tế bào miễn dịch của con người (25 - 30 loại tế bào) và 10.000 vi khuẩn kháng thuốc, được đào tạo về protein dựa trên cơ sở dữ liệu UNIPARC 100 GB.
Wu Dao 2.0
Ba tháng sau khi Wu Dao 1.0 ra đời, phiên bản 2.0 cũng được BAAI giới thiệu. Wu Dao 2.0 thông minh hơn hẳn với 1.750 tỷ tham số, lớn gấp 10 lần GPT-3 và Switch Transformers do Google phát triển.
Với lượng tham số khổng lồ, BAAI đã phát triển một hệ thống học tập mã nguồn mở có tên FastMoE - tương tự Mixture of Experts của Google để cho Wu Dao 2.0 học.
Kết quả, Wu Dao 2.0 vượt trội so với hầu hết AI hiện tại. Là mô hình đa phương thức, Wu Dao 2.0 có thể vừa tạo văn bản, xử lý hình ảnh, vừa xử lý và tương tác bằng ngôn ngữ tự nhiên với người thật.
"Sinh viên ảo" đầu tiên
Hôm 6/6 vừa qua, BAAI cũng đã phát hành người ảo mang tên Hua Zhibing, kết quả đầu tiên trong việc ứng dụng Wu Dao 2.0. Đây là một “cô gái” có ngoại hình xinh xắn và giọng nói truyền cảm. Hua Zhibing tự giới thiệu rằng bản thân thích hội họa, thư pháp, có thể sáng tác thơ và nhạc, có khả năng về lý luận và tương tác cảm xúc.
Theo BAAI, Zhibing có hàng loạt ưu điểm mà những "người ảo" khác không có, như sử dụng được tiếng Anh và tiếng Trung, vận dụng AI linh hoạt, giảm chi phí đào tạo AI và nhiều vấn đề liên quan đến kỹ thuật khác.
Sau khi ra mắt, "cô gái" này đã nhập học để trở thành sinh viên ảo của khoa Khoa học máy tính và công nghệ của Đại học Thanh Hoa, Bắc Kinh.