Kuaishou, nền tảng chia sẻ video ngắn có quy mô lớn thứ hai Trung Quốc, đã ra mắt AI tạo video từ văn bản mang tên Kling với hàng loạt tính năng từng giúp Sora của OpenAI thu hút sự chú ý như cải thiện chất lượng chuyển động, bám sát nội dung mô tả và có thể tạo chuỗi khung hình khác nhau.
Kuaishou cho biết, chỉ với một đoạn mô tả, Kling có thể tạo video dài 2 phút với độ phân giải 1080p và 30 khung hình mỗi giây, mô phỏng chính xác các hiệu ứng vật lý như thế giới thực. Điều mà hiện này phần lớn mô hình AI vẫn chưa làm được.
Kling còn có thể cải thiện cử động và biểu cảm của nhân vật trong video với khả năng xây dựng khuôn mặt và cơ thể 3D giống đời thực.
Mặc dù một số video do Kling tạo ra vẫn xuất hiện tình trạng mờ ảo thường thấy trong hình ảnh do AI tạo, nhưng mức độ nhỏ hơn rất nhiều.
Kling cũng sử dụng mô hình biến đổi khuếch tán (diffusion transformer model) giống Sora nhưng khác là AI của Trung Quốc sở hữu mô hình độc quyền, hỗ trợ nhiều tỷ lệ khung hình và kiểu quay khác nhau.
Hiện tại, Kling đã mở danh sách chờ người dùng trải nghiệm, tuy nhiên chưa rõ có thể phát hành ngoài Trung Quốc hay không. Trong khi Sora của OpenAI vẫn chưa được cung cấp rộng rãi.
Kling hứa hẹn là một đối thủ đáng gờm cho Sora của OpenAI, đặc biệt tại thị trường Trung Quốc đồng thời cho thấy Trung Quốc đang có những bước tiến nhanh chóng trong phát triển mô hình AI.