AI tạo video như thật từ văn bản

Trong kỷ nguyên AI bùng nổ như hiện nay, việc tạo ra những video ấn tượng không còn là điều khó khăn nữa, nhất là đối với các nhà sáng tạo nội dung. Các công cụ tạo video từ văn bản giúp đơn giản hóa quá trình sản xuất video, cho phép các nhà sáng tạo chuyển các nội dung văn bản từ những ý tưởng thành video hấp dẫn, chỉ với vài cú click chuột.

Những công cụ này không chỉ tiết kiệm thời gian mà còn mở ra nhiều cơ hội sáng tạo mới, giúp bạn dễ dàng truyền tải thông điệp của mình đến đối tượng khán giả rộng rãi.

AI tạo video như thật từ Lumiere

Lumiere là mô hình AI được Google Research thiết kế nhằm giải quyết thách thức lớn trong tổng hợp video là "xây dựng chuyển động thực tế, đa dạng và mạch lạc".

Video do AI tạo ra trước đây thường bị giật cục. Lumiere mang tới trải nghiệm liền mạch hơn đó thông qua kiến trúc Space-Time U-Net, trong đó tạo ra video hoàn chỉnh từ đầu đến cuối chỉ trong một lần chạy. Trong khi đó, video được tạo bởi các mô hình trước đây khó đạt được sự đồng nhất do chỉ tổng hợp những khoảnh khắc chính và cách xa nhau.

Dựa trên hình ảnh mẫu do người dùng cung cấp Lumiere có thể xây dựng phong cách riêng cho video. Ngoài tạo nội dung mới, Lumiere còn có khả năng chỉnh sửa hoặc chữa những phần bị lỗi trong video sẵn có theo yêu cầu của người dùng.

Google Research đã thực hiện một thử nghiệm để so sánh hiệu năng của Lumiere với các AI tạo video từ văn bản hiện nay, như ImagenVideo, Pika, ZeroScope và Gen2. Họ đã đề nghị một nhóm thử nghiệm chọn ra video có chất lượng hình ảnh và chuyển động tốt nhất được tạo ra bởi các mô hình, tất nhiên không cho biết chúng được tạo ra bởi mô hình nào. Kết quả, Lumiere vượt xa mọi đối thủ trong thử nghiệm.

Mô hình này vẫn đang được thử nghiệm, Google Research mới chỉ tung ra các bản demo của Lumiere.

AI chuyển văn bản thành video trong vài giây

Năm 2023, Runway - công ty AI có trụ sở tại New York, cũng cho ra mắt công cụ AI mang tên Gen-2, có khả năng biến các mô tả văn bản đơn giản hoặc ảnh tĩnh thành một đoạn video ngắn. Ví dụ, khi bạn nhập một câu "một con mèo đi dưới mưa", một video video ba giây với nội dung như yêu cầu sẽ được AI sản xuất.

Runway là startup nổi tiếng về AI ra đời năm 2018. Đây là một công ty AI nổi tiếng không kém OpenAI và đang cung cấp website hỗ trợ người dùng chỉnh sửa video nhanh, như xóa phông hay thêm hiệu ứng.

Vào tháng 2/2019, Runway công bố mô hình chỉnh sửa video có tên Gen-1 có khả năng chuyển đổi cảnh quay video có sẵn, nhập hoạt cảnh 3D thô hoặc thêm bộ lọc do AI tạo.

Gen-2 được phát triển dựa trên kiến trúc của Gen-1, nhưng tập trung nhiều hơn vào việc khởi tạo video bằng ảnh, văn bản đầu vào hoặc kết hợp cả hai.

Cris Valenzuela, nhà đồng sáng lập kiêm CEO Runway đã giới thiệu bản demo của Gen-2 trên Twitter. Chỉ sau vài giây Gen-2 có thể tạo được cảnh quay "drone trên bầu trời sa mạc" hay "cận cảnh mắt của con người" dù độ phân giải và tính chân thực vẫn bị hạn chế và chưa có âm thanh.

Valenzuela nói thêm, chỉ bằng cách nhập vào văn bản, bạn có thể tạo video về cuộc rượt đuổi gay cấn bằng ôtô, nhưng đôi khi những chiếc ôtô đó có thể bay.

Yêu cầu đầu vào càng chi tiết, thì Gen-2 tạo ra video càng sống động. Valenzuela cho tiết, Gen-2 sẽ được cải tiến để giúp nghệ sĩ, nhà thiết kế và nhà làm phim biến tạo video nhanh hơn với chi phí thấp.

Video do Gen-2 tạo ra được giáo sư Hany Farid tại Đại học California đánh giá là "siêu tuyệt vời". Nhưng ông cũng lo ngại hệ thống AI này có thể bị kẻ xấu lợi dụng cho ra đời video giả mạo để lan truyền tin giả, lừa đảo...

Thứ Hai, 29/01/2024 09:05
1,67 👨 1.108
Xác thực tài khoản!

Theo Nghị định 147/2024/ND-CP, bạn cần xác thực tài khoản trước khi sử dụng tính năng này. Chúng tôi sẽ gửi mã xác thực qua SMS hoặc Zalo tới số điện thoại mà bạn nhập dưới đây:

Số điện thoại chưa đúng định dạng!
Số điện thoại này đã được xác thực!
Bạn có thể dùng Sđt này đăng nhập tại đây!
Lỗi gửi SMS, liên hệ Admin
0 Bình luận
Sắp xếp theo