Autoflip, mô hình AI mới của Google có thể tùy chỉnh video với mọi kích thước màn hình

Phạm Hải

Chắc hẳn bất cứ ai trong số chúng ta cũng đã từng ít nhiều gặp phải tình huống khung hiển thị video bị cắt xén “lởm chởm” khi bạn xem trên thiết bị di động. Khó chịu và phiền toái có lẽ là những cảm giác xuất hiện ngay lập tức, nhưng bạn vẫn phải chấp nhận mà xem hết đoạn video bởi đơn giản bạn chẳng thể làm gì khác.

Để giải quyết vấn đề tưởng chừng nhỏ nhưng lại ảnh hưởng lớn đến trải nghiệm người dùng này, đội ngũ nghiên cứu AI của Google đã phát triển thành công một giải pháp nguồn mở có tên Autoflip, có thể tự động tinh chỉnh video sao cho phù hợp với thiết bị hoặc kích thước màn hình nhất định theo nhiều chế độ khác nhau, chẳng hạn như phong cảnh (landscape), hình vuông (square), chân dung (portrait)....

Video được cắt bởi Autoflip

Về cơ bản, Autoflip hoạt động theo 3 giai đoạn chính: Phát hiện cảnh (scene), phân tích nội dung video, và cuối cùng là tinh chỉnh.

Ở giai đoạn phát hiện cảnh, mô hình học máy sẽ chú ý nhiều đến điểm trước khi cắt hoặc nhảy từ cảnh này sang cảnh khác. Nhờ vậy, nó có thể so sánh một khung hình với khung hình trước đó để phát hiện sự thay đổi của màu sắc và các yếu tố liên quan.

Autoflip hoạt động theo ba giai đoạn

Sau khi xác định được một cảnh quay làm chuẩn, mô hình AI sẽ chuyển sang phân tích nội dung video để xác định các đối tượng quan trọng trong một cảnh. Để làm được như vậy, Autoflip sẽ sử dụng một mạng lưới thần kinh học sâu (deep learning neural network) giúp nó xác định rõ không chỉ đối tượng xuất hiện trong cảnh, ví dụ như người, động vật, xe cộ, cây cối… mà còn là cả chuyển động cũng như trạng thái di chuyển của đối tượng.

Ở giai đoạn cuối cùng, mô hình AI sẽ xác định xem nó nên sử dụng chế độ đứng yên cho các cảnh diễn ra trong một không gian duy nhất hay chế độ theo dõi khi các đối tượng quan tâm liên tục di chuyển. Dựa vào yếu tố này và kích thước mục tiêu mà video cần được hiển thị, Autoflip sẽ cắt khung hiển thị sao cho vẫn đảm bảo sự mượt mà và đặc biệt là giữ lại đầy đủ nội dung đáng quan tâm.

Cắt video theo nhiều chế độ

Các nhà nghiên cứu AI Google cho biết Autoflip có thể được sử dụng để chuyển đổi video sang nhiều định dạng và kích thước màn hình mà không cần sự can thiệp từ con người. Ở giai đoạn tiếp theo, nhóm nghiên cứu muốn cải thiện khả năng theo dõi đối tượng trong các cuộc phỏng vấn và phim hoạt hình của Autoflip. Để làm được điều này, mô hình AI cần phải được trang bị các kỹ thuật phát hiện văn bản và hình ảnh mờ để sắp đặt đối tượng ở nền trước và nền sau trong một khung hình tốt hơn.

Bạn có thể tham khảo mã của Autoflip mã ở ĐÂY.

Thứ Hai, 17/02/2020 10:11

3 ★ 1 👨 248

Bạn nên đọc

Xác thực tài khoản!

Theo Nghị định 147/2024/ND-CP, bạn cần xác thực tài khoản trước khi sử dụng tính năng này. Chúng tôi sẽ gửi mã xác thực qua SMS hoặc Zalo tới số điện thoại mà bạn nhập dưới đây:

Số điện thoại chưa đúng định dạng!

0 Bình luận

Sắp xếp theo

Xóa Đăng nhập để Gửi

Cũ vẫn chất

Xem thêm

Giấy phép số 362/GP-BTTTT. Bộ Thông tin và Truyền thông cấp ngày 30/06/2016. Cơ quan chủ quản: CÔNG TY CỔ PHẦN MẠNG TRỰC TUYẾN META. Địa chỉ: 56 Duy Tân, Phường Cầu Giấy, Hà Nội. Điện thoại: 024 2242 6188. Email: info@meta.vn. Chịu trách nhiệm nội dung: Lê Ngọc Lam.

Autoflip, mô hình AI mới của Google có thể tùy chỉnh video với mọi kích thước màn hình

Phạm Hải

Bạn nên đọc

AI đang giúp lập trình viên mã nguồn mở “làm tất ăn cả” như thế nào?

Multi-Agent Systems là gì? Toàn tập từ cơ bản đến ứng dụng thực tế

Panasonic giới thiệu giải pháp quản lý IoT & AI tiên tiến cho nhà thông minh

Đây là Windows 12 Lite đang được bày bán tại hội chợ máy tính

Cách tận dụng AI hiệu quả với ngân sách hạn chế

3 yếu tố xây dựng chiến lược AI hiệu quả cho doanh nghiệp năm 2026

PPPOE là gì? Vai trò của PPPOE ra sao?

Tối đa hóa sức mạnh giữa con người và AI trong môi trường làm việc

Hướng dẫn tạo biểu mẫu trên Canva bằng AI

Cũ vẫn chất

Cách sử dụng bộ gõ tiếng Việt EVKey mới

Đội hình Song Đấu DTCL mùa 15, Song Đấu TFT mùa 15

Hàm GETDATE trong SQL Server

Hàm SUBSTRING trong SQL Server

Chơi game Free Fire miễn phí không cần tải về

'Giấu giếm' hay 'dấu diếm' đúng chính tả

Cách tạo checklist trong Google Docs

Hàm putchar() trong C

Các cách kiếm Spin trong Coin Master, kiếm lượt quay Coin Master

Điều kiện EXISTS trong SQL Server