Deepfake của Samsung có thể khiến tu sĩ hắc ám Rasputin hát như thật

Các nhà nghiên cứu đến từ trung tâm nghiên cứu AI của Samsung tại Cambridge, Anh Quốc, cùng với các chuyên gia về khoa học máy tính thuộc Đại học Hoàng gia Luân Đôn đã cùng hợp tác trong dự án nhằm tạo ra một mạng chống đối tạo sinh (generative adversarial network - GAN), có thể tạo hiệu ứng và đồng bộ hóa đến mức hoàn hảo chuyển động khuôn mặt của hình ảnh 2D với các clip âm thanh chứa giọng nói của con người.

Ngoài việc đồng bộ chuyển động của môi và khuôn miệng, mô hình trí tuệ nhân tạo này còn có thể điều chỉnh chuyển động của lông mày cũng như chớp mắt để khiến cho những khuôn mặt mà nó tạo ra có vẻ tự nhiên hơn. Tuy nhiên, tác vụ quan trọng nhất vẫn sẽ là đồng bộ môi và khuôn miệng với âm thanh phát ra. Ngày nay, công đoạn này thường được thực hiện luôn trong quá trình chỉnh sửa sau (post-editing), hoặc thông qua việc sử dụng đồ họa máy tính.

Trung tâm AI của SamsungTrung tâm AI của Samsung

Các nhà nghiên cứu tin rằng mô hình này có thể được sử dụng để tự động tạo những khuôn mặt nói chuyện cho các nhân vật trong phim hoạt hình một cách tự nhiên nhất, cải thiện khả năng hiển thị trong các cuộc gọi video băng thông thấp, cung cung cấp khả năng đồng bộ hóa khuôn miệng hoặc lồng tiếng tốt hơn cho các bộ phim nước ngoài.

Trong số các ví dụ về công trình nghiên cứu này được chia sẻ trên YouTube, ấn tượng nhất chính là đoạn video mô tả nhà huyền bí khét tiếng người Nga Rasputin (1869 - 1919) đang “thể hiện” ca khúc Halo của nữ ca sĩ Beyoncé. Một số đoạn video khác cũng rất đáng chú ý như 2 rapper quá cố 2Pac và Biggie đang hát lại tác phẩm của họ, hay nhà khoa học vĩ đại Albert Einstein đang đọc một câu nói về ngôn ngữ chung của khoa học.

Tu sĩ hắc ám Rasputin đang thể hiện ca khúc Halo 

Ngoài ra, còn rất nhiều đoạn video ví dụ thú vị khác, bạn có thể tham khảo thêm tại địa chỉ: https://sites.google.com/view/facial-animation/home

Tin tức về công trình nghiên cứu trên được đưa ra chỉ 1 tháng sau khi một trung tâm nghiên cứu AI khác của Samsung tại Moscow giới thiệu dự án tạo hình ảnh động 2D bằng trí tuệ nhân tạo mà không cần sử dụng đến các mô hình 3D. Được biết, công nghệ này có thể được sử dụng để tạo ra các avatar kỹ thuật số hoặc hình ảnh deepfake thuyết phục hơn.

Việc sử dụng các mạng lưới GAN để giả mạo các loại hình phương tiện kỹ thuật số như hình ảnh và video đang nổi nên như một xu hướng đáng chú ý trong lĩnh vực AI nói chung trên toàn thế giới trong vài năm gần đây. Rất nhiều mô hình GAN tinh vi đã được giới thiệu trong khuôn khổ các hội nghị chuyên sâu về trí tuệ nhân tạo như ICML, CVPR, và nhiều sự kiện đáng chú ý khác từ đầu năm đến nay.

Rasputin và như ca sĩ BeyoncéRasputin và như ca sĩ Beyoncé

Trong đó, một số mô hình đáng chú ý với tiềm năng ứng dụng cực cao phải kể đến như GauGAN của Nvidia, có thể biến những nét vẽ nguệch ngoạc theo phong cách MS Paint thành “kiệt tác” nghệ thuật. Hay CollaGEN, một phương pháp được các nhà nghiên cứu Hàn Quốc sáng tạo ra để thay thế lượng dữ liệu bị thiếu trong mỗi hình ảnh.

Tuy rằng tiềm năng đóng góp trong nhiều lĩnh vực khác nhau của các công cụ deepfake là rất lớn, thế nhưng rủi ro tiềm tàng mà chúng mang lại cũng đang là vấn đề khiến các nhà khoa học đau đầu.

Trên thực tế, công nghệ này thường xuyên bị lợi dụng để giả mạo những người nổi tiếng (diễn viên, ca sĩ, người mẫu...) trong những đoạn video sai sự thật hoặc tệ hơn là trong các bộ phim khiêu dâm. Có thể thấy, công nghệ này đã tạo ra một cú sốc mạnh vì rất nhiều người đã tin rằng đó là sự thật. Điều này không chỉ làm ảnh hưởng đến danh dự, nhân phẩm của người bị giả mạo mà còn khiến dư luận trở nên xôn xao và xảy ra nhiều tranh cãi hoặc có thể là những mâu thuẫn tệ hơn thế nữa.

Deepfake chứa đựng nhiều rủi ro tiềm tàngDeepfake chứa đựng nhiều rủi ro tiềm tàng

Có lẽ trong tương lai, các nhà khoa học cũng như cơ quan quản lý nhà nước cần ngồi lại với nhau để tìm ra những quy ước đối với việc sử dụng công nghệ tuyệt vời này một cách đúng đắn và an toàn cho cộng đồng.

Thứ Năm, 04/07/2019 09:57
53 👨 326