Điều gì sẽ xảy ra nếu chúng ta có thể phát triển một thế giới trò chơi 3D chỉ đơn giản bằng những bức ảnh chụp từ chiếc điện thoại nhỏ gọn? Các nhà nghiên cứu trí tuệ nhân tạo tới từ Nvidia mới đây đã phát triển thành công một công nghệ có khả năng thể biến biến một tập hợp ảnh 2D thành cảnh 3D chỉ trong giây lát.
Ý tưởng mà NVIDIA nhắm đến phát triển một cách tiếp cận mới theo hướng kết xuất ngược, dùng để đào tạo các thuật toán AI và phát triển cảnh 3D từ các bức ảnh 2D được chụp ở nhiều góc độ khác nhau chỉ trong vài giây. Phương pháp này kết hợp đào tạo mạng nơ-ron và kết xuất nhanh, và là một trong những mô hình đầu tiên có thể làm được như vậy.
Có tên gọi Instant Neural Radiance Field hoặc Instant NeRF, công nghệ này chủ yếu hướng đến việc đào tạo các thuật toán AI để cho phép tạo ra các đối tượng 3D từ những bức ảnh hai chiều. Yếu tố cốt lõi của Instant NeRF nằm ở khả năng nội suy cực nhanh chóng và linh hoạt, cho phép nó chỉ mất vài giây để luyện tập trên hàng chục bức ảnh tĩnh cùng với siêu dữ liệu về các góc chụp, sau đó dựng cảnh 3D tương ứng chỉ trong vòng "hàng chục mili giây".
Giống như các kỹ thuật NeRF khác, Instant NeRF của NVIDIA yêu cầu hình ảnh được chụp từ nhiều vị trí. Và đối với ảnh có nhiều đối tượng, ảnh được chụp phải không có quá nhiều chuyển động được ưu tiên, nếu không, cảnh dựng 3D sẽ bị mờ.
NVIDIA cho biết Instant NeRF có thể được sử dụng để phát triển hình ảnh hoặc phong cảnh trong thế giới ảo, kết xuất những người tham gia hội nghị video trực tuyến và dựng môi trường của họ ở dạng 3D, hoặc để tái tạo cảnh cho bản đồ kỹ thuật số 3D. Còn ở khía cạnh công nghiệp,công nghệ này hoàn toàn co thể có thể được sử dụng trong chế đào tạo robot và giúp các hệ thống lái xe tự hành hiểu được kích thước và hình dạng của các vật thể trong thế giới thực. NVIDIA cũng nhìn thấy một tương lai đầy triển vọng của trong Instant NeRF lĩnh vực giải trí và kiến trúc, nơi nó có thể được sử dụng để tạo ra các mô hình 3D của môi trường thực mà người tạo có thể dễ dàng chỉnh sửa trong quá trình lập kế hoạch.
Nhận xét về công nghệ mới này, đại diện NVIDIA cho biết:
"Mặc dù ước tính độ sâu và diện mạo của một vật thể dựa trên một phần góc nhìn là kỹ năng tự nhiên của con người, nhưng đối với AI, đây lại là một nhiệm vụ không hề đơn giản.
Tạo cảnh 3D bằng các phương pháp truyền thống mất hàng giờ hoặc lâu hơn, tùy thuộc vào độ phức tạp và độ phân giải của hình ảnh. Việc đưa AI vào hình ảnh sẽ giúp tăng tốc mọi thứ. Các mô hình NeRF truyền thống có thể hiển thị cảnh dựng sắc nét trong vài phút, nhưng vẫn mất hàng giờ để đào tạo. Còn đối với Instant NeRF, thời gian hiển thị sẽ được rút ngắn đáng kể. Công nghệ này hoạt động dựa trên một kỹ thuật do NVIDIA phát triển gọi là mã hóa lưới băm đa độ phân giải, được tối ưu hóa để chạy hiệu quả trên GPU NVIDIA. Sử dụng phương pháp mã hóa đầu vào mới, các nhà nghiên cứu có thể đạt được kết quả nhanh chóng, với chất lượng cao bằng cách sử dụng một mạng nơ-ron nhỏ chạy nhanh.
Instant NeRF thậm chí còn có thể chạy trên một GPU duy nhất, tuy nhiên hiệu quả sẽ chỉ được thể hiện tối đa trên các hệ thống có lõi tensor giúp tăng hiệu suất trí tuệ nhân tạo”.
Trong tương lai, thậm chí một nhiếp ảnh gia cũng có thể trở thành một nhà sáng tạo nội dung 3D mà không cần phải viết một dòng code nào, bởi những nhiệm vụ khó khăn nhất sẽ được máy móc đảm nhận.