AI đứng sau chế độ chân dung siêu đỉnh của Pixel được Google tung thành mã nguồn mở

Camera trên điện thoại Pixel của Google đang là một trong những camera tốt nhất hiện nay, và một trong những lý do chính là nhờ hệ thống AI đằng sau. Google dùng công nghệ machine learning để chọn những bức hình đẹp nhất. Và giờ đây, họ đang lên kế hoạch biến một trong các công cụ AI này thành công cụ mã nguồn mở.

Đăng trên blog đầu tuần vừa qua, Google đã tung ra dạng mã nguồn mở của DeepLab-v3+. Đây là công cụ phân vùng hình ảnh dùng mạng thần kinh tích chập (Convolutional Neural Network - CNN). một phương pháp machine learning rất giỏi trong việc phân tình dữ liệu hình ảnh. Phân vùng ảnh phân tích đối tượng trong ảnh, chia thành các vùng, tách hình ảnh ở phần tiền cảnh và hậu cảnh trong tấm hình.

Cách hoạt động của phân vùng hình ảnh
Cách hoạt động của phân vùng hình ảnh

Dù nghe có vẻ bình thường nhưng phương pháp này lại rất hữu ích cho camera và chính Google cũng dùng nó cho chế độ chụp ảnh chân dung trên máy Pixel của mình. Kết quả là những tấm hình kiểu bokeh, làm mờ nền nhưng chủ thể vẫn rõ ràng.

Chính iPhone đã khiến công nghệ này trở nên phổ biến nhưng cần lưu ý rằng Apple dùng 2 ống kính để tạo ra hiệu ứng chân dung, trong khi Google chỉ dùng 1 ống. (Còn chế độ chân dung của Apple hay Google tốt hơn, bạn đọc hãy tự mình đánh giá).

Theo giải thích của kĩ sư phần mềm Google Liang-Chieh CHen và Yukun Zhu, phân vùng hình ảnh đã cải thiện nhanh chóng nhờ sự nở rộ của deep learning, đạt tới “độ chính xác khó mà tưởng tượng được trong 5 năm trước”. Google hy vọng chia sẻ rộng rãi cho “các nhóm khác trong ngành để tiếp tục cải tiến” công việc mà họ đã làm.

Việc đưa những phần mềm như vậy tới cộng đồng sẽ giúp các nhà phát triển ứng dụng khi họ cần tới công nghệ phân vùng hình ảnh, và bắt kịp được Google.

https://github.com/tensorflow/models/tree/master/research/deeplab

Xem thêm:

Thứ Bảy, 17/03/2018 11:59
31 👨 146
0 Bình luận
Sắp xếp theo