STEAL AI của Nvidia mang lại khả năng hỗ trợ suy luận cho các mô hình thị giác máy tính tốt hơn

Các nhà nghiên cứu khoa học máy tính đến từ Nvidia, Đại học Toronto và Viện Trí tuệ nhân tạo Vector ở Toronto đã nghĩ ra phương thức phát hiện và dự đoán chính xác hơn nơi một vật thể bắt đầu và kết thúc. Kiến thức dạng này có thể giúp cải thiện khả năng suy luận cho các mô hình thị giác máy tính (computer vision) hiện tại, đồng thời hỗ trợ ghi nhãn dữ liệu đào tạo cho những mô hình trong tương lai.

Trong một loạt thí nghiệm của nhóm nghiên cứu, các nhà khoa học đã nhận thấy rằng mô hình trí tuệ nhân tạo Semantically Thinned Edge Alignment Learning (STEAL) có thể giúp cải thiện độ chính xác của mô hình dự đoán “ranh giới ngữ nghĩa” CASENet hiện đại lên thêm 4%. Khả năng nhận dạng chính xác hơn về ranh giới cũng như góc cạnh của một đối tượng có thể mang lại ứng dụng thiết thực cho các tác vụ thuộc về thị giác máy tính, từ việc tạo dựng hình ảnh cho đến tái tạo không gian 3D để phát hiện đối tượng.

Semantically Thinned Edge Alignment Learning (STEAL)Semantically Thinned Edge Alignment Learning (STEAL)

STEAL có thể được áp dụng để cải thiện các CNN hiện tại hoặc những mô hình phát hiện góc cạnh vật thể, tuy nhiên các nhà nghiên cứu cũng tin rằng nó còn có thể giúp họ gắn nhãn hoặc chú thích dữ liệu hiệu quả hơn cho các mô hình thị giác máy tính. Để chứng minh luận điểm này, các nhà khoa học đã sử dụng phương pháp STEAL để tinh chỉnh Cityscapes - một bộ dữ liệu có nội dung liên quan đến môi trường đô thị - được giới thiệu lần đầu tiên tại hội nghị về Thị giác Máy tính và Nhận dạng Mẫu vật thể (Computer Vision and Pattern Recognition - CVPR) năm 2016.

Hiện tại trên GitHub, framework STEAL đã có thể tìm hiểu và dự đoán tương đối chính xác từng góc cạnh của đối tượng bằng pixel theo phương pháp mà các nhà nghiên cứu gọi là “active alignment”. Lý luận rõ ràng về nhiễu chú thích trong quá trình đào tạo, đồng thời công thức thiết lập mức độ cho các mạng thần kinh trong việc học tập từ những biểu nhãn bị sai lệch theo kiểu từ đầu đến cuối cũng giúp tạo ra kết quả này.

Khả năng nhận dạng chính xác hơn về ranh giới, góc cạnh của một đối tượngKhả năng nhận dạng chính xác hơn về ranh giới, góc cạnh của một đối tượng

"Chúng tôi sẽ tiếp tục chỉ ra rằng các ranh giới dự đoán của mình hiệu quả hơn đáng kể so với các ranh giới dự đoán thu được từ những dữ liệu đầu ra thuộc phân đoạn DeepLab-v3 mới nhất, trong khi chỉ sử dụng kiến trúc nhẹ hơn nhiều”, đại diện nhóm nghiên cứu cho biết trong một cuộc phỏng vấn chuyên sâu với trang tin arXiv.

Công trình nghiên cứu này được đặt tên là: “Devil is in the Edges: Learning Semantic Boundaries from Noisy Annotations” (tạm dịch: Học các ranh giới ngữ nghĩa từ nhiễu chú thích), và sẽ được giới thiệu rộng rãi thông qua một bài thuyết trình trong khuôn khổ hội nghị CVPR 2019 đang diễn ra ở Long Beach, California. Các chuyên gia đến từ Nvidia Research đã có đóng góp khá lớn cho công trình nghiên cứu này, và họ cũng sẽ trình bày cụ thể về nghiên cứu từ góc nhìn cá nhân tại CVPR năm nay.

Nvidia AI

Theo một tin tức mới được ghi nhận, Nvidia cho biết họ sẽ hỗ trợ các hệ thống phần cứng máy tính hiệu năng cao từ nhà sản xuất Arm của Anh vào năm 2020, đồng thời mở nguồn phần mềm suy luận phân tích cú pháp TensorRT trên Github để cho phép tùy biến nhiều hơn.

Thứ Tư, 03/07/2019 16:56
52 👨 129