STEAL AI của Nvidia mang lại khả năng hỗ trợ suy luận cho các mô hình thị giác máy tính tốt hơn

Phạm Hải

Các nhà nghiên cứu khoa học máy tính đến từ Nvidia, Đại học Toronto và Viện Trí tuệ nhân tạo Vector ở Toronto đã nghĩ ra phương thức phát hiện và dự đoán chính xác hơn nơi một vật thể bắt đầu và kết thúc. Kiến thức dạng này có thể giúp cải thiện khả năng suy luận cho các mô hình thị giác máy tính (computer vision) hiện tại, đồng thời hỗ trợ ghi nhãn dữ liệu đào tạo cho những mô hình trong tương lai.

Trong một loạt thí nghiệm của nhóm nghiên cứu, các nhà khoa học đã nhận thấy rằng mô hình trí tuệ nhân tạo Semantically Thinned Edge Alignment Learning (STEAL) có thể giúp cải thiện độ chính xác của mô hình dự đoán “ranh giới ngữ nghĩa” CASENet hiện đại lên thêm 4%. Khả năng nhận dạng chính xác hơn về ranh giới cũng như góc cạnh của một đối tượng có thể mang lại ứng dụng thiết thực cho các tác vụ thuộc về thị giác máy tính, từ việc tạo dựng hình ảnh cho đến tái tạo không gian 3D để phát hiện đối tượng.

5 bộ óc thiên tài trong lĩnh vực AI cùng bắt tay tạo ra những chú robot tuyệt vời

Semantically Thinned Edge Alignment Learning (STEAL)

STEAL có thể được áp dụng để cải thiện các CNN hiện tại hoặc những mô hình phát hiện góc cạnh vật thể, tuy nhiên các nhà nghiên cứu cũng tin rằng nó còn có thể giúp họ gắn nhãn hoặc chú thích dữ liệu hiệu quả hơn cho các mô hình thị giác máy tính. Để chứng minh luận điểm này, các nhà khoa học đã sử dụng phương pháp STEAL để tinh chỉnh Cityscapes - một bộ dữ liệu có nội dung liên quan đến môi trường đô thị - được giới thiệu lần đầu tiên tại hội nghị về Thị giác Máy tính và Nhận dạng Mẫu vật thể (Computer Vision and Pattern Recognition - CVPR) năm 2016.

Hiện tại trên GitHub, framework STEAL đã có thể tìm hiểu và dự đoán tương đối chính xác từng góc cạnh của đối tượng bằng pixel theo phương pháp mà các nhà nghiên cứu gọi là “active alignment”. Lý luận rõ ràng về nhiễu chú thích trong quá trình đào tạo, đồng thời công thức thiết lập mức độ cho các mạng thần kinh trong việc học tập từ những biểu nhãn bị sai lệch theo kiểu từ đầu đến cuối cũng giúp tạo ra kết quả này.

MIT nỗ lực phát triển mô hình AI có thể lái xe gần giống như con người

Khả năng nhận dạng chính xác hơn về ranh giới, góc cạnh của một đối tượng

"Chúng tôi sẽ tiếp tục chỉ ra rằng các ranh giới dự đoán của mình hiệu quả hơn đáng kể so với các ranh giới dự đoán thu được từ những dữ liệu đầu ra thuộc phân đoạn DeepLab-v3 mới nhất, trong khi chỉ sử dụng kiến trúc nhẹ hơn nhiều”, đại diện nhóm nghiên cứu cho biết trong một cuộc phỏng vấn chuyên sâu với trang tin arXiv.

Công trình nghiên cứu này được đặt tên là: “Devil is in the Edges: Learning Semantic Boundaries from Noisy Annotations” (tạm dịch: Học các ranh giới ngữ nghĩa từ nhiễu chú thích), và sẽ được giới thiệu rộng rãi thông qua một bài thuyết trình trong khuôn khổ hội nghị CVPR 2019 đang diễn ra ở Long Beach, California. Các chuyên gia đến từ Nvidia Research đã có đóng góp khá lớn cho công trình nghiên cứu này, và họ cũng sẽ trình bày cụ thể về nghiên cứu từ góc nhìn cá nhân tại CVPR năm nay.

Trí tuệ nhân tạo của Nhật Bản đã tạo ra được những người mẫu thời trang ảo siêu chân thực

Nvidia AI

Theo một tin tức mới được ghi nhận, Nvidia cho biết họ sẽ hỗ trợ các hệ thống phần cứng máy tính hiệu năng cao từ nhà sản xuất Arm của Anh vào năm 2020, đồng thời mở nguồn phần mềm suy luận phân tích cú pháp TensorRT trên Github để cho phép tùy biến nhiều hơn.

Thứ Tư, 19/06/2019 11:00

5 ★ 2 👨 232

#nVIDIA

Bạn nên đọc

Xác thực tài khoản!

Theo Nghị định 147/2024/ND-CP, bạn cần xác thực tài khoản trước khi sử dụng tính năng này. Chúng tôi sẽ gửi mã xác thực qua SMS hoặc Zalo tới số điện thoại mà bạn nhập dưới đây:

Số điện thoại chưa đúng định dạng!

0 Bình luận

Sắp xếp theo

Xóa Đăng nhập để Gửi

Cũ vẫn chất

Xem thêm

Giấy phép số 362/GP-BTTTT. Bộ Thông tin và Truyền thông cấp ngày 30/06/2016. Cơ quan chủ quản: CÔNG TY CỔ PHẦN MẠNG TRỰC TUYẾN META. Địa chỉ: 56 Duy Tân, Phường Cầu Giấy, Hà Nội. Điện thoại: 024 2242 6188. Email: info@meta.vn. Chịu trách nhiệm nội dung: Lê Ngọc Lam.

STEAL AI của Nvidia mang lại khả năng hỗ trợ suy luận cho các mô hình thị giác máy tính tốt hơn

Phạm Hải

Bạn nên đọc

Trí tuệ nhân tạo giờ đây cũng có thể lập trình

Cách tạo website cơ bản trên Cursor

Các nhà nghiên cứu IBM phân tích cấu trúc tế bào ung thư vú bằng AI

Nếu AI có thể làm mọi thứ, tại sao chúng ta vẫn cần học?

Hướng dẫn tạo website cơ bản trên Cursor

Cách tạo sổ ghi chú mới ngay trong Gemini

Khám phá cổng trải nghiệm trí tuệ nhân tạo VTCC.Ai của Trung tâm không gian mạng

Hướng dẫn chuyển file PDF kiểm tra thành slide bài giảng bằng Gemini

Train-to-Test Scaling là gì? Cách tối ưu chi phí AI từ training đến inference

Cũ vẫn chất

Những bài thơ tán gái theo tên, thơ làm quen bạn gái vừa duyên vừa mặn

Những ứng dụng hoán đổi khuôn mặt tốt nhất

Cách sửa lỗi gõ tiếng Việt trên Word, Excel

Hướng dẫn 5 cách chuyển số thành chữ trong Excel

Cách tính điểm trung bình môn HK 1, HK 2, cả năm

Cách tạo bảng trong Canva

Công thức tính diện tích xung quanh hình nón, diện tích toàn phần hình nón, thể tích hình nón, V nón

Cap đi du lịch hay, stt du lịch hay giúp bạn ghi lại nhật ký hành trình của mình

Cách tạo Slide Master trên PowerPoint

6 cách siêu dễ thêm phụ đề, caption vào video