Liệu những chiếc xe hơi tự hành hiện đại trong tương lai có thể thực sự phân biệt được chính xác các vật thể trong khi tham gia giao thông, chẳng hạn như giữa xe hơi, xe tải và người đi bộ dựa trên dữ liệu radar không? Hoàn toàn có thể, và tất cả nhờ là vào AI. Trong một bài nghiên cứu mới được công bố trên trang Arxiv.org vào tuần trước với tiêu đề: “Radar-based Road User Classification and Novelty Detection with Recurrent Neural Network Ensembles“ (tạm dịch: Phân loại vật thể trong thực tế tham gia giao thông và phát hiện mới lạ dựa trên Mạng nơ-ron tái phát), các nhà khoa học đến từ tập đoàn ô tô Daimler và Đại học Kassel, Đức đã mô tả chi tiết một framework học máy mới lạ có thể phân loại rõ ràng các cá nhân cũng như phương tiện đang tham gia giao thông chỉ bằng dữ liệu thu được thông qua hệ thống radar trang bị trên xe. Không cần giới thiệu cũng có thể thấy rằng mô hình này đặc biệt thích hợp để ứng dụng trong ngành công nghiệp ô tô nói riêng và lĩnh vực giao thông vận tải nói chung, trong đó, xe tự hành có lẽ sẽ là khía cạnh được hưởng lợi nhiều nhất.
“Hiệu suất phân loại tổng thể có thể được cải thiện đáng kể khi so sánh với các phương pháp nhận diện vật thể hiện nay và ngoài ra, số lượng vật thể nhận diện được cũng sẽ nhiều hơn, đi kèm với đó là sự cải thiện rõ rệt vệ mức độ chính xác”, nhóm nghiên cứu cho biết. Bên cạnh đó, theo giải thích của các nhà khoa học, radar là một trong số ít các loại cảm biến có thể trực tiếp đo được vận tốc từ nhiều vật thể trong tầm nhìn và đặc biệt nó mạnh mẽ hơn nhiều so với các loại cảm biến khác khi hoạt động trong các điều kiện thời tiết bất lợi như sương mù, tuyết rơi hoặc mưa lớn. Tuy nhiên, ít thiết bị nào có thể hoàn hảo 100% và cảm biến radar cũng không phải ngoại lệ. Nó sở hữu độ phân giải góc tương đối thấp so với hầu hết các loại cảm biến khác, dẫn đến việc khó có thể thể hiện dữ liệu dày đặc và rõ ràng trên màn hình.
Giải pháp của nhóm nghiên cứu trong trường hợp này là sử dụng một tập hợp các công cụ phân loại bao gồm 80 tế bào bộ nhớ ngắn hạn (long short-term memory - LSTM) hoặc các mạng thần kinh tái phát đặc biệt (đây là các hàm toán học xếp lớp bắt chước theo cấu trúc nơ-ron sinh học - một kỹ thuật trong công nghệ học sâu) có khả năng học cũng như ghi nhớ các thành phần phụ thuộc dài hạn. Đặc biệt, các nhà khoa học chỉ cần sử dụng một tập hợp con gồm 98 đặc điểm - cụ thể là những dẫn xuất thống kê về phạm vi, góc, biên độ, Doppler; đặc điểm hình học, và các tính năng liên quan đến phân phối giá trị Doppler - để xác định sự khác biệt chính giữa các đối tượng cần nhận diện, đồng thời không yêu cầu sức mạnh tính toán, xử lý quá cao trong quá trình đào tạo và suy luận mô hình.
Để đào tạo các mô hình học máy này, nhóm nghiên cứu đã tìm ra một bộ dữ liệu chứa hơn 3 triệu điểm dữ liệu của trên 3.800 trường hợp người tham gia giao thông trong thực tế. Các mẫu đào tạo này được thu nhận thông qua 4 cảm biến radar được gắn ở phần nửa trước của chiếc xe thử nghiệm (với tầm tác dụng khoảng 100 mét). Sau khi được đào tạo, kết quả là các mô hình phân loại dựa trên học máy này đã có thể sắp xếp các vật thể mà nó phát hiện được, bao gồm: người đi bộ, nhóm người đi bộ, xe đạp, xe hơi, xe tải và rác thải, vào những danh mục tương ứng với độ chính xác tương đối cao.
Cụ thể, danh mục “pedestrian group” sẽ được gán cho những dữ liệu về người đi bộ mà trong đó, hệ thống không thể nhận dạng được sự tách biệt rõ ràng giữa hình ảnh của từng cá nhân thu được thông qua dữ liệu radar. Mặt khác, danh mục “garbage” và “other” sẽ bao gồm các vật thể lạ và phương tiện tham gia giao thông mà hệ thống không thể nhận dạng được, hoặc nhận dạng sai. Nói cách khác, các vật thể được xếp vào 2 danh mục này được đánh giá là không phù hợp với bất kỳ nhóm phân loại nào khác đã nói ở trên (chẳng hạn như người đi xe máy, xe tay ga, xe lăn, cáp treo và chó mèo).
Vậy thì hệ thống phân loại tiên tiến này có độ chính xác ra sao và liệu có thể sớm được ứng dụng đại trà trong tương lai gần? Theo các nhà nghiên cứu, chúng có độ chính xác trung bình lên tới 91.46% trong các đối tượng được phân loại và thậm chí còn chính xác hơn khi chia sẻ cùng một tập hợp đặc điểm. Rõ ràng, hầu hết các lỗi phân loại thường xảy ra giữa người đi bộ và nhóm người đi bộ do những đặc điểm tương đồng phức tạp giữa 2 danh mục này. Đồng thời cũng có một số trường hợp nhầm lẫn khác liên quan đến đặc điểm, hình dáng của vật thể. Ví dụ, hệ thống có thể nhận diện sai giữa một người ngồi xe lăn và người đi xe máy scooter cỡ nhỏ.
Tạm gác lại những sai sót không quá đáng kể nêu trên, nhóm nghiên cứu tin rằng cấu trúc đề xuất này có thể cho phép đưa ra những hiểu biết mới về tầm quan trọng của các đặc điểm đối với việc nhận dạng giữa nhiều danh mục riêng lẻ, điều rất quan trọng cho sự phát triển của các thuật toán mới cũng như yêu cầu đối với hệ thống cảm biến. Bên cạnh đó, khả năng nhận diện các đối tượng một cách linh hoạt từ nhiều danh mục khác nhau với các đối tượng được thấy trong dữ liệu đào tạo cũng đóng vai trò quan trọng trong việc phát triển công nghệ xe tự hành nói chung.
Trong tương lai, các nhà khoa học có kế hoạch nâng cao kết quả hiện tại bằng cách áp dụng các kỹ thuật xử lý tín hiệu độ phân giải cao, có thể giúp tăng độ phân giải radar về mặt phạm vi tác động, góc tác động và Doppler.