Các nhà nghiên cứu sử dụng thị giác máy tính để hiểu rõ hơn về ảo ảnh quang học

Ảo ảnh quang học (Optical illusions) - những hình ảnh có thể đánh lừa mắt người, là một chủ đề nghiên cứu hấp dẫn đối với các nhà khoa học trong nhiều năm trở lại đây, đơn giản là bởi nghiên cứu về chúng có thể giúp cung cấp cái nhìn sâu sắc, có giá trị hơn trong việc đánh giá năng lực nhận thức và khả năng tri giác của con người. Các nhà khoa học tại Đại học Flinder, Úc, gần đây đã thực hiện một nghiên cứu rất thú vị, liên quan đến việc sử dụng mô hình thị giác máy tính (computer vision) để đưa ra các dự đoán về sự tồn tại của ảo ảnh quang học và mức độ ảnh hưởng của chúng đối với nhận thức của con người.

Trong suốt thập kỷ qua, các nhà nghiên cứu đã đạt được khá nhiều sự hiểu biết mang tính sinh học ngày càng chi tiết về cách thức não bộ của con người xử lý các kích thích thị giác. Nhiều mô hình thị giác máy tính hiện tại cũng đã được lấy cảm hứng từ những sự những hiểu biết đã có về xử lý hình ảnh. Tuy nhiên, một số khía cạnh khác của xử lý hình ảnh hiện vẫn chưa được hiểu rõ và gây ra mâu thuẫn giữa nhiều nhà khoa học.

Ảo ảnh

Theo giải thích của các nhà nghiên cứu trong bài báo được công bố trên tạp chí khoa học arXiv thì xử lý thị giác bắt đầu bằng cảm giác của các khu vực tiếp nhận thông tin trên võng mạc (RF) thông qua ánh sáng chiếu vào mắt. Trong đó, các tế bào hạch võng mạc (RGCs) là các tế bào thần kinh chịu trách nhiệm xử lý tín hiệu mà võng mạc thu nhận được, cụ thể là chuyển đổi từ các thông tin lớp plexiform bên trong (IPL) và mang tín hiệu thị giác đó đến não. Sự đa dạng của các loại RGC và sự phụ thuộc kích thước của từng loại cụ thể vào độ lệch tâm (khoảng cách đến hố mắt) là bằng chứng sinh lý cho thấy khả năng mã hóa đa hình ảnh của thị giác trong võng mạc. Do đó, các mô hình tính toán mức độ thấp của tầm nhìn võng mạc đã được đề xuất dựa trên việc lấy mẫu đồng thời ảnh thị giác ở nhiều tỷ lệ khác nhau.

Các nghiên cứu được tiến hành trong quá khứ đã giới thiệu một mô hình để phát hiện các góc nghiêng ảo giác trong ảo ảnh Café Wall (Café Wall illusion), phát sinh từ sự tương phản của nền và tín hiệu nghiêng. Trong nghiên cứu của mình, các nhà khoa học tại Đại học Flinder đã khái quát phương pháp này nhằm bao quát hóa một phạm vi rộng hơn của ảo ảnh hình học (geometric illusions), cũng như ảo ảnh xếp cạnh (tile illusions) phức tạp hơn.

"Chúng tôi khám phá phản ứng của một mô hình sinh học đơn giản về thị giác ở mức độ thấp đối với ảo ảnh hình học/xếp cạnh, tái tạo sự hiểu lầm gây ảo giác về hình học mà đã được báo cáo trong trường hợp của Café Wall và một số ảo ảnh về xếp cạnh khác. Tuy nhiên mô hình này cho đến nay vẫn chưa được xác minh để có thể khái quát cho những ảo ảnh khác”, các nhà khoa học chia sẻ.

"Chúng tôi khám phá phản ứng của một mô hình sinh học đơn giản về tầm nhìn ở mức độ thấp đối với ảo ảnh hình học/xếp cạnh"

Trong nghiên cứu của mình, các nhà khoa học đã đánh giá một mô hình lọc tính toán được thiết kế để mô hình hóa sự ức chế của các tế bào hạch võng mạc và phản ứng của chúng đối với các ảo giác hình học khác nhau. Bằng việc áp dụng phương pháp này, các nhà khoa học hy vọng sẽ đạt được sự hiểu biết rõ ràng hơn về những ảo ảnh này, cũng như dự đoán được mức độ ảnh hưởng của chúng ra sao.

"Mặc dù sự hiểu lầm về định hướng trong ảo giác nghiêng (tilt illusions) nói chung có thể gợi ý cho các giải thích sinh lý liên quan đến các tế bào chọn lọc định hướng trong vỏ não, nhưng công việc của chúng tôi sẽ có thể cung cấp bằng chứng cho một lý thuyết rằng sự xuất hiện của độ nghiêng trong các mẫu này được bắt đầu trước khi các tế bào chọn định hướng làm việc, như là kết quả của các cơ chế mã hóa tế bào đơn giản võng mạc/vỏ não đã biết”.

Nhìn chung, những phát hiện thu thập được trong nghiên cứu này cho thấy sự khác biệt của Gaussian (DoG), một bộ lọc phát hiện các cạnh trong hình ảnh, ở nhiều tỷ lệ có thể giúp giải thích độ nghiêng cảm ứng trong ảo ảnh xếp cạnh, và đồng thời cũng có thể giúp phát hiện ra một số tín hiệu ảo giác được cảm nhận khi nhìn vào ảo ảnh hình học. Ngoài ra, các nhà nghiên cứu cũng có thể liên kết các quá trình từ dưới và nhận thức ở cấp độ cao hơn, theo cách phù hợp với lý thuyết về tầm nhìn và khả năng phát hiện cạnh của David Marr.

Các mô hình thị giác máy tính hiện tại để phân tích ảo ảnh hình học khá phức tạp, do đó chúng có thể khó được áp dụng hơn trong các nghiên cứu, và theo các nhà khoa học, những nghiên cứu trong tương lai nên cố gắng đưa ra các phương pháp ít phức tạp hơn và hợp lý hơn về mặt sinh học để phát hiện các tín hiệu thị giác.

Các mô hình thị giác máy tính hiện tại để phân tích ảo ảnh hình học khá phức tạp

"Chúng tôi tin rằng việc nghiên cứu sâu hơn về vai trò của các mô hình giống Gaussian đơn giản trong xử lý võng mạc ở mức độ thấp, nhân Gaussian trong các DNN giai đoạn đầu, và dự đoán về việc mất ảo giác sẽ dẫn đến các kỹ thuật và mô hình thị giác máy tính chính xác hơn, đồng thời cũng có thể điều khiển thị giác máy tính hướng tới hoặc tránh xa các đặc điểm mà con người đã phát hiện ra. Những hiệu ứng này có thể được đóng góp cho việc phát triển các mô hình độ sâu và xử lý chuyển động ở mức độ cao hơn, cũng như khái quát hóa cho sự hiểu biết máy tính về hình ảnh tự nhiên."

Chủ Nhật, 07/04/2019 15:12
4,73 👨 802
0 Bình luận
Sắp xếp theo
    ❖ Công nghệ mới