Các nhà nghiên cứu AI từ Phòng thí nghiệm Khoa học Máy tính và Trí tuệ Nhân tạo (CSAIL) thuộc Học viện Công nghệ Massachusetts (MIT) và Microsoft vừa bắt tay nhau tạo ra một thuật toán AI mới có thể tìm ra thông điệp ẩn giữa các bức tranh cổ đang được lưu giữ tại Bảo tàng Nghệ thuật Metropolitan và bảo tàng Amsterdam Rijksmuseum - điều mà các nhà nghiên cứu hội họa, sử học, khảo cổ học hàng đầu thế giới thậm chí còn chưa nghĩ tới.
Hệ thống AI này có tên MosAIc, được phát triển lấy cảmhứng từ triển lãm “Rembrandt và Velazquez” của bảo tàng Rijksmuseum, trong đó các bức tranh có vẻ khác nhau, nhưng trên thực tế có một số liên quan về cách giải thích hoặc phong cách đã được ghép nối một hoàn hảo để tạo ra những khái niệm mới.
Các nhà nghiên cứu đã tạo ra một thuật toán có khả năng phân tích hình ảnh tương tự như một truy vấn. Ví dụ, như ở các hình ảnh bên dưới, câu hỏi đặt ra cho thuật toán là: “Loại nhạc cụ nào có mối liên hệ gần nhất với bức tranh về chiếc váy màu xanh và trắng này?”. Thuật toán đã phát hiện ra rằng kết quả là một cây vĩ cầm bằng sứ màu xanh và trắng. Đồng thời điều này cũng chỉ ra sự trao đổi văn hóa giữa người Hà Lan (vĩ cầm) và người Trung Quốc (đồ sứ) - sự kiện hoàn toàn có thật trong lịch sử.
MosAIc về cơ bản có khá nhiều điểm tương đồng với thí nghiệm phân tách mức độ liên hệ giữa hai hình ảnh hoặc tác phẩm nghệ thuật thông qua một loạt các đặc điểm riêng lẻ mà Google đã từng thực hiện trước đây. Tuy nhiên, MosAIc chỉ cần 1 hình ảnh duy nhất để tìm ra những hình ảnh khác có phong cách tương tự. Thông qua dữ liệu là các hình ảnh đầu vào, thuật toán cố gắng bóc tách từng chi tiết để tìm kiếm các đặc điểm theo từng nền văn hóa khác nhau.
Mark Hamilton, tác giả chính của công trình nghiên cứu, cho biết việc xây dựng thuật toán là một thách thức lớn với nhóm của ông. Vì mục tiêu chính ở đây là tìm ra điểm liên quan giữa những hình ảnh không chỉ giống nhau về màu sắc và kiểu dáng, mà còn cả ý nghĩa và chủ đề.
Hamilton và các cộng sự đã sử dụng cấu trúc dữ liệu K-Recent Neighbor (KNN) mới, đặt các hình ảnh tương tự trong cấu trúc dạng biểu đồ cây và từ từ phân tích chúng cho đến khi tìm thấy kết quả phù hợp nhất. Thuật toán này sau đó được áp dụng cho các bộ sưu tập truy cập mở kết hợp của MET và Rijksmuseum.
Ngoài ra, các nhà nghiên cứu cũng phát hiện ra rằng phương pháp này có thể được áp dụng để tìm ra giới hạn của thuật toán deepfake dựa trên mạng tạo sinh (Generative Adversarial Network - GAN). Mặc dù vậy, không rõ liệu thuật toán có thể giúp phân biệt các hình ảnh deepfake với hình ảnh thật hay không.