Google Photos hiện cho phép tìm kiếm hình ảnh bằng văn bản, trích xuất văn bản trong hình ảnh

Gã khổng lồ Mountain View mới đây đã đưa ra một thông báo rất đáng chú ý trên Twitter: Công ty đang tích cực nâng cấp cũng như triển khai các tính năng AI mới cho nền tảng Lens, nhằm tạo điều kiện cho người dùng có thể quản lý thư viện Google Photos để thực hiện việc tìm kiếm những bức ảnh lưu trữ trong thư viện ảnh Google Photos thông qua câu, từ, đoạn văn bản chứa đựng trong những bức ảnh này. Sau đó, bạn sẽ có thể dễ dàng sao chép và dán đoạn văn bản vào một ghi chú, tài liệu hoặc biểu mẫu.

Google Photos Google Photos được bổ sung thêm khả năng tìm kiếm hình ảnh bằng văn bản, trích xuất văn bản trong hình ảnh

Theo giải thích từ phía Google, cả hai tính năng mới này đều sử dụng một kỹ thuật được gọi là nhận dạng ký tự quang học (optical character recognition - OCR), kết hợp với tùy chọn copy/paste dựa trên các tính năng nhận diện và xử lý văn bản trong hình ảnh đã được tích hợp sẵn trên Lens, từ đó giúp hệ thống hiểu nội dung của văn bản và trích xuất được đoạn văn bản chứa đựng trong các hình ảnh (có thể là ảnh chụp thông thường và cả ảnh chụp màn hình).

Theo báo cáo từ trang tin 9to5Google, tính năng này hiện đã có sẵn trên một số thiết bị Android, nhưng có vẻ như trên iOS thì chưa. Nếu muốn trải nghiệm, bạn có thể sử dụng tính năng này trên phiên bản website của Lens.

Google đang cố gắng tinh chính các tính năng của Lens trở thành một phương thức hỗ trợ người dùng tìm kiếm mật khẩu truy cập mạng WiFi dễ dàng hơn, cùng với đó là trở thành một công cụ trích xuất văn bản “chuyên nghiệp”, có thể trích dẫn bất cứ câu, từ, đoạn văn bản nào xuất hiện trên những hình ảnh đang được lưu trữ trên thư viện Google Photos của người dùng, trong từng trường hợp cụ thể.

Tài khoản Twitter @hunterwalk phát hiện ra những tính năng mới được cập nhật trên Google PhotosTài khoản Twitter @hunterwalk phát hiện ra những tính năng mới được cập nhật trên Google Photos

Tuy nhiên, điều ấn tượng hơn cả là khả năng tìm kiếm bất kỳ đoạn văn bản nào mà không phải chọn cụ thể hình ảnh từ trước. Điều này cho thấy rằng Google đã ứng dụng rất tốt OCR để quét toàn bộ những hình ảnh mà bạn đang lưu trữ trong thư viện.

“Bắt đầu từ tháng này, chúng tôi sẽ giới thiệu tính năng tìm kiếm ảnh lưu trữ trong thư viện Google Photos bằng văn bản chứa đựng trong bức ảnh đó. Sau khi đã tìm thấy bức ảnh mà mình đang cần, bạn có thể nhấp vào nút Lens để dễ dàng sao chép và dán đoạn văn bản đó vào bất cứ đâu, tính năng này hứa hẹn mang đến khả năng trích xuất mật khẩu wifi dễ dàng hơn” Google phản hồi lại phát hiện của tài khoản @hunterwalk trên Twitter.

Google phản hồi lại phát hiện của tài khoản @hunterwalk trên TwitterGoogle phản hồi lại phát hiện của tài khoản @hunterwalk trên Twitter

Nếu xem xét kỹ, tính năng mới này của Google có khá nhiều điểm tương đồng với một tính năng mà Google đã từng “úp mở” trong khuôn khổ sự kiện I/O 2017. Ở thời điểm đó, CEO Sundar Pichai đã không giấu nổi niềm vui sướng, đến mức phải “khoe” ngay trên khấu I/O rằng đội ngũ của ông nhiều khả năng sẽ phát triển thành công một tính năng “vô cùng tuyệt vời”, có thể thông qua Lens để hiểu được mọi nội dung ẩn chứa trong một tấm ảnh. Cùng với đó, người dùng hoàn toàn có thể dùng camera trên smartphone và chụp lại mật khẩu được dán trên router WiFi, phần mềm sẽ đọc mật khẩu và hiểu rằng bạn muốn kết nối với mạng WiFi này, từ đó nhanh chóng cho phép bạn đăng nhập.

Cho phép đăng nhập mạng WiFi thông qua mật khẩu được dán trên routerCho phép đăng nhập mạng WiFi thông qua mật khẩu được dán trên router

Kể từ thời điểm đó, Google đã âm thầm phát triển tính năng này, đồng thời cải tiến và bổ sung thêm tính năng tìm kiếm các hình ảnh trên web, thêm thông tin liên lạc từ danh thiếp (card visit) vào danh bạ, cùng với tất cả những gì có liên quan đến OCR.

Nhìn chung với sự xuất hiện của tính năng mới này, có thể thấy các mô hình AI ứng dụng trên Lens dường như đã được cải tiến và phát triển mạnh mẽ hơn rất nhiều so với 2 năm trước đây. Đồng thời AI cũng đã được triển khai với quy mô lớn hơn, áp dụng được trên toàn bộ thư viện của người dùng để hỗ trợ khả năng tìm kiếm cũng như trích xuất văn bản trong chính bức ảnh đó - vô cùng tuyệt vời!

Thứ Năm, 29/08/2019 08:21
54 👨 289