Dịch ảnh sang văn bản, chuyển văn bản hình ảnh sang chữ dạng text

Khá dễ dàng để đọc phần văn bản trên một hình ảnh và tự gõ lại phần nội dung đó. Nhưng việc tự động lấy phần văn bản từ một bức ảnh khó khăn hơn một chút, và may mắn thay, imgclip là một giải pháp đơn giản để thực hiện việc này.

Công cụ dòng lệnh này chạy trong terminal trên Mac, Windows và Linux. Chỉ đơn giản là lấy một đối số cho file hình ảnh cùng với ngôn ngữ, sau đó trả về phần văn bản được sao chép vào clipboard.

Bạn có thể cài đặt toàn bộ thư viện dễ dàng thông qua npm. Thư viện này chỉ có dung lượng một vài KB và đi kèm với một file JS mà bạn có thể duyệt trên GitHub.

Imgclip sử dụng thư viện Tesseract.js để tự động xử lý hình ảnh và kéo văn bản qua OCR. Tesseract.js là một trong những thư viện OCR mạnh nhất cho đến nay và nó có mã nguồn mở hoàn toàn giống như imgclip.

Công cụ này gây ấn tượng mạnh nhất với người dùng nhờ chất lượng và tốc độ của nó. Imgclip thực sự làm rất tốt nhiệm vụ “kéo” văn bản ra khỏi hình ảnh và được đánh giá là một trong những công cụ đơn giản nhất để thực hiện việc này.

Cách trích xuất văn bản từ hình ảnh bằng imgclip

Lệnh imgclip phải được chạy trực tiếp trong terminal, theo sau là đường dẫn tương đối đến hình ảnh. Bạn cũng có thể thêm bốn tùy chọn vào cuối để tùy chỉnh đầu ra.

  • -h, --help: Xuất thông tin về việc sử dụng
  • -V, --version: Xuất số phiên bản
  • -l, --lang: Xuất ra ngôn ngữ của văn bản trong hình ảnh
  • -p, --print: In văn bản trong ảnh (thay vì sao chép vào clipboard)

Tính đến thời điểm viết bài này, Tesseract hỗ trợ 65 ngôn ngữ. Code mà bạn gắn vào thẻ --lang phải là code được sử dụng trong các file Tesseract đó.

Ví dụ, -l eng sẽ tìm kiếm văn bản tiếng Anh trong hình ảnh, còn -l jpn sẽ tìm kiếm văn bản tiếng Nhật. Thậm chí bạn có thể chạy -l jpn_vert để tìm kiếm văn bản tiếng Nhật theo chiều dọc.

Vì imgclip phụ thuộc rất nhiều vào Tesseract, nên về cơ bản, bạn có sức mạnh của toàn bộ thư viện đó.

Để bắt đầu, hãy truy cập trang GitHub và tải xuống một bản sao cục bộ hoặc cài đặt imgclip vào một thư mục cụ thể qua npm. Sau đó, bạn có thể chạy công cụ trong terminal như một ứng dụng để phân tích bất kỳ hình ảnh nào bạn muốn.

Chúc bạn thực hiện thành công!

Thứ Năm, 02/05/2019 08:14
52 👨 621