Hàm IMPORTXML: Tự động lấy bảng dữ liệu về Google Sheets

IMPORTXML là một hàm xử lý dữ liệu hữu ích trong Google Sheets. Dưới đây là cách dùng IMPORTXML tự động hóa quá trình nhập dữ liệu trong Google Sheets.

IMPORTXML trong Google Sheets là gì?

Công thức của hàm IMPORTXML trong Google Sheets như sau:

=IMPORTXML(url, xpath_query)

Hàm IMPORTXML nhập dữ liệu từ bất kỳ kiểu dữ liệu có cấu trúc khác nhau, bao gồm XML, HTML, CSV, TSV, RSS và ATOM XML.

Nó lấy thông tin từ mọi trường XML. Bạn có thể dùng nó để nhập thông tin công khai có sẵn trên Internet. Vì thế, bạn không được phép dùng nó với web phải đăng nhập để truy cập.

Khi nào dùng IMPORTXML trong Google Sheets?

  • Trích xuất dữ liệu trên web
  • Khi cần dữ liệu trên trang nhưng không thể kích hoạt Screaming Frog

Cách dùng IMPORTXML trong Google Sheets

Trước khi đi sâu và cách dùng IMPORTXML thực tế, bạn cần hiểu các đối số trong công thức:

Công thức hàm IMPORTXML trong Google Sheets

URL

  • Là URL của trang web bạn muốn nhập dữ liệu.
  • Bao gồm giao thức (https:// hoặc http://).
  • Phải bao gồm giá trị của URL trong dấu trích dẫn hoặc tham chiếu tới một ô chứa văn bản phù hợp.

XPath Query

  • Truy vấn XPath chạy trên dữ liệu của URL được cung cấp.
  • Mỗi kết quả từ truy vấn XPath được đặt trong hàng riêng của bảng tính.
  • XPath là một ngôn ngữ query được dùng để lấy các phần thông tin trên web.
  • Nó có cú pháp riêng mà bạn có thể tìm hiểu chi tiết từ các nguồn online.

Điều cần biết về XPath:

  • Dữ liệu trên web được hiển thị và lưu ở định dạng XML.
  • Ngôn ngữ truy vấn dữ liệu.
  • Có thể tùy biến các đối số Xpath theo điều bạn đang tìm kiếm trong web.

Hàm IMPORTXML cho phép bạn nhập dữ liệu trực tiếp từ web vào bảng tính. Bạn chỉ cần nhìn vào mã nguồn của web tại vị trí muốn nhập dữ liệu, tìm thành phần HTML có thể dùng và trích xuất nó bằng các truy vấn XPath.

Để tìm thành phần HTML, bạn phải nhìn vào code trang web. Ví dụ, tới một trang wiki, click chuột phải vào trang và nhấn View page source trong menu hiện ra. Khi trang nguồn mở, bạn sẽ thấy code HTML của nó. Ví dụ, trên web Wikipedia:

Ví dụ trên web Wikipedia

Có thể bạn đã quen với tab HTML như <h2>, <p>, <a>… Bạn cần dùng những tag này trong xpath_query để nhập dữ liệu mong muốn từ web.

Ví dụ về cách dùng IMPORTXML trong Google Sheets:

Dùng IMPORTXML trên Google Sheets để lấy bảng xếp hạng bóng đá
Dùng IMPORTXML trên Google Sheets để lấy bảng xếp hạng bóng đá
Ví dụng dùng IMPORTXML đơn giản nhất
Ví dụng dùng IMPORTXML đơn giản nhất
Dùng IMPORTXML với nhiều biến
Dùng IMPORTXML với nhiều biến

Trên đây là những điều bạn cần biết về cách dùng IMPORTXML trong Google Sheets. Hi vọng bài viết hữu ích với các bạn.

Thứ Sáu, 03/03/2023 11:49
51 👨 1.296
0 Bình luận
Sắp xếp theo
    ❖ Google Sheets