Hàm IMPORTXML: Tự động lấy bảng dữ liệu về Google Sheets
IMPORTXML là một hàm xử lý dữ liệu hữu ích trong Google Sheets. Dưới đây là cách dùng IMPORTXML tự động hóa quá trình nhập dữ liệu trong Google Sheets.
IMPORTXML trong Google Sheets là gì?
Công thức của hàm IMPORTXML trong Google Sheets như sau:
=IMPORTXML(url, xpath_query)
Hàm IMPORTXML nhập dữ liệu từ bất kỳ kiểu dữ liệu có cấu trúc khác nhau, bao gồm XML, HTML, CSV, TSV, RSS và ATOM XML.
Nó lấy thông tin từ mọi trường XML. Bạn có thể dùng nó để nhập thông tin công khai có sẵn trên Internet. Vì thế, bạn không được phép dùng nó với web phải đăng nhập để truy cập.
Khi nào dùng IMPORTXML trong Google Sheets?
- Trích xuất dữ liệu trên web
- Khi cần dữ liệu trên trang nhưng không thể kích hoạt Screaming Frog
Cách dùng IMPORTXML trong Google Sheets
Trước khi đi sâu và cách dùng IMPORTXML thực tế, bạn cần hiểu các đối số trong công thức:
URL
- Là URL của trang web bạn muốn nhập dữ liệu.
- Bao gồm giao thức (https:// hoặc http://).
- Phải bao gồm giá trị của URL trong dấu trích dẫn hoặc tham chiếu tới một ô chứa văn bản phù hợp.
XPath Query
- Truy vấn XPath chạy trên dữ liệu của URL được cung cấp.
- Mỗi kết quả từ truy vấn XPath được đặt trong hàng riêng của bảng tính.
- XPath là một ngôn ngữ query được dùng để lấy các phần thông tin trên web.
- Nó có cú pháp riêng mà bạn có thể tìm hiểu chi tiết từ các nguồn online.
Điều cần biết về XPath:
- Dữ liệu trên web được hiển thị và lưu ở định dạng XML.
- Ngôn ngữ truy vấn dữ liệu.
- Có thể tùy biến các đối số Xpath theo điều bạn đang tìm kiếm trong web.
Hàm IMPORTXML cho phép bạn nhập dữ liệu trực tiếp từ web vào bảng tính. Bạn chỉ cần nhìn vào mã nguồn của web tại vị trí muốn nhập dữ liệu, tìm thành phần HTML có thể dùng và trích xuất nó bằng các truy vấn XPath.
Để tìm thành phần HTML, bạn phải nhìn vào code trang web. Ví dụ, tới một trang wiki, click chuột phải vào trang và nhấn View page source trong menu hiện ra. Khi trang nguồn mở, bạn sẽ thấy code HTML của nó. Ví dụ, trên web Wikipedia:
Có thể bạn đã quen với tab HTML như <h2>, <p>, <a>… Bạn cần dùng những tag này trong xpath_query để nhập dữ liệu mong muốn từ web.
Ví dụ về cách dùng IMPORTXML trong Google Sheets:
Trên đây là những điều bạn cần biết về cách dùng IMPORTXML trong Google Sheets. Hi vọng bài viết hữu ích với các bạn.
Bạn nên đọc
-
Tìm hiểu về Google Sheets mới
-
Google Sheets: Những điều cần biết trước khi sử dụng
-
Cách dùng Format Painter trong Google Sheets
-
Dấu ngoặc đơn trong Google Sheets
-
Định dạng đường viền trong Google Sheets
-
Sắp xếp và lọc dữ liệu
-
Cài đặt vị trí trong Google Sheets
-
Các loại tham chiếu ô
-
Cách dùng phép cộng trong Google Sheets
Cũ vẫn chất
-
Tổng hợp câu hỏi Nhanh như chớp mùa 2
Hôm qua -
Cách đổi công cụ tìm kiếm trên Safari
Hôm qua -
Cách dọn dẹp và khôi phục không gian trên ổ C Windows
Hôm qua -
Làm thế nào để kiểm tra nhiệt độ CPU của máy tính?
Hôm qua -
Hướng dẫn cách chơi, lên đồ Natalya mùa S1 2023
Hôm qua -
Cách tạo brush tùy chỉnh trong Photoshop
Hôm qua -
Hướng dẫn chơi Rung Cây vàng Trúng Cây vàng trên My Viettel
Hôm qua -
Tổng hợp cách tạo mật khẩu mạnh và quản lý mật khẩu an toàn nhất
Hôm qua -
Khóa ngoại Foreign Key trong SQL Server
Hôm qua 5 -
Căn bậc 2, cách tính căn bậc 2
Hôm qua