Hàm IMPORTXML: Tự động lấy bảng dữ liệu về Google Sheets
IMPORTXML là một hàm xử lý dữ liệu hữu ích trong Google Sheets. Dưới đây là cách dùng IMPORTXML tự động hóa quá trình nhập dữ liệu trong Google Sheets.
IMPORTXML trong Google Sheets là gì?
Công thức của hàm IMPORTXML trong Google Sheets như sau:
=IMPORTXML(url, xpath_query)
Hàm IMPORTXML nhập dữ liệu từ bất kỳ kiểu dữ liệu có cấu trúc khác nhau, bao gồm XML, HTML, CSV, TSV, RSS và ATOM XML.
Nó lấy thông tin từ mọi trường XML. Bạn có thể dùng nó để nhập thông tin công khai có sẵn trên Internet. Vì thế, bạn không được phép dùng nó với web phải đăng nhập để truy cập.
Khi nào dùng IMPORTXML trong Google Sheets?
- Trích xuất dữ liệu trên web
- Khi cần dữ liệu trên trang nhưng không thể kích hoạt Screaming Frog
Cách dùng IMPORTXML trong Google Sheets
Trước khi đi sâu và cách dùng IMPORTXML thực tế, bạn cần hiểu các đối số trong công thức:
URL
- Là URL của trang web bạn muốn nhập dữ liệu.
- Bao gồm giao thức (https:// hoặc http://).
- Phải bao gồm giá trị của URL trong dấu trích dẫn hoặc tham chiếu tới một ô chứa văn bản phù hợp.
XPath Query
- Truy vấn XPath chạy trên dữ liệu của URL được cung cấp.
- Mỗi kết quả từ truy vấn XPath được đặt trong hàng riêng của bảng tính.
- XPath là một ngôn ngữ query được dùng để lấy các phần thông tin trên web.
- Nó có cú pháp riêng mà bạn có thể tìm hiểu chi tiết từ các nguồn online.
Điều cần biết về XPath:
- Dữ liệu trên web được hiển thị và lưu ở định dạng XML.
- Ngôn ngữ truy vấn dữ liệu.
- Có thể tùy biến các đối số Xpath theo điều bạn đang tìm kiếm trong web.
Hàm IMPORTXML cho phép bạn nhập dữ liệu trực tiếp từ web vào bảng tính. Bạn chỉ cần nhìn vào mã nguồn của web tại vị trí muốn nhập dữ liệu, tìm thành phần HTML có thể dùng và trích xuất nó bằng các truy vấn XPath.
Để tìm thành phần HTML, bạn phải nhìn vào code trang web. Ví dụ, tới một trang wiki, click chuột phải vào trang và nhấn View page source trong menu hiện ra. Khi trang nguồn mở, bạn sẽ thấy code HTML của nó. Ví dụ, trên web Wikipedia:
Có thể bạn đã quen với tab HTML như <h2>, <p>, <a>… Bạn cần dùng những tag này trong xpath_query để nhập dữ liệu mong muốn từ web.
Ví dụ về cách dùng IMPORTXML trong Google Sheets:
Trên đây là những điều bạn cần biết về cách dùng IMPORTXML trong Google Sheets. Hi vọng bài viết hữu ích với các bạn.
Bạn nên đọc
-
Cách dùng Format Painter trong Google Sheets
-
Định dạng đường viền trong Google Sheets
-
Sắp xếp và lọc dữ liệu
-
Cài đặt vị trí trong Google Sheets
-
Dấu ngoặc đơn trong Google Sheets
-
Tìm hiểu về các định dạng số
-
Làm việc với các hàm
-
Google Sheets: Những điều cần biết trước khi sử dụng
-
Cách dùng phép cộng trong Google Sheets
Cũ vẫn chất
-
30 lời chúc sinh nhật chồng yêu ý nghĩa và ngọt ngào
Hôm qua 1 -
Đấu Trường Chân Lý Mobile (TFT Mobile)
-
200+biệt danh cho người yêu hay và hài hước
Hôm qua 5 -
Bạn đã sử dụng keo tản nhiệt đúng cách?
Hôm qua -
Khắc phục lỗi mạng WiFi không hiển thị trên Windows 10
Hôm qua -
5 cách tắt Update Windows 11, ngừng cập nhật Win 11
Hôm qua 14 -
Những câu nói hay về mùa thu, lời chào mùa thu hay và ý nghĩa
Hôm qua -
Cách viết số mũ trong Excel, viết chỉ số trên, chỉ số dưới trong Excel
Hôm qua -
Cách sửa file MP4 bị hỏng với thủ thuật đơn giản
Hôm qua -
Cách khởi động và dừng các dịch vụ trong MS SQL Server
Hôm qua