Search engine (công cụ tìm kiếm) là gì?

Công cụ tìm kiếm hoạt động bằng cách thu thập dữ liệu từ hàng tỷ trang bằng trình thu thập dữ liệu web. Còn được gọi là spider hoặc bot, trình thu thập thông tin điều hướng trên web và theo các liên kết để tìm trang mới. Các trang này sau đó được thêm vào một chỉ mục mà những công cụ tìm kiếm lấy kết quả từ đó.

Hiểu cách hoạt động của công cụ tìm kiếm rất quan trọng nếu bạn đang làm SEO. Rốt cuộc, thật khó để tối ưu hóa một thứ gì đó trừ khi bạn biết nó hoạt động như thế nào.

Phần 1: Những điều cơ bản về công cụ tìm kiếm

Hãy bắt đầu bằng cách khám phá công cụ tìm kiếm là gì, tại sao chúng tồn tại và cách chúng kiếm tiền.

Công cụ tìm kiếm là gì?

Công cụ tìm kiếm là cơ sở dữ liệu có thể tìm kiếm được về nội dung web. Chúng được tạo thành từ hai phần chính:

  • Chỉ mục tìm kiếm. Một thư viện kỹ thuật số thông tin về các trang web.
  • (Các) thuật toán tìm kiếm. (Các) chương trình máy tính có nhiệm vụ đối sánh kết quả từ chỉ mục tìm kiếm.

Mục đích của công cụ tìm kiếm là gì?

Mọi công cụ tìm kiếm đều nhằm mục đích cung cấp kết quả tốt và phù hợp nhất cho người dùng. Đó một phần là cách chúng giành được thị phần.

Công cụ tìm kiếm kiếm tiền như thế nào?

Công cụ tìm kiếm có hai loại kết quả tìm kiếm:

  • Kết quả không phải trả tiền từ chỉ mục tìm kiếm. Bạn không thể trả tiền để ở đây.
  • Kết quả được trả tiền từ các nhà quảng cáo. Bạn có thể trả tiền để được ở đây.

Mỗi khi ai đó nhấp vào kết quả tìm kiếm phải trả tiền, nhà quảng cáo sẽ trả tiền cho công cụ tìm kiếm. Đây được gọi là quảng cáo trả tiền cho mỗi lần nhấp chuột (PPC) và đó là lý do tại sao thị phần lại quan trọng. Nhiều người dùng hơn có nghĩa là nhiều nhấp chuột vào quảng cáo hơn và nhiều doanh thu hơn.

Công cụ tìm kiếm kiếm tiền như thế nào
Công cụ tìm kiếm kiếm tiền như thế nào

Phần 2: Cách công cụ tìm kiếm xây dựng chỉ mục

Mỗi công cụ tìm kiếm có quy trình riêng để xây dựng chỉ mục tìm kiếm. Dưới đây là phiên bản đơn giản hóa của quy trình mà Google sử dụng.

Cách Google xây dựng chỉ mục tìm kiếm của mình
Cách Google xây dựng chỉ mục tìm kiếm của mình

Hãy chia nhỏ mọi yếu tố để tìm hiểu rõ hơn.

URL

Mọi thứ bắt đầu với một danh sách URL đã biết. Google phát hiện ra những điều này theo nhiều cách, nhưng 3 cách phổ biến nhất là:

  • Từ các backlink. Google có chỉ mục của hàng trăm tỷ trang web. Nếu ai đó liên kết đến một trang mới từ một trang đã biết, Google có thể tìm thấy trang đó từ đó.
  • Từ sitemap. Sitemap cho Google biết những trang và file nào bạn cho là quan trọng trên trang web của mình.
  • Từ việc gửi URL. Google cho phép chủ sở hữu trang web yêu cầu thu thập dữ liệu các URL riêng lẻ trong Google Search Console.

Thu thập thông tin

Thu thập thông tin (Crawling) là nơi bot máy tính (spider) truy cập và tải xuống các URL đã biết. Trình thu thập thông tin của Google là Googlebot.

Xử lý và kết xuất

Quá trình xử lý là nơi Google làm việc để hiểu và trích xuất thông tin chính từ các trang được thu thập thông tin. Để làm điều này, nó phải hiển thị trang, đây là nơi nó chạy code của trang để hiểu giao diện của trang đó đối với người dùng.

Không ai ngoài Google biết mọi chi tiết về quá trình này. Nhưng nó không thành vấn đề. Tất cả những gì chúng ta thực sự cần biết là nó liên quan đến việc trích xuất các liên kết và lưu trữ nội dung để lập chỉ mục.

Lập chỉ mục

Lập chỉ mục là nơi thông tin được xử lý từ các trang được thu thập thông tin được thêm vào chỉ mục tìm kiếm.

Chỉ mục tìm kiếm là những gì bạn tìm kiếm khi sử dụng công cụ tìm kiếm. Đó là lý do tại sao việc được lập chỉ mục trong các công cụ tìm kiếm lớn như Google và Bing lại quan trọng đến vậy. Người dùng không thể tìm thấy bạn trừ khi bạn có trong chỉ mục.

Phần 3: Cách công cụ tìm kiếm xếp hạng các trang

Khám phá, thu thập thông tin và lập chỉ mục nội dung chỉ là phần đầu tiên của câu đố. Công cụ tìm kiếm cũng cần một cách để xếp hạng các kết quả phù hợp khi người dùng thực hiện tìm kiếm. Đây là công việc của các thuật toán tìm kiếm.

Thuật toán tìm kiếm là gì?

Thuật toán tìm kiếm là các công thức khớp và xếp hạng các kết quả có liên quan từ chỉ mục. Google sử dụng nhiều yếu tố trong thuật toán của mình.

Các yếu tố xếp hạng chính của Google

Không ai biết mọi yếu tố xếp hạng của Google vì Google chưa tiết lộ chúng. Nhưng có một số điều quan trọng như sau:

Backlink

Backlink là các liên kết từ một trang trên trang web này đến trang web khác. Chúng là một trong những yếu tố xếp hạng mạnh nhất của Google. Đây có lẽ là lý do tại sao chúng tôi nhận thấy mối tương quan chặt chẽ giữa các domain liên kết và lưu lượng truy cập không phải trả tiền trong nghiên cứu trên một tỷ trang.

Mối tương quan giữa domain được đề cập và lưu lượng tìm kiếm
Mối tương quan giữa domain được đề cập và lưu lượng tìm kiếm

Tuy nhiên, số lượng không phải là tất cả. Vấn đề chất lượng cũng vậy. Các trang có một vài backlink chất lượng cao thường xếp hạng cao hơn những trang có nhiều backlink chất lượng thấp.

Mức độ liên quan

Mức độ liên quan là tính hữu ích của một kết quả nhất định đối với người tìm kiếm. Google có nhiều cách để xác định điều này. Ở cấp độ cơ bản nhất, nó tìm kiếm các trang chứa cùng từ khóa với truy vấn tìm kiếm. Nó cũng xem xét dữ liệu tương tác để xem liệu những người khác có thấy kết quả này hữu ích hay không.

Sự mới mẻ

Sự mới mẻ là một yếu tố xếp hạng phụ thuộc vào truy vấn. Nó mạnh hơn đối với những tìm kiếm yêu cầu kết quả mới. Đó là lý do tại sao bạn thấy kết quả hàng đầu được công bố gần đây cho “loạt phim Netflix mới” chứ không phải “cách giải khối rubik”.

Sự mới mẻ là yếu tố xếp hạng của Google phụ thuộc vào truy vấn
Sự mới mẻ là yếu tố xếp hạng của Google phụ thuộc vào truy vấn

Tốc độ trang

Tốc độ trang là yếu tố xếp hạng trên máy tính và thiết bị di động. Nhưng đó là yếu tố xếp hạng tiêu cực hơn là tích cực. Điều này là do nó ảnh hưởng tiêu cực đến các trang chậm nhất hơn là ảnh hưởng tích cực đến các trang có tốc độ nhanh như chớp.

Thân thiện với thiết bị di động

Tính thân thiện với thiết bị di động đã là yếu tố xếp hạng trên thiết bị di động và máy tính kể từ khi Google chuyển sang lập chỉ mục đầu tiên trên thiết bị di động vào năm 2019.

Phần 4: Cách công cụ tìm kiếm cá nhân hóa kết quả

Google điều chỉnh kết quả tìm kiếm cho từng người dùng. Nó sử dụng thông tin như vị trí, ngôn ngữ và lịch sử tìm kiếm của bạn để thực hiện việc này. Hãy xem xét kỹ hơn những điều này.

Vị trí

Google sử dụng vị trí của bạn để cá nhân hóa kết quả cho những tìm kiếm có mục đích địa phương. Đó là lý do tại sao tất cả kết quả cho “nhà hàng Ý” đều đến từ hoặc về các nhà hàng địa phương. Google biết bạn khó có thể bay nửa vòng trái đất để ăn trưa.

Ngôn ngữ

Google biết rằng không có ích gì khi hiển thị kết quả bằng tiếng Anh cho người dùng Tây Ban Nha. Đó là lý do tại sao nó xếp hạng các phiên bản nội dung đã bản địa hóa (nếu có) cho người dùng nói các ngôn ngữ khác nhau.

Google xếp hạng các phiên bản khác nhau của trang cho những ngôn ngữ khác nhau
Google xếp hạng các phiên bản khác nhau của trang cho những ngôn ngữ khác nhau

Lịch sử tìm kiếm

Google lưu những việc bạn làm và những nơi bạn đến để mang đến cho bạn trải nghiệm tìm kiếm được cá nhân hóa hơn. Bạn có thể từ chối điều này, nhưng hầu hết mọi người sẽ không làm như vậy.

Tổng kết

  • Một công cụ tìm kiếm bao gồm hai phần chính: Chỉ mục và thuật toán.
  • Để xây dựng chỉ mục, nó thu thập dữ liệu các trang đã biết và đi theo những liên kết đó để tìm trang mới.
  • Mục đích của thuật toán tìm kiếm là trả về kết quả tốt và phù hợp nhất.
  • Chất lượng kết quả tìm kiếm rất quan trọng để xây dựng thị phần.
  • Không ai biết tất cả các yếu tố xếp hạng của Google cho kết quả không phải trả tiền.
  • Các yếu tố xếp hạng chính bao gồm backlink, mức độ liên quan và độ mới.
  • Google cá nhân hóa kết quả dựa trên vị trí, ngôn ngữ và lịch sử tìm kiếm của bạn.
Thứ Năm, 21/03/2024 09:08
4,612 👨 9.868
0 Bình luận
Sắp xếp theo
    ❖ Thủ thuật SEO