{SEO GUIDE 2} CÁCH LÀM VIỆC CỦA CÁC ĐỘNG CƠ TÌM KIẾM: CRAWLING, INDEXING và RANKING

Also Read

cach-lam-viec-cua-cac-dong-co-tim-kiem-crawling-indexing-va-ranking


Như chúng ta đã đề cập trong Chương 1, công cụ tìm kiếm là máy trả lời. Chúng tồn tại để khám phá, hiểu và tổ chức nội dung của internet nhằm cung cấp các kết quả phù hợp nhất cho các câu hỏi mà người tìm kiếm đang đặt ra.

Để hiển thị trong kết quả tìm kiếm, trước tiên nội dung của bạn cần phải hiển thị cho các công cụ tìm kiếm. Đây được cho là phần quan trọng nhất của câu đố SEO: Nếu trang web của bạn không thể được tìm thấy, bạn sẽ không bao giờ xuất hiện trong SERPs (Trang kết quả của công cụ tìm kiếm).

Công cụ tìm kiếm hoạt động thông qua ba chức năng chính:

  • Thu thập thông tin: Tìm kiếm nội dung trên Internet, xem qua mã / nội dung cho từng URL mà họ tìm thấy.

  • Lập chỉ mục: Lưu trữ và sắp xếp nội dung được tìm thấy trong quá trình thu thập thông tin. Khi một trang đã có trong chỉ mục, trang đó sẽ được hiển thị do kết quả của các truy vấn có liên quan.

  • Xếp hạng: Cung cấp các phần nội dung sẽ trả lời tốt nhất cho truy vấn của người tìm kiếm, có nghĩa là các kết quả được sắp xếp theo thứ tự phù hợp nhất đến ít liên quan nhất.

Công cụ tìm kiếm thu thập thông tin là gì?

Thu thập thông tin là quá trình khám phá trong đó các công cụ tìm kiếm cử ra một nhóm rô bốt (được gọi là trình thu thập thông tin hoặc trình thu thập thông tin) để tìm nội dung mới và cập nhật. Nội dung có thể khác nhau - có thể là trang web, hình ảnh, video, PDF, v.v. - nhưng bất kể định dạng nào, nội dung đều được khám phá bởi các liên kết.

Bạn gặp khó khăn với bất kỳ định nghĩa nào trong phần này? Bảng thuật ngữ SEO của chúng tôi có các định nghĩa theo từng chương cụ thể để giúp bạn luôn cập nhật.

Robot công cụ tìm kiếm, còn được gọi là trình thu thập thông tin, thu thập dữ liệu từ trang này sang trang khác để tìm nội dung mới và cập nhật.

Googlebot bắt đầu bằng cách tìm nạp một vài trang web, sau đó đi theo các liên kết trên các trang web đó để tìm các URL mới. Bằng cách di chuyển dọc theo đường dẫn liên kết này, trình thu thập thông tin có thể tìm thấy nội dung mới và thêm nội dung đó vào chỉ mục của họ có tên Caffeine - một cơ sở dữ liệu khổng lồ về các URL được phát hiện - để sau đó được truy xuất khi người tìm kiếm đang tìm kiếm thông tin rằng nội dung trên URL đó là phù hợp tốt cho.

Chỉ mục công cụ tìm kiếm là gì?

Các công cụ tìm kiếm xử lý và lưu trữ thông tin mà họ tìm thấy trong một chỉ mục, một cơ sở dữ liệu khổng lồ về tất cả nội dung mà họ đã khám phá và cho là đủ tốt để cung cấp cho người tìm kiếm.

Xếp hạng công cụ tìm kiếm

Khi ai đó thực hiện tìm kiếm, các công cụ tìm kiếm sẽ lùng sục chỉ mục của họ để tìm nội dung có liên quan cao và sau đó đặt hàng nội dung đó với hy vọng giải quyết được truy vấn của người tìm kiếm. Thứ tự kết quả tìm kiếm theo mức độ liên quan được gọi là xếp hạng. Nói chung, bạn có thể giả định rằng một trang web được xếp hạng càng cao, thì công cụ tìm kiếm càng tin rằng trang web đó có liên quan đến truy vấn.

Có thể chặn trình thu thập thông tin của công cụ tìm kiếm khỏi một phần hoặc toàn bộ trang web của bạn hoặc hướng dẫn các công cụ tìm kiếm tránh lưu trữ một số trang nhất định trong chỉ mục của chúng. Mặc dù có thể có lý do để làm điều này, nhưng nếu bạn muốn nội dung của mình được người tìm kiếm tìm thấy, trước tiên bạn phải đảm bảo rằng trình thu thập thông tin có thể truy cập được nội dung đó và có thể lập chỉ mục. Nếu không, nó tốt như vô hình.

Đến cuối chương này, bạn sẽ có bối cảnh cần thiết để làm việc với công cụ tìm kiếm, thay vì chống lại nó!

Trong SEO, không phải tất cả các công cụ tìm kiếm đều bình đẳng

Nhiều người mới bắt đầu thắc mắc về tầm quan trọng tương đối của các công cụ tìm kiếm cụ thể. Hầu hết mọi người đều biết rằng Google có thị phần lớn nhất, nhưng điều quan trọng là tối ưu hóa cho Bing, Yahoo và những người khác như thế nào? Sự thật là bất chấp sự tồn tại của hơn 30 công cụ tìm kiếm web lớn, cộng đồng SEO chỉ thực sự chú ý đến Google. Tại sao? Câu trả lời ngắn gọn là Google là nơi mà đại đa số mọi người tìm kiếm trên web. Nếu chúng tôi bao gồm Google Hình ảnh, Google Maps và YouTube (một sản phẩm của Google), hơn 90% các tìm kiếm trên web diễn ra trên Google - gần gấp 20 lần Bing và Yahoo cộng lại.


Thu thập thông tin: Công cụ tìm kiếm có thể tìm thấy các trang của bạn không?

Như bạn vừa tìm hiểu, đảm bảo trang web của bạn được thu thập thông tin và lập chỉ mục là điều kiện tiên quyết để hiển thị trong SERPs. Nếu bạn đã có một trang web, có thể bắt đầu bằng cách xem có bao nhiêu trang của bạn trong chỉ mục. Điều này sẽ mang lại một số thông tin chi tiết tuyệt vời về việc liệu Google có đang thu thập thông tin và tìm thấy tất cả các trang bạn muốn hay không và không trang nào mà bạn không làm.

Một cách để kiểm tra các trang được lập chỉ mục của bạn là "site: yourdomain.com", một toán tử tìm kiếm nâng cao. Truy cập Google và nhập "site: yourdomain.com" vào thanh tìm kiếm. Điều này sẽ trả về kết quả mà Google có trong chỉ mục của mình cho trang web được chỉ định:

Ảnh chụp màn hình của trang web: moz.com tìm kiếm trong Google, hiển thị số lượng kết quả bên dưới hộp tìm kiếm.

Số lượng kết quả mà Google hiển thị (xem “Về kết quả XX” ở trên) không chính xác, nhưng nó cung cấp cho bạn một ý tưởng chắc chắn về những trang nào được lập chỉ mục trên trang web của bạn và cách chúng hiện đang hiển thị trong kết quả tìm kiếm.

Để có kết quả chính xác hơn, hãy theo dõi và sử dụng báo cáo Trạng thái lập chỉ mục trong Google Search Console. Bạn có thể đăng ký tài khoản Google Search Console miễn phí nếu bạn hiện chưa có. Với công cụ này, bạn có thể gửi sơ đồ trang web của mình và theo dõi số lượng trang đã gửi đã thực sự được thêm vào chỉ mục của Google, trong số những thứ khác.

Nếu bạn không hiển thị ở bất kỳ đâu trong kết quả tìm kiếm, có một số lý do có thể xảy ra:

  • Trang web của bạn là thương hiệu mới và chưa được thu thập thông tin.

  • Trang web của bạn không được liên kết đến từ bất kỳ trang web bên ngoài nào.

  • Điều hướng trên trang web của bạn khiến rô bốt khó thu thập dữ liệu một cách hiệu quả.

  • Trang web của bạn chứa một số mã cơ bản được gọi là chỉ thị trình thu thập thông tin đang chặn các công cụ tìm kiếm.

  • Trang web của bạn đã bị Google phạt vì các chiến thuật spam.

Cho các công cụ tìm kiếm biết cách thu thập dữ liệu trang web của bạn

Nếu bạn đã sử dụng Google Search Console hoặc toán tử tìm kiếm nâng cao “site: domain.com” và nhận thấy rằng một số trang quan trọng của bạn bị thiếu trong chỉ mục và / hoặc một số trang không quan trọng của bạn đã bị lập chỉ mục nhầm, bạn có thể thực hiện một số cách tối ưu hóa triển khai để hướng dẫn Googlebot tốt hơn cách bạn muốn nội dung web của mình được thu thập thông tin. Nói với các công cụ tìm kiếm cách thu thập dữ liệu trang web của bạn có thể giúp bạn kiểm soát tốt hơn những gì kết thúc trong chỉ mục.

Hầu hết mọi người đều nghĩ đến việc đảm bảo Google có thể tìm thấy các trang quan trọng của họ, nhưng rất dễ quên rằng có những trang mà bạn không muốn Googlebot tìm thấy. Chúng có thể bao gồm những thứ như URL cũ có nội dung mỏng, URL trùng lặp (chẳng hạn như thông số sắp xếp và lọc cho thương mại điện tử), các trang mã khuyến mại đặc biệt, trang thử nghiệm hoặc phân đoạn, v.v.

Để hướng Googlebot khỏi các trang và phần nhất định trên trang web của bạn, hãy sử dụng robots.txt.

Robots.txt

Tệp Robots.txt được đặt trong thư mục gốc của các trang web (ví dụ: yourdomain.com/robots.txt) và đề xuất những phần nào của công cụ tìm kiếm trang web của bạn nên và không nên thu thập dữ liệu, cũng như tốc độ chúng thu thập dữ liệu trang web của bạn , thông qua các lệnh robots.txt cụ thể.

Cách Googlebot xử lý tệp robots.txt

Nếu Googlebot không thể tìm thấy tệp robots.txt cho một trang web, nó sẽ tiến hành thu thập dữ liệu trang web.

Nếu Googlebot tìm thấy tệp robots.txt cho một trang web, nó thường sẽ tuân theo các đề xuất và tiến hành thu thập dữ liệu trang web.

Nếu Googlebot gặp lỗi khi cố gắng truy cập vào tệp robots.txt của trang web và không thể xác định xem tệp đó có tồn tại hay không, nó sẽ không thu thập dữ liệu trang web.

Tối ưu hóa cho ngân sách thu thập thông tin!

Ngân sách thu thập thông tin là số lượng URL trung bình mà Googlebot sẽ thu thập dữ liệu trên trang web của bạn trước khi rời đi, vì vậy, việc tối ưu thông tin quan trọng nhất trên các trang web rất lớn với hàng chục nghìn URL, nhưng không bao giờ là ý tưởng tồi nếu chặn trình thu thập thông tin truy cập vào nội dunhóa ngân sách thu thập thông tin đảm bảo rằng Googlebot không lãng phí thời gian thu thập thông tin qua các trang không quan trọng có nguy cơ bỏ qua các trang quan trọng của bạn. Ngân sách thu thậpg mà bạn chắc chắn không quan tâm. Chỉ cần đảm bảo không chặn trình thu thập thông tin truy cập vào các trang mà bạn đã thêm các lệnh khác, chẳng hạn như thẻ chuẩn hoặc thẻ noindex. Nếu Googlebot bị chặn khỏi một trang, nó sẽ không thể xem hướng dẫn trên trang đó.

Không phải tất cả các rô bốt web đều tuân theo robots.txt. Những người có ý định xấu (ví dụ: kẻ phá hoại địa chỉ e-mail) xây dựng các bot không tuân theo giao thức này. Trên thực tế, một số kẻ xấu sử dụng tệp robots.txt để tìm nơi bạn đặt nội dung riêng tư của mình. Mặc dù có vẻ hợp lý khi chặn trình thu thập thông tin khỏi các trang riêng tư như trang đăng nhập và quản trị để chúng không hiển thị trong chỉ mục, nhưng việc đặt vị trí của các URL đó trong tệp robots.txt có thể truy cập công khai cũng có nghĩa là những người có ý định xấu có thể dễ dàng tìm thấy chúng hơn. Tốt hơn là NoIndex các trang này và đặt chúng sau biểu mẫu đăng nhập hơn là đặt chúng vào tệp robots.txt của bạn.

Bạn có thể đọc thêm chi tiết về điều này trong phần robots.txt của Trung tâm Kiến thức của chúng tôi.Không phải tất cả các rô bốt web đều tuân theo robots.txt. Những người có ý định xấu (ví dụ: kẻ phá hoại địa chỉ e-mail) xây dựng các bot không tuân theo giao thức này. Trên thực tế, một số kẻ xấu sử dụng tệp robots.txt để tìm nơi bạn đặt nội dung riêng tư của mình. Mặc dù có vẻ hợp lý khi chặn trình thu thập thông tin khỏi các trang riêng tư như trang đăng nhập và quản trị để chúng không hiển thị trong chỉ mục, nhưng việc đặt vị trí của các URL đó trong tệp robots.txt có thể truy cập công khai cũng có nghĩa là những người có ý định xấu có thể dễ dàng tìm thấy chúng hơn. Tốt hơn là NoIndex các trang này và đặt chúng sau biểu mẫu đăng nhập hơn là đặt chúng vào tệp robots.txt của bạn.

Bạn có thể đọc thêm chi tiết về điều này trong phần robots.txt của Trung tâm Kiến thức của chúng tôi.

Xác định các tham số URL trong GSC

Một số trang web (phổ biến nhất với thương mại điện tử) cung cấp cùng một nội dung trên nhiều URL khác nhau bằng cách thêm các thông số nhất định vào URL. Nếu bạn đã từng mua sắm trực tuyến, bạn có thể đã thu hẹp tìm kiếm của mình qua các bộ lọc. Ví dụ: bạn có thể tìm kiếm “giày” trên Amazon, sau đó tinh chỉnh tìm kiếm của mình theo kích cỡ, màu sắc và kiểu dáng. Mỗi lần bạn tinh chỉnh, URL sẽ thay đổi một chút:

https://www.example.com/products/women/dresses/green.htmhttps://www.example.com/products/women?category=dresses&color=greenhttps://example.com/shopindex.php?product_id= 32 & highlight = green + dress & cat_id = 1 & sessionid = 123 $ affid = 43

Làm cách nào để Google biết phiên bản nào của URL để phân phát cho người tìm kiếm? Google thực hiện công việc khá tốt trong việc tự tìm ra URL đại diện, nhưng bạn có thể sử dụng tính năng Tham số URL trong Google Search Console để cho Google biết chính xác cách bạn muốn họ xử lý các trang của mình. Nếu bạn sử dụng tính năng này để thông báo cho Googlebot “không thu thập thông tin URL nào có thông số ____” thì về cơ bản, bạn đang yêu cầu ẩn nội dung này khỏi Googlebot, điều này có thể dẫn đến việc xóa các trang đó khỏi kết quả tìm kiếm. Đó là những gì bạn muốn nếu các thông số đó tạo ra các trang trùng lặp, nhưng không lý tưởng nếu bạn muốn các trang đó được lập chỉ mục.

Trình thu thập thông tin có thể tìm thấy tất cả nội dung quan trọng của bạn không?

Bây giờ bạn đã biết một số chiến thuật để đảm bảo trình thu thập thông tin của công cụ tìm kiếm tránh xa nội dung không quan trọng của bạn, hãy cùng tìm hiểu về các tối ưu hóa có thể giúp Googlebot tìm thấy các trang quan trọng của bạn.

Đôi khi công cụ tìm kiếm có thể tìm thấy các phần của trang web của bạn bằng cách thu thập thông tin, nhưng các trang hoặc phần khác có thể bị che khuất vì lý do này hay lý do khác. Điều quan trọng là đảm bảo rằng các công cụ tìm kiếm có thể khám phá tất cả nội dung bạn muốn lập chỉ mục chứ không chỉ trang chủ của bạn.

Hãy tự hỏi bản thân mình điều này: Bot có thể thu thập thông tin qua trang web của bạn không, chứ không chỉ tới nó?

Nội dung của bạn có ẩn sau các biểu mẫu đăng nhập không?

Nếu bạn yêu cầu người dùng đăng nhập, điền vào biểu mẫu hoặc trả lời khảo sát trước khi truy cập nội dung nhất định, các công cụ tìm kiếm sẽ không nhìn thấy các trang được bảo vệ đó. Trình thu thập thông tin chắc chắn sẽ không đăng nhập.

Bạn có đang dựa vào các hình thức tìm kiếm?

Robot không thể sử dụng các biểu mẫu tìm kiếm. Một số cá nhân tin rằng nếu họ đặt một hộp tìm kiếm trên trang web của họ, các công cụ tìm kiếm sẽ có thể tìm thấy mọi thứ mà khách truy cập của họ tìm kiếm.

Văn bản có bị ẩn trong nội dung không phải văn bản không?

Không nên sử dụng các biểu mẫu phương tiện không phải văn bản (hình ảnh, video, GIF, v.v.) để hiển thị văn bản mà bạn muốn được lập chỉ mục. Trong khi các công cụ tìm kiếm ngày càng nhận ra hình ảnh tốt hơn, không có gì đảm bảo rằng chúng sẽ có thể đọc và hiểu nó. Tốt nhất bạn nên thêm văn bản trong phần đánh dấu <HTML> của trang web của mình.

Công cụ tìm kiếm có thể theo dõi điều hướng trang web của bạn không?

Cũng giống như trình thu thập thông tin cần khám phá trang web của bạn thông qua các liên kết từ các trang web khác, trình thu thập thông tin cần một đường dẫn liên kết trên trang web của riêng bạn để dẫn nó từ trang này sang trang khác. Nếu bạn có một trang mà bạn muốn các công cụ tìm kiếm tìm thấy nhưng nó không được liên kết đến từ bất kỳ trang nào khác, thì nó tốt như là ẩn. Nhiều trang web mắc sai lầm nghiêm trọng khi cấu trúc điều hướng của họ theo những cách mà các công cụ tìm kiếm không thể tiếp cận được, cản trở khả năng được liệt kê trong kết quả tìm kiếm của họ.

Mô tả cách trình thu thập thông tin có thể tìm thấy các trang được liên kết đến, trong khi một trang không được liên kết trong điều hướng trang web của bạn tồn tại dưới dạng một hòn đảo, không thể khám phá được.

Các lỗi điều hướng phổ biến có thể khiến trình thu thập thông tin không nhìn thấy tất cả trang web của bạn:

  • Có điều hướng trên thiết bị di động hiển thị kết quả khác với điều hướng trên máy tính để bàn của bạn
  • Bất kỳ loại điều hướng nào mà các mục menu không có trong HTML, chẳng hạn như điều hướng hỗ trợ JavaScript. Google đã tiến bộ hơn nhiều trong việc thu thập thông tin và hiểu Javascript, nhưng đó vẫn chưa phải là một quá trình hoàn hảo. Cách chắc chắn hơn để đảm bảo một thứ gì đó được Google tìm thấy, hiểu và lập chỉ mục là đưa nó vào HTML.
  • Cá nhân hóa hoặc hiển thị điều hướng duy nhất cho một loại khách truy cập cụ thể so với những người khác, có thể dường như đang che giấu trình thu thập thông tin của công cụ tìm kiếm
  • Quên liên kết đến một trang chính trên trang web của bạn thông qua điều hướng của bạn - hãy nhớ rằng, liên kết là đường dẫn mà trình thu thập thông tin theo đến các trang mới!

Đây là lý do tại sao điều cần thiết là trang web của bạn phải có điều hướng rõ ràng và cấu trúc thư mục URL hữu ích.

Bạn có kiến ​​trúc thông tin sạch không?

Kiến trúc thông tin là thực hành tổ chức và gắn nhãn nội dung trên một trang web để nâng cao hiệu quả và khả năng tìm kiếm cho người dùng. Kiến trúc thông tin tốt nhất là trực quan, có nghĩa là người dùng không cần phải suy nghĩ nhiều để lướt qua trang web của bạn hoặc để tìm thứ gì đó.


Bạn có đang sử dụng sơ đồ trang web không?

Sơ đồ trang web giống như âm thanh của nó: một danh sách các URL trên trang web của bạn mà trình thu thập thông tin có thể sử dụng để khám phá và lập chỉ mục nội dung của bạn. Một trong những cách dễ nhất để đảm bảo Google đang tìm thấy các trang có mức độ ưu tiên cao nhất của bạn là tạo một tệp đáp ứng các tiêu chuẩn của Google và gửi tệp đó qua Google Search Console. Mặc dù việc gửi sơ đồ trang web không thay thế nhu cầu điều hướng trang web tốt, nhưng nó chắc chắn có thể giúp trình thu thập thông tin theo đường dẫn đến tất cả các trang quan trọng của bạn.


Đảm bảo rằng bạn chỉ bao gồm các URL mà bạn muốn các công cụ tìm kiếm lập chỉ mục và đảm bảo cung cấp cho trình thu thập thông tin các hướng dẫn nhất quán. Ví dụ: không bao gồm một URL trong sơ đồ trang web của bạn nếu bạn đã chặn URL đó qua robots.txt hoặc bao gồm các URL trong sơ đồ trang web của bạn trùng lặp thay vì phiên bản chuẩn, được ưu tiên (chúng tôi sẽ cung cấp thêm thông tin về việc chuẩn hóa trong Chương 5!).

Tìm hiểu thêm về sơ đồ trang web XML

Nếu trang web của bạn không có bất kỳ trang web nào khác liên kết đến nó, bạn vẫn có thể lập chỉ mục nó bằng cách gửi sơ đồ trang web XML của bạn trong Google Search Console. Không có gì đảm bảo rằng họ sẽ bao gồm một URL đã gửi trong chỉ mục của họ, nhưng rất đáng để thử!

Trình thu thập thông tin có gặp lỗi khi họ cố gắng truy cập vào URL của bạn không?

Trong quá trình thu thập thông tin các URL trên trang web của bạn, trình thu thập thông tin có thể gặp lỗi. Bạn có thể truy cập báo cáo "Lỗi thu thập thông tin" của Google Search Console để phát hiện các URL mà điều này có thể xảy ra - báo cáo này sẽ hiển thị cho bạn các lỗi máy chủ và lỗi không tìm thấy. Tệp nhật ký máy chủ cũng có thể hiển thị cho bạn điều này, cũng như một kho tàng thông tin khác như tần suất thu thập thông tin, nhưng bởi vì truy cập và phân tích tệp nhật ký máy chủ là một chiến thuật nâng cao hơn, chúng tôi sẽ không thảo luận chi tiết về nó trong Hướng dẫn dành cho người mới bắt đầu, mặc dù bạn có thể tìm hiểu thêm về nó ở đây.

Trước khi bạn có thể làm bất cứ điều gì có ý nghĩa với báo cáo lỗi thu thập thông tin, điều quan trọng là phải hiểu lỗi máy chủ và lỗi "không tìm thấy".

  • Mã 4xx: Khi trình thu thập thông tin của công cụ tìm kiếm không thể truy cập nội dung của bạn do lỗi máy khách

Lỗi 4xx là lỗi máy khách, có nghĩa là URL được yêu cầu chứa cú pháp sai hoặc không thể thực hiện được. Một trong những lỗi 4xx phổ biến nhất là lỗi “404 - not found”. Những điều này có thể xảy ra do lỗi đánh máy URL, trang bị xóa hoặc chuyển hướng bị hỏng, chỉ để nêu tên một số ví dụ. Khi công cụ tìm kiếm đạt 404, chúng không thể truy cập URL. Khi người dùng chạm ngưỡng 404, họ có thể thất vọng và rời đi.

  • Mã 5xx: Khi trình thu thập thông tin của công cụ tìm kiếm không thể truy cập nội dung của bạn do lỗi máy chủ

Lỗi 5xx là lỗi máy chủ, có nghĩa là máy chủ đặt trang web không thực hiện được yêu cầu của người tìm kiếm hoặc công cụ tìm kiếm để truy cập trang. Trong báo cáo "Lỗi thu thập thông tin" của Google Search Console, có một tab dành riêng cho những lỗi này. Những điều này thường xảy ra vì yêu cầu URL đã hết thời gian chờ, vì vậy Googlebot đã từ bỏ yêu cầu. Xem tài liệu của Google để tìm hiểu thêm về cách khắc phục sự cố kết nối máy chủ.

Rất may, có một cách để cho cả người tìm kiếm và công cụ tìm kiếm biết rằng trang của bạn đã di chuyển - chuyển hướng 301 (vĩnh viễn).

Giả sử bạn di chuyển một trang từ example.com/young-dogs/ sang example.com/puppies/. Công cụ tìm kiếm và người dùng cần một cầu nối để chuyển từ URL cũ sang URL mới. Cầu đó là chuyển hướng 301.

Khi bạn triển khai 301:

  • Link Equity: Chuyển vốn liên kết từ vị trí cũ của trang sang URL mới.

  • Lập chỉ mục: Giúp Google tìm và lập chỉ mục phiên bản mới của trang.

  • Trải nghiệm người dùng: Đảm bảo người dùng tìm thấy trang mà họ đang tìm kiếm.

Khi bạn không triển khai 301:

  • Link Equity: Nếu không có 301, quyền từ URL trước đó sẽ không được chuyển cho phiên bản mới của URL.

  • Lập chỉ mục: Chỉ riêng sự hiện diện của lỗi 404 trên trang web của bạn không ảnh hưởng đến hiệu suất tìm kiếm, nhưng việc để các trang 404 xếp hạng / được quản lý có thể khiến chúng rơi ra khỏi chỉ mục, với thứ hạng và lưu lượng truy cập đi theo chúng - thật tuyệt vời!

  • Trải nghiệm người dùng: Cho phép khách truy cập của bạn nhấp vào các liên kết chết sẽ đưa họ đến các trang lỗi thay vì trang dự định, điều này có thể gây khó chịu.

Bản thân mã trạng thái 301 có nghĩa là trang đã vĩnh viễn chuyển đến một vị trí mới, vì vậy, hãy tránh chuyển hướng URL đến các trang không liên quan - những URL mà nội dung của URL cũ không thực sự tồn tại. Nếu một trang đang xếp hạng cho một truy vấn và bạn 301 nó đến một URL có nội dung khác, nó có thể bị tụt xuống vị trí xếp hạng vì nội dung làm cho nó có liên quan đến truy vấn cụ thể đó không còn ở đó nữa. 301s rất mạnh mẽ - di chuyển URL một cách có trách nhiệm!

Bạn cũng có tùy chọn 302 chuyển hướng một trang, nhưng điều này nên được dành cho những lần di chuyển tạm thời và trong những trường hợp việc chuyển hướng liên kết không phải là vấn đề đáng lo ngại. 302 giống như một con đường vòng. Bạn đang tạm thời thu hút lưu lượng truy cập qua một tuyến đường nhất định, nhưng nó sẽ không như vậy mãi mãi.

Xem ra cho các chuỗi chuyển hướng!

Googlebot có thể khó tiếp cận trang của bạn nếu nó phải trải qua nhiều lần chuyển hướng. Google gọi đây là "chuỗi chuyển hướng" và họ khuyên bạn nên hạn chế chúng càng nhiều càng tốt. Nếu bạn chuyển hướng example.com/1 đến example.com/2, sau đó quyết định chuyển hướng nó đến example.com/3, tốt nhất là loại bỏ người trung gian và chỉ cần chuyển hướng example.com/1 đến example.com/3.

Tìm hiểu thêm về chuỗi chuyển hướng

Sau khi bạn đã đảm bảo trang web của mình được tối ưu hóa cho khả năng thu thập thông tin, yêu cầu tiếp theo của doanh nghiệp là đảm bảo rằng nó có thể được lập chỉ mục.

Lập chỉ mục: Công cụ tìm kiếm diễn giải và lưu trữ các trang của bạn như thế nào?

Khi bạn đã đảm bảo rằng trang web của mình đã được thu thập thông tin, yêu cầu tiếp theo của công việc kinh doanh là đảm bảo rằng nó có thể được lập chỉ mục. Đúng vậy - chỉ vì công cụ tìm kiếm có thể phát hiện và thu thập thông tin trang web của bạn không nhất thiết có nghĩa là nó sẽ được lưu trữ trong chỉ mục của họ. Trong phần trước về thu thập thông tin, chúng ta đã thảo luận về cách các công cụ tìm kiếm khám phá các trang web của bạn. Chỉ mục là nơi lưu trữ các trang đã khám phá của bạn. Sau khi trình thu thập thông tin tìm thấy một trang, công cụ tìm kiếm sẽ hiển thị trang đó giống như một trình duyệt. Trong quá trình làm như vậy, công cụ tìm kiếm sẽ phân tích nội dung của trang đó. Tất cả thông tin đó được lưu trữ trong chỉ mục của nó.

Một robot lưu trữ một cuốn sách trong thư viện.

Đọc tiếp để tìm hiểu về cách hoạt động của lập chỉ mục và cách bạn có thể đảm bảo trang web của mình lọt vào cơ sở dữ liệu quan trọng này.

Tôi có thể thấy cách trình thu thập thông tin của Googlebot nhìn thấy các trang của tôi không?

Có, phiên bản được lưu trong bộ nhớ cache của trang của bạn sẽ phản ánh ảnh chụp nhanh lần cuối cùng Googlebot thu thập dữ liệu trang đó.

Google thu thập thông tin và lưu trữ các trang web ở các tần suất khác nhau. Các trang web nổi tiếng, lâu đời hơn đăng bài thường xuyên như https://www.nytimes.com sẽ được thu thập thông tin thường xuyên hơn so với trang web ít nổi tiếng hơn đối với sự hối hả của Roger the Mozbot, http: //www.rogerlovescupcakes ... . (giá như nó là thật…)

Bạn có thể xem phiên bản được lưu trong bộ nhớ cache của một trang trông như thế nào bằng cách nhấp vào mũi tên thả xuống bên cạnh URL trong SERP và chọn "Đã lưu trong bộ nhớ cache":

Ảnh chụp màn hình về nơi để xem kết quả được lưu trong bộ nhớ cache trong SERPs.

Bạn cũng có thể xem phiên bản chỉ có văn bản của trang web của mình để xác định xem nội dung quan trọng của bạn có đang được thu thập thông tin và lưu vào bộ nhớ cache hiệu quả hay không.

Có bao giờ các trang bị xóa khỏi chỉ mục không?

Có, các trang có thể bị xóa khỏi chỉ mục! Một số lý do chính khiến URL có thể bị xóa bao gồm:

  • URL trả về lỗi "không tìm thấy" (4XX) hoặc lỗi máy chủ (5XX) - Điều này có thể là do ngẫu nhiên (trang đã được di chuyển và chuyển hướng 301 không được thiết lập) hoặc cố ý (trang đã bị xóa và chuyển hướng 404 để lấy nó ra khỏi chỉ mục)

  • URL đã được thêm thẻ meta ngăn lập chỉ mục - Chủ sở hữu trang web có thể thêm thẻ này để hướng dẫn công cụ tìm kiếm loại bỏ trang khỏi chỉ mục của nó.

  • URL đã bị phạt theo cách thủ công vì vi phạm Nguyên tắc quản trị trang web của công cụ tìm kiếm và do đó, URL đã bị xóa khỏi chỉ mục.

  • URL đã bị chặn thu thập thông tin với việc bổ sung mật khẩu bắt buộc trước khi khách truy cập có thể truy cập trang.

Nếu bạn tin rằng một trang trên trang web của mình trước đây nằm trong chỉ mục của Google không còn hiển thị nữa, bạn có thể sử dụng công cụ Kiểm tra URL để tìm hiểu trạng thái của trang hoặc sử dụng Tìm nạp như Google có tính năng "Yêu cầu lập chỉ mục" để gửi các URL riêng lẻ đến chỉ mục. (Phần thưởng: Công cụ “tìm nạp” của GSC cũng có tùy chọn “kết xuất” cho phép bạn xem liệu có bất kỳ vấn đề nào với cách Google diễn giải trang của bạn hay không).

Thẻ meta rô bốt

Thẻ meta rô bốt có thể được sử dụng trong <head> của HTML của trang web của bạn. Nó có thể loại trừ tất cả hoặc các công cụ tìm kiếm cụ thể. Sau đây là những chỉ thị meta phổ biến nhất, cùng với những tình huống bạn có thể áp dụng chúng trong những trường hợp nào.

  • index / noindex cho các công cụ biết liệu trang có nên được thu thập thông tin và giữ trong chỉ mục của công cụ tìm kiếm để truy xuất hay không. Nếu bạn chọn sử dụng "noindex", bạn đang liên lạc với trình thu thập thông tin rằng bạn muốn trang bị loại trừ khỏi kết quả tìm kiếm. Theo mặc định, các công cụ tìm kiếm cho rằng chúng có thể lập chỉ mục tất cả các trang, vì vậy việc sử dụng giá trị "index" là không cần thiết.

Khi nào bạn có thể sử dụng: Bạn có thể chọn đánh dấu một trang là "noindex" nếu bạn đang cố gắng cắt các trang mỏng khỏi chỉ mục của Google về trang web của mình (ví dụ: các trang hồ sơ do người dùng tạo) nhưng bạn vẫn muốn khách truy cập có thể truy cập chúng.

  • follow / nofollow cho các công cụ tìm kiếm biết liệu các liên kết trên trang nên được theo dõi hay không được theo dõi. “Theo dõi” kết quả là các chương trình theo dõi các liên kết trên trang của bạn và chuyển vốn liên kết đến các URL đó. Hoặc, nếu bạn chọn sử dụng "nofollow", các công cụ tìm kiếm sẽ không theo dõi hoặc chuyển bất kỳ liên kết nào thông qua các liên kết trên trang. Theo mặc định, tất cả các trang được giả định có thuộc tính "theo dõi".

Khi nào bạn có thể sử dụng: nofollow thường được sử dụng cùng với noindex khi bạn đang cố gắng ngăn một trang được lập chỉ mục cũng như ngăn trình thu thập thông tin theo các liên kết trên trang.

  • noarchive được sử dụng để hạn chế các công cụ tìm kiếm lưu bản sao được lưu trong bộ nhớ cache của trang. Theo mặc định, các công cụ sẽ duy trì các bản sao hiển thị của tất cả các trang mà họ đã lập chỉ mục, người tìm kiếm có thể truy cập được thông qua liên kết được lưu trong bộ nhớ cache trong kết quả tìm kiếm.

Khi nào bạn có thể sử dụng: Nếu bạn điều hành một trang web thương mại điện tử và giá của bạn thay đổi thường xuyên, bạn có thể xem xét thẻ noarchive để ngăn người tìm kiếm thấy giá đã lỗi thời.

Dưới đây là một ví dụ về thẻ meta robots noindex, nofollow:

<! DOCTYPE html> <html> <head> <meta name = "robots" content = "noindex, nofollow" /> </head> <body> ... </body> </html>

Ví dụ này loại trừ tất cả các công cụ tìm kiếm lập chỉ mục trang và theo dõi bất kỳ liên kết trên trang nào. Nếu bạn muốn loại trừ nhiều trình thu thập thông tin, chẳng hạn như googlebot và bing, bạn có thể sử dụng nhiều thẻ loại trừ rô bốt.

X-Robots-Tag

Thẻ x-robots được sử dụng trong tiêu đề HTTP của URL của bạn, mang lại tính linh hoạt và chức năng hơn thẻ meta nếu bạn muốn chặn các công cụ tìm kiếm trên quy mô lớn vì bạn có thể sử dụng biểu thức chính quy, chặn các tệp không phải HTML và áp dụng thẻ noindex trên trang web .

Ví dụ: bạn có thể dễ dàng loại trừ toàn bộ thư mục hoặc loại tệp (như moz.com/no-bake/old-recipes-to-noindex):

<Files ~ “\ /? No \ -bake \ /.*”> Bộ tiêu đề X-Robots-Tag “noindex, nofollow” </Files>

Các dẫn xuất được sử dụng trong thẻ meta rô bốt cũng có thể được sử dụng trong Thẻ X-rô-bốt.

Hoặc các loại tệp cụ thể (như PDF):

<Files ~ “\ .pdf $”> Bộ tiêu đề X-Robots-Tag “noindex, nofollow” </Files>

Để biết thêm thông tin về Thẻ meta rô bốt, hãy khám phá Thông số kỹ thuật thẻ meta rô bốt của Google.

Mẹo WordPress:

Trong Dashboard > Settings > Reading , đảm bảo không chọn hộp "Mức độ hiển thị của Công cụ Tìm kiếm". Điều này chặn các công cụ tìm kiếm đến trang web của bạn thông qua tệp robots.txt của bạn!

Hiểu các cách khác nhau mà bạn có thể ảnh hưởng đến việc thu thập thông tin và lập chỉ mục sẽ giúp bạn tránh được những cạm bẫy phổ biến có thể ngăn cản việc tìm thấy các trang quan trọng của bạn.

Xếp hạng: Công cụ tìm kiếm xếp hạng URL như thế nào?

Làm cách nào để các công cụ tìm kiếm đảm bảo rằng khi ai đó nhập truy vấn vào thanh tìm kiếm, họ sẽ nhận được các kết quả có liên quan? Quá trình đó được gọi là xếp hạng, hoặc thứ tự các kết quả tìm kiếm theo liên quan nhất đến ít liên quan nhất đến một truy vấn cụ thể.

Một cách giải thích nghệ thuật về xếp hạng, với ba con chó ngồi xinh xắn trên bệ hạng nhất, hạng nhì và hạng ba.

Để xác định mức độ liên quan, các công cụ tìm kiếm sử dụng các thuật toán, một quy trình hoặc công thức mà thông tin được lưu trữ được truy xuất và sắp xếp theo những cách có ý nghĩa. Các thuật toán này đã trải qua nhiều thay đổi trong nhiều năm để cải thiện chất lượng kết quả tìm kiếm. Ví dụ, Google thực hiện các điều chỉnh thuật toán mỗi ngày - một số trong số các bản cập nhật này là các chỉnh sửa nhỏ về chất lượng, trong khi các bản cập nhật khác là các bản cập nhật thuật toán cốt lõi / rộng được triển khai để giải quyết một vấn đề cụ thể, như Penguin để giải quyết spam liên kết. Kiểm tra Lịch sử thay đổi thuật toán Google của chúng tôi để biết danh sách các bản cập nhật của Google đã được xác nhận và chưa được xác nhận từ năm 2000.

Tại sao thuật toán thay đổi thường xuyên như vậy? Có phải Google chỉ đang cố gắng giữ chân chúng ta không? Mặc dù Google không phải lúc nào cũng tiết lộ chi tiết cụ thể về lý do tại sao họ làm những gì họ làm, nhưng chúng tôi biết rằng mục tiêu của Google khi thực hiện các điều chỉnh thuật toán là cải thiện chất lượng tìm kiếm tổng thể. Đó là lý do tại sao, để trả lời cho các câu hỏi cập nhật thuật toán, Google sẽ trả lời bằng một số điều như sau: "Chúng tôi luôn thực hiện các bản cập nhật có chất lượng". Điều này cho thấy rằng, nếu trang web của bạn bị ảnh hưởng sau khi điều chỉnh thuật toán, hãy so sánh nó với Nguyên tắc chất lượng của Google hoặc Nguyên tắc đánh giá chất lượng tìm kiếm, cả hai đều rất rõ ràng về những gì công cụ tìm kiếm muốn.

Công cụ tìm kiếm muốn gì?

Các công cụ tìm kiếm luôn mong muốn điều tương tự: cung cấp câu trả lời hữu ích cho câu hỏi của người tìm kiếm ở các định dạng hữu ích nhất. Nếu điều đó là đúng, thì tại sao SEO bây giờ lại khác so với những năm trước?

Hãy nghĩ về điều đó khi ai đó học một ngôn ngữ mới.

Lúc đầu, sự hiểu biết của họ về ngôn ngữ này rất thô sơ - “See Spot Run”. Theo thời gian, sự hiểu biết của họ bắt đầu sâu sắc hơn, và họ học ngữ nghĩa - ý nghĩa đằng sau ngôn ngữ và mối quan hệ giữa các từ và cụm từ. Cuối cùng, với đủ thực hành, học sinh biết ngôn ngữ đủ tốt để thậm chí hiểu sắc thái, và có thể cung cấp câu trả lời cho các câu hỏi thậm chí mơ hồ hoặc không đầy đủ.

Khi các công cụ tìm kiếm mới bắt đầu học ngôn ngữ của chúng ta, việc đánh lừa hệ thống bằng cách sử dụng các thủ thuật và chiến thuật thực sự đi ngược lại với các nguyên tắc về chất lượng sẽ dễ dàng hơn nhiều. Lấy ví dụ như nhồi nhét từ khóa. Nếu bạn muốn xếp hạng cho một từ khóa cụ thể như “chuyện cười vui nhộn”, bạn có thể thêm các từ “chuyện cười vui nhộn” nhiều lần vào trang của mình và tô đậm, với hy vọng tăng thứ hạng của bạn cho cụm từ đó:

Chào mừng bạn đến với những câu chuyện cười vui nhộn! Chúng tôi kể những câu chuyện cười hài hước nhất trên thế giới. Những trò đùa vui nhộn và vui nhộn. Trò đùa vui nhộn của bạn đang chờ đợi. Hãy ngồi lại và đọc những câu chuyện cười hài hước vì những câu chuyện cười hài hước có thể khiến bạn vui và hài hước hơn. Một số câu chuyện cười vui nhộn được yêu thích nhất.

Chiến thuật này tạo ra trải nghiệm người dùng tồi tệ và thay vì cười vào những trò đùa hài hước, mọi người lại bị tấn công bởi văn bản khó đọc, khó đọc. Nó có thể đã hoạt động trong quá khứ, nhưng đây không bao giờ là điều mà các công cụ tìm kiếm muốn.

Vai trò của các liên kết trong SEO

Khi chúng ta nói về các liên kết, chúng ta có thể muốn nói đến hai điều. Liên kết ngược hoặc "liên kết trong nước" là liên kết từ các trang web khác trỏ đến trang web của bạn, trong khi liên kết nội bộ là liên kết trên trang web của riêng bạn trỏ đến các trang khác của bạn (trên cùng một trang web).

Các liên kết trong lịch sử đã đóng một vai trò lớn trong SEO. Ngay từ rất sớm, các công cụ tìm kiếm đã cần trợ giúp để tìm ra URL nào đáng tin cậy hơn những URL khác để giúp họ xác định cách xếp hạng kết quả tìm kiếm. Tính toán số lượng liên kết trỏ đến bất kỳ trang web nhất định nào đã giúp họ thực hiện điều này.


Các liên kết ngược hoạt động rất giống với các giới thiệu WoM (Word-of-Mouth) trong đời thực. Hãy lấy một quán cà phê giả định, Jenny’s Coffee, làm ví dụ:

  • Giới thiệu từ người khác = dấu hiệu tốt của thẩm quyền

Ví dụ: Nhiều người khác nhau đều nói với bạn rằng Jenny’s Coffee là quán ngon nhất trong thị trấn

  • Giới thiệu từ chính bạn = thiên vị, vì vậy không phải là một dấu hiệu tốt của thẩm quyền

Ví dụ: Jenny tuyên bố rằng Jenny’s Coffee là quán ngon nhất trong thị trấn

  • Giới thiệu từ các nguồn không liên quan hoặc chất lượng thấp = không phải là dấu hiệu tốt của thẩm quyền và thậm chí có thể khiến bạn bị gắn cờ vì spam

Ví dụ: Jenny đã trả tiền để có những người chưa bao giờ đến quán cà phê của cô ấy nói cho người khác biết nó tốt như thế nào.

  • Không có giới thiệu = thẩm quyền không rõ ràng

Ví dụ: Jenny’s Coffee có thể tốt, nhưng bạn không thể tìm thấy bất kỳ ai có ý kiến ​​nên bạn không thể chắc chắn.

Đây là lý do tại sao PageRank được tạo. PageRank (một phần của thuật toán cốt lõi của Google) là một thuật toán phân tích liên kết được đặt tên theo một trong những người sáng lập của Google, Larry Page. PageRank ước tính tầm quan trọng của một trang web bằng cách đo lường chất lượng và số lượng các liên kết trỏ đến nó. Giả định rằng một trang web càng có liên quan, quan trọng và đáng tin cậy thì trang web đó sẽ kiếm được càng nhiều liên kết.

Bạn càng có nhiều liên kết ngược tự nhiên từ các trang web có thẩm quyền cao (đáng tin cậy), thì tỷ lệ cược của bạn càng cao để xếp hạng cao hơn trong kết quả tìm kiếm.

Vai trò của nội dung trong SEO

Sẽ không có điểm liên kết nào nếu chúng không hướng người tìm kiếm đến một thứ gì đó. Đó là một cái gì đó là nội dung! Nội dung không chỉ là lời nói; đó là bất cứ thứ gì để người tìm kiếm sử dụng - có nội dung video, nội dung hình ảnh và tất nhiên, văn bản. Nếu công cụ tìm kiếm là máy trả lời, thì nội dung là phương tiện mà công cụ cung cấp các câu trả lời đó.

Bất kỳ lúc nào ai đó thực hiện tìm kiếm, có hàng nghìn kết quả có thể đạt được, vậy làm cách nào để các công cụ tìm kiếm quyết định trang nào mà người tìm kiếm sẽ tìm thấy có giá trị? Một phần quan trọng trong việc xác định vị trí trang của bạn sẽ xếp hạng cho một truy vấn nhất định là mức độ phù hợp của nội dung trên trang của bạn với mục đích của truy vấn. Nói cách khác, trang này có khớp với các từ đã được tìm kiếm và giúp hoàn thành nhiệm vụ mà người tìm kiếm đang cố gắng hoàn thành không?

Bởi vì điều này tập trung vào sự hài lòng của người dùng và hoàn thành nhiệm vụ, không có điểm chuẩn nghiêm ngặt nào về thời lượng nội dung của bạn, số lần nội dung phải chứa một từ khóa hoặc những gì bạn đặt trong thẻ tiêu đề của mình. Tất cả những thứ đó có thể đóng một vai trò trong việc một trang hoạt động tốt như thế nào trong tìm kiếm, nhưng trọng tâm phải là những người dùng sẽ đọc nội dung.

Ngày nay, với hàng trăm hoặc thậm chí hàng nghìn tín hiệu xếp hạng, ba tín hiệu hàng đầu vẫn khá nhất quán: liên kết đến trang web của bạn (đóng vai trò là tín hiệu uy tín của bên thứ ba), nội dung trên trang (nội dung chất lượng đáp ứng ý định của người tìm kiếm) và RankBrain.

RankBrain là gì?

RankBrain là thành phần học máy trong thuật toán cốt lõi của Google. Máy học là một chương trình máy tính tiếp tục cải thiện các dự đoán của nó theo thời gian thông qua các quan sát và dữ liệu đào tạo mới. Nói cách khác, nó luôn học hỏi và vì nó luôn học hỏi, nên kết quả tìm kiếm sẽ không ngừng được cải thiện.

Ví dụ: nếu RankBrain nhận thấy một URL xếp hạng thấp hơn cung cấp kết quả tốt hơn cho người dùng so với các URL xếp hạng cao hơn, bạn có thể đặt cược rằng RankBrain sẽ điều chỉnh các kết quả đó, chuyển kết quả phù hợp hơn lên cao hơn và hạ cấp các trang ít liên quan hơn như một sản phẩm phụ.

Một hình ảnh cho thấy kết quả có thể thay đổi như thế nào và đủ biến động để hiển thị các thứ hạng khác nhau thậm chí vài giờ sau đó.

Giống như hầu hết mọi thứ với công cụ tìm kiếm, chúng tôi không biết chính xác những gì bao gồm RankBrain, nhưng rõ ràng, những người ở Google cũng vậy.

Các chỉ số về mức độ tương tác: tương quan, quan hệ nhân quả hay cả hai?

Với xếp hạng của Google, các chỉ số tương tác rất có thể là mối tương quan một phần và một phần nhân quả.

Khi chúng tôi nói chỉ số tương tác, chúng tôi muốn nói đến dữ liệu đại diện cho cách người tìm kiếm tương tác với trang web của bạn từ kết quả tìm kiếm. Điều này bao gồm những thứ như:

  • Số lần nhấp (lượt truy cập từ tìm kiếm)

  • Thời gian trên trang (lượng thời gian khách truy cập đã dành trên một trang trước khi rời khỏi trang)

  • Tỷ lệ thoát (tỷ lệ phần trăm của tất cả các phiên trang web mà người dùng chỉ xem một trang)

  • Pogo-stick (nhấp vào một kết quả không phải trả tiền và sau đó nhanh chóng quay lại SERP để chọn một kết quả khác)

Nhiều thử nghiệm, bao gồm cả khảo sát về yếu tố xếp hạng của chính Moz, đã chỉ ra rằng các chỉ số tương tác tương quan với xếp hạng cao hơn, nhưng quan hệ nhân quả đã được tranh luận sôi nổi. Các chỉ số tương tác tốt có phải chỉ là dấu hiệu của các trang web được xếp hạng cao không? Hay các trang web được xếp hạng cao bởi vì chúng sở hữu các chỉ số tương tác tốt?

Google đã nói gì

Mặc dù họ chưa bao giờ sử dụng thuật ngữ “tín hiệu xếp hạng trực tiếp”, nhưng Google đã rõ ràng rằng họ hoàn toàn sử dụng dữ liệu nhấp chuột để sửa đổi SERP cho các truy vấn cụ thể.

Theo cựu Giám đốc Chất lượng Tìm kiếm của Google, Udi Manber:

“Bản thân thứ hạng bị ảnh hưởng bởi dữ liệu nhấp chuột. Nếu chúng tôi phát hiện ra rằng, đối với một truy vấn cụ thể, 80% người nhấp vào # 2 và chỉ 10% nhấp vào # 1, sau một thời gian, chúng tôi nhận ra có lẽ # 2 là truy vấn mà mọi người muốn, vì vậy chúng tôi sẽ chuyển nó. ”

Một nhận xét khác từ cựu kỹ sư của Google, Edmond Lau chứng thực điều này:

“Rõ ràng là bất kỳ công cụ tìm kiếm hợp lý nào sẽ sử dụng dữ liệu nhấp chuột trên kết quả của chính chúng để cung cấp lại xếp hạng nhằm cải thiện chất lượng kết quả tìm kiếm. Cơ chế thực tế về cách dữ liệu nhấp chuột được sử dụng thường là độc quyền, nhưng Google cho thấy rõ ràng rằng họ sử dụng dữ liệu nhấp chuột với các bằng sáng chế của mình trên các hệ thống như các mục nội dung được điều chỉnh xếp hạng. ”

Bởi vì Google cần duy trì và cải thiện chất lượng tìm kiếm, dường như không thể tránh khỏi các chỉ số tương tác hơn là tương quan, nhưng có vẻ như Google không gọi các chỉ số tương tác là "tín hiệu xếp hạng" vì những chỉ số đó được sử dụng để cải thiện chất lượng tìm kiếm và xếp hạng của các URL riêng lẻ chỉ là sản phẩm phụ của việc đó.

Những thử nghiệm nào đã xác nhận

Nhiều thử nghiệm khác nhau đã xác nhận rằng Google sẽ điều chỉnh thứ tự SERP để đáp ứng sự tương tác của người tìm kiếm:

Thử nghiệm năm 2014 của Rand Fishkin đã cho ra kết quả thứ 7 chuyển lên vị trí số 1 sau khi có khoảng 200 người nhấp vào URL từ SERP. Thật thú vị, việc cải thiện xếp hạng dường như được tách biệt với vị trí của những người đã truy cập liên kết. Vị trí xếp hạng tăng đột biến ở Hoa Kỳ, nơi có nhiều người tham gia, trong khi vị trí xếp hạng vẫn thấp hơn trên trang trong Google Canada, Google Úc, v.v.

So sánh của Larry Kim về các trang hàng đầu và thời gian dừng trung bình của chúng trước và sau RankBrain dường như chỉ ra rằng thành phần học máy trong thuật toán của Google làm giảm vị trí xếp hạng của các trang mà mọi người không dành nhiều thời gian.

Thử nghiệm của Darren Shaw cũng cho thấy tác động của hành vi người dùng đối với kết quả tìm kiếm địa phương và gói bản đồ.

Vì các chỉ số tương tác của người dùng rõ ràng được sử dụng để điều chỉnh SERP về chất lượng và xếp hạng các thay đổi vị trí như một sản phẩm phụ, nên có thể an toàn khi nói rằng SEO nên tối ưu hóa cho sự tương tác. Sự tương tác không thay đổi chất lượng khách quan của trang web của bạn, mà là giá trị của bạn đối với người tìm kiếm so với các kết quả khác cho truy vấn đó. Đó là lý do tại sao, sau khi không có thay đổi nào đối với trang của bạn hoặc các liên kết ngược của nó, nó có thể giảm thứ hạng nếu hành vi của người tìm kiếm cho thấy họ thích các trang khác hơn.

Về mặt xếp hạng các trang web, số liệu tương tác hoạt động giống như một công cụ kiểm tra thực tế. Các yếu tố khách quan như liên kết và nội dung đầu tiên xếp hạng trang, sau đó là các chỉ số tương tác giúp Google điều chỉnh nếu họ không làm đúng.

Đăng nhận xét

Mới hơn Cũ hơn