Lương lập trình viên javascript

Nếu bạn có một trang duy nhất có thể truy cập bằng nhiều URL hoặc các trang khác nhau có nội dung tương tự (ví dụ: một trang có cả phiên bản dành cho thiết bị di động và máy tính để bàn), thì Google sẽ coi đây là các phiên bản trùng lặp của cùng một trang. Google sẽ chọn một URL làm phiên bản chuẩn và thu thập dữ liệu đó, đồng thời tất cả các URL khác sẽ được coi là URL trùng lặp và được thu thập dữ liệu ít thường xuyên hơn

Nếu bạn không cho Google biết rõ ràng URL nào là chuẩn, thì Google sẽ đưa ra lựa chọn cho bạn hoặc có thể coi cả hai đều có trọng số như nhau, điều này có thể dẫn đến hành vi không mong muốn, như được giải thích trong

Tài liệu này giải thích cách hoạt động của quá trình chuẩn hóa URL trong Google Tìm kiếm, liệu bạn có cần chỉ định URL chuẩn hay không và cách chỉ định tùy chọn của bạn cho Google

URL chuẩn là gì?

URL chuẩn là URL của trang mà Google cho là tiêu biểu nhất từ ​​tập hợp các trang trùng lặp trên trang web của bạn. Ví dụ: nếu bạn có các URL cho cùng một trang (_______54_______ và example.com/dresses/1234), Google sẽ chọn một URL là chuẩn

Các trang không cần phải hoàn toàn giống nhau; . URL chuẩn có thể ở miền khác với URL trùng lặp

Cách Google lập chỉ mục và chọn URL chuẩn

Khi Google lập chỉ mục một trang web, nó sẽ cố gắng xác định nội dung chính của mỗi trang. Nếu Google tìm thấy nhiều trang trên cùng một trang web có vẻ giống nhau, Google sẽ chọn trang mà Google cho là đầy đủ và hữu ích nhất và đánh dấu trang đó là trang chuẩn. Trang chuẩn sẽ được thu thập thường xuyên nhất;

Google chọn trang chuẩn dựa trên một số yếu tố (hoặc tín hiệu), chẳng hạn như trang được phân phối qua HTTP hay HTTPS, chất lượng trang, sự hiện diện của URL trong sơ đồ trang web và bất kỳ nhãn rel=canonical nào. Bạn có thể sử dụng các kỹ thuật này, nhưng Google có thể chọn một trang khác làm trang chuẩn so với trang của bạn, vì nhiều lý do

Các phiên bản ngôn ngữ khác nhau của một trang chỉ được coi là trùng lặp nếu nội dung chính ở cùng một ngôn ngữ (nghĩa là nếu chỉ dịch phần đầu trang, chân trang và văn bản không quan trọng khác, nhưng phần nội dung vẫn giữ nguyên, thì các trang

Google sử dụng các trang chuẩn làm nguồn chính để đánh giá nội dung và chất lượng. Kết quả tìm kiếm của Google thường trỏ đến trang chuẩn, trừ khi một trong những trang trùng lặp rõ ràng phù hợp hơn với người dùng. Ví dụ: kết quả tìm kiếm có thể sẽ trỏ đến trang dành cho thiết bị di động nếu người dùng đang sử dụng thiết bị di động, ngay cả khi trang dành cho máy tính để bàn được đánh dấu là chuẩn

Lý do có các trang tương tự hoặc trùng lặp

Có những lý do chính đáng khiến trang web của bạn có thể có các URL khác nhau trỏ đến cùng một trang hoặc có các trang trùng lặp hoặc rất giống nhau ở các URL khác nhau. Dưới đây là những lý do phổ biến nhất

  • Để hỗ trợ nhiều loại thiết bị.
    https://example.com/news/koala-rampage
    https://m.example.com/news/koala-rampage
    https://amp.example.com/news/koala-rampage
  • Để bật URL động cho những thứ như sắp xếp hoặc lọc tham số hoặc ID phiên.
    https://www.example.com/products?category=dresses&color=green
    https://example.com/dresses/cocktail?gclid=ABCD
    https://www.example.com/dresses/green/greendress.html
  • Nếu hệ thống blog của bạn tự động lưu nhiều URL khi bạn đặt cùng một bài đăng trong nhiều phần.
    https://blog.example.com/dresses/green-dresses-are-awesome/
    https://blog.example.com/green-things/green-dresses-are-awesome/
  • Nếu máy chủ của bạn được định cấu hình để phân phát cùng một nội dung cho các biến thể cổng giao thức và http/https không phải www.
    https://example.com/green-dresses
    https://example.com/green-dresses
    https://www.example.com/green-dresses
    https://example.com:80/green-dresses
    https://example.com:443/green-dresses
  • Nếu nội dung bạn cung cấp trên blog để cung cấp cho các trang web khác được sao chép một phần hoặc toàn bộ trên các miền đó
    https://www.example.com/products?category=dresses&color=green
    https://example.com/dresses/cocktail?gclid=ABCD
    https://www.example.com/dresses/green/greendress.html
    0 (bài đăng tổng hợp)
    https://www.example.com/products?category=dresses&color=green
    https://example.com/dresses/cocktail?gclid=ABCD
    https://www.example.com/dresses/green/greendress.html
    1 (bài đăng gốc)

Lý do chọn URL chuẩn

Có một số lý do khiến bạn muốn chọn rõ ràng một trang chuẩn trong một tập hợp các trang trùng lặp hoặc tương tự

  • Để chỉ định URL nào bạn muốn mọi người nhìn thấy trong kết quả tìm kiếm. Bạn có thể thích mọi người tiếp cận trang sản phẩm trang phục màu xanh lá cây của bạn qua
    https://www.example.com/products?category=dresses&color=green
    https://example.com/dresses/cocktail?gclid=ABCD
    https://www.example.com/dresses/green/greendress.html
    2 hơn là
    https://www.example.com/products?category=dresses&color=green
    https://example.com/dresses/cocktail?gclid=ABCD
    https://www.example.com/dresses/green/greendress.html
    3
  • Để hợp nhất các tín hiệu liên kết cho các trang tương tự hoặc trùng lặp. Nó giúp các công cụ tìm kiếm có thể hợp nhất thông tin họ có cho các URL riêng lẻ (chẳng hạn như các liên kết tới chúng) thành một URL ưa thích duy nhất. Điều này có nghĩa là các liên kết từ các trang web khác đến
    https://www.example.com/products?category=dresses&color=green
    https://example.com/dresses/cocktail?gclid=ABCD
    https://www.example.com/dresses/green/greendress.html
    3 được hợp nhất với các liên kết đến
    https://www.example.com/products?category=dresses&color=green
    https://example.com/dresses/cocktail?gclid=ABCD
    https://www.example.com/dresses/green/greendress.html
    2
  • Để đơn giản hóa số liệu theo dõi cho một sản phẩm hoặc chủ đề. Với nhiều URL, sẽ khó khăn hơn để có được các chỉ số tổng hợp cho một phần nội dung cụ thể
  • Để quản lý nội dung được cung cấp. Nếu bạn cung cấp nội dung của mình để xuất bản trên các miền khác, bạn muốn đảm bảo rằng URL ưa thích của mình xuất hiện trong kết quả tìm kiếm
  • Để tránh dành thời gian thu thập thông tin trên các trang trùng lặp. Bạn muốn Googlebot tận dụng tối đa trang web của mình, vì vậy, tốt hơn là dành thời gian thu thập dữ liệu các trang mới (hoặc cập nhật) trên trang web của bạn, thay vì thu thập dữ liệu phiên bản dành cho máy tính để bàn và thiết bị di động của cùng một trang

Tìm hiểu trang nào Google coi là chuẩn

Sử dụng để tìm hiểu trang nào Google coi là chuẩn. Ngay cả khi bạn chỉ định rõ ràng một trang chuẩn, Google có thể chọn một trang chuẩn khác vì nhiều lý do, chẳng hạn như hiệu suất hoặc nội dung

Chỉ định một trang chuẩn

Để chỉ định một URL chuẩn cho các URL trùng lặp hoặc các trang tương tự, hãy chọn một trong các phương pháp sau. Mặc dù chúng tôi khuyến khích bạn sử dụng bất kỳ phương pháp nào trong số này, nhưng không có phương pháp nào là bắt buộc. Nếu bạn không chỉ ra một URL chính tắc, chúng tôi sẽ xác định những gì chúng tôi nghĩ là phiên bản hoặc URL tốt nhất. Hãy chắc chắn làm theo

Nếu bạn sử dụng CMS, chẳng hạn như WordPress, Wix hoặc Blogger, bạn có thể không trực tiếp chỉnh sửa được HTML của mình. Thay vào đó, CMS của bạn có thể có trang cài đặt công cụ tìm kiếm hoặc một số cơ chế khác để thông báo cho công cụ tìm kiếm về URL chuẩn. Tìm kiếm hướng dẫn về cách sửa đổi

https://www.example.com/products?category=dresses&color=green
https://example.com/dresses/cocktail?gclid=ABCD
https://www.example.com/dresses/green/greendress.html
6 của trang trên CMS của bạn (ví dụ: tìm kiếm "wordpress set the canonical tag")

Phương pháp và mô tả

Thêm thẻ

https://www.example.com/products?category=dresses&color=green
https://example.com/dresses/cocktail?gclid=ABCD
https://www.example.com/dresses/green/greendress.html
8 vào mã cho tất cả các trang trùng lặp, trỏ đến trang chuẩn

ưu
  • Có thể ánh xạ vô số trang trùng lặp

Nhược điểm

  • Có thể thêm vào kích thước của trang
  • Có thể phức tạp để duy trì ánh xạ trên các trang web lớn hơn hoặc các trang web có URL thay đổi thường xuyên
  • Chỉ hoạt động cho các trang HTML, không hoạt động cho các tệp như PDF. Trong những trường hợp như vậy, bạn có thể sử dụng tiêu đề HTTP rel=canonical

Gửi tiêu đề rel=canonical trong phản hồi trang của bạn

ưu

  • Không tăng kích thước trang
  • Có thể ánh xạ vô số trang trùng lặp

Nhược điểm

  • Có thể phức tạp để duy trì ánh xạ trên các trang web lớn hơn hoặc các trang web có URL thay đổi thường xuyên

Chỉ định các trang chuẩn của bạn trong sơ đồ trang web

ưu

  • Dễ thực hiện và bảo trì, đặc biệt là trên các trang web lớn

Nhược điểm

  • Google vẫn phải xác định bản sao được liên kết cho bất kỳ trang chuẩn nào mà bạn khai báo trong sơ đồ trang web
  • Tín hiệu kém mạnh mẽ hơn đối với Google so với kỹ thuật lập bản đồ rel=canonical
Sử dụng chuyển hướng
https://blog.example.com/dresses/green-dresses-are-awesome/
https://blog.example.com/green-things/green-dresses-are-awesome/
3 để cho Googlebot biết rằng URL được chuyển hướng là phiên bản tốt hơn so với URL đã cho. Chỉ sử dụng điều này khi không dùng một trang trùng lặp. Biến thể AMPNếu một trong các biến thể của bạn là trang AMP, hãy làm theo nguyên tắc AMP để chỉ ra trang chuẩn và biến thể AMP

Hướng dẫn chung

Đối với tất cả các phương pháp chuẩn hóa, hãy làm theo các hướng dẫn chung này

  • Không sử dụng robot. txt cho mục đích chuẩn hóa
  • Không sử dụng công cụ xóa URL để chuẩn hóa. Nó ẩn tất cả các phiên bản của URL khỏi Tìm kiếm
  • Không chỉ định các URL khác nhau là chuẩn cho cùng một trang bằng cách sử dụng các kỹ thuật chuẩn hóa giống hoặc khác nhau (ví dụ: không chỉ định một URL trong sơ đồ trang web mà chỉ định một URL khác cho cùng trang đó bằng cách sử dụng
    https://blog.example.com/dresses/green-dresses-are-awesome/
    https://blog.example.com/green-things/green-dresses-are-awesome/
    5)
  • Không sử dụng
    https://blog.example.com/dresses/green-dresses-are-awesome/
    https://blog.example.com/green-things/green-dresses-are-awesome/
    6 như một phương tiện để ngăn chặn việc lựa chọn một trang chuẩn. Quy tắc này nhằm mục đích loại trừ trang khỏi chỉ mục, không quản lý việc lựa chọn trang chuẩn
  • Chỉ định trang chuẩn khi sử dụng thẻ hreflang. Chỉ định một trang chuẩn trong cùng một ngôn ngữ hoặc ngôn ngữ thay thế tốt nhất có thể nếu một trang chuẩn không tồn tại cho cùng một ngôn ngữ

  • Liên kết tới URL chuẩn thay vì URL trùng lặp khi liên kết trong trang web của bạn. Liên kết nhất quán với URL mà bạn cho là chuẩn giúp Google hiểu tùy chọn của bạn

Thích HTTPS hơn HTTP cho các URL chuẩn

Google ưu tiên các trang HTTPS hơn các trang HTTP tương đương là trang chuẩn, trừ khi có sự cố hoặc tín hiệu xung đột, chẳng hạn như sau

  • Trang HTTPS có chứng chỉ SSL không hợp lệ
  • Trang HTTPS chứa các thành phần phụ thuộc không an toàn (ngoài hình ảnh)
  • Trang HTTPS chuyển hướng người dùng đến hoặc thông qua một trang HTTP
  • Trang HTTPS có một
    https://blog.example.com/dresses/green-dresses-are-awesome/
    https://blog.example.com/green-things/green-dresses-are-awesome/
    5
    https://blog.example.com/dresses/green-dresses-are-awesome/
    https://blog.example.com/green-things/green-dresses-are-awesome/
    8 tới trang HTTP

Mặc dù hệ thống của chúng tôi ưu tiên các trang HTTPS hơn các trang HTTP theo mặc định, nhưng bạn có thể đảm bảo hành vi này bằng cách thực hiện bất kỳ hành động nào sau đây

  • Thêm chuyển hướng từ trang HTTP sang trang HTTPS
  • Thêm một
    https://blog.example.com/dresses/green-dresses-are-awesome/
    https://blog.example.com/green-things/green-dresses-are-awesome/
    5
    https://blog.example.com/dresses/green-dresses-are-awesome/
    https://blog.example.com/green-things/green-dresses-are-awesome/
    8 từ trang HTTP vào trang HTTPS
  • Thực hiện HSTS

Để ngăn Google tạo trang HTTP chuẩn không chính xác, hãy tránh các phương pháp sau

  • Tránh các chứng chỉ TLS/SSL xấu và chuyển hướng HTTPS sang HTTP vì chúng khiến Google ưu tiên HTTP hơn rất nhiều. Việc triển khai HSTS không thể ghi đè tùy chọn mạnh mẽ này
  • Tránh đưa trang HTTP vào sơ đồ trang web của bạn hoặc các mục nhập hreflang thay vì phiên bản HTTPS
  • Tránh triển khai chứng chỉ SSL/TLS của bạn cho biến thể máy chủ không phù hợp. Ví dụ, ví dụ. com phục vụ chứng chỉ cho www. thí dụ. com. Chứng chỉ phải khớp với URL trang web hoàn chỉnh của bạn hoặc là chứng chỉ ký tự đại diện có thể được sử dụng cho nhiều miền phụ trên một miền

Sử dụng thẻ https://blog.example.com/dresses/green-dresses-are-awesome/ https://blog.example.com/green-things/green-dresses-are-awesome/5 https://blog.example.com/dresses/green-dresses-are-awesome/ https://blog.example.com/green-things/green-dresses-are-awesome/8

Một

https://blog.example.com/dresses/green-dresses-are-awesome/
https://blog.example.com/green-things/green-dresses-are-awesome/
5 link tag (canonical tag) is a tag used in the head section of HTML to indicate that a page overlaps another page. To indicate when a page is a duplicate of another page, you can use a ________1_______8 tag in the ________3_______5 section of your HTML.

Giả sử bạn muốn

https://example.com/green-dresses
https://example.com/green-dresses
https://www.example.com/green-dresses
https://example.com:80/green-dresses
https://example.com:443/green-dresses
6 làm URL chính tắc, mặc dù nhiều URL có thể truy cập nội dung này. Cho biết URL này là chuẩn với các bước sau

  1. Đánh dấu tất cả các trang trùng lặp bằng thẻ liên kết
    https://blog.example.com/dresses/green-dresses-are-awesome/
    https://blog.example.com/green-things/green-dresses-are-awesome/
    5

    Thêm phần tử <________2_______8> có thuộc tính

    https://blog.example.com/dresses/green-dresses-are-awesome/
    https://blog.example.com/green-things/green-dresses-are-awesome/
    5 vào phần
    https://www.example.com/products?category=dresses&color=green
    https://example.com/dresses/cocktail?gclid=ABCD
    https://www.example.com/dresses/green/greendress.html
    6 của các trang trùng lặp, trỏ đến trang chuẩn. Ví dụ

  2. Nếu trang chính tắc có một biến thể dành cho thiết bị di động, hãy thêm
    1
    https://blog.example.com/dresses/green-dresses-are-awesome/
    https://blog.example.com/green-things/green-dresses-are-awesome/
    8 vào trang đó, trỏ đến phiên bản dành cho thiết bị di động của trang.
  3. Thêm bất kỳ hreflang hoặc chuyển hướng nào khác phù hợp với trang

Sử dụng đường dẫn tuyệt đối thay vì đường dẫn tương đối với thẻ

https://blog.example.com/dresses/green-dresses-are-awesome/
https://blog.example.com/green-things/green-dresses-are-awesome/
5
https://blog.example.com/dresses/green-dresses-are-awesome/
https://blog.example.com/green-things/green-dresses-are-awesome/
8

Ví dụ tốt.

https://www.example.com/products?category=dresses&color=green
https://example.com/dresses/cocktail?gclid=ABCD
https://www.example.com/dresses/green/greendress.html
2

Ví dụ xấu.

6

Nếu bạn sử dụng JavaScript để thêm thẻ liên kết

https://blog.example.com/dresses/green-dresses-are-awesome/
https://blog.example.com/green-things/green-dresses-are-awesome/
5, hãy đảm bảo

Sử dụng tiêu đề HTTP https://blog.example.com/dresses/green-dresses-are-awesome/ https://blog.example.com/green-things/green-dresses-are-awesome/5

Nếu bạn có thể định cấu hình máy chủ của mình, thì bạn có thể sử dụng tiêu đề HTTP

https://blog.example.com/dresses/green-dresses-are-awesome/
https://blog.example.com/green-things/green-dresses-are-awesome/
5 (chứ không phải thẻ HTML) để chỉ ra URL chuẩn cho tài liệu được Tìm kiếm hỗ trợ, bao gồm các tài liệu không phải HTML, chẳng hạn như tệp PDF

Google hiện chỉ hỗ trợ phương pháp này cho kết quả tìm kiếm trên web

Nếu bạn hiển thị tệp PDF thông qua nhiều URL, bạn có thể trả về tiêu đề HTTP

https://blog.example.com/dresses/green-dresses-are-awesome/
https://blog.example.com/green-things/green-dresses-are-awesome/
5 để cho Googlebot biết URL chính tắc cho tệp PDF là gì

Link: ; rel="canonical"

Các đề xuất cho tiêu đề HTTP

https://blog.example.com/dresses/green-dresses-are-awesome/
https://blog.example.com/green-things/green-dresses-are-awesome/
5 giống với thẻ
https://blog.example.com/dresses/green-dresses-are-awesome/
https://blog.example.com/green-things/green-dresses-are-awesome/
5
https://blog.example.com/dresses/green-dresses-are-awesome/
https://blog.example.com/green-things/green-dresses-are-awesome/
8. Theo RFC2616, chỉ sử dụng dấu ngoặc kép trong tiêu đề HTTP
https://blog.example.com/dresses/green-dresses-are-awesome/
https://blog.example.com/green-things/green-dresses-are-awesome/
5

Sử dụng sơ đồ trang web

Chọn một URL chuẩn cho từng trang của bạn và gửi chúng trong sơ đồ trang web. Tất cả các trang được liệt kê trong sơ đồ trang web được đề xuất là trang chuẩn;

Chúng tôi không đảm bảo rằng chúng tôi sẽ coi các URL của sơ đồ trang web là chuẩn, nhưng đó là một cách đơn giản để xác định các chuẩn cho một trang web lớn và sơ đồ trang web là một cách hữu ích để cho Google biết trang nào bạn cho là quan trọng nhất trên trang web của mình

Không bao gồm các trang không chính tắc trong sơ đồ trang web. Nếu bạn đang sử dụng sơ đồ trang web, hãy chỉ định các URL chính tắc trong sơ đồ trang web

Sử dụng chuyển hướng https://blog.example.com/dresses/green-dresses-are-awesome/ https://blog.example.com/green-things/green-dresses-are-awesome/3 cho các URL đã ngừng hoạt động

Sử dụng phương pháp này khi bạn muốn loại bỏ các trang trùng lặp hiện có nhưng cần đảm bảo quá trình chuyển đổi suôn sẻ trước khi gỡ bỏ các URL cũ

Giả sử có thể truy cập trang của bạn theo nhiều cách

  • 6
  • 7
  • 8

Chọn một trong các URL đó làm URL chính tắc của bạn và sử dụng chuyển hướng

https://blog.example.com/dresses/green-dresses-are-awesome/
https://blog.example.com/green-things/green-dresses-are-awesome/
3 để gửi lưu lượng truy cập từ các URL khác đến URL ưa thích của bạn. Chuyển hướng
https://blog.example.com/dresses/green-dresses-are-awesome/
https://blog.example.com/green-things/green-dresses-are-awesome/
3 phía máy chủ là cách tốt nhất để đảm bảo rằng người dùng và công cụ tìm kiếm được chuyển hướng đến đúng trang. Mã trạng thái
https://blog.example.com/dresses/green-dresses-are-awesome/
https://blog.example.com/green-things/green-dresses-are-awesome/
3 có nghĩa là một trang đã được di chuyển vĩnh viễn đến một vị trí mới

Nếu bạn đang sử dụng dịch vụ lưu trữ trang web, hãy tìm kiếm tài liệu của họ về cách thiết lập chuyển hướng

https://blog.example.com/dresses/green-dresses-are-awesome/
https://blog.example.com/green-things/green-dresses-are-awesome/
3

Xử lý sự cố

Nếu URL chính tắc nằm trong thuộc tính mà bạn không sở hữu, bạn sẽ không thể thấy bất kỳ lưu lượng truy cập nào cho trang trùng lặp của mình. Dưới đây là một số lý do phổ biến mà một quy tắc có thể tồn tại trong một tài sản riêng biệt