若要向 Google 搜索指定重复网页或非常相似网页的规范网址,您可以使用多种方法指明您更愿意使用哪个网址。这些方法按照其对规范化的影响程度排列如下:
rel="canonical"
link
注释:强信号,表明所指定的网址应成为规范网址。请注意,这些方法可以叠加,因此组合使用会更有效。 这意味着,如果您使用两种或更多种方法,将会增加您的首选规范网址出现在搜索结果中的几率。
虽然我们建议您使用这些方法,但并非硬性要求;即使您不指定首选规范网址,您的网站或许也能表现不错。这是因为,如果您没有指定规范网址,Google 会客观地确定哪个版本的网址最适合在 Google 搜索中向用户显示。
虽然指定首选规范网址通常并不重要,但您还是会出于各种原因希望将一组重复或类似网页中的规范网页明确告知 Google:
https://www.example.com/dresses/green/green-dress.html
(而非 https://example.com/dresses/cocktail?gclid=ABCD
)访问您的绿色连衣裙商品页。https://example.com/dresses/cocktail?gclid=ABCD
的信号会整合到指向 https://www.example.com/dresses/green/green-dress.html
(如果该网址成为规范网址)的链接。无论使用哪种规范化方法,都请遵循以下最佳实践:
rel="canonical"
为同一网页另行指定一个规范网址)。noindex
阻止选择单个网站中的规范网页,因为这样会完全阻止该网页显示在 Google 搜索结果中。rel="canonical"
link
注释是首选解决方案。hreflang
元素,请务必指定一个采用同一语言的规范网页;如果没有这样的规范网页,请指定一个采用最佳替代语言的规范网页。下表比较了不同的规范化方法,重点说明了它们在不同场景中在维护和效果方面的优势和劣势。
方法和说明 | |||
---|---|---|---|
rel="canonical" link 元素 |
在所有重复网页的代码中分别添加一个 <link> 元素,使其指向规范网页。
|
||
rel="canonical" HTTP 标头 |
在网页响应中发送 rel="canonical" 标头。
|
||
站点地图 | 在站点地图中指定您的规范网页。
|
||
重定向 | 使用重定向告知 Googlebot 重定向网址是比给定网址更佳的版本。请仅在弃用重复网页时使用此方法。 | ||
AMP 变体 | 如果您的某个网页变体是 AMP 网页,请按照 AMP 指南指明规范网页和 AMP 变体。 |
rel="canonical"
link
注释Google 支持明确的 rel
canonical link
注释(如 RFC 6596 中所述)。系统会忽略建议网页替代版本的 rel="canonical"
注释;具体来说就是,带有 hreflang
、lang
、media
和 type
属性的 rel="canonical"
注释不用于规范化。请改为使用适当的 link
注释来指定网页的备用版本;例如用 link
rel="alternate"
hreflang
进行语言和国家/地区注释。
您可以通过以下两种方式提供 rel="canonical"
link
注释:
我们建议您从中选择一个使用;在受支持的情况下,同时使用这两种方法更容易出错(例如,您可能会在 HTTP 标头中提供一个网址,在 rel="canonical"
link
元素中提供另一个网址)。
rel="canonical"
link
元素 rel="canonical"
link
元素(也称为“规范元素”)是指在 HTML 的 head
部分中使用的元素,用于指明另一个网页可体现该网页上的内容。
假设您想将 https://example.com/dresses/green-dresses
设为规范网址(即使有很多个网址指向该内容),那么您可通过执行以下步骤,将此网址指定为规范网址:
rel="canonical"
属性的 <link>
元素添加到重复网页的 <head>
部分中,并使其指向规范网页。例如:
<html> <head> <title>Explore the world of dresses</title> <link rel="canonical" href="https://example.com/dresses/green-dresses" /> <!-- other elements --> </head> <!-- rest of the HTML -->
rel="alternate"
link
元素,并使该链接指向此网页的移动版:
<html> <head> <title>Explore the world of dresses</title> <link rel="alternate" media="only screen and (max-width: 640px)" href="https://m.example.com/dresses/green-dresses"> <link rel="canonical" href="https://example.com/dresses/green-dresses" /> <!-- other elements --> </head> <!-- rest of the HTML -->
hreflang
或其他元素。对于 rel="canonical"
link
元素,请使用绝对路径(而非相对路径)。尽管 Google 支持相对路径,但从长远来看,相对路径可能会造成问题(例如,如果您无意中允许抓取您的测试网站),因此我们不建议您这样做。
正面示例: https://www.example.com/dresses/green/green-dress.html
反面示例: /dresses/green/green-dress.html
rel="canonical"
link element
仅当出现在 HTML 的 <head>
部分时才被接受,因此请确保至少 <head>
部分是有效的 HTML。
如果您使用 JavaScript 添加 rel="canonical"
link
元素,请务必正确注入规范 link 元素。
rel="canonical"
HTTP 标头如果您能更改服务器配置,则可使用 link
HTTP 响应标头(带有 RFC5988 中定义的 rel="canonical"
目标属性)(而不是 HTML 元素)为 Google 搜索支持的文档(包括 PDF 文件等非 HTML 文档)指明规范网址。
Google 仅支持在网页搜索结果中使用此方法。
如果您以多种文件格式(例如 PDF 或 Microsoft Word)发布内容,并且均采用自己的网址,那么您可以返回 rel="canonical"
HTTP 标头,告知 Googlebot 哪个是非 HTML 文件的规范网址。例如,若要指明 PDF 版本的 .docx
版本应为规范网址,您可以为内容的 .docx
版本添加此 HTTP 标头:
HTTP/1.1 200 OK Content-Length: 19 ... Link: <https://www.example.com/downloads/white-paper.pdf>; rel="canonical" ...
与 rel="canonical"
link
元素一样,请在 rel="canonical"
HTTP 标头中使用绝对网址。
请分别为您的每个网页选择一个规范网址,然后通过站点地图提交这些规范网址。您在站点地图中列出的所有网页都会被视为向系统建议的规范网页;Google 会根据内容相似度决定哪些网页是重复网页(如果有)。
在站点地图中提供首选规范网址,即可轻松为大型网站指定规范网址,您也可以通过站点地图这种实用方法告知 Google 您认为网站上的哪些网页最重要。
如果您想移除现有的重复网页,请使用此方法。所有重定向方法(301
和 302
重定向、meta-refresh
、JavaScript 重定向)对 Google 搜索的效果相同,但搜索引擎发现不同重定向方法所用的时间可能有所不同。
要实现最快效果,请使用 3xx
HTTP(也称为“服务器端”)重定向。
假定用户可通过以下几种方式访问您的网页:
https://example.com/home
https://home.example.com
https://www.example.com
您可从这些网址中挑选一个作为规范网址,并使用重定向将来自其他网址的流量引导至首选网址。
除了明确提供的方法之外,Google 还使用一组规范化信号,这些信号通常基于网站设置:优先选择 HTTPS(而非 HTTP)以及优先选择 hreflang
集群中的网址。
Google 会优先选择 HTTPS 网页(而非等效的 HTTP 网页)作为规范网页,除非存在如下问题或冲突信号:
rel="canonical"
link
。虽然我们的系统在默认情况下会优先选择 HTTPS 网页(而非 HTTP 网页),但您可通过执行以下任一操作来确保此行为始终都会发生:
rel="canonical"
link
。为防止 Google 误将 HTTP 网页选为规范网页,请避免以下几种做法:
hreflang
注释中包含网页的 HTTP 版本(而不是 HTTPS 版本)。example.com
上提供 subdomain.example.com
的证书。该证书必须与您的完整网站网址匹配,或者必须是可用于同一网域上多个子网域的通配证书。hreflang
集群中的网址为了方便网站进行本地化,出于规范化目的,Google 会优先选择 hreflang
集群中的网址。例如,如果 https://example.com/de-de/cats
和 https://example.com/de-ch/cats
通过 hreflang
注释指向对方,而不是指向 https://example.com/de-at/cats
,de-de
和 de-ch
的网页将成为首选规范网页(而不是未出现在 hreflang
集群中的 /de-at/
网页)。
详细了解如何排查和解决规范化问题。
免费申请你的专属方案
Online Consulting