什么是规范网页?为什么要指定规范网页?
2011-07-01 21:16:08 来源:WEB开发网Google 的网页索引服务现在开始支持 HTTP 头中指定的 link rel=“canonical” 关系声明,该语法在 IETF RFC 5988 第 5 段有叙述。站长可以通过 rel=“canonical” HTTP 头通告 HTML 文档以及其他格式内容(如 PDF 文件)的 canonical URL。
假设一家网站同时提供了白皮书的 HTML 页面与可下载的 PDF 版本,URL 分别为:
http://www.example.com/white-paper.html
http://www.example.com/white-paper.pdf
这时,站长可以在 PDF 文件被请求时通过 rel=“canonical” HTTP 头通告 Google 该 PDF 下载版的 canonical URL 就是相应的 HTML 文档;例如:
另一种 rel=“canonical” HTTP 头有用的常见情形是:网站通过多个 URL 提供同样的文件(例如使用内容分发网络/CDN 时)而站长希望通告 Google 首选 URL。
当前 link 头元素只支持网页搜索。将来会根据站长的使用情况再进行调整。详情可查阅帮助中心的 canonicalization(“规范化”) 与 rel=“canonical” 元素两篇文章。
拓展阅读:关于 rel=“canonical”
什么是规范网页?为什么要指定规范网页?
规范网页是一组内容高度相似的网页的首选版本。
对于网站来说,包含多个列有同组产品的网页很正常。例如,一个网页可能按字母表顺序显示产品,而其他网页则按照价格或评分显示相同产品。例如:
http://www.example.com/product.php?item=swedish-fish&trackingid=1234567&sort=alpha&sessionid=5678asfasdfasfd
http://www.example.com/product.php?item=swedish-fish&trackingid=1234567&sort=price&sessionid=5678asfasdfasfd
如果 Google 知道这些网页的内容相同,我们可能只会将搜索结果的一个版本编入索引。我们的算法会选择我们认为可以最好地回答用户查询的网页。不过,现在用户可以通过将<link>元素和 rel=“canonical” 属性添加到该网页非规范版本的 <head>部分,为搜索引擎指定规范网页。添加此链接和属性可以让网站拥有者识别出哪些网页具有相同的内容,从而向 Google 提出建议:“在内容相同的所有网页中,此网页最有用。请将该网页排在搜索结果中靠前的位置。”
如何指定规范网页?
要指定指向网页 http://www.example.com/product.php?item=swedish-fish 的规范链接,请按以下形式创建 <link>元素:
<link rel=“canonical” href=“http://www.example.com/product.php?item=swedish-fish”/>
将上述链接复制到该网页所有非规范版本的<head>部分,如 http://www.example.com/product.php?item=swedish-fish&sort=price。
如果您在 http://www.example.com/product.php?item=swedish-fish 和 https://www.example.com/product.php?item=swedish-fish 上都发布了内容,则可以指定该网页的规范版本。创建<link>元素:
<link rel=“canonical” href=“http://www.example.com/product.php?item=swedish-fish”/>
将上述链接添加到 https://www.example.comproduct.php?item=swedish-fish 的<head>部分。
via Google Webmaster Central Blog
更多精彩
赞助商链接