目前针对搜索引擎的网站优化主要是针对两个方面:
并不是页面上的每个链接都有被索引的必要的。比如用来“注册”或“登录”的页面可能就不需要被索引。
可以通过指定rel="nofollow"
来告诉爬虫无需索引对应的链接。
<a href="some_link.html" rel="nofollow">链接文本</a>
如果一个页面有多个可能的URL,为了避免内容重复,可以用下面的方法指定Canonical URL(Preferred URL):
<link rel="canonical" href="http://noyesno.net/book/isbn:9787500779049"/>
这个方法是适用于Google,参见 About rel="canonical"
主要是合理使用页面的title标签和H1~H6标签。
<html> <head> <title>关于SEO的小技巧</title> </head><body> <h1>关于SEO的小技巧</h1> <h2>SEO介绍</h2> ... ... <h2>SEO技巧</h2> ... ... </body></html>
TODO More