搜索引擎优化(Search engine optimization,简称SEO)


  1. 服务器访问速度和稳定性,搜索爬虫与普通用户一样访问并获取内容。

  2. 使用文字而不是flash、图片、Javascript等来显示重要的内容或链接,

  3. 如果必须使用Flash制作网页,建议同时制作一个供搜索引擎收录的文字版,并在首页使用文本链接指向文字版Ajax等搜索引擎不能识别的技术,只用在需要用户交互的地方,不把希望搜索引擎“看”到的导航及正文内容放到Ajax中。

  4. 不使用frame和iframe框架结构,通过iframe显示的内容可能会被百度丢弃

  5. 网站应该有清晰的结构和明晰的导航

  6. 使用图片做导航时,可以使用Alt注释,用Alt告诉搜索引擎,所指向的网页内容是什么

  7. URL尽量短

  8. 不添加不能被系统自动识别为url组成部分的字符

  9. 通常网页标题可以这样描述:

    首页:网站名称 或者 网站名称_提供服务介绍or产品介绍 •

    频道页:频道名称_网站名称 •

    文章页:文章title_频道名称_网站名称 

  10. 建议不要使用https协 议,如果非用不可,尽量将首页和重要页面做个http可访问版,方面百度收录。

  11. 要防止所有搜索引擎显示您网站的快照,请将此元标记置入网页的

  12. <HEAD> 部分:<meta name="robots" content="noarchive">

  13. 如果您不想搜索引擎追踪此网页上的链接,且不传递链接的权重,请将此元标记置入:<meta name="robots" content="nofollow">



百度 spider 对常用的 http 返回码的处理逻辑是这样的 :

  • 404返回码的含义是“NOT FOUND”,百度会认为网页已经失效,那么通常会从搜索结果中删除,并且短期内spider再次发现这条url也不会抓取。

  • 503返回码的含义是“Service Unavailable”,百度会认为该网页临时不可访问,通常网站临时关闭,带宽有限等会产生这种情况。对于网页返回503,百度spider不会把这条url直接删除,短期内会再访问。届时如果网页已恢复,则正常抓取;如果继续返回503,短期内还会反复访问几次。但是如果网页长期返回503,那么这个url仍会被百度认为是失效链接,从搜索结果中删除。

  • 403返回码的含义是“Forbidden”,百度会认为网页当前禁止访问。对于这种情况,如果是新发现的url,百度spider暂不会抓取,短期内会再次检查;如果是百度已收录url,当前也不会直接删除,短期内同样会再访问。届时如果网页允许访问,则正常抓取;如果仍不允许访问,短期内还会反复访问几次。但是如果网页长期返回403,百度也会认为是失效链接,从搜索结果中删除。

  • 301返回码的含义是“Moved Permanently”,百度会认为网页当前跳转至新url。当遇到站点迁移,域名更换、站点改版的情况时,推荐使用301返回码,尽量减少改版带来的流量损失。虽然百度spider现在对301跳转的响应周期较长,但我们还是推荐大家这么做。


我的以前项目示例:

<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
<meta name="keywords" content="大学生网购分期,大学生分期付款,大学生分期购物,分期付款,iphone6分期付款,手机分期付款,0元首付,大学生购物,大学生商城" />
<meta name="description" content="专为大学生设计的一个分期购物商城,主要功能有网购分期、信用宝和酷分享,这里提供网购最“酷”的商品,由大学生去选择,还为大学生量身定制了一个兼职服务,我们不提倡先用未来钱,而提倡用劳动换来您想要的东西;引入大学生信用体系,让大学生提前积累信用;" />
<meta name="author" content="coolfenqi" />
<title>酷分期 - 你的梦想提款机</title>


其他:

<META NAME="ROBOTS" CONTENT="INDEX,FOLLOW">:可以抓取本页,而且可以顺着本页继续索引别的链接 
<META NAME="ROBOTS" CONTENT="NOINDEX,FOLLOW">:不许抓取本页,但是可以顺着本页抓取索引别的链接 
<META NAME="ROBOTS" CONTENT="INDEX,NOFOLLOW">:可以抓取本页,但是不许顺着本页抓取索引别的链接 
<META NAME="ROBOTS" CONTENT="NOINDEX,NOFOLLOW">:不许抓取本页,也不许顺着本页抓取索引别的链接。


各大搜索引擎入口:



注意:本文归作者所有,未经作者允许,不得转载