关于EMLOG,BLOG的robots.txt屏蔽一些重复内容。

最近有不少朋友都用了EMLOG,这个BLOG程序,他是中国国产的BLOG相对与wordpress来说比较精简。

但是在使用过程中发现了一些不太适合搜索引擎优化的地方,比如首页与其他页面title雷同度高,即首页不能自定义title。

再就是,友情链接继承wordpress全站都有。

再就是,site时候发现很多page 和 author 和 ?plugin

还有很多栏目的列表翻页页面 page/2 page/3 ......

如果你用的是win服务器,那么还需要 修改httpd.ini 或者修改伪静态规则。

特别强调的是要加上这一句。

 RewriteRule /robots.txt /robots.txt [L]


下面看下,如何用robots.txt 屏蔽,EMLOG的一些容易重复的页面。

如下

 /*/ 代表所有一级目录下的要屏蔽内容。

/*/*/代表第二级目录下要屏蔽的内容。

以此类推 根据自己网站结构有几级写几次,为了避免写错导致自杀性屏蔽。还是 用 /*/ 来代表 目录深度。

同时也可以按照,要屏蔽的字符来定义,但是一旦屏蔽,所有包含这个字符的将都被屏蔽掉。

这个是我要屏蔽的内容,作为实例供参考。

User-agent: * 
Disallow: /content
Disallow: /author/
Disallow: /page/
Disallow: /?plugin*
Disallow: /*/?plugin*
Disallow: /*/*/page/
Disallow: /*/*/*/page/
Disallow: /*/*/*/*/page/
Disallow: /*/*/?plugin*
Disallow: /*/*/*/?plugin*
Disallow: /*/*/*/*/?plugin*

4703 人围观 / 5 条评论 ↓快速评论↓

  • 与就吃这么多写的内容你曾经运行成的plagorism或侵犯版权的任何问题吗?我的网站有一个完全独特的内容,我要么写自己或外包的很多,但似乎很多它是所有在互联网上出现了未经我同意。你知道任何解决方案,以帮助被扯掉的一站式内容?我肯定会欣赏它。

    car title loans 2012-05-12 03:40 回复

(必须)

(必须,保密)

阿狸1 阿狸2 阿狸3 阿狸4 阿狸5 阿狸6 阿狸7 阿狸8 阿狸9 阿狸10 阿狸11 阿狸12 阿狸13 阿狸14 阿狸15 阿狸16 阿狸17 阿狸18