搜索引擎工作原理与英文SEO的一些看法

2010 - 10 - 13 作者 : 石家庄SEO 分类 :杂谈

    用户来到搜索引擎,输入需要查询的关键词。

经过搜索引擎查询已收录记录,并按照用户意愿(输入的关键词)匹配出最佳结果给予置前。其余相关结果按照一个股则排列。——搜索引擎排名

那好 大家都知道蜘蛛看的是代码即html(超文本标记语言),也就是说html蜘蛛是认的.当通过链接或者自己将网站登陆搜索引擎,那么,搜索引擎会暂存你提交的网址.在过一定的时间周期,它(蜘蛛)会去你网站看看.首先来检查网站是否有robots.txt,它会知道你网站那些东西是可以被任何搜索引擎收录的,哪些是不允许搜索引擎收录的.然后robots.txt中是否有存在网站地图-sitemap 通常指的是按照国际标准书写的xml 文件.而不是页面中的网站地图,虽然页面上的网站地图有的也叫sitemap但是起到导航作用给用户看的.也可以作为网站的地图让搜索引擎爬行.

也就是说,蜘蛛看到的东西都是"字符串",人们通常说的密度就是关键词在网站页面出现"字符串"的多少.经过搜索引擎过滤无其他代码只留下文字性的内容.屁如td tr div li 等等HTML标记.

爬行页面 在看过网站robots.txt 之后 会读 页面 html 的head 部分的3个标记

title

keyworld

direction

title 也是被蜘蛛 认定页面中心思想的一个主要

keyworld 是 网站 或者页面 中包含的认为最能体现中心思想 并与标题呼应的 几个关键词

分词 蜘蛛在过滤了一些结构代码(泛指TD TR DIV LI 等组织结构 的HTML标记),那么生下来的就是蜘蛛将抓取的页面句子(长句,短句,词组).拆分成 几个 或多个 词组.并按照主,谓,宾。形容词 副词 动词和其他拆分。

影响页面排名的一些因素 各自都占有一定的数值比例

例如

标题 关键词 描述 网站导航 页面大小 W3C标准 关键词密度 出现位置 关键词在页面的先后(从做到右,从上到下)相关词 内部连接 外部链接 JS出现多少

看积分情况()表示 影响排名因素的积分 积分10进制 这里用的积分仅仅作为举例并不是按照重要性评分

 如果

标题(9) 关键词(7) 描述(4) 网站导航(5) 页面大小(6) W3C标准(4) 关键词密度(5) 出现位置(3) 关键词在页面的先后(4)相关词(2) 内部连接(6) 外部链接(2) JS出现多少(4) 等。。

那么这个些因素就会形成一个字符串或者一个矩阵

09 07 04 05 06 04 05 03 04 02 06 02 04

这个值 是按照你的页面根据你指定关键词 与页面内容符合度的一个数值 比如是 seo博客

那么这个数值 在将来决定你关键词排名中就虎起到作用

A 表示 你的SEO博客的得分情况是  B表示对手 的得分情况

0    1   2    3   4   5   6  7  8   9  10  11 12 13

A:09 07 04 05 06 04 05 03 04 02 06 02 04

B:10 08 08 05 06 04 06 03 04 02 08 02 04

C:  10 07 06 05 06 05 06 03 04 02 08 02 04

那么你看出异同来了 如果

B1>A1 B2>B2 ......   B>A

B1>C1 B2>C2.......   B>C

然后讲10组 数组 循环进行比对最后得出的数值 就是搜索引擎排名的最终结果

好了 基础扯完了  不懂的名词 请百度一下 百度不知道 谷歌一下你就知道了

下面进入正题

英文优化 其实与中文是一样的。上面说过都是字符串。经过搜索引擎收录 并处理后给出 上面的 数组

也可能是 及时给出的 及时的意思是 在用户查询某个关键词 那么

搜索引擎 将前面专区的页面信息进行繁琐的比对后 给出的搜索结果

呢么其决定因素并不是 页面用语言与编码 而是 用户输入的关键词 与数据库中的记录内 对应符合度多少 和上面提到的 数组比对结果符合度

对于站内的操作 中文如何做 英文也如何做 每一个影响排名因素都不要放弃(空或者填写的不和情理)

把每一各因素都一科学合理的而有针对性的书写好,保证该因素是加分而不是减分。

那么这样综合下来 配合外链 避免作弊 基本可以做到各个搜索引擎中和

中和的意思就是 各个搜索引擎算法 不一样但是 经过多年SEO们的研究 得出的能够影响 搜索引擎能够排名的因素把握好 那么各个搜索引擎中目标页面的关键词排名就会 相差不多

权重 蜘蛛对网站 更新习惯的把握 在一天内 第一次来爬行与第二次 第三次都有时间记录

而且还有跟心内容收录数量记录 这些应该可以在 log 里面看到 当你网站形成一定周期性

那么 蜘蛛也会判断 你更新内容频率 和 内容与网站相关性 同比其他网站 相同内容进行对比

中间有没有点到或者漏掉的就领会精神吧 这个博大精深的 包含了许多复杂的算法的聚合搜索还有待我们继续研究

3551 人围观 / 5 条评论 ↓快速评论↓

  • 首先我阐明自己的观点:seo不仅是一种技术更是一种思想。
      结合我个人建站的经验我来谈谈如何饲养好百度蜘蛛。
      分析一下,要想百度蜘蛛经常光顾自己的站,首先要先把蜘蛛引过来。怎么引?最简单的办法是你自己创造个关键字,注意要保证关键字的唯一性(如:得开旗胜),百度搜索到的结果相关性要低。那关键字要在你首页出现,而且有相关解释,目的是围绕关键字做相关内容。然后去百度更新快的地方,发布相关信息。 你发表的文章要围绕你创造的关键字写,关键字可以使用一两次加粗,色彩,或者下划线等,关键字连接到你首页地址,内容里再加一两次你首页地址(传说中的软文)。 最关键字加好了,信息也发布了,最关键的就是要触发百度检测数据库,使百度蜘蛛会顺着那些新内容找到你首页!怎么触发?还用问吗?刚做的关键字,具有唯一性,而且相关性低。如果有人搜索那关键字,百度蜘蛛检索时候会优先考虑最合适的页面,也许百度暂时没显示收录你的站,但是百度蜘蛛肯定已经闻风而动了。
      原理已经介绍了一些,吸引蜘蛛还有许多方法,简单的总结一下:
      一、 增加原创的文字,适当围绕关键字优化,强烈建议在title里也加一下。这里的原创不是说纯自己写的就完事了,你还要搜索一下别人是不是写过类似的,如果有劝你还是另换话题吧。 二、在百度权重高,更新快的地方发布围绕关键字相关内容的信息和你站点连接,让百度蜘蛛能够从多个地方转到你的站上去。我常用的有百度知道、贴吧以及各大网摘。
      三、围绕这个关键字进行推广,发布大量外链,让检索结果定位到你的站。
    http://www.50633.cn/

    jnshwws 2011-07-18 20:23 回复

    • @jnshwws:说的不错。思想也需要技术来实现呢啊,互联网没有技术不行的呢。

      石家庄SEO 2011-07-20 21:22 回复

  • 博主使用的是什么网站程序?

    SEO 2010-10-14 11:20 回复

    • @SEO:Powered by emlog

      石家庄SEO 2010-10-14 12:22 回复

  • 上述这些工作都做了,为什么百度的蜘蛛程序还是不会主动走进我的站。

    小欧 2010-10-13 16:26 回复

(必须)

(必须,保密)

阿狸1 阿狸2 阿狸3 阿狸4 阿狸5 阿狸6 阿狸7 阿狸8 阿狸9 阿狸10 阿狸11 阿狸12 阿狸13 阿狸14 阿狸15 阿狸16 阿狸17 阿狸18