搜索引擎排序计算第三课:排序计算
搜索引擎的的排序计算是最主要的阶段,因为百度有很多的产品,所以形成页面的白条鸡作为基础页面,将被所需要的检索所调用,搜索也因此节省了很大的资源。
排序的计算也同样调用了很多的计算模块,对页面进行全方位的立体的计算,包括对本页的计算和相关本站的计算以及外部链接的计算,然后各自模块形成各自的数值。
※※※※※※※※※※
网页的类型判断:
拜读过搜索引擎-原理、技术系统。其中对于网页类型的判断有独到的见地。我依照百度搜索引擎的理解,又改动了一些计算程序,使之更符合百度搜索的检索习惯。
主题类型:
该类型是最常用的格式,凡是有主题的文本都属于此类,我的理解对于主题文本的判断,也就是正文规则和天网的有所不同,主要是天网处理的数量和百度搜索殷勤的海量收录的不同,同时百度搜索引擎的主题命中算法,更符合内容的判断。
对于正文规则,也就是主题文本的判断,为了更加符合百度的主题搜索的要求,和目前检索的规律,我自己认为,title和标题的主题关联度,内容和标题的关联的,最权重容器标签内的文本,为主要判断条件。
对于正文规则计算的深度解析: (包括如何正文规则,以及主题正文计算的具体应用)
(1)title和内容标题的相关度。
(1)--> 相关度--> (2)标题和内容的相关度。
(3)最权重容器标签和内容的相关度。
(2)-->文本的数量于链接之间的比值,以及和图片之间的比值,就可以完全区分类型。
(3)-->切词-->分析计算-->也许还有少量语意匹配计算-->确认主题、提炼出关键字列表(重要索引词表)。
(4)-->容器确认-->标签树的构建-->通过相关计算,推导出最权重的正文所在处。
(5)-->特征标签的计算-->尤其对于位置、字体、大小等的统计所计算出的数值。
(6)-->相关链接的计算-->链接的计算-->切词的计算。
(7)-->基页的计算-->指纹的标识。
以上是对于主题正文计算的一些粗步构思。不够全面,望大家有兴趣的可以跟帖补充。
大地原创-欢迎以链接形式的转载
原发于搜索引擎爱好者:http://bbs.semhome.net
作者: 河北SEO终极梦幻
原载: 河北石家庄SEO网站优化技术服务
版权所有。转载时必须以链接形式注明作者和原始出处及本声明。否则将追究法律责任。
排序计算第三课:单个网页的排序计算 -搜索引擎的计算
文章出处:
http://www.hebeiseo.cn/suanfayanjiu/paixu-jisuan/
QQ:316492174
呼叫终极梦幻