福州CF酷鱼网络

QQ联系CF酷鱼
业务咨询:13950426257
快捷链接:网站建设 网站推广 网站改版
收藏CF酷鱼
网站地图 | 付款方式 | 常见问题 | 服务客户
搜索
网站建设 cfkuyu.com
    最新资讯
    联系我们
电话:13950426257
QQ:535378167
E-mail: cf#cfkuyu.com
   (请将#更改为@)
硬件维护
QQ:443218644
E-mail: 443218644#qq.com
   (请将#更改为@)
当前位置:首页 -> 最新资讯 -> 网站优化

GSA测试:链接和文本排序对比

时间:2013/3/15浏览 【字体:

经常会看到,好多网站面包屑上的位置标题会被加上链接,像下面这种:

京东的面包屑

同样也有下面这种位置标题没有链接的面包屑,如下图:

中关村面包屑

大概猜想了一下,这在搜索引擎计算中会有一定的影响。

从搜索引擎原理的角度看,页面上的文本和链接是分开处理的。正文提取的时候,是将页面上的文本信息单独提取处理,而把页面上的链接等等会被提取到另一个表中去。TF(词频)计算的时候,是依靠页面上的文本进行计算。猜想,页面上的链接锚文本会被过滤掉,不参与TF的计算。

下面用GSA做的一些测试来验证猜测:

做了两个页面,内容完全一样,页面上有三个用于测试的词【国平 刚子 66699303】,词中间用空格隔开。

gnbase-nolink.html是纯写出来的,gnbase-link.html是用三个链接将词指向自己(自链)。

纯文本 and 带链接

测试结果如下:

分别搜索:国平、刚子、66699303 排名在前面的都是不带链接的页面gnbase-nolink.html。

从上图看,不带链接的文本在摘要的时候,将中间的空格去除掉了,把三个词连接在一起。

然而link页面的自链效果没有体现出来,或者说是自己指向自己的锚文本没有直接出现文本效果好。

PS:测试的时候疏忽掉了,link这个页面是14号已经抓取并收录过的,nolink是15号新加上去的,开始测试link显示的日期为2012-05-14,后来发现后改了一下页面,GSA自动重新抓取了一次,link页面的日期才同步到15号。在搜索三个测试词的时候,link虽然抓取早,但是排名却没有后抓取的纯文本页面高。不过在搜索页面标题的时候,还是先抓取的link页面排名高。

由此可见,页面文本会直接参与页面的TF计算,链接锚文本被排除在外。

附录一些搜索数据:

百度关键字 | 网站 | 排名

华为时间管理法 | 360buy | 1

华为时间管理法 杨玉柱 | kongfz | 1

华为时间管理法 杨玉柱 | 360buy | 4

再生勇士9 | 360buy | 1

再生勇士9 施鸥 | kongfz| 3

再生勇士9 施鸥 | 360buy | 4

。。。。

出现这么一个情况就是,360buy很多书名排名很好,但是加上作者名之后,排名就很不理想,甚至翻页都找不到。点击看了页面,书名一般都是文本形式出现,而作者出现的时候用链接指向了作者的页面。

如果结合TF*IDF的一些因素来看的话,书名与检索词之间获得了不错的相关性,而作者因为没有参与到页面TF的计算,没有获得相应的得分。当只搜索【书名】的时候,书名的TF*IDF相关度够了,排名前面;但搜索【书名+作者】时,TF*IDF(书名)+TF*IDF(作者)的值没达到排名前列的要求。

文章来源:光年论坛


来源于:CF酷鱼网站建设 网站设计 网站制作 UI设计

专业源于CF酷鱼网站建设,提供特价网站设计、网页设计、网站建设、网页制作及网站制作
专业的团队,专业的设计,精心的打造

邮箱:cf#cfkuyu.com   MSN:cfkuyu#Live.com (请将#更改为@)
Copyright 2005 cfkuyu.com All Right Reserved  福州CF酷鱼网站建设  闽ICP备09042638号
本站字体为微软雅黑安装字体说明
QQ在线联系