飞飞电影系统

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 756|回复: 0

GSA测试:链接和文本排序比照

[复制链接]
  • TA的每日心情
    开心
    2015-6-7 01:58
  • 签到天数: 145 天

    [LV.7]常住居民III

    511

    主题

    808

    帖子

    3499

    积分

    高级会员

    Rank: 5Rank: 5

    积分
    3499

    最佳新人灌水之王优秀版主

    发表于 2014-1-27 09:15:25 | 显示全部楼层 |阅读模式
    时常会看到,若干站点面包屑上的地位题目会被加上链接,像上面这种:

    京东的面包屑
    异样也有上面这稼穑位题目没有链接的面包屑,如次图:

    中关村面包屑
    或者许猜测了一下,这正在搜寻引擎打算中会有定然的反应。
    从搜寻引擎原理的立场看,页面上的文本和链接是离开解决的。注释提取的时分,是将页面上的文本消息共同提取解决,而把页面上的链接之类会被提取到另一度表中去。(字频)打算的时分,是依托页面上的文本停止打算。猜测,页面上的链5接锚链接会被过滤掉,没有参加的打算。
    上面用做的一些测试来考证猜想:
    做了两个页面,形式彻底一样,页面上有三个用来测试的词【国平 刚刚子 66699303】,词两头用空格隔开。
    .是纯写进去的,.是用三个链接将词指向本人(自链)。

    纯文本  带链接
    测试后果如次:

    辨别搜寻:国平、刚刚子、66699303 名次正在后面的都是没有带链接的页面.。
    从上图看,没有带链接的文本正在撮要的时分,将两头的空格去除掉了,把三个词联接正在一同。
    但是页面的自链成效没有表现进去,或者许说是本人指向本人的锚链接没有间接涌现文本成效好。
    :测试的时分忽略掉了,某个页面是14号曾经抓取并收录过的,是15号新加下去的,开端测试显现的日子为20120514,起初发觉后改了一下页面,主动从新抓取了一次,页面的日子才同步到15号。正在搜寻三个测试词的时分,固然抓取早,然而名次却没有后抓取的纯文本页面高。没有过正在搜寻页面题目的时分,还是先抓取的页面名次高。
    由此可见,页面文本会间接参加页面的打算,链接锚链接被扫除正在外。
    附录一些搜寻数据:
    度娘要害字  站点  名次
    华为工夫治理法  360  1
    华为工夫治理法 杨玉柱  z  1
    华为工夫治理法 杨玉柱  360  4
    再造壮士9  360  1
    再造壮士9 施鸥  z 3
    再造壮士9 施鸥  360  4
    。。。。
    涌现这样一度状况就是,360很多书名名次很好,然而加上笔者名以后,名次就很没有现实,以至翻页都找没有到。点击看了页面,书名正常都是文甲方式涌现,而笔者涌现的时分用链接指向了笔者的页面。
    假如联合*的一些因从来看的话,书名与检索词之间失掉了没有错的有关性,而笔者由于没有参加到页面的打算,没有失掉呼应的得分。当只搜寻【书名】的时分,书名的*有关度够了,名次后面;但搜寻【书名+笔者】时,*(书名)+*(笔者)的值没到达名次前项的请求。
    山外人精品影院
    http://www.tmtuang.com/
    翻译公司
    http://www.yazhoufanyi.com/
    狐狸色
    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    QQ|Archiver|手机版|飞飞CMS |网站地图

    GMT+8, 2024-5-3 02:24 , Processed in 0.093870 second(s), 28 queries .

    Powered by Discuz! X3.4

    Copyright © 2001-2021, Tencent Cloud.

    快速回复 返回顶部 返回列表