搜索引擎摘要大的缺点是什么?

来源: 外贸网站建设   点击数:   发布时间: 2011-4-16

搜索引擎摘要大的缺点是什么?
  (中国电子商务研究中心讯)是有用的信息太少,尤其是查询串以外的信息量非常小。这种摘要对用户没什么参考价值。为什么这么说呢?原因如下。

  传统搜索引擎摘要是以命中与查询串一样的文本为出发点的,也就是说,好的命中结果是与查询串一样的文本;好的摘要,是标红了与查询串一样的文字的摘要。本来引擎摘要就短,把这些与查询串一样的标红文字排除出去,剩下的甚至可能连完整的一句话都没有了。所以引擎摘要其实就没提供什么额外的信息。

  也许有人会说,本来搜索引擎的结果就是要引导用户去点击原文链接的,因此摘要不需要提供额外信息量,而应该忠实展现原文中与查询串一样的文字。这纯粹是不明就里的瞎辩。摘要是干什么的?是帮助用户判断原文质量,以决定是否阅读的。额外的信息量越少,用户的判断越难。其实传统摘要发展成今天这样,实在是没有更好技术手段的情况下自然形成的,而用户对这种形式的摘要也基本能接受(其实你不接受也得接受,现在就没有第二种摘要),慢慢就约定俗成了。

  但这种约定俗成并不表示用户对好摘要的需求消失了。我们买书的时候往往会根据别人的推荐或者书评来判断此书是否该买,全文检索用户看摘要就像看书评,希望根据摘要来判断是否点击原文链接进行阅读。不过,现在的技术又怎么能真的自动给出一个高质量的书评呢?所以呢,大家只好将就着看看,再打开原文碰碰运气了。

  不过,现在的摘要还有一点用处的,就是说明原文是不是空的(如果摘要为空,原文基本上也是空的)。除此之外,其实就没太大用处了。在现在的这种摘要下,用户判断原文是否值得阅读的时候,其实标题占很大比重,这也是为什么有那么多“标题党”(认为标题非常重要的用户或者技术人员)的原因。

  正因为这样,现在做引擎摘要的人关注的都是一些细枝末节的东西,如字体、颜色、长度、对齐、省略号、作弊(原文中堆叠了很多查询关键词,按照现在的摘要方法,真的就成了“好”摘要了)等等。美其名曰“用户体验”。其实,这正说明摘要没做到点子上,如果你的摘要内容对用户有很大参考价值,字体、颜色、长度这些表面文章就变得不重要了。不过大家还是要靠薪水谋生的,关键的做不了,那也总得找点可做的来做做,要不然如何向老板交待?

  那么如何改变这种情况呢?当然是改变摘要方法,提供更多的额外信息。首要一点,就是不要再以查询串全命中为标准来出摘要。越是全命中的地方,越没什么信息量。于是,某些同行就要问了:如果不以全命中为标准来出摘要,那以什么标准来出呢?当然还有很多标准了,不过我不想在这里说。知识是有价的,如果你是做引擎摘要的,却没有一点突破老框框的想法,那你的想象力和创造力哪里去了?也别想在我这里捡便宜。如果你对以上观点有同感,前面的文字应该很容易理解,你也很自然地能想到很多标准。我倒是愿意与这样的同行交流,大家互相启发。

  其实,这第二种摘要的尝试,我们已经进行了差不多半年时间了。初步证明还是有效的,对用户的帮助比传统摘要要大一些。再过几天就要扩展到我们全部的搜索结果上了。至于是否能够带来革命性的变化,现在还难说,不过至少我们已经上路了。(来源:新浪博客 文/第三基地主任)

 

上一篇: 引315关注借地震行骗 下一篇: 支付清算协会今日成立 易宝支付成为常务理事