Google 指责错了,Bing 同学可能还真不叫作弊

来源: 外贸网站建设   点击数:   发布时间: 2011-2-6

近Google指责Bing抄袭一事炒的火热。Google先是策划好在“搜索之未来”大会前一天爆料,然后Bing时间回应说Google是编小说呢,然后Google官方博客向Bing开火,Bing再次不承认,同时还倒打一耙说Google也抄袭我们呢,后Matt Cutts继续拿出了更多证据,甚至连讽刺电视都插一腿进来。事情已经乱套了,这事到底谁对谁错呢?SEL的主编Danny Sullivan来了个彻底的分析,他认为Google错怪Bing同学了,以下是长篇分析。

观看用户不算抄袭:

微软不承认抄袭了Google的搜索结果,他们一直都没承认这一点,因为他们没直接看Google同学的考卷,而是利用点击数据流改进搜索结果的,只不过点击数据流的来源有Google。Bing的集团VP Harry Shum也一直坚称:

我们并没有抄袭,只是观察用户。

Bing的经理Stefan Weitz也说:

“复制”这个词有独特的内涵,这么说我们是错误的。我们只是得到了点击数据流,然后进行分析,我们并不一定全用它。

点击数据流?

Google坚持微软利用了IE浏览器和Bing工具栏监视用户在Google搜索了什么,但Bing不承认他们只监视Google,他们监视的是用户在整个网络上的操作行为。Bing可以看到用户正在浏览什么,假设他们去了百度,Bing也会知道的,假设用户在百度做了搜索,Bing也会知道你搜索了什么点击了什么。其实叫点击数据流不太准确,我们暂且给它一个更准确的名字吧:冲浪数据流。

通过冲浪数据流获得搜索活动:

人们当然上Google的次数多,只要他们搜索了什么,Bing就知道,因为只要分析一下他们进入的网页地址就成了:

当然Bing也知道用户点击了Google的哪个搜索结果──只需要记录下一个去到的那个网站的地址即可。这样做之后,Bing就知道用户针对某个搜索关键字选择了哪个适合的搜索结果网站。

Bing确实在分析搜索引擎,但并不只针对Google:

其实前面已经说了,Bing的这种冲浪数据流的分析并不只针对Google,而是所有网站,即便是在百度搜索,可能也会被Bing所知道。等于说是全天下所有搜索引擎都在帮助Bing提升搜索质量,这是一种很聪明的做法。Bing的Shum也承认这一点:

我们会收集所有信息,全部的点击数据流会按照不同信号种类分为不同权重。头搜索(常用词搜索)权重大,长尾搜索(非常用词搜索)权重小。

1000种信号种类:

Bing号称自己有1000种信号种类,搜索只是其中的一种,而且并没有凌驾于其它信号种类之上。

即便是Google的测试也证明了搜索信号权重不高:

Bing承认对于那些怪异关键字的搜索,Bing收集到的冲浪数据流会导致其结果与Google的搜索结果相近。Google正是掌握了这个证据才坚称Bing抄袭了。但Bing不这么认为,他们觉得即便是Google的测试也证明了搜索信号权重不高,因为Google测试了100个关键字,只有大概9%导致Bing的搜索结果跟Google一样了。

9%确实是个不高的数字,Google方面在爆料的时候也说他们不清楚为什么Bing只有9%的结果上钩了。Bing称就是因为搜索信号这个种类的权重并不高,不会导致自己的搜索结果全盘与Google一样,Google的测试反到成了证明这一点的好证据。

为啥Google发现Bing越来越像自己了?

Google的故事里还说道他们不是无缘无故钓Bing上钩的,他们之前已经发现Bing越来越像自己了,非常多的首页搜索结果跟Google一模一样。

但Bing也不承认这一点。在去年10月Bing内部使用了全新的算法和称为Aether的实验系统,来测试排名的变化。这个变化让Google感到了冲浪数据流的存在。

实际上这是另外一个Google没清楚回答的问题,Google说他们去年5月就发现Bing开始用冲浪数据流了,但为什么直到数个月之后才发现Bing的搜索像自己?Google也不知道,可能是Bing在后来提升了冲浪数据流的权重吧。

为什么说Bing没有抄袭Google?

Bing的部分搜索结果可能跟Google很像,但仅限非常少的关键字。比如咱们搜索“pontneddfechan”看看,这是南威尔士的一个小城的名字,点击可放大:

pontneddfechan绝对是个长尾的搜索关键字了吧?首先Google找到了71000个匹配结果,Bing只有9000个。然后首页10个搜索结果里,Bing只有4个跟Google重合,而仅仅有一个(雷打不动的位维基百科)搜索结果的排名是完全一样的。

再看看一个拼错的单词“bombilate”的搜索结果:

这是拼错的单词,Google会给出拼对的搜索结果,然后问你是不是要坚持搜索错误的拼写。而Bing呢?压根不问你,直接给出正确拼写的搜索结果,但是跟Google的结果并不一样。别忘了Google当初就是这么发现Bing在利用冲浪数据流抄袭自己的,但是在这个例子里二者的结果并不相同。

Google为啥要吵吵Bing抄袭了?

9%的上钩率,并不完全一样的长尾搜索结果,并不完全一样的错误拼写搜索结果,那么Google干嘛还要高调爆料Bing抄袭了呢?

因为Google看到了Bing改进搜索质量的方法,特别是对于不常用搜索关键字和错误拼写的搜索结果提升很明显。对Google来说,Bing全盘抄袭Google并不是可怕的,可怕的是Bing在利用自己的办法对Google进行去粗取精的筛选。

要Bing停止从Google去粗取精的行径?

Google并未起诉Bing,而只是爆料,并要求Bing停止通过冲浪数据流分析Google搜索结果的行径。但Bing的经理Weitz也做出了回应:

我们不会停止使用搜索信号,除非它会破坏搜索相关性,没有任何理由让我们不去分析大流量的搜索引擎。

Weitz同时也指出他不相信Google就没有使用Google Toolbar和Chrome浏览器做着同样的勾当,以改进自己的搜索质量。其实就算Google不让Bing直接从他们那里获得冲浪数据流,他们一样有办法,因为Google的搜索引擎正在驱动着很多很多的大网站,包括ISP合作商、Ask.com、大型门户网站等等,Bing大可以继续从他们那里获得数据。

Google的工具条在干着什么勾当?

Google起初的回应是说自己从未利用工具条数据来截取任何Google的搜索结果页面,是啊,他们何必要用这种绕一个大圈子的方式获得自己搜索引擎的数据呢?他们说自己的工具栏只是去测量网站速度,至于做不做其它的事情呢?这个问题自打事情爆出的天就抛给Google了,但至今他们仍未做出任何回复,哈?

没完没了:

这个事情还远远没有结束,或者说才刚刚开始。这不是一场由两家公司公关部门引起的争端,而是工程师在真刀真枪的进行着较量。搜索质量和搜索结果是一个搜索引擎的命根子,Google是否还在改进自己的搜索结果?Bing是不是比以前更出色了?谁又超过谁了?这才是重要的。

上一篇: 球后5个IPv4地址被分配 亚太IP将先耗尽 下一篇: 广州网站制作、网络营销市场状况