当前位置: 首页 > 编程日记 > 正文

百度、谷歌理念对对碰

尽管百度和谷歌哪个更好用是用户自己说了算,但它们对搜索引擎的理解和理念到底有多少异同?它们将带给用户一个怎样的搜索未来?
          为了更好地看清这些问题,《第一财经日报》分别向两公司提出了如下问题,且听它们的回答.
1.搜索结果提供得尽可能多,是否会提升搜索质量?
并不是搜索结果越多搜索质量越好,网页收录量是衡量搜索质量的一个方面.
搜索结果“多”并不是衡量搜索质量的唯一因素,在我们看来,过多并且重复的搜索结果反而造成对用户的困扰,进而影响他们的搜索体验.对于使用搜索引擎的用户来说,他们更在乎的不是“搜索结果够不够多”,而是“准”和“全”.

2.影响搜索质量的最重要因素是什么?
谷歌:客观公正的排序原则和谷歌的排序算法保证了谷歌的搜索质量.
百度:影响搜索质量有几大因素,包括搜索速度、搜索内容是否全面、搜索更新是否及时、搜索结果是否准确等等.为了改善搜索体验,百度过去一年,在研发上投入的费用有10亿元,占到了公司年度营收的1/3.

3.广告呈现方式是否会影响搜索质量?
谷歌:将广告信息混同于其他信息之中,而用户一无所知,或者人为地做信息的排序,让用户不知不觉中受到误导,当然会影响搜索质量.谷歌的广告绝大多数情况下放在搜索结果页面的右侧,只有很小的一部分能够放在左上端,并且用阴影标注出来,加上“赞助商链接”的标志,用户可以清晰地辨识广告.
百度:在搜索引擎服务中,好的信息推广呈现方式,非但不会影响搜索质量,反而会提升用户的搜索体验.对于网民来说,当出现在面前的一个商业信息恰好就是他想要的信息时,那么,这就是一个好的搜索体验.而百度的搜索推广也恰恰就是建立在这个基础之上.

4.贴吧、问吧、百科等社区产品对搜索质量有何影响?
谷歌:谷歌是一个专注的公司,专注于搜索,社区产品和垂直搜索都将对下一代搜索技术——整合搜索和个性化搜索发挥重要作用.
百度:除了搜索体验,百度搜索份额的遥遥领先是由于贴吧、知道、百科等社区平台的爆发,这不仅是竞争对手不具备的,更是无法超越的.在搜索越来越成为一种综合体验的今天,百度的社区将与网页搜索一起,成为贴近用户需求、打造完整搜索体验的一部分.

5.市场份额与搜索质量的关系如何?
谷歌:我们以动态的长期的态度看待两者的关系.我们看到,在过去两年,谷歌的份额几乎增加了一倍.这就意味着更多的网民开始意识到了我们的产品做得更好,开始更多地使用谷歌搜索.任何一个技术都需要一定的时间才能够把市场做得更大,谷歌在美国经过10年,从零做到60%多.这代表了只要我们专注用户,把技术做好,在搜索体验和精确度方面有足够的差异化优势,赢得越来越多的用户只是时间的问题.
百度:应该说,用户使用搜索引擎是零成本的,网民可以自由地在各个搜索引擎之间切换,那么,“找到自己想要的信息”就成为网民选择一个搜索引擎的主要因素.由于百度满足了用户搜索信息的需求,我们才能在搜索引擎市场上一直保持70%以上的市场份额.根据艾瑞最新统计数据显示,2008年,百度一共处理了1096亿条网页搜索请求,在中国搜索市场中占有73.2%的份额,这一数字与2007年百度72.6%的份额相比,又提升了0.6个百分点,这些都是百度搜索质量不断提升的印证.

6.未来提升搜索质量的计划是什么?
谷歌:搜索是一门可以发展几个世纪的科学,互联网最伟大的进步还没有到来.今后 10 年内,我们将看到搜索模式出现重大变革:手持设备可提供更方便的搜索服务,更多的移动设备具备互联网功能,人们在进行搜索活动时,既可键入关键词,也可使用语音、手势、图片甚至歌曲来提交搜索问题.谷歌认为,我们的下一个任务,就是更好地推进个性化搜索和整合搜索,谷歌地图类产品和谷歌地理类产品也已经取得长足发展,谷歌还将把互联网搜索移植到手机平台.
百度:目前,能被搜索引擎检索到的信息只占人类所有信息中很小的一部分,几乎只占千分之二,搜索引擎还有大幅提高的空间.2008年底,百度还推出了一项面向下一代搜索引擎技术的“阿拉丁计划”,这个计划的目的之一,就是希望能够更好地整合互联网上的相关信息,在一个最简单的搜索页面上,将网民所需要的信息尽可能集中地呈现出来.

      谷歌和百度搜索引擎谁的搜索质量更好,这在互联网上一直是个争论的话题.只要进行搜索,就会发现有大批博客和机构曾用不同的方法比较和讨论过.但由于评价一个搜索引擎质量总会有用户和统计者主观因素的介入,结果总是各执一词.
事实上,谷歌和百度都在持续投入提高搜索质量,对于单个用户来说,由于自身的认知、偏好和搜索方式等不同,短期就会有差异化的选择,这样就是为什么有baigoogledu(百谷歌度)这样同时提供两者搜索结果的网站存在.而到底使用何种因素来评价一个搜索引擎的质量,一时的得失难以量化,长期看最终还是要落到“沉默的大多数”用长时间的鼠标累计投票.
偏好差异

      你喜欢用哪个搜索引擎,如果一个用户问自己身边的人,那么得到的推荐结果会有很多变数.如果是这一幕发生在上海办公楼,那么结果可能是谷歌,因为根据谷歌自身的统计,谷歌在上海最得办公人士的青睐,而如果在网吧中,那些青少年或许会推荐百度.
尽管搜索引擎是一个普遍服务,但却客观上形成了以地域和人群区分的偏好差异.谷歌大中华区总裁李开复对《第一财经日报》表示,他每天上班的第一件事就是打开电脑看看流量,他会连续看很多个不同维度的流量,比如从网吧访问谷歌的流量,三四级城市来的流量,甚至从大学生来的流量.
从城市看,上海一直是对谷歌接受度最高的城市,而李开复也发现,到周六周日谷歌的流量就出现下降,这说明还是办公人群使用谷歌的比例高.谷歌相对落后的市场还是在三四级城市、网吧等领域.
对于影响搜索质量的最重要因素,百度相关人士告诉记者,包括搜索速度、搜索内容是否全面、搜索更新是否及时、搜索结果是否准确等.
      谷歌负责人则认为,是客观公正的排序原则和排序算法保证了搜索质量.
但有多少用户可以这么理性的比较从而选择适合的搜索引擎呢?各种因素在影响着用户的选择.记者通过长时间的调查,曾经得到过多种理由,有人就是喜欢百度这个品牌,因为“众里寻他千百度”,实在是太有诗意.有人则说,谷歌经常在节日等出现的创意logo打动了他,因此就会一直用谷歌.
        有人喜欢用百度贴吧,因此也就一直用百度搜索,而有人觉的Gmail用的顺手,所以谷歌才是首选.有人用自己的名字和手机号测试,发现哪个搜索引擎排序高就用哪个.
测试词
     事实上,用常用词或者热门词搜索,两家差异并不巨大.百度给记者提供的测试词是使用最近很受关注的魔术师“刘谦”的名字搜索,会发现百度和谷歌的搜索结果看起来差异较大,但是都能满足用户需求.
       百度搜索结果页第一个是刘谦简介(百度百科),第二个是刘谦的表演(百度视频),第三个是刘谦粉丝聚会讨论(百度贴吧).而谷歌呈现的是焦点新闻聚合,百度百科,视频搜索在第五条出现,博客搜索在最下方.
       而谷歌推荐的测试词是电影《疯狂的赛车》,谷歌出现的依次是整合搜索中的放映时间、预告片、评论、影院信息和地图、焦点新闻聚合等.而百度出现的是片花、影评和电影简介等信息.比较而言,谷歌多了影院信息和地图.
     双方的工程师对此次搜索评价的量化打分如何,不得而知,但对用户有意义的是,是否便捷、精准地找到自己想要查找的信息.
如果搜索者带有强烈的个人欲望去搜索,那么对于百度和谷歌都是挑战.因为在搜索引擎上,任何人搜索同一个词的结果都是一样,这不能满足所有访问者.科学家搜索“星球”,可能是希望了解星球的知识,但普通人可能是想找“星球大战”电影.
搜索引擎的排序涉及到很多让普通用户眼花缭乱的技术,比如超链分析、PageRank、HillTop算法、锚文本、页面版式等.如今,如何提升网页在搜索引擎中的排序,已经形成了叫SEO(Search Engine Optimization)搜索引擎优化的专门行业,针对搜索引擎排序的技术,帮助客户提高网页排序.
     也有专家建议,由于各家搜索引擎的算法不一,蜘蛛抓取网页结果不一,排序的方法不一,最终导致了信息数据抓取范围的差异.使用多个搜索引擎,对它一次性信息的满足率更好一些.

评价
     如果不摒除品牌、用户环、先发优势、市场占有率等因素的影响,很难做到纯粹的搜索质量评价,这就如同一个女人选择化妆品,品牌、美白、抗皱、保湿、滋润等因素,都会成为影响的参数,而一盒日霜到底哪个好,每个女人都有自己的答案.
这就用到了“盲测”,让一些用户在不知情的情况下来比较,两年前就有个人网站使用匿名搜索应用,摒除了谷歌与百度搜索页面中的广告内容以及特征元素,让用户做出 “搜索质量对比”,而非“搜索体验对比”,结果是谷歌略好.
     正望咨询此前也有过一个盲测结果,在盲测参与者完成的全部11864次测试中,判断谷歌搜索结果好于百度的比例为48.2%,百度搜索结果好于谷歌的比例为39.8%.
      百度内部人士表示,盲测是常用的搜索引擎市场调研方法中的一种.在百度的用户体验部,百度的产品人员也经常采取盲测的方法来对比搜索结果,寻找出不同结果对用户搜索体验影响的差异,再加以不断的改进,帮助百度在搜索引擎市场保持优势.
然而,由于搜索引擎用户需求的多样性,一些个人和机构组织的盲测往往采纳的样本单一,不能客观公正代表整个搜索引擎群体使用状况,因而往往不能反映实际问题.而百度和谷歌的内部测试结果也无法对外公开.
      谷歌高层则认为,目前谷歌的索引至少比任何公司大两三倍,只要用户搜一个偏僻一点的词(例如手机号码)就知道,而且谷歌的整合搜索已经造成盲测意义不是很大了,因为有了整合搜索,谷歌的搜索在三公尺之外就看得出差别,不需要再做盲测了.
李开复曾表示,根据各种统计,谷歌的搜索质量经过一段时间的提高,其实已经超过了竞争对手,但是中国用户不认,他们不比较,也看不出来.
      但李开复也承认,之前很多用户跑到百度贴吧、知道和MP3搜索就出不来了,这说明谷歌中国的娱乐性还有不足,谷歌正在不断地推出细分的服务.
      对于搜索引擎的观察和比较,一些有经验的个人一直在进行.搜房网的王峰(王峰新闻,王峰说吧)最近发表了一个博客,认为近期谷歌网页收录数量已经超过百度,谷歌依靠自己的技术力量提升很多很重要的服务.这使得之前已经抛弃了谷歌的他渐渐变成了双搜索引擎用户,也就是说如果某个搜索引擎搜不到一定要换另外一个试一下.他身边有不少朋友在做网站,最近很多人都感觉谷歌要比百度收入的内容更快.
       另一个角度是,搜索引擎对于常用词来说,搜索效果都不会太差,但是偏僻词和长尾词会看出一些区别,能不能找到长尾词,关键在有多少的网页收入.
      但有的用户认为,如果加入市场因素,那么有多少用户会在意长尾词的结果而更改搜索引擎呢?因为一个难搜的词,用户会有足够的耐心多翻几页,多加上几个词来搜索,这对用户的影响太细微,只能在很长的时期才能看出来.
文/《第一财经日报》

相关文章:

2019 GDUT Rating Contest I : Problem H. Mixing Milk

题面: H. Mixing Milk Input file: standard inputOutput file: standard outputTime limit: 1 secondMemory limit: 256 megabytesFarming is competitive business – particularly milk production. Farmer John figures that if he doesn’t innovate in his mi…

托管调试助手报错

今天在调试程序时出现下面的异常: 其他信息: CLR 无法从COM 上下文0x1a0e50 转换为COM 上下文0x1a0fc0,这种状态已持续60 秒。拥有目标上下文/单元的线程很有可能执行的是非泵式等待或者在不发送Windows 消息的情况下处理一个运行时间非常长的操作。这种情况通常会影…

在文件中查找指定字符串

1. 在指定文件中查看指定字符串的行数 cat file_name | grep -n "String" 2. 在多个文件中查找指定字符串 在多个指定文件中查找指定字符串,命令如下:grep -l "String" file1 file2 file3-l : 列出包含特定字符串的文件名称&#…

FPGA研发之道(25)-管脚

管脚是FPGA重要的资源之一,FPGA的管脚分别包括,电源管脚,普通I/O,配置管脚,时钟专用输入管脚GCLK等。 本文引用地址:http://www.eepw.com.cn/article/266429.htm (1)电源管脚: 通常来说&#xf…

函数组:SDIFRUNTIME

函数组:SDIFRUNTIME;Interfaces for Type Runtime Objects,获得与表相关的数据信息。 包含函数模块: DDIF_FIELDINFO_GET:DD:读取表格字段信息的接口,获得一个表中全部或部分字段的信息。DDIF_F…

原来AGILE就是这么一回事啊!

仅仅还在几年前, XP 还被认为是方法异教, FDD 属于黑客程序方法。如今,敏捷俨然已经成为主流学说,敏捷方法成为人们学习和讨论的热点。敏捷方法的应用也更加广泛,以至于不少外包项目都要求采用某种敏 捷方法。它不仅仅…

开发微信小程序入门前

开发微信小程序入门前 百牛信息技术bainiu.ltd整理发布于博客园 2016年09月21日晚 微信发不了微信“小程序”的内测版,一时间整个互联网都炸了锅。个大新闻、论坛都在讨论这个事情。 作为互联网的一猿,我们怎能不紧跟时代的脚步。于是第二天上午也对微信…

hive的join

第一:在map端产生join mapJoin的主要意思就是,当链接的两个表是一个比较小的表和一个特别大的表的时候,我们把比较小的table直接放到内存中去,然后再对比较大的表格进行map操作。join就发生在map操作的时候,每当扫描一…

表格在线转换工具

表格在线转换工具 :https://tableconvert.com/ —— END ——

Android之View绘制流程源码分析

版权声明:本文出自汪磊的博客,转载请务必注明出处。 对于稍有自定义View经验的安卓开发者来说,onMeasure,onLayout,onDraw这三个方法都不会陌生,起码多少都有所接触吧。 在安卓中,一个View显示到…

看不懂的生成函数

不得不说这个东西真是妙啊 遭到了降智打击 生成函数又叫做母函数,主要用于解决一些组合数学问题 对于一个数列\(\{f_0,f_1,f_2,...,f_n\}\) 我们定义其生成函数为 \[F(x)f_0f_1xf_2x^2...f_nx^n\] 也就是 \[F(x)\sum_{i0}^nf_ix^i\] 也就是把数列的每一项当成了多项…

Coolite Toolkit学习笔记五:常用控件Menu和MenuPanel

Coolite Toolkit里的Menu控件和其他的.NET Web控件不一样,如果只是设计好了Menu或是通过程序初始化菜单项,菜单是不会呈现在界面上的,因为Coolite Toolkit规定Menu控件需要一个容器来做依托,而这个让Menu依托的控件就是MenuPanel&…

解决Neither the JAVA_HOME nor the JRE_HOME environment variable is defined问题

问题描述: 在cmd窗口使用 startup 命令启动Tomcat时,出现 Neither the JAVA_HOME nor the JRE_HOME environment variable is defined At least one of these environment variable is needed to run this program 错误提示,如下如所示。 解…

在 Windows XP 中,无法使用 Windows 图片和传真查看器来查看图片

在 Microsoft Windows XP 中试图使用 Windows 图片和传真查看器查看图片时,图片未按预期显示。不过,当使用 Microsoft 画图工具查看图片时,图片会按预期显示。注意:Windows 资源管理器中可能不会显示某些图片缩略图。 发生这种现象…

前端常用正则表达式

前端常用的正则表达式 通过一些例子来学习正则表达式摘录,js正则函数match、exec、test、search、replace、split //去除首尾的‘/’input input.replace(/^\/*|\/*$/g,);javascript:; 、javascript:void(0)javascript:;.match(/^(javascript\s*\:|#)/);//["j…

BeanShell使用json.jar包处理Json数据

环境准备 ①Jmeter版本 ,JDK ②前置条件:将json.jar包置于..\lib\下, 如果还是报错,可以将该jar包添加到测试计划的Library中;否则会报:Typed variable declaration : Class: JSONObject not found in nam…

ES6 let和const 命令

ES6 let 和 const 命令1. 变量声明2. 变量提升问题3. 暂时性死区(TDZ)4. 块级作用域4.1 为什么需要块级作用域?4.2 ES6的块级作用域4.3 块级作用域和函数声明1. 变量声明 ES5 只有两种声明变量的方法:var命令和function命令。 ES6 新增了let命令和cons…

jQuery的Tab插件 Tabtastic

Tabtastic 是一个 jQuery 用来实现 Tab 窗体的插件,支持 Tab 嵌套以及动态内容加载。 下面是源文件下载:Tabtastic转载于:https://www.cnblogs.com/zhulidong/archive/2009/11/01/1593753.html

另类×××应用(三):不花一分钱,实现总部和多分支机构网络互联

[本文高清PDF版,在文章最后的附件提供下载,欢迎下载查阅] 【需求分析】(一)我们面临的问题。Freesky公司是一家在台湾和大陆都有很多分支机构的大饼油条连锁经销商,大陆总部在宁波,在宁波、温州、上…

[SDOI2017]天才黑客

传送门 Description 给出一张带边权的有向图,每个边都上都有一个字符串(给出对应Trie树上的节点),一条路径的长度为路径上的边权之和相邻两条边的字符串的lcp长度之和。 求从1到其它节点的最短路 Solution 预备部分 首先&#…

spine - unity3D(摘自博主softimagewht)

摘自&#xff1a;&#xff08;博主 http://www.cnblogs.com/softimagewht/p/4149118.html&#xff09; //skeletonDataSkeletonAnimation skeletonAnimation GetComponent<SkeletonAnimation>();Debug.Log(skeletonAnimation.name);//获取角色名Debug.Log(skeletonAnima…

Windows搜索工具 — Everything

everything 主页 &#xff1a;https://www.voidtools.com/zh-cn/ Everything&#xff1a;是 Windows 上一款搜索引擎&#xff0c;它能够基于文件名快速定文件和文件夹位置。 下载链接&#xff1a;https://www.voidtools.com/zh-cn/downloads/ —— END ——

向访客和爬虫显示不同的内容

为了提高网页的用户体验, 我们经常会做一些对搜索引擎不太友好的事情, 但某些情况下这并不是无法挽回的, 可以通过向自然人和搜索引擎机器人显示不同的内容来提供好的用户体验和 SEO. 听说本方法会触犯搜索引擎的一些操作原则, 有可能被被各搜索引擎处罚, 甚至删除网站. 所以我…

php取url后的文件名

<? $a"http://www.esyu.com.cn/images/aaa.gif"; echo substr($a,strrpos($a,"/")1); ?>

ES6 函数的扩展

ES6 函数的扩展1. 函数参数的默认值1.1 基本用法1.2 与解构赋值默认值结合使用1.3 参数默认值的位置1.4 函数的length属性2. rest参数2.1 rest参数2.2 arguments对象3. 函数的name属性4. 箭头函数1. 函数参数的默认值 1.1 基本用法 ES6之前&#xff0c;不能直接为函数的参数指…

Mycat分片规则详解

1、分片枚举 通过在配置文件中配置可能的枚举 id&#xff0c;自己配置分片&#xff0c;本规则适用于特定的场景&#xff0c;比如有些业务需要按照省份或区县来做保存&#xff0c;而全国省份区县固定的&#xff0c;这类业务使用本条规则&#xff0c;配置如下&#xff1a; <ta…

COGS 2769. mk去撸串

【题目描述】 今天 mk 去撸串 ,恰逢店里活动 ,如果吃一种串串超过记录, 可以 赠送 328, 所以 mk 想知道他吃的串串中吃的最多的种类是什么. 【输入格式】 第一行一个整数 1<n<50000; 然后有 n 行长度<100 的全部由小写字母组成的字符串;每个代表一种串串 【输出格式】…

C# 使用HttpWebRequest提交ASP.NET表单并保持Session和Cookie

由于种种原因&#xff0c;我们有时需要从互联网上抓取一些资料&#xff0c;有些页面可以直接打开&#xff0c;而有些页面必登录之后才能打开。本文介绍的是使用 HttpWebRequest 和 HttpWebResponse 自动填写提交 ASP.NET 表单并保持 Session 和 Cookie 的一个完整的例子。这里涉…

rman备份后为什么要同时备份归档日志

今天在CU上看到有人问一个问题&#xff1a;rman备份后为什么要同时备份归档日志呢&#xff0c;既然rman是物理备份&#xff0c;所有数据已经都备份&#xff0c;再次备份归档日志何用&#xff1f;思考了一下&#xff0c;认为有必要记录一下为什么要备份归档日志&#xff1a;其实…

Angular响应式表单及表单验证

1. 什么是响应式表单&#xff1f; 响应式表单提供了一种模型驱动的方式来处理表单输入&#xff0c;其中的值会随时间而变化。 响应式表单使用显示的&#xff0c;不可变的方式&#xff0c;管理表单在特定时间点上的状态。对表单状态的每一次变更都会返回一个新的状态&#xff…