首页 > 电脑网络 > 互联网 > 谷歌和百度的算法有哪些不同

谷歌和百度的算法有哪些不同
2012-01-16 20:26:28   来源:   点击:

      百度嘛,也有难处,在天朝这个神奇的国度,也没法子,g.cn就是先例,google可以撤出中国,百度撤出中国那还有啥,不过baidu那个竞价排名 太恶心人,什么杂七杂八广告都有,而且和自然排名在一起,google不是没有竞价排名,一般他都会打上广告便签,一眼就知道那个是竞价排名那个是自然排名。

      google以前核心算法是RP(PageRank)值,但现在google更新算法很濒繁,PR值现在越来越不重要,现在一般的SEO都不看什么PR值的,因为那东西几乎没用。具体核心算法是什么,除非你是google算法规定人,不然只有猜。网站机构合理,关键词密度正常,有些相关度很高的外链,网站内容充实新颖,就基本行了,还有google最近更新算法对新的东西排名会很靠前,所以,亲,记得更新网站哦。

      看来大家对百度积怨颇深啊。我从技术上就我所知回答一下这个问题吧(不含主观色彩),顺便纠正几个广泛流传的谣言:

      1. 谷歌的算法与百度的算法到底有什么不同?

      其实要完全回答这个问题,必须首先了解百度和Google各自的排序算法,据谷歌撤出中国时一位跳槽的谷歌技术专家说,了解Google排序算法的全球总人数加起来不超过20人(包括Larry Page在内),而且这些人都在Google总部。从这个角度说,我想LZ在知乎是不可能得到答案了(即使真的有人知道[先膜拜一下这位大神],他也不可能明说的,否则他就等着被起诉吧)。我只能就信息检索常识的角度来谈一谈,让大家有个大概的认识,这里不涉及任何公司的技术和机密,所有涉及技术均可以从信息检索文献中查到。

      先明确一个概念。网页排序算法其实是一个统称,并不对应一个唯一的具体算法,而是一个包含多种算法的排序逻辑(或称系统),所以不能简单地说谷歌在用A算法,而百度在用B算法。信息检索系统常见流程分两步:特征选取,特征使用。前者选择/抽取特征,后者利用特征进行排位计算。所谓特征就是反应关键字与网页匹配度的一个指标,比如PageRank,BM25,用户的个性化倾向,用户反馈等。匹配度越高的网页应该排序越靠前。

      1) 特征选取的不同

      除了在信息检索学术界有很多公认比较好的特征两家都会使用外(比如PageRank --这个算法现在之所以不好使很大程度上是现在过度泛滥的SEO所致,算法本身还是好算法),两个公司会根据自己不同的需要和想法使用不同的特征。比如Google的用户分布在全球各地,肯定要非常重视语言/地域特征,搜中文给中文网页更好,搜英文给英文网页就好,即使同样搜英文,大陆用户和美国用户期望看到的结果也往往不同。而这点百度就基本不用考虑哈~ 百度是不是更懂中文我不做评价,反正百度不怎么懂英文。

      2)使用特征方法的不同

      (本身写了很多,想了想,这段还是删了,总之是传闻,若是假的大家得不到有效知识,若是真的我可能就说了不该说的,真是倍感压力。。。)

      仅科普一下这个概念吧,目前利用特征主要方法主要有两个:人工规则、机器学习。两者最大的区别在于,前者的规则是开发人员拍脑袋想出来的,后者的规则是使用统计学方法由机器学出来的(具体怎么学请参见《机器学习》相关知识,简单讲就是你先人工标注大量搜索结果(至少1W+),并告诉机器哪些是好结果,哪些是差结果,然后让机器通过这些例子自己总结规律。之后就可以让机器利用这些规律自动判断新的搜索结果好坏了)。这两种方法其实各有利弊,人工规则过于武断,机器学习也会有过拟合的问题。嗯,科普到这里结束。

      3)审查

      这个我想大家都知道 (注意Google没有审查,但谷歌是有的,谷歌后来不审查了,然后就只能去香港了)。也许聪明的你已经注意到了,这步不在信息检索的步骤里呀!!没错,这步的确不在信息检索的步骤里。

      2. 常见谣言

      1) 百度竞价排名,Google没有

      这是一条流传甚广的过时信息,广到现在很多学计算机的同学也这么认为。百度最早的确是竞价排名,但那已经是N年前的事情了。

      其实2009年百度的凤巢系统上线之后,百度网页排名和广告排名正式分开。网页排名从此就不涉及竞价排名了(网页排名的大搜索部和广告竞价的商务搜索部被分为两个部门,网页和广告的展现位置也独立开来,网页排名没有钱的因素)。因此目前百度的网页结果完全是按照系统排序打分排出来的,并不涉及钱的问题。任何公司的排序算法都会不定期升级,因此如果你是靠SEO做到了排名靠前,但网页内容并不优胜于其它网页的话,在下次升级之后可能就找不到了,更相关的网页会排上来。很多流传说这是因为没给百度钱,很多人信以为真。。。唉,我只能说只怪百度你积累的名声太差了。。。

      很多知友会说,可是现在百度上还是有很多广告啊(尤其是虚假的)?!。没错,百度的广告仍然继续竞价排名,给钱多少对广告排位影响很大。但是注意----百度和Google的广告都是竞价排名!!!这是当今所有主流搜索引擎的盈利模式呀亲!!!另外还有很多人说,百度的广告是在网页结果上方的,Google是在右侧栏的,你去Google搜一下”鲜花“试试。至于广告虚不虚假,公平的说,这和百度没太大关系。就像三鹿奶粉是不是毒奶粉,蒙牛是不是添加剂超标和CCAV关系不大一样。

      2) 百度人工干预结果,Google没有

      我不是百度的粉丝,但应该说除了政治审查、色情屏蔽,这个应该真没有。大家观察一下就会看到,说百度恶意降低自己网页排序的都是一些非热点关键词能搜索到的小网站。光就这类关键词的数量,百度即使想干预也没这么多人力。就算干预了赚了那点收入,还不够填补这个人工干预系统的花销。

      3)搜索排名就是PageRank

      PageRank只是其中一个特征。就像@谷健民所说,这个特征目前的使用权重已经较低。

相关热词搜索:谷歌 百度 算法

上一篇:如何不使知乎成为百度知道?
下一篇:为什么称百度为度娘