English

搜索引擎的第三定律

2001-09-26 来源:光明日报 李彦宏 我有话说

搜索引擎走到今天,已经是结束过去、开辟未来的时候了。为了说清楚我所讲的第三定律,我们先来回顾一下第一和第二定律。

第一、第二定律的提法以前没有过,但其内容却早已在业界和学术界得到了公认。其实第一定律早在互联网出现之前就被信息检索领域广泛研究过,那就是所谓的相关性定律。当时的相关性都是基于词频统计的,也就是说,当用户输入关键词时,搜索引擎去找关键词在文章(网页)中出现频率,再加上一些对关键词本身常用程度的加权,最后得出检索结果。词频统计其实根本没有利用任何跟网络有关的特性,是网络时代之前的技术。按照第一定律,只要关键词在两个网页中出现的频率相同,不管这两个网页质量相差多远,它们在搜索结果的排序就是一样的。

1996年4月,笔者到拉斯维加斯开一个有关信息检索的学术会议时,突然把科学引文索引的机制跟W eb上的超级链接联系起来了。科学引文索引的机制,说白了就是谁的论文被引用次数多,谁就被认为是权威,论文就是好论文。这个思路移到网上就是谁的网页被链接次数多,那个网页就被认为是质量高,人气旺。这就引出了搜索引擎的第二定律:人气质量定律。根据这一定律,搜索结果更多地依赖于超链分析进行排序。我意识到这是一个突破,就很快总结了思路,于1996年6月申请了这一方面的美国专利。超链分析方法1998年以后逐渐被各大搜索引擎所接受,由于链接是网络内容的一个根本特性,这时候的搜索引擎才开始真正利用网络时代的检索技术。

上述两个定律都只解决技术层面的问题,并不能解决搜索引擎公司的生存和发展问题。2000年网络泡沫迅速破灭,搜索引擎公司前途茫然,解决搜索引擎公司的生存和发展问题需要搜索引擎的第三定律———自信心定律。

1998年,没有多少人拿远在硅谷500英里以外、刚成立的GOTO.COM公司当回事。它不过是买了一个搜索引擎的技术服务,然后再向网站的拥有者拍卖其网站在GOTO检索结果中的排名,谁付的钱多,谁的网站就排在前面,不过只有网民在搜索结果中点击网站之后,该网站才需要付费,仅仅在搜索结果中出现并不需要付费。根据这一定律,搜索结果的排序,除了词频统计和超链分析之外,更注重竞价。谁对自己的网站有信心,谁就排在前面。有信心的表现就是愿意为这个排名付钱。需要声明的是,自信心定律也是我自己给这一模式起的名字,以前的文献中并没有人这样总结过。

今天,在纳斯达克风声鹤唳之时,GOTO却如日中天,市值高达13亿美金,收入高达雅虎总收入的35%。反观门户网站,有哪一个能从它们的搜索引擎服务中赚出总收入的三分之一呢?究其原因,就是因为GOTO最早实践了搜索引擎的自信心定律,它一改过去搜索引擎靠CPM收钱的尴尬局面,开创了真正属于互联网的收费模式。

在中国,百度一直致力于推动搜索引擎市场的培植和发展。现在,百度联合了各大门户网站的搜索引擎,一起通过百度的竞价排名系统来实践搜索引擎的第三定律,为数十万网站的拥有者提供一个展示自信心、吸引潜在客户、发现销售线索的平台。

 

手机光明网

光明网版权所有

光明日报社概况 | 关于光明网 | 报网动态 | 联系我们 | 法律声明 | 光明网邮箱 | 网站地图

光明网版权所有