谷歌搜索

谷歌搜索算法首席工程师:反对人工干预搜索

Tagged:  
来源: 
新浪科技
引用文字: 


谷歌搜索算法首席工程师阿米特·辛格

  新浪科技讯 北京时间7月14日消息,谷歌搜索算法首席工程师阿米特·辛格(Amit Singhal)近日在谷歌官方博客网上对谷歌的搜索排名算法的原则进行了介绍,以下为辛格博客全文:

  今年5月,谷歌工程副总裁尤迪·曼博(Udi Manber)对搜索质量事业部进行了介绍,该事业部主要负责对搜索结果进行排名,旗下包含多个团队。其中,曼博谈到了核心排名团队、国际搜索团队、用户界面团队和评估等其他一系列团队。在这里,我重点谈一下核心排名团队。

  首先自我介绍一下,我叫阿米特.辛格,在谷歌负责搜索排名团队,在谷歌从事搜索业务已有8年。在学术界,搜索被称为信息检索。1990年我在读研究生时就开始接触搜索,做了10年信息搜索研究员后,我于2000年加盟谷歌,一直从事搜索排名工作至今。

  谷歌搜素排名是一套算法,用来查找与用户查询内容相关度最高的文档。我们每天要对海量的网页进行数亿次的查询,而每一次查询都需要使用这套算法。网页搜索是访问量最高的搜索服务,但其他搜索业务也使用这套算法,如图片搜索、新闻搜索、地图搜索、产品搜索和书籍搜索等。

  关于搜索排名,人们问我最多的问题是:“你们是如何做这件事情的?”当然,首先要建立一套先进的排名系统,这点我在以后会详细介绍。今天,我先简单介绍一下谷歌搜索排名:

  1、全球相关性最高的搜索引擎

  2、简单易用

  3、无需人工干预

  第一点很明显,鉴于我们对搜索业务的激情,我们绝对要确保每位用户获得相关度最高的搜索结果,我们将其称之为“不落后”原则。对于来自任何国家、任何语言的搜索,如果提供的搜索结果关联度不高,就会激励我们进行改进。

  第二点也很明显,每个系统架构师不都希望自己的系统简单易用吗?搜索系统同样如此,但我们需要处理来自全世界多种语言的搜索,因此很容易使系统变得很复杂。在这方面,在保证搜索质量的前提下,我们尽量保持系统的简易性。这是一件需要持续改进的工作,也是值得做的事情。每周,我们要对排名系统进行10次改进,每一次都要确保简单性。这套简单易用的系统同时还有利于创新,事实也证明了这一点。因此,简单易用很重要。

  谈到搜素排名,如果不谈“是否进行人工干预”那将是不完整的讨论。谷歌搜索算法本身就是人类智慧的结晶,但最终对搜索结果进行排名的是搜索算法,而无需人工干预。我们认为,任何个人的主观判断都具有个人主观性,因此,通过搜索算法自动排名比人工干预更适合。

  此外,我们反对人工干预的第二个原因是,一次失败的查询结果就意味着我们需要对搜索算法进行改进。改进搜索算法不只是提高一次搜索查询结果,而是整个查询结果,且针对全部语言。这里还要补充一点,我们对所推荐的网站有明文规定,对于一小部分违反政策的网站我们将采取行动,如违法、具有儿童色情内容、存在病毒和恶意软件的网站等。(李明)

商业周刊:谷歌搜索面临挑战严峻

Tagged:  
来源: 
赛迪网
引用文字: 

  【赛迪网讯】北京时间6月17日《商业周刊》文章指出,如果谷歌在新技术开发上不思进取,它的市场领袖地位很可能会被包括微软在内的竞争对手夺走。Powerset开发出了语义搜索技术,微软也开发出了专业化搜索技术。

  谷歌已经是搜索市场的绝对领先者,为什么它仍时刻关注着竞争对手的发展? 谷歌刚刚与雅虎签订了一项与搜索文字广告相关的合作协议,根据规定,雅虎将在其美国和加拿大网站上放置谷歌广告。这样,谷歌的最大竞争对手就只有微软了,而微软在美国搜索市场的份额只有6%。 据市场研究公司Hitwise于6月10日发布的研究报告称,谷歌在美国搜索市场的份额为68%,雅虎的市场份额为20%。然后,谷歌并未因此而懈怠。 谷歌搜索质量团队的主管Udi Manber称:“我们必须时刻保持警惕,因为每天都可能出现新的搜索技术。”

  Manber知道,谷歌周围有一大群竞争对手仍在虎视眈眈,伺机挑战谷歌。 据市场研究公司eMarketer称,搜索广告市场的规模将在今年达到258亿美元,到2012年将增长到510亿美元。那些竞争对手都盯着这个市场,并在开发创新技术上投入了大量的财力和人力,以期在未来十年改变搜索市场目前的格局。 微软Live搜索总经理Brad Goldberg表示:“搜索必然会变得越来越好,搜索是我们的长期战略重点。”

  实际上,包括谷歌的搜索技术在内,整个搜索行业的技术仍处于初期发展阶段。大部分网民所熟悉的网络搜索形式仍依赖于相对简单的匹配模式,即在网页上搜索与关键字匹配的内容,然后将那些搜索结果按照关键字出现的频率进行排列。 今后,最根本的搜索技术肯定会发生变化。搜索网站将采用其他一些新技术。 它们将采用一些能够更好地识别多媒体内容的新一代语音、图像和人脸识别软件。它们将在搜索中加入一些目前尚未开发出来甚至想象到的新系统。

  许多专家表示,最后,搜索结果中将出现更多的文本和多媒体内容,而减少链接的数量。Hitwise的研究主管Heather Dougherty称:“也许其他公司可能会开发出新技术而异军突起超过谷歌。”

  语义搜索

  某组织认为,今后最有可能超越谷歌的是那些所谓的语义搜索公司。 包括Powerset和Cognition Technologies等在内的这类公司可以让搜索系统理解语言的结构以及词汇的定义,并利用这些技术来检索搜索结果。

  比如,利用语义搜索引擎搜索“哪些网球运动员曾经打败过阿加西?”结果就会得到一些曾经打败过阿加西的网球运动员的链接。Powerset搜索得出的第一条结果就是皮特桑普拉斯的网页链接。 然而,谷歌目前还做不到这一点。它的搜索结果指向的是阿加西打败过的网球运动员们的链接,而不是打败过阿加西的网球运动员们的链接。 Powerset的联合创始人、首席技术官Barney Pell表示:“我们在五年或者十年后回头看看,就会发现我们现在的搜索技术是很原始的。”

  人类开发语义搜索技术的时间已经长达30多年,但直到最近才将它应用于网络搜索。Powerset在五月份推出了一款专门针对网络百科全书维基的搜索产品。 Cognition也在一年前推出了一款搜索引擎,可以搜索法律、医疗和维基等内容。

  整合新技术

  谷歌和微软都正在将语义搜索技术整合到各自搜索引擎中。但是相对而言初创公司拥有更大的灵活性,因此它们认为,从长远角度考虑,自己在这方面拥有更大的优势。 Cognition Technologies的首席执行官Scott Jarus称:“这并不是件容易的事。我们花了十多年的时间才完成基本技术的开发。”

  当然,如果语义搜索技术真能改变整个搜索行业,那么微软和谷歌肯定都会收购这类公司。谷歌每个季度都可获得10亿美元的自由现金流。 微软也是如此,而且,收购雅虎的交易告吹之后,它就有460亿美元的预算可以用来收购其他公司。实际上,Jarus认为语义搜索技术肯定会通过收购交易而被整合到著名的搜索引擎之中。 Jarus称:“我想,最终语义搜索技术将被整合到通用搜索引擎之中。”

  但是由维基联合创始人Jimmy Wales领导的开源搜索技术开发的成果却是微软或谷歌所不能收购的。用搜索引擎将社区输入与开源程序整合在一起就是所谓的维基搜索。 Wales说,最后,就会得到一款谷歌无法开发出来的新产品,但是各大网站却可以通过网络轻易将它整合到网站上,这样网民们就不用局限于使用某一家网站上的搜索引擎了。Wales称:“我们认为这并非一蹴而就的事情。 但是如果我们可以成功,那么搜索将成为一种公益事业,任何公司都可以提供搜索服务,再也不会出现一家公司独霸整个市场的局面。”

  微软的专业化搜索技术

  微软采取了另一种战术来挑战谷歌的权威地位,那就是走专业化搜索道路。微软最近一直把精力集中在购物搜索技术的开发上,并发布了一款Live搜索现金返还产品。 当用户在网络上购物时,微软只向相关广告客户收费,这样整个服务就变成免费的了。微软创始人比尔盖茨在声明中表示:“我们的目标是让Live搜索成为互联网上收益最高的商业搜索引擎。”

  微软的Goldberg称,如果微软取得成功,它将从中获得大量收益,因为搜索明显与网络贸易息息相关。Goldberg说:“商品搜索在全部搜索中占30%到40%,但是它们对企业收入的贡献比例却在不断增长。”

  如果微软取得成功,它可能会将这方面的经验推广到其他专业化搜索领域,比如娱乐、导航和地区搜索以及研究等。Goldberg说:“我们相信,搜索将变得越来越以任务为中心。” “届时搜索体验将明显与现在不同,它将根据具体任务的不同而不同。”

  谷歌的搜索

  谷歌一直凭借通用搜索产品取胜,这正好与微软的专业化搜索技术相对。 虽然专业化搜索已经在保健、旅游、地区搜索和购物等特殊领域取得了成功,但是它们始终不如谷歌的一站式通用搜索引擎流行。谷歌的Manber表示:“我们想提高搜索引擎的易用性和速度。” 除了医疗搜索之外,谷歌也开发了专业化搜索技术,但是都处于幕后。用户们只能看到一个综合性搜索网站。

  谷歌绝不会坐以待毙的。搜索是其所有业务的核心组成部分,谷歌招募了大量技术人才,每天都在研发新的搜索技术。 业内人士认为,即便市场上出现了一种搜索结果相关性胜过谷歌的搜索产品,但谷歌的品牌已经深入人心,网民们仍会使用谷歌的搜索产品。

  当然,品牌和财力并不足以保证其他创新公司不会取代谷歌的领袖地位。雅虎就是最好的例子。

  作者:子聪

聚合内容