北京时间5月12日消息,据国外媒体报道,本周一,公众将有望体验Powerset公司发布的新搜索引擎,该搜索引擎抛开传统的关键词搜索技术,转向"语言分析技术",这种技术拥有理解网页语言的含义的能力,而这也正是Powerset与谷歌本质上的区别。谷歌依靠的是PageRank技术,即通过一定的统计学方法计算用户所搜索的关键词在网页中出现的频率,从而把相关的结果返回给用户。
尽管谷歌一直以来都在苦心钻研语言分析技术,但至今为止,我们还没看到这种技术被应用于谷歌的搜索引擎里。这一次,Powerset走在了谷歌前面。
Powerset公司称,新推出的搜索引擎将彻底颠覆传统的搜索理念,为用户提供更加智能高效的搜索体验。虽然Powerset搜索引擎给用户留下非常深刻的印象,但其有限的适用范围和参数使人们不得不怀疑其挑战谷歌的能力。
Powerset产品经理斯科普雷沃斯特(Scott Prevost)说:"我们通过对页面进行深层次分析来改变传统信息搜索的方式。传统的关键词搜索把网页看作是由一个个关键词组组成,只分析其组成,而忽视了其含义。与此同时,Powerset搜索引擎获得了施乐公司旗下著名的帕洛阿尔托研究中心(PARC,Palo Alto Research Center)所研发的自然语言分析技术的独家使用权,此技术号称是当今最领先的自然语言处理系统,这种技术将通过分析每个句子,提炼其真实含义,从而生成一个个语义特征,而语义特征就是Powerset的搜索参数。
去年十月,谷歌负责搜索产品的副总裁玛丽莎梅尔(Marissa Mayer)在接受采访时表示,谷歌的搜索引擎应该而且也即将克服对关键词的依赖。不过她也认为,谷歌搜索引擎之所以成功要感谢谷歌积累的庞大数据库。
到目前为止,Powerset的搜索参数还是非常有限的,仅包括维基百科和Metaweb Technologies数据库内的数百万个页面。但普雷沃斯特宣称,该搜索参数库将会在搜索引擎发布后的一个月内得到迅速扩大,并最终达到可与谷歌叫板的水平。
如今,Powerset搜索引擎可以对海量的网页进行分析,为数百万终端用户提供服务。然而,Powerset还须面对一个新兴技术公司将面临的挑战,如获得赢利和克服"成长的烦恼"等。
普雷沃斯特称,公司投资人都希望并努力使Powerset搜索引擎的参数库不断扩大,能够达到200亿个页面的容量。他说:"尽管在发布之初并不能提供广告服务,但Powerset搜索引擎的商业模式仍将搜索广告为主。我们在搜索广告领域的舞台很大,这也是我们的远景目标。"
Powerset搜索引擎起初将仅限于网页搜索,但最终会向图片和视频搜索领域发展。Powerset测试版仅是语言分析技术应用的领域的冰山一角。
也有业内人士指出,在目前自然语言分析技术未完善和成熟之前,一切定论都还言之过早。谷歌以48%的市场占有率,牢牢占据着互联网搜索和在线广告市场的领头羊地位,且近几年更是在搜索技术改进方面进行了大量的投入。Powerset即使能够提供完善的语言搜索技术,但作为搜索引擎市场的一支新秀,要想挑战谷歌还尚需时日。(来源:腾讯科技)