当你向互联网上传一个页面,来自世界各地的无数“蜘蛛”便会蜂拥而至。它们抓取并复制你的网页,跟踪着网页中的链接,悄悄地爬上更多的页面,用触角将它们纳入索引数据库。数据库像轰鸣的机器,拆解网页上的文字内容、标记关键词的位置、字体和颜色,并生成庞大的表格。这时,你输入一个单词,点击Google或百度上的“搜索”按钮,它会在0.2秒内得到响应,带着单词奔向索引数据库的每个神经末梢,检索到所有包含搜索词的网页,依据它们的浏览次数与关联性等一系列算法确定网页级别、排列出顺序,最终按你期望的格式呈现在网页上。
这就是一个“关键词”的云端之旅。在过去的10多年里,类似的旅程总共进行过数十万亿次。它催生了搜索引擎的先驱Overture,成就了本世纪最早期的创新明星Google,还有Yandex、Navar和百度等来自全球各地的Google效仿者。它让搜索引擎成为人们最依赖的互联网工具,以及推动人类信息自由流动的传福音者……
但现在,这一切可能都不再重要了。
设想一下,当你同时打开RSS订阅工具、Twitter(新浪微博)和Facebook(开心网)坐在电脑前的时候,你更倾向于用哪种方式获得信息?那些通过社交工具推送到你面前的内容,是不是通常比你主动搜索的信息更有价值?你搜索“美洲豹最便宜的价格,”得到的结果是车还是棒球杆?如果你对腾讯与360的战争完全没兴趣的话,在你搜索“周鸿祎”的时候,真的一定希望“马化腾”跳出来吗?
这就是当下的搜索引擎在几何级网页数量爆炸时面临的困境:即便搜索引擎优化(SEO)工具越来越普遍地被网页设计者们纯熟地应用,但它仍然不能确保人们在第一时间搜索到他们需要的信息——甚至,成功几率越来越低。
“目前上万亿的网页,其中大约有250亿的页面可被检索,有可能出现在用户搜索结果里的页面,最多占5%,未来几年这个数字甚至会降低到1%以下,”微软亚洲研究院常务副院长马维英说。当下的搜索引擎技术就像图书馆检索那样为所有的书建立检索码,但最后有可能带给用户的价值越来越少——它被持续膨胀的网页数量稀释了。
那么,未来人们需要什么样的搜索引擎?
Google试图提供最新的解决方案是:超快速的自动搜索。Google首席执行官施密特在最近的一次演讲中提醒人们永远不要低估速度对搜索的重要性。他还认为,搜索最终将不仅仅是搜索网页,而是个人的几乎所有信息——包括电子邮件、音乐和你关注的话题。在得到你的允许后,它将成为你专属你个人的搜索。
这似乎解决了搜索引擎的个性化需求和匹配问题,但Google未曾真正提及的是:与任何一类以“你”为中心的媒介相同,“你搜索”需要建立在社交网络化的基础之上——例如你搜索到的内容被你的朋友推荐,它会在搜索结果中得到提升,从而进入你个人搜索的优先级。在这个过程中,朋友的“顶”就进入了搜索引擎,成为整个搜索的一部分。
但奉逻辑学与数学为宗教的Google却并不擅长社交网络领域——它甚至站在全球最大社交网站Facebook的对立面。让搜索“社交化”意味着赋予搜索引擎社会学和心理学的属性,而这会改变Google的基本逻辑。
事实上,搜索引擎领域逻辑更替的核心是:搜索引擎将越来越通晓人类的语言和意图,为用户抓取他们最想知道的网页内容,甚至能识别语音、图像及表情等非文本材料——不但返回更精确的文本结果,还包括大量的多媒体内容。
回复该发言
搜索引擎的终极使命
2 回复:搜索引擎的终极使命
jdlp10122010-12-03 16:22:02 发表
越来越多中小型公司试图沿着这条道路证明Google代表的当下“客观主义”搜索技术的简陋:当你在一家名为Powerset的搜索引擎网站搜索“谁曾打败过安德烈·阿加西(Andre Agassi,美国著名职业网球运动员)”的时候,呈现在第一位的搜索结果是另一位网球运动员皮特·桑普拉斯(Pete Sampras)的页面。而在Google上,最前面的结果仍然是阿加西的个人信息。如果在另一家搜索引擎Cognition的页面上输入相关的法律和诉讼问题,也能得到相关条款的精确回应。
这就是人们通常所谓的“语义搜索”,但割据的小型语义搜索网站采集的信息量有限,并不足以在全面抗衡Google这样的巨头。但它们被召集在一面旗帜下,意义就完全不同了。
这个“召集者”不是别人,正是在互联网时代落寞许久的巨头微软。
在收购雅虎的交易失败后,微软对互联网和搜索引擎的布局走向了一条隐蔽但颇具技巧的道路。2008年7月,微软宣布收购上文中提到的语义搜索引擎Powerset。紧接着又推出了购物比较引擎Live Cashback、旅游搜索引擎Farecast以及健康搜索引擎health.live.com等基于语义的搜索分支。2009年6月微软发布全新搜索品牌Bing之后,它们又被整合进入Bing的框架体系。
但它们尚未构成一个完整的搜索产品。这是因为语义搜索技术的处理能力和速度仍是主要缺点,有时甚至需要长达20秒才能分析完一个页面。但微软的不同在于,它有能力投资更大型的服务器集群,这使语义搜索成为微软在搜索引擎领域树立的壁——当然,你也可以把它看作微软搜索引擎计划的Plan B。
不容忽视的是,支持微软在语义搜索领域有望抢先获得一席之地的,是它背后的基础研究力量。在基础的计算科学领域,语义搜索并非一个崭新的话题。至少在微软内部,围绕它的研究至少已经有10多年的历史。而现在,是它们集中爆发并转化为现实产品的时候了。
“尽管人们不该让科学家预测一项研究计划转化为现实产品的周期有多长,但是我们在搜索引擎领域的多年基础研究,正好到了收获果实的时候,因为人们对搜索的需求正在发生变化,这就是你现在看到的一切。”微软全球高级副总裁里克·雷斯特(Rick Rashid)对《环球企业家》说。
回复该发言
这就是人们通常所谓的“语义搜索”,但割据的小型语义搜索网站采集的信息量有限,并不足以在全面抗衡Google这样的巨头。但它们被召集在一面旗帜下,意义就完全不同了。
这个“召集者”不是别人,正是在互联网时代落寞许久的巨头微软。
在收购雅虎的交易失败后,微软对互联网和搜索引擎的布局走向了一条隐蔽但颇具技巧的道路。2008年7月,微软宣布收购上文中提到的语义搜索引擎Powerset。紧接着又推出了购物比较引擎Live Cashback、旅游搜索引擎Farecast以及健康搜索引擎health.live.com等基于语义的搜索分支。2009年6月微软发布全新搜索品牌Bing之后,它们又被整合进入Bing的框架体系。
但它们尚未构成一个完整的搜索产品。这是因为语义搜索技术的处理能力和速度仍是主要缺点,有时甚至需要长达20秒才能分析完一个页面。但微软的不同在于,它有能力投资更大型的服务器集群,这使语义搜索成为微软在搜索引擎领域树立的壁——当然,你也可以把它看作微软搜索引擎计划的Plan B。
不容忽视的是,支持微软在语义搜索领域有望抢先获得一席之地的,是它背后的基础研究力量。在基础的计算科学领域,语义搜索并非一个崭新的话题。至少在微软内部,围绕它的研究至少已经有10多年的历史。而现在,是它们集中爆发并转化为现实产品的时候了。
“尽管人们不该让科学家预测一项研究计划转化为现实产品的周期有多长,但是我们在搜索引擎领域的多年基础研究,正好到了收获果实的时候,因为人们对搜索的需求正在发生变化,这就是你现在看到的一切。”微软全球高级副总裁里克·雷斯特(Rick Rashid)对《环球企业家》说。
回复该发言
共有2帖子