长久以来Google的旗舰产品已成为我们生活的一部分。但Google并不认为搜索理所当然就应该是那样的。此文编译自《In The Plex :
How Google thinks, Works, and Shapes Our Lives》作者Steven Levy的文章,是有关搜索变革研究的第一部分。
天为什么是蓝的?
小孩经常问这个问题,但是很少有家长在不需要帮助的情况下能回答得上。不久以前,找到正确的答案至少需要钻研百科全书,甚至还需要跑一趟图书馆。不过最近,爸爸妈妈只需要打开电脑,Google一下,点击链接,问题的回答就呈现在面前,然后父母阅读一下解释,再用小孩可以理解的方式阐述一遍即可。
但到了2015,甚至这种看似快捷的过程也算不上快了。首先,在移动设备上问题的提出更有可能是通过口述而不是在搜索框敲字。其次,尽管从一堆链接排序中选择最相关者仍然是特定查询的有效办法,那些有着明确定义问题(如天空为什么是蓝的)的人更希望马上知道答案。如果Google不能马上提供答案,这些人就会失望、甚至愤怒。
那么……“好吧,Google……为什么天是蓝的?”
对于Google最近几年对搜索进行的变革,Google搜索团队负责人Amit Singhal以飞机空中更换引擎来打比方,其改动包括排名算法,添加新的企业信息,以及在用户完成问题输入前开始搜索等。除了引擎切换以外,在移动搜索即将超越桌面搜索的大背景下,Google也在考虑对“座舱”—使用界面进行彻底的重新设计,甚至考虑整个使命的重新定位。
搜索一直是公司的旗舰产品,搜索广告仍是公司的主要收入来源,Google对搜索的重视跟外界对Google的关注点是不一样的。现在开始有人质疑Google搜索在走下坡路(参见Google统治终结了吗)。理由包括:1)垃圾结果太多 2)过分强调信息的更新度而非相关性等。
Singhal强烈抨击这种言论,认为说法与事实完全相反,Google的搜索做得比2年前好得多,那些批评者陷入的是一股对过去的怀旧情绪。
尽管如此,Facebook的社交网络屏蔽Google的爬虫抓取信息令Singhal感到忧心忡忡,担心封闭的网络会威胁到Google的地位。但事实证明他过过虑了。Facebook的Graph Search仍非常稚嫩,对Google几乎没什么影响。微软的Bing在搜索质量上有得一比,但市场份额不到1/5。在基础设施、人才厚度、经验、雄心等方面没有竞争对手可以与Google匹敌。G+尽管远未能成为引起轰动的社交网络,但的确吸引了许多搜索用户的加入。
要说到威胁,Google搜索最大的威胁并不是来自于竞争对手,而是搜索对象的变化—从web迁移到了星罗密布的app孤岛。不过Google认为这种情况自己是可以克服的—毕竟开发者跟网站站长一样希望自己的信息被发现。从2013年秋,Google开始设立App Indexing将移动app内的数据纳入整个索引内。现在已经有15%的Android登录用户可获得含app内信息的搜索结果。但是iOS app是一个很大的坑。
目前抓取app信息的挑战尚未影响Google的搜索统治地位。Google每天接受的搜索查询超过30亿次,每年执行的搜索超1万亿次。美国2/3的搜索用的是Google,在全球其他地区(中国除外)情况类似。最近Google搜索份额的变化只是因为Yahoo跟Firefox的默认搜索引擎交易导致的。而且Google还拿到了80%的移动搜索份额。2013年Google出现了5分钟的中断的结果是全球流量下挫了40%!
尽管搜索不是外界关注Google的热点,但它本身却正在进行稳步而密集的再造。实际上17年的时间里Google从未停止对搜索的改进,但最近几年Google搜索变革的速度明显加快,为的是保持领先优势。
其中的一些变化用户已经有所体会。搜索更快了、内容更新了、更加社会化了、结果呈现更加丰富了。这些变化不是一夜之间完成的,而是Google持续不断的升级改进的结果。Google每周都要开搜索质量协调会,对算法进行微调。每2、3年都要对排名系统进行重大升级,最近一次的代号为Hummingbird。据称过去3年排名系统进行的改动要比此前13年的加起来还要多。
Google搜索的变革主要体现在三个方面:知识图、语音搜索和Google Now。知识图把全球的信息组织为一个浩瀚的数据库;语音搜索把口语吸收进了搜索;而Google Now则提供了未问先答的能力。这三大变化都与Google聚焦于移动有关。
知识图(Knowledge Graph)
知识图谱的推出源自对MetaWeb的收购。MetaWeb 2005年由知名计算机科学家与创业者Danny Hillis创办,2007年推出。做的是语义网。MetaWeb做的事情也是通过扫描互联网去回答问题,它拥有1200条人、地点与事物的实体记录,一度被认为是Google的竞争对手。不过最终Hillis意识到只有在Google的大树下自己搭建全球信息数据库的宏伟目标才能实现。而彼时尽管Google也提供了一些问题(比方说奥巴马生日)的直接答案,但是却无法回答“西海岸学费低于3万美元的大学”、“至少获得过一次奥斯卡奖的年龄超过40的演员”这样的问题。双方一拍即合。
Google意识到,事物是搜索的重要部分,而让大众关心的事物的事实与信息迅速呈现是一种很好的方式。于是在MetaWeb的基础上,2012年5月,Google推出了提供搜索主体关键事实的知识图作为搜索的辅助呈现在搜索结果页面的右侧。现在它的条目已经超过了5亿。那么那些搜索结果会出现知识图呢?Google会将查询词条扩展为其他形式和同义词等等,然后进行算法测试看看是否与知识图(Knowledge Graph)结果相关,确定相关后再从中择取相关结果呈现(比方说敲“达芬奇”试试)。根据估计,目前约有25%的搜索可唤出知识图。
在Google搜索与知识图整合的这2年多的时间里,知识图也在不断演变。原先它是静态的,但现在正慢慢吸纳Google搜索本身在分析用户行为方面的学习能力。比方说“谁在《太空炮弹》中饰演Barf?”这样的问题问多了以后,知识图就知道要把演员、电影和情节等东西列进去。
此外在知识的新鲜度方面知识图也有了大幅改进。以往知识的更新最长可能需要2个星期。但现在系统已经能处理新闻,所以更新调整只需要几分钟。
当然,Google的改进计划还有很多。包括增加知识域(最近添加了汽车、视频游戏、雨果文学奖得主),提供除简单事实以外更加复杂的、更主观性、模糊化的搜索结果。用户的兴趣点就是改进的出发点。而Google最终想要实现的效果是,让你不仅觉得跟你对话的不是冰冷的机器,而是既无所不知又懂附庸风雅的圣人。
但这个目标目前还有点遥远。令产品经理Emily Moxley恼火的是,尽管现在知识图已经知道一些电视节目,但却既缺乏新剧集的信息,也不知道什么时候上映,在哪里能够看到。在知识图成为圣人之前,Google需要要先实现这一“中期目标”。
或者这个要求还有点高。因为4年时间过去了,Google至今仍未给出上述那两个类似问题(“西海岸学费低于3万美元的大学”、“至少获得过一次奥斯卡奖的年龄超过40的演员”)的一站式的答案。知识图,任重而道远啊。
未完待续......