搜索的边界

2022-09-30

A version of this article appears on Sep. 30, 2022 as a member article for SSPAI. Learn more or subscribe

前两天,谷歌举办了第三届「Search On」活动。这是从 2020 年起举办的搜索功能专项发布会,旨在介绍谷歌在这项老本行上的新动作和新进展。

在发布会介绍的众多功能中,有一项一句带过的改进:谷歌搜索结果中将会加入一个「讨论与论坛」(discussions and forums)板块,定向收录来自在线社区 Reddit、问答网站 Quora 和其他垂直领域社区中的内容。

尽管戏份不多,但明眼人都能看出这项功能是在回应什么。近年来,网上有一种流传甚广的「技巧」:在搜索关键词后面加上「reddit」,就可以显著提高搜索结果的质量。

这与其说是技巧,不如说是对谷歌的批评。其潜台词是,谷歌搜索结果已经日渐被机器批量生成的「内容农场」,以及重流量轻质量的「标题党」所侵蚀;只有将搜索范围限定在 Reddit 这种在线论坛,才更有可能找到真人分享、基于真实体验的内容。

其实,与过去更多强调花哨的智能功能相比,谷歌近来已经相当「努力」地表现出重视基础搜索功能的意愿。例如,八月初,谷歌就曾做出一项看似很琐碎的改进:引号语法的呈现效果。引号语法是一种传统的搜索技巧:将某个关键词放在引号中,就可以要求搜索结果中必须包含这个词的原文。过去,谷歌经常不遵从这一语法,引起了很多资深用户的不满,现在终于听取了用户的声音。没过两周,谷歌又宣布在搜索排名中以及在搜索结果中突出「原创、优质内容」和「专业产品评测」,显然也是在回应对「内容农场」现象的广泛批评。

那么,谷歌为什么忽然开始密切关注搜索质量?至少部分原因是从其显著恶化的口碑中感到了压力。

近年来,在国外技术社区,几乎每隔一两个月就会出现一篇被广泛转载和讨论的「檄文」,向谷歌的搜索体验发难。今年三月,一篇题为《谷歌搜索正在消亡》(Google Search is Dying,少数派刊载过授权翻译)的文章尤其引发共鸣,甚至还引来了谷歌公关人员答复。

于此同时,大量新兴的小众搜索引擎也抓住了这一宣传时机,例如 KagiNeevaBrave Search 等;其功能也都是瞄准谷歌当靶子,主打无广告搜索体验、更好的隐私保护,以及更透明的搜索结果定制能力。

但在和众人一起高喊「谷歌要完」,切换到那些小而美的替代搜索引擎之前,我们也有必要反思: 搜索质量日益下滑,责任都在于谷歌吗?

这么说并不是想为谷歌开脱。谷歌的推广内容过多确属事实;作为一家财运滚滚的科技巨头,它也比任何其他服务更有能力去改进搜索。但也要看到,搜索是一个范围难以界定、效果难以量化的行为,其中很多环节和因素,可能是超出谷歌掌控范围的。

首先,必须承认如今互联网上内容的质量本来就在下降;或者换一种更中性的说法,信噪比在下降——相同数量的信息中,有效信息的比例在降低。这并不完全是由那些蓄意滥用规则的垃圾信息带来的,而是互联网普及的必然结果。如今的互联网不是专家、学者、技术先驱的俱乐部,而是普通人生活的延伸,其承载的内容也必然偏向日常、琐碎、未经深思熟虑。

此外,信息总量虽然仍在指数增长,但其中相当一部分要么被锁在垄断平台各自为政的「围墙花园」中,要么散落在音视频、图片等新兴媒介上。对于基于互联网开放的假定、以文本索引为基础的搜索引擎,这都构成了明显的盲区。

巧妇难为无米之炊。搜索引擎的「良心」——本质上取决于其商业模式——决定的只是搜索质量的下限,但互联网的信噪比则决定了搜索质量的上限。这方面,无论在搜索词里加上「reddit」,还是换成更「良心」的小众引擎,都是治标不治本:即使搜到更多真实用户创作的内容,那也不代表高质量的内容,更不代表有帮助的内容。

不仅如此,如今的搜索需求也是极为多元和复杂的,其结果优劣并不存在统一的衡量标准。 每当我们按下搜索按钮时,其实可能存在两种不同层次的目的:有时是为了回答事实问题,类似于查询产品名录、翻阅菜单;有时则是为了解决现实问题,类似于咨询导购、请服务员协助点单。

对于回答事实问题,基于关键词匹配的传统搜索技术可以很好地应对。在这方面,二三线搜索引擎没有那么多广告,也没有被营销网站做针对性「优化」,可能确实显得比谷歌更高效准确。

但随着互联网日渐织入人们的日常生活,为了解决现实问题而搜索才是新常态。浏览谷歌历年发布的年度热搜,不难注意到其中很多搜索请求都不是严格意义上的「关键词」,而是高度口语化的问题(例如「如何一个人过得开心」)和描述(例如「我附近的疫苗接种点」)。正如一位 Reddit 用户所评论,年轻一代的搜索习惯已经完全不同了,他们的习惯是把谷歌当成一个人去对话。更不用说,在面对一些完全陌生的领域时,我们最初甚至无法用语言组织出一个明确的问题。

对于这些模棱两可的问题,我们评价搜索结果时,往往就不是基于字词匹配的准确性,而是基于现实需求是否被充分满足。如果一次搜索帮你找到了一处美景、一份美味或解了燃眉之急,即使其他结果再跑题也是瑕不掩瑜。相反,如果需求没有得到解决,即使精准命中再多的真实内容、专家意见也是枉然。因此,谷歌受到的负面评价,很多时候是在为用户从第三方信息源得到的不满意体验「背锅」。

此外,谷歌作为一家科技巨头,还要面临一些复杂的平衡和取舍。并不是所有的搜索需求都是能「摆上台面」的;还有相当数量的搜索,或庸俗、或猎奇、或偏激、或处于灰色地带甚至合法边缘。对此,二三线的搜索引擎可以因为受众少、影响小而不用费力去管,或者因为技术限制无力去管;而到了谷歌的体量,无论是出于道德、形象还是政策的要求,都不得不管。但这样的权衡反映到搜索结果上,或许就显得保守、乏味和不真实,留下操纵搜索结果的口实。

这当然不是为谷歌的所有内容决策辩护,但一个理性的用户应该意识到,「勇者」变成「恶龙」并不一定完全出于自愿,而可能只是因为他站到了恶龙的位置上。

最后,从自身角度说,我们或许需要降低对于搜索引擎的心理预期。 尽管搜索引擎广告多、搜不准已经是广为人知的问题,但在很多人的潜意识中,搜索引擎仍然是、或者应该是让各种疑问迎刃而解的天外救星(deus ex machina)。在这种迷思中,技术总是能够为现实问题提供一个解决方案,如果不能解决,一定是技术提供者单方面的故意或疏忽。

但技术并不是什么全能的神明,它必然有自己的能力边界。就搜索而言,再准确、再复杂的索引能力和排序算法,也不能代替使用者的二次筛选的判断。相反,在获取信息的流程中,搜索引擎只是各种渠道和工具中的一种,众多步骤中最初级的一步。

十多年前,一本名为《比特素养》(Bit Literacy)的书将搜索列为应对信息过载的方法之一,在多个章节提及了搜索的技巧和价值。时至今日,搜索的入口、方式都前所未有地丰富,「能不能搜到」的问题日渐变成「搜到之后怎么办」的问题。在这样的背景下,掌握具体的搜索技巧尽管仍有价值,但尽早意识到搜索的能力边界,提高自己鉴别信息来源、去伪存真的能力,或许才是更面向未来的「比特素养」。