0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌搜索算法究竟是怎么工作的?为什么谷歌不做搜索结果个性化?

DPVg_AI_era 来源:未知 作者:李倩 2018-10-04 09:04 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

谷歌搜索算法究竟是怎么工作的?谷歌如何调整和改变其搜索算法,依据的标准和进行的测试是怎样的?为什么谷歌不做搜索结果个性化?本文告诉你全部答案。

自特朗普总统指责谷歌操纵搜索结果以来,谷歌一直否认其搜索系统存在任何政治偏见。

Google一下,净说我坏话!

尽管谷歌的个别员工在政治领域倾向于自由派,但没有证据表明搜索引擎的结果故意偏向任何特定的意识形态。

监管机构和Yelp等竞争对手批评谷歌通过其他网站的信息增强自己的服务,如地图,职位发布,商业评论和旅游信息等。去年,欧盟对谷歌的购物搜索结果开出了27亿美元的反托拉斯罚单,美国司法部副部长Jeff Sessions则公开调查包括谷歌在内的科技企业是否正在扼杀竞争。

为了揭开它如何运行其搜索引擎的神秘面纱,谷歌邀请CNBC参加了一个内部会议,会上搜索业务的主管们讨论是否要进行一项变动:在某些搜索结果旁边放上图片。

提议的更改很小,而且非常具体,谷歌的这项更改决定是数据驱动的。会议表明了谷歌是如何实现搜索产品的巨大复杂性和渐进式简洁的统一。

先来点基本知识:谷歌搜索的工作原理究竟是怎样的?

人们有时会对Google搜索进行拟人化,认为搜索引擎“理解”了他们的查询请求,比如用户输入“电影 排球岛”,Google返回了汤姆·汉克斯的电影《荒岛求生》的相关结果。

但是,搜索引擎其实并不知道这些词是什么意思:而只是在搜索那些词及其同义词,甚至是常见的拼写错误出现的页面,以及和这些页面相关度最高的页面。

谷歌的程序(称为网络抓取工具)会搜索互联网,从数千亿个网页中收集信息。然后将这些数据存储在一个巨大的、不断变化的索引中,记录信息的新鲜度和页面创建位置等信号。当用户在搜索栏中输入内容时,会通过所谓Google搜索“算法”的一系列规则和流程提供这些信息和信号。在此过程中,将用户的查询请求与索引中的信息进行比较,并确定出现在搜索结果顶部的页面,这些过程都在几分之一秒内完成。

20年前,谷歌刚刚成立时,其中一个搜索排名指标是PageRank,以谷歌联合创始人拉里·佩奇的名字命名。PageRank根据有多少用户链接到某页面,判断该页面的与搜索内容相关性。也就是说,如果网上很多人发现一个页面足够有用,与其建立了链接,这个页面就可能比大家都忽略的页面的相关性更高。今天,PageRank仍然是Google算法尚在使用的排名因素之一。

谷歌故意没有透露排名系统的全部指标,部分原因是它不希望人们利用这些信息来玩弄搜索系统,因为出现在搜索页面顶部可以带来大量的流量和经济利益。

对这些指标保密,也有助于谷歌领先潜在的竞争对手。

如何提升谷歌搜索排名?关注页面的专业知识、权威性和可靠性

当谷歌考虑改变搜索的算法时,会组建一个团队对一小部分真实用户进行测试,了解他们的搜索习惯,也会与名为“搜索质量评估者”的承包商团队一起调查。

Google在全球范围内约有10000名评估者,虽然他们无法直接影响搜索结果,但他们的意见有助于Google的搜索小组评估是否应该实施调整。评估者通常会同时查看新旧搜索结果,并确定哪个更好。

“更好”并不是一个纯粹主观的判断。而是会由过去发布的搜索质量评估指南文档来定义,该文档描述评估者应如何判断显示在其结果中的页面的好坏。文档内容特别关注页面的专业知识、权威性和可信赖性。

“你可以将评估指南中的内容视为我们希望搜索算法的发展方向。”Google搜索、智能助理和新闻副总裁Ben Gomes表示。“他们虽然没有告诉你算法如何对结果进行排名,但从根本上说明了算法应该做什么。”

改不改,怎么改?一切由数据驱动

谷歌在今年7月份对该指南进行了一些重大更改,其中包括要求评估者考虑页面作者的声誉。因此,作者不明的页面现在可能被评为低质量页面。

2017年,谷歌与其评估者共同进行了31584次实验,并推出了2453次搜索规则更改。虽然这些更改会对任何给定网站的排名产生巨大影响,但普通谷歌搜索用户通常根本不会注意到这些更改。

在CNBC本次受邀参加的会议中,测试团队测试了一种新的移动搜索格式,在搜索结果旁边显示网页上的照片及链接。他们假定这样做可以帮助用户更好地确定要点击哪个链接,找到与搜索内容最相关的页面。

最终评估数据显示,91%的情况下,评估者发现展示图像很有用。在实时实验中,真实用户也点击了图片。在权衡了增加图片导致延迟增加与用户体验的正反馈之后,Gomes和Nayak批准了这次调整。

这次调整并没有激烈的辩论或哲学上的探索,是数据推动了这一决定。

“对此我们有严格的测试过程,” Gomes说。“我们的改动是数据指标驱动的,这是我们运营方式的核心。”

谷歌为什么不做个性化搜索?

谷歌会倾听用户的反馈意见,包括一些由于结果错误导致的丑闻事件,比如用户曾发现谷歌将白人至上主义网站链接为“大屠杀是否发生?”的第一个搜索结果。如果出现明显问题,谷歌不仅要去掉糟糕的搜索结果。更常见的情况是,谷歌要试图弄清楚如何更改其算法及其评估指南,以避免类似的错误。

通过不对搜索结果进行个性化,谷歌摆脱了大部分Facebook和Twitter所遭受的批评——创建“过滤圈”(filter bubbles),也即用户只看到他们原本就倾向于相信或喜欢的信息。(谷歌的视频产品YouTube则无法躲开这种批评,尤其是它对于相关视频的推荐算法。这两种算法是完全独立的,不是由同一个团队创建或维护。)

个性化也可能导致人们对谷歌失去信任。虽然谷歌没有对其大部分搜索排名进行个性化,但由于其收集的大量数据(Google允许用户关于其收集的数据管理进行隐私设置,但其方法在过去一直存在误导性),其广告非常个性化。

对于所有用户测试,谷歌知道错误不可避免,有时是因为有人故意破坏,有时是则是因为算法存在问题,还有的时候是因为结果反映了社会偏见。

“我们并不认为搜索是完美的,”Nayak说:“但我们绝对致力于应对我们所面临的挑战并继续改进。这就是人们在这里做的事情。”

其他时候,算法更改的想法来自公司内部的广泛意见。 Nahak表示,一些员工长期以来一直认为谷歌搜索结果应该更加个性化。目前,谷歌搜索个性化的内容很少,现有的搜索重点是用户的位置或先前搜索的直接上下文。 (例如,如果你搜索了与棒球有关的东西,然后是“巨人队”,那么结果就不会影响到足球队。)

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    6244

    浏览量

    110259
  • 算法
    +关注

    关注

    23

    文章

    4760

    浏览量

    97144

原文标题:谷歌搜索歧视特朗普?全面拆解Google搜索算法及优化

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    线性搜索与二分搜索介绍

    搜索算法搜索过程从数组的中间元素开始,如果中间元素正好是要查找的元素,则搜索过程结束;如果某一特定元素大于或者小于中间元素,则在数组大于或小于中间元素的那一半中查找,而且跟开始一样从中间元素开始比较。
    发表于 12-01 07:36

    解析淘宝拍立淘按图搜索API接口与JSON数据示例参考

    文章大纲 1. 淘宝拍立淘按图搜索API接口的作用 基于图像识别的商品搜索。 提升用户体验与购物效率。 支持个性化推荐与营销活动。 2. 如何调用淘宝拍立淘按图搜索API 注册淘宝开放
    的头像 发表于 11-11 13:19 117次阅读

    京东拍立淘API开发指南:从零开始构建图像搜索应用

    京东图片识别搜索API(拍立淘)是基于深度学习的视觉搜索服务,通过卷积神经网络提取图像特征向量,结合近似最近邻搜索算法实现商品精准匹配‌。该技术解决了传统文字搜索难以描述商品外观的痛点
    的头像 发表于 11-09 17:40 1948次阅读

    用拼多多 API 实现拼多多店铺商品搜索权重提升

    ​ 在电商平台如拼多多上,商品搜索权重直接影响曝光率和销量。权重高的商品更容易出现在搜索结果前列,吸引更多用户点击。通过拼多多 API(应用程序接口),卖家可以自动优化商品信息,提升
    的头像 发表于 08-19 17:23 517次阅读
    用拼多多 API 实现拼多多店铺商品<b class='flag-5'>搜索</b>权重提升

    产品搜索与过滤API接口

    ​ 在现代电子商务和应用程序开发中,高效的产品搜索与过滤功能至关重要。它能帮助用户快速找到所需商品,提升用户体验和转化率。产品搜索与过滤API接口作为后端服务的核心组件,允许开发者通过编程方式实现
    的头像 发表于 07-24 14:35 358次阅读
    产品<b class='flag-5'>搜索</b>与过滤API接口

    利用API提升电商用户体验:个性化推荐系统

    的推荐算法,实时为用户提供精准的购物建议。本文将逐步解析如何利用API构建个性化推荐系统,提升用户体验。 1. 个性化推荐系统概述 个性化推荐系统通过分析用户行为数据(如浏览历史、购买
    的头像 发表于 07-14 14:45 380次阅读
    利用API提升电商用户体验:<b class='flag-5'>个性化</b>推荐系统

    百度搜索全量上线DeepSeek满血版,开启AI搜索新体验

    搜索结果页看到“AI+”的入口。点击进入AI搜索界面,再点击下方的“去试试满血版”按钮,即可与DeepSeek进行对话。这一功能不仅为用户提供了更加便捷的搜索方式,还极大地丰富了
    的头像 发表于 02-18 15:15 1956次阅读

    百度搜索与文心智能体平台接入DeepSeek及文心大模型深度搜索

    够免费使用DeepSeek和文心大模型的深度搜索功能。这一功能不仅融合了先进的搜索算法,还借助文心大模型的强大能力,实现了对信息的深度挖掘和精准匹配。用户在进行搜索时,将能够获得更加全面、准确的
    的头像 发表于 02-17 09:14 969次阅读

    室内导航究竟是如何实现的

    作为物联网智能硬件的引领者,云里物里当然不是来聊电影的,而是想借此机会,和大家探讨一下:室内导航究竟是如何实现的?它背后的技术原理是什么?接下来,让我们一起揭开室内导航的神秘面纱。
    的头像 发表于 02-12 13:50 888次阅读

    ADS1298R PACE_OUT1和PACE_OUT2这两条引腿究竟是输入还是输出?有什么用?怎样使用?

    PACE_OUT1和PACE_OUT2这两条引腿究竟是输入还是输出?有什么用?怎样使用?
    发表于 02-12 07:56

    谷歌公司被立案调查 谷歌股价暴跌 谷歌母公司Alphabet跌8%

    ,要求其改变市场垄断现状。去年8月,谷歌在美国遭遇重创,被联邦法官认定其搜索业务违反了美国反垄断法。这一判决为谷歌带来了诸多限制性的建议,如美国司法部建议联邦法院要求谷歌出售其核心的C
    的头像 发表于 02-06 16:23 1805次阅读

    OpenAI免费开放ChatGPT搜索功能

    近日,OpenAI宣布了一项重大决策:向所有用户免费开放ChatGPT搜索功能。这一举措无疑将为用户带来更加高效、智能的搜索体验。 与谷歌等传统搜索引擎的收录模式相比,ChatGPT
    的头像 发表于 02-06 14:35 810次阅读

    苹果为谷歌支付数十亿美元辩护,参与搜索案反垄断审判

    近日,苹果公司已正式要求参与谷歌即将在美国举行的在线搜索反垄断审判,此举旨在为其与谷歌之间的收入分成协议进行辩护。该协议使得谷歌成为Safari浏览器的默认
    的头像 发表于 12-26 10:41 716次阅读

    ChatGPT新增实时搜索与高级语音功能

    。OpenAI对搜索算法进行了深度优化,使得ChatGPT能够在用户提出问题后,迅速获取到分钟级别的最新信息,包括股票、新闻等。这一功能的加入,极大地满足了用户对即时数据的需求,使得ChatGPT在各类应用场景中更加得心应手。 同时,ChatGPT还推出了高级语音功能。在高级语
    的头像 发表于 12-17 14:08 921次阅读

    谷歌和Meta秘密广告交易被欧洲监管机构调查

    据外媒报道;欧洲监管机构认为Meta和谷歌的一个广告营销项目违反了谷歌公司制定的禁止向未成年人投放个性化广告的规则,目前已经被欧盟委员会(European Commission)官员调查。欧洲监管
    的头像 发表于 12-11 16:10 733次阅读