0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一种改变标准的谷歌关键词搜索的新方式

DPVg_AI_era 来源:未知 作者:胡薇 2018-04-17 11:28 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

昨天,谷歌发布“Talk to Books”(撩书??)和一个名为Semantris的游戏。这两项都是基于自然语言文本理解,用户能够凭语义而非关键词来实现搜索功能。这些创新来源于“在向量空间中表示语言”想法的延伸,以及词向量模型的发展。

未来的搜索,可能不需要输入关键词,直接表达想法就好。

谷歌昨晚放出大招:上线Semantic Experiences(语义体验)网站,网站有两项特殊功能,一个是“Talk to Books”(撩书??),一个是名为Semantris的语义联想游戏。

这两个大招都是基于自然语言文本理解,用户能够凭语义而非关键词来实现搜索功能。

过去几年里,自然语言理解(Natural language understanding)有了很大发展,部分原因是词向量(word vectors)的发展使得算法能够根据实际语言使用的例子来理解单词之间的关系。这些向量模型根据概念和语言之间的等价性、相似性或相关性将语义上相似的短语映射到相近的点。去年,谷歌已经使用语言的分层向量模型(hierarchical vector models)改进了Gmail的智能回复。

当“Talk to Books”时,只需要输入模糊的词汇,算法模型会在超过10万本书中搜索对应的每一个句子,以查找最有可能在对话中匹配的书籍,摆脱了以往通过书名或作者的搜索方式。

“Semantris”是一个单词语义联想游戏,当输入单词时,游戏会对屏幕中所有单词进行评分,简单有趣。

这篇博客由著名的未来学家、谷歌研究的工程总监Ray Kurzweil和产品经理Rachel Bernstein发布,博客地址:

https://research.googleblog.com/2018/04/introducing-semantic-experiences-with.html?m=1

游戏试玩地址:

https://research.google.com/semantris/

谷歌还公开了论文“Universal Sentence Encoder”,论文中详细描述了这些示例所使用的模型。此外,谷歌Semantic Experiences网站还在TensorFlow平台上提供了一个预先训练好的模型供其他研究人员进行实验。

不用关键词,轻松去“撩书”

“Talk to Books”可以让用户与用机器学习训练的算法进行对话,该算法可以从人写的文本中找到相关段落的答案。

“撩书”的方法很简单:你只要输入一句话,这句话可以是一个陈述句或一个疑问句,然后而“Talk to Books”会在书中找到相应的句子,完全不依赖于关键字匹配。

比如,问“为什么天空是蓝色的?”你会得到很多不同的答案,这些答案都是在清晰的文本中显示出来的,并且显示来自于关于这个主题的书籍。

这种做法改变了以往使用标准的谷歌关键词搜索的方式,并且也不需要必须点击链接并解析文章或网页。

此外,“Talk to Books”的Web界面非常整洁、完美(更没有竞价排名的医疗小广告)。

Kurzweil和Berstein说,这个模型接受了10亿次类似的训练,比如对句子进行分析,并学会识别出好的反应可能是什么样的。“一旦你问了你的问题(或者做了一个陈述),这些工具就会在超过10万本书中搜索所有的句子,找出那些根据句子层面的语义含义对你的输入做出反应的句子。你输入的和你得到的结果之间的关系没有预先定义的规则。

不过,“Talk to Books”并不是最完美的。TheVerge报道称,这个工具更适合回答原始的事实问题,而在处理复杂的地缘政治问题或现代文化和历史重要性的话题时表现不佳。

但是作为一个简单的Web工具,谷歌表示,这个技术能帮助改进像Gmail智能回复这样的产品,而且与书籍对话是一种以自然语义的方式搜索Web的有趣方式。更重要的是,它让我们意识到,当人工智能真正成熟到可以处理几乎所有我们抛出的问题时,未来的界面会是什么样子。

Semantris:开脑洞、发散思维的小游戏

跟“撩书”一起推出的是一款叫做Semantris的游戏,它主要测试用户单词联想能力。

举个例子,如果你把“床”(Bed)这个单词放在一个10个单词的最上面,你可能会把“睡眠”(Sleep)作为一种反应。Semantris将对这10个单词进行排序,并根据它认为床与睡眠之间的语义关系与列表中的其他单词之间的关系进行比较,最后还可以打分。

应该指出的是,很多谷歌实验也是公司收集用户数据的方法,通过给用户提供丰富的关于文字关系的信息,有助于信息技术的发展。这似乎是Semantris的案例,但无论如何,游戏是测试你自己能力的一种有趣的方式,看看软件如何判断单词之间的联系。

此外,你也可以玩一个类似tetris的游戏,它可以让你输入文字来清除屏幕上的文字块,根据你自己的假设,软件可以在彩色方块上的文字和你输入的答案之间的文字之间画出什么关联。

建模方法

谷歌使用的方法是“在向量空间中表示语言”这一想法的延伸,方法是为更大的语言块(如完整句子和小段落)创建向量。由于语言是由概念层次组成的,我们使用一个模块层级结构创建向量,每个模块考虑与不同时间尺度的序列对应的特征。如果以正确的方式训练,然后提出正确的“问题”,那么就可以用向量空间语言模型来表示相关性、同义词、反义词、部分整体关系、同形异义词以及其他许多类型的关系。谷歌在论文“Efficient Natural Language Response for Smart Reply”中描述了这种方法。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    6258

    浏览量

    111959
  • 关键词
    +关注

    关注

    0

    文章

    16

    浏览量

    11030
  • 自然语言
    +关注

    关注

    1

    文章

    292

    浏览量

    14026

原文标题:谷歌发大招:搜索全面AI化,不用关键词就能轻松“撩书”

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    探索AC自动机:多关键词搜索的原理与应用案例

    引言 目前,大多数自由文本搜索技术采用类似于Lucene的策略,通过解析搜索文本为各个组成部分来定位关键词。这种方法在处理少量关键词时表现良好。但当
    的头像 发表于 08-26 15:55 2201次阅读
    探索AC自动机:多<b class='flag-5'>关键词</b><b class='flag-5'>搜索</b>的原理与应用案例

    [讨论]提高网站关键词排名的28个SEO小技巧

    ) 内容中自然出现关键词 内容第段和最后段出现关键词 H1,H2标签中出现关键词 导出链接锚文本中包含
    发表于 12-01 17:08

    关键词优化有哪些实用的方法

    我们在做关键词优化排名的时候,有经验的seo人员都会有自己的套关于关键词应该怎么去优化排名的方法,但是对于些刚接触seo的新手来说就会比较迷茫,不知道应该怎么去做好
    发表于 08-11 01:19

    基于盲GDH签名的无记忆模糊关键词搜索

    在云计算中,用户在计算过程中的数据安全问题已经成为制约云计算发展的个瓶颈。本文针对云计算中的加密搜索问题,提出个有效的加密搜索方案。在搜索
    发表于 12-14 14:14 0次下载

    对加密电子医疗记录的关键词搜索

    被称为MCKS I的简单的多域连接关键词搜索(MCKS)方案,该方案仅支持连接相等查询,为了实现更加灵活而复杂的多域关键词连接查询,例如子集查询和范围查询,又提出了被称为MCKS II的提高方案.该方案利用了分层属性的矢量表示
    发表于 01-14 10:42 0次下载

    一种基于和文档嵌入的关键词抽取方法

    各类应用领域的文本数据日益增多,如何从这些海量数据中迅速准确地提取核心内容,已成为关键词抽取的主要任务。提出一种基于和文档嵌入的关键词抽取方法,通过计算单词与文档在同
    发表于 04-02 14:59 4次下载
    <b class='flag-5'>一种</b>基于<b class='flag-5'>词</b>和文档嵌入的<b class='flag-5'>关键词</b>抽取方法

    一种基于位置信息的关键词自动化提取算法

    关键词提取是进行未知网络协议逆向的关键步骤。鉴于现有的关键词提取方法存在精确度不髙、需要较多先验知识、操作繁琐等问题,提出了一种基于位置信息的关键词
    发表于 04-25 13:56 3次下载
    <b class='flag-5'>一种</b>基于位置信息的<b class='flag-5'>关键词</b>自动化提取算法

    ADI年度关键词曝光,这些你肯定搜索过!

    大数据时代,每个人的搜索框在某种程度上都代表着这个人的所思所想。如果将时间放长,样本量放大,那么 份年度搜索关键词就会呈现出了这个世界上绝大部分人是如何走过这
    的头像 发表于 12-30 00:05 1857次阅读

    搜索关键词获取商品详情接口的设计与实现

    ​   在电商、内容平台等应用中,用户经常通过输入关键词搜索商品并获取详情。设计个高效、可靠的API接口是核心需求。本文将逐步介绍如何设计并实现个“
    的头像 发表于 10-20 15:37 628次阅读
    <b class='flag-5'>搜索</b><b class='flag-5'>关键词</b>获取商品详情接口的设计与实现

    浅谈京东关键词

    、京东搜索关键词的核心特性 支持中文直接搜索 :京东官网支持中文关键词输入(如 “笔记本电脑”、“华为手机”),但在 HTTP 请求中,中
    的头像 发表于 01-04 10:40 1151次阅读

    利用京东搜索关键词 API 接口赋能电商运营

    数据,为选品、标题优化、定价策略、竞品监控等关键运营环节提供数据支撑。本文将从 API 核心价值、技术实现(多语言代码示例)、运营场景落地、避坑指南四个维度,拆解如何通过该 API 实现运营效率与业绩双提升。 、京东搜索
    的头像 发表于 01-05 09:21 484次阅读

    淘宝搜索API:关键词优化工具,提升曝光率!

    搜索API的使用、关键词优化原理、工具开发方法以及实际应用策略,帮助您高效提升曝光率。 1. 淘宝搜索API概述 淘宝搜索API是淘宝开放平台提供的
    的头像 发表于 01-05 15:38 314次阅读
    淘宝<b class='flag-5'>搜索</b>API:<b class='flag-5'>关键词</b>优化工具,提升曝光率!

    京东关键词的应用

    京东关键词应用核心是围绕搜索匹配与流量获取,贯穿商品上架、搜索优化、付费推广、精细化运营等全链路,以精准匹配用户需求、提升排名与转化为目标。以下是具体应用与实操方法:
    的头像 发表于 01-20 09:05 818次阅读

    野莓平台关键词商品搜索API接口使用指南

    ​ 在电商平台开发中,API接口是实现高效商品搜索关键。野莓平台(假设为个虚构的电商平台)提供了关键词商品搜索API,允许开发者通过HT
    的头像 发表于 02-04 16:48 645次阅读
    野莓平台<b class='flag-5'>关键词</b>商品<b class='flag-5'>搜索</b>API接口使用指南

    关键词搜索京东列表 API 技术对接指南

    、前言 在电商数据服务、代购集运系统搭建、电商平台竞品分析、自有商城商品同步等业务场景中,京东商品列表的精准、实时获取是核心环节之。 二、接口概述 关键词搜索京东列表 API,核心
    的头像 发表于 02-05 16:36 517次阅读