0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一种改变标准的谷歌关键词搜索的新方式

DPVg_AI_era 来源:未知 作者:胡薇 2018-04-17 11:28 次阅读

昨天,谷歌发布“Talk to Books”(撩书??)和一个名为Semantris的游戏。这两项都是基于自然语言文本理解,用户能够凭语义而非关键词来实现搜索功能。这些创新来源于“在向量空间中表示语言”想法的延伸,以及词向量模型的发展。

未来的搜索,可能不需要输入关键词,直接表达想法就好。

谷歌昨晚放出大招:上线Semantic Experiences(语义体验)网站,网站有两项特殊功能,一个是“Talk to Books”(撩书??),一个是名为Semantris的语义联想游戏。

这两个大招都是基于自然语言文本理解,用户能够凭语义而非关键词来实现搜索功能。

过去几年里,自然语言理解(Natural language understanding)有了很大发展,部分原因是词向量(word vectors)的发展使得算法能够根据实际语言使用的例子来理解单词之间的关系。这些向量模型根据概念和语言之间的等价性、相似性或相关性将语义上相似的短语映射到相近的点。去年,谷歌已经使用语言的分层向量模型(hierarchical vector models)改进了Gmail的智能回复。

当“Talk to Books”时,只需要输入模糊的词汇,算法模型会在超过10万本书中搜索对应的每一个句子,以查找最有可能在对话中匹配的书籍,摆脱了以往通过书名或作者的搜索方式。

“Semantris”是一个单词语义联想游戏,当输入单词时,游戏会对屏幕中所有单词进行评分,简单有趣。

这篇博客由著名的未来学家、谷歌研究的工程总监Ray Kurzweil和产品经理Rachel Bernstein发布,博客地址:

https://research.googleblog.com/2018/04/introducing-semantic-experiences-with.html?m=1

游戏试玩地址:

https://research.google.com/semantris/

谷歌还公开了论文“Universal Sentence Encoder”,论文中详细描述了这些示例所使用的模型。此外,谷歌Semantic Experiences网站还在TensorFlow平台上提供了一个预先训练好的模型供其他研究人员进行实验。

不用关键词,轻松去“撩书”

“Talk to Books”可以让用户与用机器学习训练的算法进行对话,该算法可以从人写的文本中找到相关段落的答案。

“撩书”的方法很简单:你只要输入一句话,这句话可以是一个陈述句或一个疑问句,然后而“Talk to Books”会在书中找到相应的句子,完全不依赖于关键字匹配。

比如,问“为什么天空是蓝色的?”你会得到很多不同的答案,这些答案都是在清晰的文本中显示出来的,并且显示来自于关于这个主题的书籍。

这种做法改变了以往使用标准的谷歌关键词搜索的方式,并且也不需要必须点击链接并解析文章或网页。

此外,“Talk to Books”的Web界面非常整洁、完美(更没有竞价排名的医疗小广告)。

Kurzweil和Berstein说,这个模型接受了10亿次类似的训练,比如对句子进行分析,并学会识别出好的反应可能是什么样的。“一旦你问了你的问题(或者做了一个陈述),这些工具就会在超过10万本书中搜索所有的句子,找出那些根据句子层面的语义含义对你的输入做出反应的句子。你输入的和你得到的结果之间的关系没有预先定义的规则。

不过,“Talk to Books”并不是最完美的。TheVerge报道称,这个工具更适合回答原始的事实问题,而在处理复杂的地缘政治问题或现代文化和历史重要性的话题时表现不佳。

但是作为一个简单的Web工具,谷歌表示,这个技术能帮助改进像Gmail智能回复这样的产品,而且与书籍对话是一种以自然语义的方式搜索Web的有趣方式。更重要的是,它让我们意识到,当人工智能真正成熟到可以处理几乎所有我们抛出的问题时,未来的界面会是什么样子。

Semantris:开脑洞、发散思维的小游戏

跟“撩书”一起推出的是一款叫做Semantris的游戏,它主要测试用户单词联想能力。

举个例子,如果你把“床”(Bed)这个单词放在一个10个单词的最上面,你可能会把“睡眠”(Sleep)作为一种反应。Semantris将对这10个单词进行排序,并根据它认为床与睡眠之间的语义关系与列表中的其他单词之间的关系进行比较,最后还可以打分。

应该指出的是,很多谷歌实验也是公司收集用户数据的方法,通过给用户提供丰富的关于文字关系的信息,有助于信息技术的发展。这似乎是Semantris的案例,但无论如何,游戏是测试你自己能力的一种有趣的方式,看看软件如何判断单词之间的联系。

此外,你也可以玩一个类似tetris的游戏,它可以让你输入文字来清除屏幕上的文字块,根据你自己的假设,软件可以在彩色方块上的文字和你输入的答案之间的文字之间画出什么关联。

建模方法

谷歌使用的方法是“在向量空间中表示语言”这一想法的延伸,方法是为更大的语言块(如完整句子和小段落)创建向量。由于语言是由概念层次组成的,我们使用一个模块层级结构创建向量,每个模块考虑与不同时间尺度的序列对应的特征。如果以正确的方式训练,然后提出正确的“问题”,那么就可以用向量空间语言模型来表示相关性、同义词、反义词、部分整体关系、同形异义词以及其他许多类型的关系。谷歌在论文“Efficient Natural Language Response for Smart Reply”中描述了这种方法。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    5858

    浏览量

    103251
  • 关键词
    +关注

    关注

    0

    文章

    16

    浏览量

    9643
  • 自然语言
    +关注

    关注

    1

    文章

    269

    浏览量

    13203

原文标题:谷歌发大招:搜索全面AI化,不用关键词就能轻松“撩书”

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    [讨论]提高网站关键词排名的28个SEO小技巧

    ) 内容中自然出现关键词 内容第段和最后段出现关键词 H1,H2标签中出现关键词 导出链接锚文本中包含
    发表于 12-01 17:08

    搜索年度关键词 从产业趋势看平板变革

    专门针对ARM而生的新操作系统,三大品牌三大系统之间的斗争构成了如今的产业格局。  ·盘点平板行业热门关键词  借此,我们也来盘点下2012年平板电脑行业的热门关键词。由于本次文章的基调以偏产业的
    发表于 01-06 16:57

    ☑网站建设 ☑网站推广 ☑关键词优化 ☑百度地标 ☑欢迎...

    ☑网站建设 ☑网站推广 ☑关键词优化 ☑百度地标 ☑欢迎咨询QQ:2991704102
    发表于 03-15 16:13

    关于电子发烧友论坛帖子搜索的问题建议

    搜索帖子,应该是每个电子发烧友的爱好,也是一种习惯。大家都希望通过搜索关键词来寻找自己想要的帖子。但是经过我这么长时间的使用,发现我们这个
    发表于 07-23 11:28

    TF-IDF测量文章的关键词相关性研究

    停用词的移除、大小写字母转化和词干提取。4)获取查询。获取单词权重,对于可疑文档利用TF-IDF获得关键词,并排序得到相应的关键词列表。排在前n个的关键词组成个查询,以此类推,本试验
    发表于 01-26 10:38

    亚马逊代运营 amazon Search term 关键词填写的“神技”

    、转化率,且与自己产品相关的关键词,单独拿出来放进 search term 里面进行优化 listing 的操作。2.自己利用些工具去筛选出些买家搜索词,然后根据自己对产品的理解,
    发表于 06-05 15:41

    HanLP关键词提取算法分析详解

    document.提取出来的关键词,可用来作为文本分类,或者概括文本的中心思想。TextRank通过不断地迭代来提取关键词,每轮迭代,算法给图中的顶点打分。直到满足某个条件(比如说迭代次数克到200次,或者
    发表于 11-05 10:41

    基于Cortex-M处理器的高精度关键词识别实现

    更胜筹。关键词识别神经网络管道由于要保持“永远在线”,KWS 应用的功耗预算受到很大限制。虽然 KWS 应用也可在专用 DSP 或高性能 CPU 上运行,但更适合在 Arm Cortex-M 微控制器
    发表于 07-23 06:59

    关键词优化有哪些实用的方法

    我们在做关键词优化排名的时候,有经验的seo人员都会有自己的套关于关键词应该怎么去优化排名的方法,但是对于些刚接触seo的新手来说就会比较迷茫,不知道应该怎么去做好
    发表于 08-11 01:19

    将cnc数控机床关键词优化到百度前三,询盘无忧

    `CNC加工外贸如何找客户,GOOGLE优化推广转化率更高电话CNC数控加工国外客户out了,我有妙计将cnc数控机床关键词优化到百度前三,询盘无忧百度关键词排名+网络推广代运营,两者需要起做
    发表于 11-18 14:17

    百度关键词排名掉完了怎么办

    夜之间关键词排名掉完了,没有被K,也没有出现违规操作,这是怎么回事呢?
    发表于 01-27 11:01

    如何在Cortex-M处理器上实现高精度关键词的识别

    如何在 Cortex-M 处理器上实现高精度关键词识别
    发表于 02-05 07:14

    example/speech_recognition/asr样例写了关键词识别程序,关键词识别后播放提升音失败的原因?

    仿造example/speech_recognition/asr样例写了关键词识别程序,识别到关键词后,就播放提示音。目前关键词可以正确识别,就是播放提示音的时候就报错,报错信息如
    发表于 03-10 06:18

    #2023,你的 FPGA 年度关键词是什么? #

    FPGA 年度关键词,我的想法是“标准化”;今年的工作中遇到了不少同事的issues,本身都是小问题或者很细节的东西但是却反复出现问题,目前想到的最好的办法是做好设计规则的标准化才能避免,不知道大家有没有更好的建议?
    发表于 12-06 20:31

    基于盲GDH签名的无记忆模糊关键词搜索

    在云计算中,用户在计算过程中的数据安全问题已经成为制约云计算发展的一个瓶颈。本文针对云计算中的加密搜索问题,提出一个有效的加密搜索方案。在搜索过程中,为保证用户的数据安全,用户需要隐藏搜索
    发表于 12-14 14:14 0次下载