0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

为提升虚拟助手智能谷歌发布了最大的的任务型对话数据集SGD帮其开发

姚小熊27 来源:新智元 作者:佚名 2019-10-30 15:01 次阅读

近日,谷歌软件工程师Abhinav Rastogi和工程主管Pranav Khaitan称在谷歌虚拟助手中,已经引入了新的方法,更好地支持新服务。谷歌团队称,目前虚拟助手可帮助用户完成各种各样的任务,包括寻找航班,搜索附近的活动和电影并进行预订,从网上获取信息等等。他们通过为网络上的各种服务提供统一的自然语言界面来提供此功能。

为了适应未来的增长,虚拟助手必须能够轻松支持新服务,并减少维护工作量,而无需收集其他数据或重新训练模型。

而像Google Assistant这样的大型虚拟助手,需要与众多领域中不断增加的大量服务集成在一起,但每种服务都可能具有重叠的功能。这一适应性问题在最新模型中常常被忽略。这在一定程度上是由于缺乏合适的数据集,这些数据集无法与虚拟助手所面对的规模和复杂性相匹配。

在谷歌最近的论文《迈向可扩展的多域对话代理:模式指导的对话数据集》(Towards Scalable Multi-domain Conversational Agents: The Schema-Guided Dialogue Dataset)中,研究团队引入了一个新的数据集SGD(Schema-Guided Dialogue dataset)来解决这些问题。该团队表示,此数据集将会成为有效的测试平台,可用于意图预测,槽位填充,状态跟踪和语言生成以及大型虚拟助手的其他任务。

目前,谷歌已发布SGD数据集,谷歌表示,发布SGD数据集的基本目标是应对许多现有数据集无法充分解决的现实挑战。谷歌研究团队称,SGD数据集是目前公开可用的、最大的任务型对话数据集。

在此之前,9月17日,亚马逊在GitHub上发布了超470万单词21万句子的语料库 , 并声称这个数据集支持“高质量”和“可重复”的对话系统研究,将成为研究界公开可用的最大的基于知识的社交对话数据集 。

SGD数据集由人类和虚拟助手之间超过18000条的带注释的任务型对话组成。这些对话涉及17个领域。对于大多数领域,数据集包含多个不同的API,其中许多API 具有重叠的功能,但接口不同,这反映了典型的真实场景。SGD是第一个涵盖多个领域并为每个域提供多个API的数据集。此外,为了量化模型对API接口更改或添加新API,评估集还包含了许多训练集没有的新服务。

目前,利用SGD数据集就可以训练虚拟助手来支持互联网上各种各样的服务。而为达到这种功能,通用方法是需要一个master schema,来列出所有受支持的功能及其参数。但是,开发出适合所有使用案例的master schema很难。即使开发成功,master schema也会使新的或小型服务的集成复杂化,并会增加维护虚拟助手的工作量。此外,尽管跨服务可以有许多相似的概念可以联合建模,例如用于查询或指定电影票、机票或音乐会票数量在逻辑上有相似性,但除非手动定义它们之间的显式映射,否则master schema方法并不便于对此类概念进行联合建模。

对此,谷歌团队提出了的新的模式指导方法。此方法不需要为助手设定master schema。相反,每个服务或API都会提供其模式功能及其相关属性的自然语言描述。然后,这些描述会用于学习模式的分布式语义表示,语义表示则会作为对话系统的附加输入。对话系统之后就会被作为不包含域或服务特定参数的单个统一模型。这种统一模型利于在不同服务中相似概念之间的常识表示,而使用模式的分布式表示可以对训练数据中不存在的新服务进行操作。

目前,谷歌已经将这一方法用在了开源对话状态跟踪模型中,该模型在常规设置中仍具有竞争力,且适用于 zero-shot 设置(即没有针对新服务和API的训练数据)。

“我们认为该数据集将会成为建立大规模对话模型的良好基准,” Rastogi和Khaitan称。“我们期待研究界将其用于对话技术的发展创新。”
责任编辑:lw

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    5843

    浏览量

    103240
  • 人工智能
    +关注

    关注

    1776

    文章

    43762

    浏览量

    230550
收藏 人收藏

    评论

    相关推荐

    鸿蒙原生应用开发-ArkTS语言基础类库多线程CPU密集任务TaskPool

    CPU密集任务是指需要占用系统资源处理大量计算能力的任务,需要长时间运行,这段时间会阻塞线程其它事件的处理,不适宜放在主线程进行。例如图像处理、视频编码、数据分析等。 基于多线程并发
    发表于 03-19 14:14

    HarmonyOS开发技术全面分析

    不同类型的任务用户匹配并选择能力合适的执行硬件,让业务连续地在不同设备间流转,充分发挥不同设备的资源优势。分布式设备虚拟化示意图见 图 2 。 图2:分布式设备虚拟化示意图 分布式
    发表于 02-21 16:31

    【爱芯派 Pro 开发板试用体验】在爱芯派部署ChatGLM3(一)

    ,ChatGLM3 在 44 个中英文公开数据测试中表现优异,在国内同尺寸模型中排名首位。评测结果显示,ChatGLM3 在 MMLU、CEval、GSM8K 和 BBH 等基准测试中均取得了显著的性能提升,分别
    发表于 12-17 22:54

    语音数据集在智能语音助手中的应用与挑战

    一、引言 随着智能设备的普及和人工智能技术的不断发展,智能语音助手已经成为人们日常生活中不可或缺的一部分。语音数据集在
    的头像 发表于 12-14 15:07 339次阅读

    HarmonyOS后台任务管理开发指南上线!

    为什么要使用后台任务开发过程中如何选择合适的后台任务?后台任务申请时存在哪些约束与限制? 针对开发者使用后台
    发表于 11-29 09:58

    HarmonyOS CPU与I/O密集任务开发指导

    一、CPU密集任务开发指导 CPU密集任务是指需要占用系统资源处理大量计算能力的任务,需要长
    发表于 09-26 16:29

    K210开发板部署到开发板上后,会提示“Out of Memory”无法完成检测任务如何解决?

    您好,我想问一下嘉楠官方有没有出一套基于K210开发板进行目标检测的训练流程呢?我想训练自己的数据并部署到亚博智能K210开发板上,在网络
    发表于 09-14 08:35

    ChatGPT:人工智能的交互式对话伙伴

    ChatGPT作为智能对话生成模型,可以帮助打造智能客服体验的重要工具。以下是一些方法和步骤: 1.数据收集和准备:收集和整理与客服相关的数据,包括常见问题、回答示例、客户
    的头像 发表于 08-06 16:02 347次阅读
    ChatGPT:人工<b class='flag-5'>智能</b>的交互式<b class='flag-5'>对话</b>伙伴

    问答对话文本数据:解锁智能问答的未来

    文本数据是指在问答对话过程中产生的文本记录。这些数据包含了用户提出的问题以及智能问答系统返回的答案或解决方案。通过收集、整理和分析这些问答对话
    的头像 发表于 07-13 14:19 308次阅读

    谷歌助手LED控制开源分享

    电子发烧友网站提供《谷歌助手LED控制开源分享.zip》资料免费下载
    发表于 06-30 09:51 0次下载
    <b class='flag-5'>谷歌</b><b class='flag-5'>助手</b>LED控制开源分享

    MobaXterm 的安装-迅STM32MP157开发

    MobaXterm 是远端电脑的终极工具箱,作为一个单窗口程序,程序员,网站管理员,IT 管理员以及更多需要处理远端任务的用户提供很多实用的功能。MobaXterm windo
    发表于 06-27 15:50

    重磅!大眼夹化身「PPT小助手」入职OfficePLUS,PPT进入智能时代

    智能时代,科技将如何落地,切实改善每个人的办公体验?  这是一次来自OfficePLUS的回答。  大眼夹重磅回归,化身「PPT小助手」 PPT从思考到完成,只需1次对话 微软官方办公插件
    的头像 发表于 06-14 22:35 761次阅读
    重磅!大眼夹化身「PPT小<b class='flag-5'>助手</b>」入职OfficePLUS,PPT进入<b class='flag-5'>智能</b>时代

    智能虚拟助手如何彻底改变行业

    智能虚拟助手 (IVA) 是一种软件程序,它使用人工智能 (AI) 来执行不同的活动或根据给予他们的响应或任务为个人提供服务。IVA 通常旨
    发表于 06-08 10:33 307次阅读

    ChatGPT系统开发AI人功智能方案

    解决的问题和应用场景,例如智能客服、智能助手等。数据准备:准备与应用场景相关的数据
    发表于 05-18 10:16

    NVIDIA NeMo 如何支持对话式 AI 任务的训练与推理?

    开发和运行可落地的语音人工智能服务仍然是一项复杂而艰巨的任务,通常需要面临实时性、可理解性、自然性、低资源、鲁棒性等挑战。 本期分享我们邀请到了  NVIDIA 的解决方案架构师丁文 ,分享如何使用 NVIDIA NeMo 进
    的头像 发表于 05-11 20:16 618次阅读
    NVIDIA NeMo 如何支持<b class='flag-5'>对话</b>式 AI <b class='flag-5'>任务</b>的训练与推理?