0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Google发布用于训练通用智能助理的架构数据集

独爱72H 来源:十轮网 作者:佚名 2019-10-31 17:05 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

(文章来源:十轮网)

为了满足智能助理需要执行越来越多复杂任务的需求,Google发布了最新的架构引导对话(Schema-Guided Dialogue,SGD)数据集,以扩展智能助理模型,使其有能力处理多重领域的任务。

现在的智能助理可以完成的任务越来越多,包括预定餐厅或是截取网络消息等,Google提到,像是Google助理这类智能助理集成了众多领域的服务,每个服务可能由不同领域的服务叠加而成。为了适应这样的发展,让智能助理能够支持更多的新服务,而不需要收集额外的数据或是重新训练模型,降低维护成本。因此Google发布SGD数据集,来填补训练智能助理处理复杂与大规模任务所需要的数据集空缺。

SGD数据集是目前最大的任务导向对话语料库,Google使用绿野仙踪(Wizard of Oz)方法产生人类与助理的对话,共包含跨17个领域18,000个对话,并附加了不同的注解。这些对话涉及与服务和API的交互,包括银行服务、事件、日历甚至是天气等17个领域,而在多数的领域,SGD数据集包含多个不同的API,不少API接口不同但是功能重复,以反应实际的状况。

Google表示,SGD数据集是第一个涵盖这么多领域,会为每个领域都提供多个API的数据集,而且为了量化模型对API接口更新或是新API的强健性,评估数据集包含了许多在训练数据集中,所没有的新服务。

用户使用SGD数据集,可以训练智能助理支持网页的多样服务,Google提到,要完成这个目的,通常需要一个大型的主要架构(Master Schema),罗列所有支持的功能和参数,但实际上,要开发适合所有使用案例的主架构非常困难,而且即便克服了这项障碍,主架构也可能会让新的或是小型服务的集成变得复杂,进而增加智能助理的维护成本。

而且不少服务之间使用相似的概念,像是订票服务,电影票、机票和演奏会门票逻辑都相似,但使用主架构的方法,就会不方便对这类概念进行连接建模,除非以手动的方式定义之间的映射。

Google提出了一个新的架构引导方法解决这些问题,这个新方法不需要为智能助理定义一个主架构,而是为每个服务或是API,提供功能与相关属性列表的自然语言描述,这些描述可以用于学习一个架构的分布式语义表达,为对话系统提供额外的输入,并将对话系统以单个统一的模型实例,这个统一模型为不同服务提供相似概念的表示,并通过架构的分布式表达,使得新服务可以不需要事先有训练数据就能运行。

Google为此还以架构引导方法创建了一个智能助理,在所有服务和领域使用单一模型,没有设置各领域的专门参数,就能处理各式任务,Google开源了用于对话状态关注的模型,可以在新服务和API没有训练数据的情况下,同时保有与常规设置相同的能力。
(责任编辑:fqj)

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    6244

    浏览量

    110263
  • AI
    AI
    +关注

    关注

    89

    文章

    38121

    浏览量

    296693
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    基于蜂鸟E203架构的指令K扩展

    扩展指令架构(RISC-V ISA)的K扩展。 K扩展是一种可选的指令扩展,它增加了一些向量和矩阵操作的指令。这些指令可以利用硬件并行性,高效地处理大量数据。K扩展的指令
    发表于 10-21 09:38

    NVIDIA推出多语种语音AI开放数据与模型

    发布的 Granary 数据包含约 100 万小时音频,可用于训练高精度、高吞吐量的 AI 音频转录与翻译模型。
    的头像 发表于 09-23 15:34 605次阅读

    训练平台数据过大无法下载数据至本地怎么解决?

    起因是现在平台限制了图片数量,想要本地训练下载数据时发现只会跳出网络异常的错误,请问这有什么解决办法?
    发表于 07-22 06:03

    使用AICube导入数据点创建后提示数据不合法怎么处理?

    重现步骤 data目录下 labels.txt只有英文 **错误日志** 但是使用示例的数据可以完成训练并部署
    发表于 06-24 06:07

    数据下载失败的原因?

    数据下载失败什么原因太大了吗,小的可以下载,想把大的下载去本地训练报错网络错误 大的数据多大?数据
    发表于 06-18 07:04

    NVIDIA GTC巴黎亮点:全新Cosmos Predict-2世界基础模型与CARLA集成加速智能汽车训练

    。这种向使用大模型的过渡大大增加了对用于训练、测试和验证的高质量、基于物理学传感器数据的需求。 为加速下一代辅助驾驶架构的开发,NVIDIA 发布
    的头像 发表于 06-12 10:00 930次阅读

    RAKsmart智能算力架构:异构计算+低时延网络驱动企业AI训练范式升级

    在AI大模型参数量突破万亿、多模态应用爆发的今天,企业AI训练正面临算力效率与成本的双重挑战。RAKsmart推出的智能算力架构,以异构计算资源池化与超低时延网络为核心,重构AI训练
    的头像 发表于 04-17 09:29 598次阅读

    ShiMeta信息发布软件接入DeepSeek大模型,AI助理正式上线——您的智能信发顾问!

    一代【信发AI助理】,无论您是新手还是资深用户,AI助理都能为您提供实时、专业的指导,让信息发布变得更简单、更智能。核心升级,AI助理更懂您
    的头像 发表于 04-15 17:11 1962次阅读
    ShiMeta信息<b class='flag-5'>发布</b>软件接入DeepSeek大模型,AI<b class='flag-5'>助理</b>正式上线——您的<b class='flag-5'>智能</b>信发顾问!

    用于数据中心和AI时代的800G网络

    ,成为新一代AI数据中心的核心驱动力。 AI时代的两大数据中心:AI工厂与AI云 AI时代催生了两类数据中心架构: AI工厂:用于
    发表于 03-25 17:35

    用PaddleNLP为GPT-2模型制作FineWeb二进制预训练数据

    ,使用PaddleNLP将FineWeb数据集中文本形式的数据,经过分词化(Tokenize),转换为大语言模型能直接使用的二进制数据,以便提升训练效果。 ChatGPT
    的头像 发表于 03-21 18:24 3835次阅读
    用PaddleNLP为GPT-2模型制作FineWeb二进制预<b class='flag-5'>训练</b><b class='flag-5'>数据</b><b class='flag-5'>集</b>

    是否可以输入随机数据来生成INT8训练后量化模型?

    无法确定是否可以输入随机数据来生成 INT8 训练后量化模型。
    发表于 03-06 06:45

    AI Cube进行yolov8n模型训练,创建项目目标检测时显示数据目录下存在除标注和图片外的其他目录如何处理?

    AI Cube进行yolov8n模型训练 创建项目目标检测时显示数据目录下存在除标注和图片外的其他目录怎么解决
    发表于 02-08 06:21

    《具身智能机器人系统》第10-13章阅读心得之具身智能机器人计算挑战

    得到详细介绍,它创新性地解决了具身智能数据瓶颈问题。该系统包含三个核心组件:数据采集端点负责收集真实环境数据,仿真服务生成合成数据扩充
    发表于 01-04 01:15

    【「具身智能机器人系统」阅读体验】+数据在具身人工智能中的价值

    提供了对机器人环境和动作的统一和详细的理解。只有在这些过程之后,数据才能有效地用于训练 EAI 系统。 目前,应用 Sim2Real 技术的主要障碍是“现实差距”,即模拟环境与现实世界之间的差异,包括物理
    发表于 12-24 00:33

    RISC-V架构及MRS开发环境回顾

    是RISC-V被称为开放指令的主要原因。(4)RISC-V目前的应用 沁恒微电子于2020年2月24日发布了首款基于 RISC-V架构,自主设计的RISC-V3A处理器内核及 其硬件产品
    发表于 12-16 23:08