0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

微软美国研究院和清华联合推出了一款开源的多领域端到端对话系统平台—ConvLab

nlfO_thejiangme 来源:lp 2019-04-23 10:42 次阅读

近年来对话系统迅速发展,同时也出现了一系列丰富的数据集。但对于刚刚进入这一领域团队来说,迅速搭建起对于特定任务的可用的对话系统依然充满挑战。这主要是由于这一领域内缺乏结构完善、易于使用的开源系统,让研究人员可以便捷的搭建和测评对话机器人

众所周知,基础性的开源系统为AI研究的突破打下了坚实的基础,在这一领域的Moses、HTK和CoreNLP等项目都被广泛用于机器翻译、语音识别和自然语言处理,推动了各层次研究的飞速发展。

为了促进这一领域的发展,微软美国研究院和清华联合推出了一款开源的多领域端到端对话系统平台—ConvLab,使得研究人员可以便捷地搭建对话系统、自动训练对话模型、构建并评测对话机器人的各方面表现。

ConvLab

为了便于用于构建不同类型任务导向的机器人、将更多的自动化引入构建、训练和测评过程中,ConvLab包含了丰富的模型工具和运行引擎、以及端到端的测评平台。简单来讲台中包含了基于模块和端到端两种架构类型的对话系统:基于模块的架构系统包含了自然语言理解(NLU)、对话系统追踪(DST)、对话策略(POL)和自然语言生成(NLG)等模块;完全端到端神经架构减少了手工编程的工作量,并减小了误差在工作流程中的传播。

与先前工具集集中于系统策略或者受限于固定的预训练模型不同,ConvLab基于全标注的数据集覆盖了所有可训练的统计模型,解决了先前对于系统性能度量的困难。

很多时候用户需要在多子域之间无缝衔接实现高层用户目标,多层级的对话系统对数据收集、标注以及模型的开发都提出了复杂的要求。有研究人员提出了MultiWOZ数据集(包含了旅行相关的多邻域对话内容),但目前却缺乏对应的开源平台来处理多域多意图对话。为了加速多领域对话的研究ConvLab研究了MultiWOZ任务的特征,并提供了一系列完整的参考模型(包含了独立的模块和端到端模型)、这些模型在为用户对话额外标注的MultiWOZ数据集上进行了训练。ConvLab目前还作为DSTC18多领域端到端对话追踪的标准平台,得到了更广泛的应用和实际的检验。为了更好的支持端到端评价、ConvLab提供了两个互补模块、分别集成了亚马逊Amazon Mechanical Turk平台用于人类测评、同时也集成了虚拟用户用于自动测评。针对用户仿真,平台同时提供了基于规则和基于数据驱动的模拟器。ConvLab在开发模拟用户的过程中也研发出了一系列先进的用户模拟技术

架构设计

整个系统基于模块化的设计保障了灵活性和适应性。为了支持多领域对话系统的搭建,平台使用了主体-环境-对话实体的组合设计(Agents-Environments-Bodies,AEB),除了单环境和单主体的配置外,系统还包含了一系列先进的研究实验、包括多任务学习、多主体学习和角色扮演、无需复杂的代码即可导入到实例中使用。

此外,为了系统性地对比不同的主体和环境,并实现自动超参数搜索,平台充分利用了SLM Lab和Ray^2 作为实验组件。他们提供了多层级的控制,从会话、尝试和试验上为每一层次生成评测报告。

其中会话用于初始化主体和环境、并以预设的轮次运行。随后利用随机种子来启动多个会话进行尝试、并最终在会话上分析并求平均。最后利用实验来确定不同超参数的表现。

对话主体和环境的配置

在系统中每个层代表了构建对话系统的不同方式,在下图中可以看到最上层代表了传统方式构建对话系统的架构路线图,包括了NLU,DST,POL,NLG。研究人员近年来通过引入词级对话状态追踪、对话策略和端到端模型等典型组件,探索了构建对话系统不同可能的组合实现形式。在ConvLab平台上,研究人员可以聚焦于下图中的任意组件,并以端到端的简单方式进行测试。

对于环境构建来说,可以由很可能的组件来进行构建。在研究对话策略优化的强化学习算法中,典型的方法是利用用户模拟器在对话行为层级上进行操作。对话主体会尽可能利用端到端的方式尝试减小对标注数据的需求,对于人类评测来说平台提供了基于Amazon Mechanical Turk来作为最后一层进行环境构建。

参考模型和跨域数据实验

在ConvLab中还涵盖了针对多重任务的模型供研究人员进行参考评测,包括了自然语言理解领域的Semantic Tuple Classi-fier (STC)、 OneNet以及作为拓展的Multi-intent LU (MILU);对话状态追踪引入了DSTCs基准模型、词级对话状态追踪领域集成了MDBT模型将域识别与置信状态追踪进行结合;在系统策略方面平台支持DQN,REINFORCE\PPO以及自模仿等;自然语言生成领域则使用了SC-LSTM方法。在词级策略上使用了Budzianowski等人提出的基准;在用户策略上ConvLab提供了基于agenda的方法和基于数据驱动(例如HUS等)的方法,模型在对话行为级别进行并可与NLU等模块协同构架出完整的用户模拟器;最后再端到端模型上则包含了Mem2Seq,Sequicity,并使得Sequicity实现了对于多域的支持。目前ConvLab主要支持MultiWOZ和Movie两个不同复杂度的数据域。其中MultiWOZ的主要任务是帮助旅客,其中引入了包含景点介绍和酒店预订等不同方面的内容。MultiWOZ中主要包含了7个子领域的问题:景点、医院、酒店、警察、餐厅、出租车、火车等方面的内容。其中包含了10438个标注对话。对于单领域和多领域的对话轮次平均为8.93和15.93轮。ConvLab对于用户对话行为进行了额外的标注、并为对话系统元件和用户模拟器提供了预训练基准模型、以及基于此数据训练的端到端的自然对话模型。Movie则来自于微软对话挑战赛,主要集中于电影票预订场景,包含了2890个标注对话,评论为7.5轮,同时还提供了针对主体和用户模拟器的一系列完整的参考模型。研究人员表示在未来还会加入Taxi和Restaurant等领域的任务不断丰富平台支持的领域。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 微软
    +关注

    关注

    4

    文章

    6218

    浏览量

    103062
  • 开源
    +关注

    关注

    3

    文章

    2982

    浏览量

    41694
  • 模块化
    +关注

    关注

    0

    文章

    300

    浏览量

    21157

原文标题:微软与清华开源多领域端到端对话系统集成平台ConvLab,帮助研究人员迅速搭建对话系统

文章出处:【微信号:thejiangmen,微信公众号:将门创投】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    产学研三界顶级大咖分享:RISC-V场景Show暨开源生态高级别论坛定档12/19

    和中科软件研究所高级工程师于佳耕出席,现场为大家分享新轮处理器技术突破、RISC-V架构生态建设以及开源操作系统教学。同时,现场嘉宾还将
    发表于 12-15 18:36

    周礼栋对话比尔·盖茨:深入的科学研究比以往任何时候都更加重要

    特别策划了“智汇对话”系列内容,邀请全球各领域顶尖专家学者,与微软亚洲研究院院长周礼栋博士共同畅谈研究文化,探讨跨学科创新,展望技术未来。
    的头像 发表于 12-12 15:55 172次阅读
    周礼栋<b class='flag-5'>对话</b>比尔·盖茨:深入的科学<b class='flag-5'>研究</b>比以往任何时候都更加重要

    RISC-V内核突破百亿颗 RVV1.0如何解锁侧AI市场应用潜能

    RISC-V内核增长迅猛,2022年就实现了破百亿颗出货量。作为一款开源的RISC架构,其凭借轻量化、优秀的可扩展性与不断增强的软件兼容性吸引越来越多的企业采用。不断扩张的生态版图之下,RISC-V
    发表于 12-01 13:17

    CMU、MIT、清华联合发布全球首个生成式机器人智能体RoboGen

    CMU、MIT、清华联合发布了全球首个生成式机器人智能体RoboGen,可以无限生成数据,让机器人7*24小时永不停歇地训练。为机器人进入通用场景迈出坚实一步。
    的头像 发表于 11-09 10:19 652次阅读

    开源机密计算平台:蓬莱-OpenHarmony

    OpenHarmony技术峰会——安全及机密计算分论坛 ​ 正 文 内 容 OpenHarmony赋能万物互联,存在覆盖从云的安全能力需求。蓬莱-OpenHarmony是开源
    发表于 09-07 16:08

    飞凌嵌入式国产平台大盘点之瑞芯微系列

    “国产化”词正在被越来越多的提及,有着越来越高的关注度,飞凌嵌入式也已与多家国内芯片原厂联合推出了国产化智能平台。为了帮助大家快速认识飞凌嵌入式
    发表于 08-05 11:12

    微软亚洲研究院否认撤离中国,但确认部分 AI 科学家将迁至温哥华

    6 月 19 日消息,针对有消息称微软公司旗下研究机构 微软亚洲研究院(MSRA)的 AI 顶级科学家从中国转移到温哥华,6 月 19 日上午,微软
    的头像 发表于 06-20 08:48 539次阅读

    共建、共享开源EDA核心共性技术框架|2023开放原子全球开源峰会开源EDA分论坛成功举办

    、武汉理工大学、清华大学等单位的openDACS工作委员会委员及各专业领域负责人汇聚堂,共同探讨EDA技术的未来发展,携手共建国产开源EDA的全新生态。openDACS工委会
    发表于 06-16 13:45

    国产第二代“香山”RISC-V 开源处理器计划 6 月流片:基于中芯国际 14nm 工艺,性能超 Arm A76

    是南湖,第三代架构是昆明湖。香山开源社区称,第代“雁栖湖”架构已经成功流片,实测达到预期性能,第二代“南湖”架构正在持续迭代优化中。去年 8 月 24 日,中科计算所、北京开源芯片
    发表于 06-05 11:51

    纵目科技与清华大学共同成立智能辅助驾驶系统联合研究中心

    今日,纵目科技宣布与国内顶尖学府——清华大学共同成立智能辅助驾驶系统联合研究中心(以下简称“联合研究
    的头像 发表于 05-31 09:52 315次阅读
    纵目科技与<b class='flag-5'>清华</b>大学共同成立智能辅助驾驶<b class='flag-5'>系统</b><b class='flag-5'>联合</b><b class='flag-5'>研究</b>中心

    中科发布“香山”与“傲来”两项开源处理器芯片

    449个分支(Fork)。 随后,中科软件研究所副所长、总工程师武延军介绍了“傲来”RISC-V原生操作系统。他表示,作为“先导”专项亮点成果之,“傲来”集成软件所的最新科研成果,
    发表于 05-28 08:43

    中国开源未来发展峰会“问道 AI 分论坛”即将开幕!

    是致力于推动中国开源事业发展的非营利机构,于 2022 年 12 月 31 日在重庆揭牌,由重庆市政府批复设立,由清华大学,华中科技大学,重庆大学,中冶赛迪,中国信科,中科等知名高校和企业
    发表于 05-09 09:49

    已结束-【书籍评测活动NO.12】 OpenHarmony嵌入式系统原理与应用——基于RK2206芯片(微课视频版)

    标准规范制定专家,福建省开源数字技术研究院监事长。OpenAtom OpenHarmony代码TOP10贡献者,2022数字中国创新大赛·鲲鹏赛道全国总决赛等奖获得者(获奖作品:OpenHarmony
    发表于 05-08 15:51

    开源鸿蒙OpenHarmony系统已成功用于微纳卫星

    软件研究所、中国科学院微小卫星创新研究院清华大学、大连理工大学、武汉大学、长光卫星、北京爱太空科技、航天创客和清华大学附中等。 为推广 OpenHarmony 在微纳卫星以及航天其他
    发表于 04-26 13:59

    首届EDA国际研讨会(ISEDA)5月将在南京召开,点击查看会议信息

    会议。ISEDA旨在探索新的挑战课题,呈现领先的技术与思想,并为EDA生态捕捉领域未来发展的趋势与机会。ISEDA涵盖了从器件和电路级系统级、从模拟数字设计以及制造等所有EDA相关
    发表于 04-20 18:48