侵权投诉

微软美国研究院和清华联合推出了一款开源的多领域端到端对话系统平台—ConvLab

2019-04-23 10:42 次阅读

近年来对话系统迅速发展,同时也出现了一系列丰富的数据集。但对于刚刚进入这一领域团队来说,迅速搭建起对于特定任务的可用的对话系统依然充满挑战。这主要是由于这一领域内缺乏结构完善、易于使用的开源系统,让研究人员可以便捷的搭建和测评对话机器人。

众所周知,基础性的开源系统为AI研究的突破打下了坚实的基础,在这一领域的Moses、HTK和CoreNLP等项目都被广泛用于机器翻译、语音识别和自然语言处理,推动了各层次研究的飞速发展。

为了促进这一领域的发展,微软美国研究院和清华联合推出了一款开源的多领域端到端对话系统平台—ConvLab,使得研究人员可以便捷地搭建对话系统、自动训练对话模型、构建并评测对话机器人的各方面表现。

ConvLab

为了便于用于构建不同类型任务导向的机器人、将更多的自动化引入构建、训练和测评过程中,ConvLab包含了丰富的模型工具和运行引擎、以及端到端的测评平台。简单来讲台中包含了基于模块和端到端两种架构类型的对话系统:基于模块的架构系统包含了自然语言理解(NLU)、对话系统追踪(DST)、对话策略(POL)和自然语言生成(NLG)等模块;完全端到端神经架构减少了手工编程的工作量,并减小了误差在工作流程中的传播。

与先前工具集集中于系统策略或者受限于固定的预训练模型不同,ConvLab基于全标注的数据集覆盖了所有可训练的统计模型,解决了先前对于系统性能度量的困难。

很多时候用户需要在多子域之间无缝衔接实现高层用户目标,多层级的对话系统对数据收集、标注以及模型的开发都提出了复杂的要求。有研究人员提出了MultiWOZ数据集(包含了旅行相关的多邻域对话内容),但目前却缺乏对应的开源平台来处理多域多意图对话。为了加速多领域对话的研究ConvLab研究了MultiWOZ任务的特征,并提供了一系列完整的参考模型(包含了独立的模块和端到端模型)、这些模型在为用户对话额外标注的MultiWOZ数据集上进行了训练。ConvLab目前还作为DSTC18多领域端到端对话追踪的标准平台,得到了更广泛的应用和实际的检验。为了更好的支持端到端评价、ConvLab提供了两个互补模块、分别集成了亚马逊Amazon Mechanical Turk平台用于人类测评、同时也集成了虚拟用户用于自动测评。针对用户仿真,平台同时提供了基于规则和基于数据驱动的模拟器。ConvLab在开发模拟用户的过程中也研发出了一系列先进的用户模拟技术。

架构设计

整个系统基于模块化的设计保障了灵活性和适应性。为了支持多领域对话系统的搭建,平台使用了主体-环境-对话实体的组合设计(Agents-Environments-Bodies,AEB),除了单环境和单主体的配置外,系统还包含了一系列先进的研究实验、包括多任务学习、多主体学习和角色扮演、无需复杂的代码即可导入到实例中使用。

此外,为了系统性地对比不同的主体和环境,并实现自动超参数搜索,平台充分利用了SLM Lab和Ray^2 作为实验组件。他们提供了多层级的控制,从会话、尝试和试验上为每一层次生成评测报告。

其中会话用于初始化主体和环境、并以预设的轮次运行。随后利用随机种子来启动多个会话进行尝试、并最终在会话上分析并求平均。最后利用实验来确定不同超参数的表现。

对话主体和环境的配置

在系统中每个层代表了构建对话系统的不同方式,在下图中可以看到最上层代表了传统方式构建对话系统的架构路线图,包括了NLU,DST,POL,NLG。研究人员近年来通过引入词级对话状态追踪、对话策略和端到端模型等典型组件,探索了构建对话系统不同可能的组合实现形式。在ConvLab平台上,研究人员可以聚焦于下图中的任意组件,并以端到端的简单方式进行测试

对于环境构建来说,可以由很可能的组件来进行构建。在研究对话策略优化的强化学习算法中,典型的方法是利用用户模拟器在对话行为层级上进行操作。对话主体会尽可能利用端到端的方式尝试减小对标注数据的需求,对于人类评测来说平台提供了基于Amazon Mechanical Turk来作为最后一层进行环境构建。

参考模型和跨域数据实验

在ConvLab中还涵盖了针对多重任务的模型供研究人员进行参考评测,包括了自然语言理解领域的Semantic Tuple Classi-fier (STC)、 OneNet以及作为拓展的Multi-intent LU (MILU);对话状态追踪引入了DSTCs基准模型、词级对话状态追踪领域集成了MDBT模型将域识别与置信状态追踪进行结合;在系统策略方面平台支持DQN,REINFORCE\PPO以及自模仿等;自然语言生成领域则使用了SC-LSTM方法。在词级策略上使用了Budzianowski等人提出的基准;在用户策略上ConvLab提供了基于agenda的方法和基于数据驱动(例如HUS等)的方法,模型在对话行为级别进行并可与NLU等模块协同构架出完整的用户模拟器;最后再端到端模型上则包含了Mem2Seq,Sequicity,并使得Sequicity实现了对于多域的支持。目前ConvLab主要支持MultiWOZ和Movie两个不同复杂度的数据域。其中MultiWOZ的主要任务是帮助旅客,其中引入了包含景点介绍和酒店预订等不同方面的内容。MultiWOZ中主要包含了7个子领域的问题:景点、医院、酒店、警察、餐厅、出租车、火车等方面的内容。其中包含了10438个标注对话。对于单领域和多领域的对话轮次平均为8.93和15.93轮。ConvLab对于用户对话行为进行了额外的标注、并为对话系统元件和用户模拟器提供了预训练基准模型、以及基于此数据训练的端到端的自然对话模型。Movie则来自于微软对话挑战赛,主要集中于电影票预订场景,包含了2890个标注对话,评论为7.5轮,同时还提供了针对主体和用户模拟器的一系列完整的参考模型。研究人员表示在未来还会加入Taxi和Restaurant等领域的任务不断丰富平台支持的领域。

原文标题:微软与清华开源多领域端到端对话系统集成平台ConvLab,帮助研究人员迅速搭建对话系统

文章出处:【微信号:thejiangmen,微信公众号:将门创投】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
分享:

评论

相关推荐

开源办公套件LibreOffice在 7.0 RC中加入了商业化的探索

在此后将近 10 年的时间里,该软件都在 Sun 的管理下,从 1.0 版开发到 3.2 版,从 L....
的头像 Linux爱好者 发表于 08-14 16:40 39次 阅读
开源办公套件LibreOffice在 7.0 RC中加入了商业化的探索

一个可以将Ubuntu转换为滚动版本的工具Rolling Rhino

滚动更新对于想要一次安装 Ubuntu 并跟踪所有开发更新,同时自动跟踪后续系列的 Ubuntu 开....
的头像 Linux爱好者 发表于 08-14 16:32 49次 阅读
一个可以将Ubuntu转换为滚动版本的工具Rolling Rhino

谷歌越来越封闭,微软越来越开放?

被问到 OSM 与 Istio 有何区别时,Gabe 表示,最主要的区别在于 OSM 更加轻量。“ ....
的头像 Linux爱好者 发表于 08-14 16:12 115次 阅读
谷歌越来越封闭,微软越来越开放?

中国工程师们准备好开发自己的操作系统了吗?

从接触微软的windows 95系统开始,到后面的windows XP系统,一直到现在的Window....
的头像 传感器技术 发表于 08-14 11:11 171次 阅读
中国工程师们准备好开发自己的操作系统了吗?

TikTok愿意向美国监管机构展示其算法、推荐策略和数据流

据《纽约时报》称,美国财政部长 Steven T.Mnuchin 向总统 Donald Trump ....
的头像 传感器技术 发表于 08-14 10:27 75次 阅读
TikTok愿意向美国监管机构展示其算法、推荐策略和数据流

微软突发声明:Windows或断供中国!

最近,微软更新了其官网的Microsoft服务协议,声明如果因为不可抗力导致微软无法履行或延迟履行其....
的头像 传感器技术 发表于 08-13 16:16 431次 阅读
微软突发声明:Windows或断供中国!

为什么中国不能开发出属于自己的OS系统?

前几天微软断供中国客户Windows10系统的消息刷屏了,随后微软辟谣,否认会断供,不过这件事依然引....
的头像 如意 发表于 08-13 14:43 172次 阅读
为什么中国不能开发出属于自己的OS系统?

新研制的全息无人机控制系统,飞行所需数据量将减少六倍

来自香港科技大学的研究人员公布了一种全息无人机控制系统,一种控制无人机的新操作界面。它比第一人称视角....
发表于 08-13 10:36 72次 阅读
新研制的全息无人机控制系统,飞行所需数据量将减少六倍

Rockwell 的远程桌面可广泛应用于制造业现场

研华工业容错系统已测试通过,例如 Rockwell 的远程桌面,GE 的 SCADA 人机桌面系统,....
的头像 lhl545545 发表于 08-12 10:48 207次 阅读
Rockwell 的远程桌面可广泛应用于制造业现场

基于最新锐龙 PRO 移动处理器可为用户提供可靠的性能和视觉体验

AMD 为客户提供全面的商用解决方案,客户可基于移动性、性能、可管理性和安全需求进行灵活选择。对中小....
发表于 08-11 11:47 65次 阅读
基于最新锐龙 PRO 移动处理器可为用户提供可靠的性能和视觉体验

想摆脱微软系统?微软回应断供谣言 微软声明服务承诺坚定不移

近日某些个别社交媒体对微软服务条款全球性更新的谣言,不符合事实。我们为中国用户提供服务的承诺坚定不移....
的头像 电子发烧友网工程师 发表于 08-10 17:20 1192次 阅读
想摆脱微软系统?微软回应断供谣言 微软声明服务承诺坚定不移

微软回应断供谣言_坚决为中国提供Windows服务

对于近日网络上传闻的“微软可能断供中国Windows系统”消息,微软公司在8月10日周一回应称,近日....
的头像 电子魔法师 发表于 08-10 14:55 4476次 阅读
微软回应断供谣言_坚决为中国提供Windows服务

自然语言对话工具将人工智能跨越裂谷的关键之一

现在的人工智能,就处于这样的阶段:人人都在谈论,但大多数人不会主动使用,手机照片处理那种被动的使用除....
的头像 我快闭嘴 发表于 08-09 10:51 930次 阅读
自然语言对话工具将人工智能跨越裂谷的关键之一

字节跳动否认微软求购TikTok全球业务_微软和字节跳动正探索初步提案

此前微软公司在一份声明中确认,正就收购TikTok美国与字节跳动开展谈判,并不晚于9月15日完成。根....
的头像 电子魔法师 发表于 08-07 09:22 724次 阅读
字节跳动否认微软求购TikTok全球业务_微软和字节跳动正探索初步提案

是德科技Scienlab Charging Discovery 系统支持通信和功率流测试

Keysight Scienlab CDS 产品组合作为完整的模块化测试系统,能够在大功率充电过程中....
发表于 08-06 16:21 134次 阅读
是德科技Scienlab Charging Discovery 系统支持通信和功率流测试

蓬佩奥威胁下架不可信任中国App曝光 TIKTOK建立首个欧洲数据中心投资4.2 亿欧元

蓬佩奥当天还瞄准了阿里巴巴、百度、中国移动、中国电信和腾讯等多家中企。他声称,美国务院将与其他政府机....
的头像 inr999 发表于 08-06 11:13 255次 阅读
蓬佩奥威胁下架不可信任中国App曝光 TIKTOK建立首个欧洲数据中心投资4.2 亿欧元

从比尔盖茨回应微软收购TikTok来看TikTok为何遭遇封杀

目前,美国微软公司正在洽谈收购TikTok在美业务。当地时间8月4日,美国微软公司创始人比尔盖茨接受....
的头像 电子发烧友网工程师 发表于 08-05 16:34 1814次 阅读
从比尔盖茨回应微软收购TikTok来看TikTok为何遭遇封杀

华为最新消息:华为天才少年最高年薪201万元 华为阿里员工跳槽至微软受抵制

全球仅四人拿到华为“天才少年”最高一档年薪201万元,分别是钟钊(本科毕业于华中科技大学软件工程专业....
的头像 工程师人生 发表于 08-04 09:14 1265次 阅读
华为最新消息:华为天才少年最高年薪201万元 华为阿里员工跳槽至微软受抵制

特朗普要求TikTok9月15日前卖给美企 但英法德未跟风封禁TikTok

我们把日期定在9月15日左右,到那时它将在美国关门大吉,但如果微软或者其他大公司买下它,那将是有趣的....
的头像 电子发烧友网工程师 发表于 08-04 07:46 1053次 阅读
特朗普要求TikTok9月15日前卖给美企 但英法德未跟风封禁TikTok

张一鸣发内部信:TikTok美国业务一切皆有可能

张一鸣表示,在当前的情况下,TikTok美国业务面临被CFIUS强制要求出售的可能性,或因行政命令让....
的头像 inr999 发表于 08-03 16:20 797次 阅读
张一鸣发内部信:TikTok美国业务一切皆有可能

2020年中国云市场有望实现远超30%的增长

近日,根据市场调研机构Synergy Research Group最新数据显示,2020年第二季度,....
发表于 08-03 11:02 206次 阅读
2020年中国云市场有望实现远超30%的增长

tiktok有多火?禁TikTok禁不了心TikTok美国区总经理称不会离开 微软暂停收购TikTok美国业务谈判

2020年8月1日,微软正谈判收购TikTok美国业务。 8月1日晚,字节跳动同意剥离TikTok....
的头像 inr999 发表于 08-02 15:02 1697次 阅读
tiktok有多火?禁TikTok禁不了心TikTok美国区总经理称不会离开 微软暂停收购TikTok美国业务谈判

回顾AI应用的亮点 微软NExT用人工智能来发现治疗癌症

AI应用领域很多,比如我们最常见得AI 应用实例谷歌的翻译系统,它能够实现任意语言之间的互译;比如像....
发表于 08-02 13:53 495次 阅读
回顾AI应用的亮点 微软NExT用人工智能来发现治疗癌症

探讨自动学习项目中的工作方式

多余的库存很快就变成了一个流动性问题,除非我们通过折扣和促销来减少利润,否则它就不能转换成现金。或者....
发表于 07-31 16:15 46次 阅读
探讨自动学习项目中的工作方式

盘点50多家企业源代码遭泄露

据悉,由于不安全的 DevOps 应用程序导致公司专有信息暴露,包括微软、Adobe、联想、AMD、....
的头像 beanxyy 发表于 07-30 17:15 611次 阅读
盘点50多家企业源代码遭泄露

如何做到用完电脑就直接拔掉U盘,还不伤电脑?

随着朗科的U盘专利过期,U盘伴随着我们已经走过了20年。很多老玩家还保留了一个良好习惯,会在使用U盘....
发表于 07-30 14:50 183次 阅读
如何做到用完电脑就直接拔掉U盘,还不伤电脑?

微软Azure云端平台:适合芯片设计及签核等高效能运算的应用

微软 Azure芯片、电子和游戏产品主管Mujtaba Hamid提到:「微软 Azure云端平台非....
的头像 我快闭嘴 发表于 07-30 14:26 516次 阅读
微软Azure云端平台:适合芯片设计及签核等高效能运算的应用

微软将为iOS和Android启动一个新的家庭安全应用程序

Microsoft Family Safety还可以在Windows,Xbox和Android之间同....
的头像 倩倩 发表于 07-29 17:18 291次 阅读
微软将为iOS和Android启动一个新的家庭安全应用程序

英特尔CEO表示CPU将采用7纳米芯片技术

近日,英特尔CEO斯万(Bob Swan)表示,由于其未来的CPU将采用7纳米芯片技术,而英特尔自己....
发表于 07-29 16:58 363次 阅读
英特尔CEO表示CPU将采用7纳米芯片技术

索尼的下一代游戏机将与微软的Xbox Series X主机竞争

台湾供应商认为,该游戏机的销量将在1.2亿至1.7亿之间。这三家公司已经在这方面给了索尼5年的时间,....
的头像 倩倩 发表于 07-29 16:57 735次 阅读
索尼的下一代游戏机将与微软的Xbox Series X主机竞争

微软已经与美国金融公司MSCI发起了基于云的战略联盟

与此类合作伙伴关系一样,MSCI会将其现有产品和服务迁移到Azure平台,选择Microsoft作为....
的头像 倩倩 发表于 07-29 16:16 340次 阅读
微软已经与美国金融公司MSCI发起了基于云的战略联盟

微软的第一款双屏可折叠设备指日可待

上周,现代生活与设备业务副总裁Liat Ben-zur展示了一个Surface Duo并为两个孩子运....
的头像 倩倩 发表于 07-29 11:04 284次 阅读
微软的第一款双屏可折叠设备指日可待

百事可乐公司已宣布与微软建立合作关系

作为为期五年的合作伙伴关系的一部分,微软将成为百事可乐的首选云提供商,并且该公司将其全球数据资产和S....
的头像 倩倩 发表于 07-29 10:19 558次 阅读
百事可乐公司已宣布与微软建立合作关系

Windows的人脸识别与Mac的区别

值得一提的是,Windows Hello不会将面部照片保存在电脑上,而是收集面部或者虹膜传感器、指纹....
发表于 07-29 09:29 540次 阅读
Windows的人脸识别与Mac的区别

Google正在为chrome开发一项新的“稍后阅读”功能

对于使用第三方扩展程序(除了使用书签)以外的其他选项卡的Chrome用户,此功能的添加将是受欢迎的。....
的头像 倩倩 发表于 07-28 16:49 286次 阅读
Google正在为chrome开发一项新的“稍后阅读”功能

白色Xbox Series X控制器在线显示

 正如The Verge报道的那样,该用户已经在Reddit上呆了几个月,他们的许多帖子都在讨论与华....
的头像 倩倩 发表于 07-28 16:47 221次 阅读
白色Xbox Series X控制器在线显示

微软即将推出的Android驱动的Surface Duo

对于那些不知道的人,Surface Duo是微软生产的可折叠智能手机。它具有通过铰链连接的双屏,并且....
的头像 倩倩 发表于 07-28 16:29 351次 阅读
微软即将推出的Android驱动的Surface Duo

雷电4接口发布 支持双4K显示输出

近日,英特尔公布了雷电4接口标准,40Gbps的带宽要求不变,但是规格全面增强,支持双4K输出及4口....
发表于 07-28 16:07 103次 阅读
雷电4接口发布 支持双4K显示输出

微软存储技术新突破 最新玻璃硬盘问世

如果说到在进入数字互联网时代之后,什么是人类社会最重要的财富,数据绝对是很多人的首选。
发表于 07-28 14:42 199次 阅读
微软存储技术新突破  最新玻璃硬盘问世

Microsoft Edge现在将使网站的恼人通知请求静音

在关闭通知的情况下,通过通知或Push API发出的任何此类请求都将在地址栏中显示为标有“禁止通知”....
的头像 倩倩 发表于 07-28 14:35 411次 阅读
Microsoft Edge现在将使网站的恼人通知请求静音

微软、Intel、IBM等合力把计算机推广到发达国家的千家万户

这次芯片浪潮差不多持续了30年,成就了基于个人电脑的Intel、AMD、Nvidia等芯片企业。
的头像 lhl545545 发表于 07-28 11:44 503次 阅读
微软、Intel、IBM等合力把计算机推广到发达国家的千家万户

微软成功利用氢燃料电池为数据中心供电,考虑替代柴油发电机

微软今天宣布,已经成功测试了氢燃料电池(250千瓦),为一排数据中心服务器连续供电48小时。微软正在....
发表于 07-28 09:34 194次 阅读
微软成功利用氢燃料电池为数据中心供电,考虑替代柴油发电机

虚拟现实技术需解决四大技术“奇点”

谋求重生的 Google Glass 和微软的 Hololens 近两年搅动了整个科技圈,引爆了人们....
发表于 07-27 15:55 439次 阅读
虚拟现实技术需解决四大技术“奇点”

微软用人工智能校正算法使未来智能手机屏下前摄成为可能

在推进全面屏进程中,打孔前摄已经是较为成熟的商用解决方案,不过即将会被屏下前摄所取代。 屏下前摄是指....
发表于 07-27 09:31 39次 阅读
微软用人工智能校正算法使未来智能手机屏下前摄成为可能

Verizon利用人工智能来简化和加速端到端物联网解决方案的创建

微软Azure物联网中心平台(Azure IoT Central)能够为不同的产业用例提供应用级云分....
发表于 07-26 08:52 390次 阅读
Verizon利用人工智能来简化和加速端到端物联网解决方案的创建

Microsoft Healthcare以AI助力人类健康福祉

在过去的几年里,微软AI 技术在医疗健康领域的许多出色应用已经证明了这一点。例如,微软和Novart....
的头像 倩倩 发表于 07-25 10:59 800次 阅读
Microsoft Healthcare以AI助力人类健康福祉

Android Things 1.0版可供开发人员用来构建IoT产品

当然,许多用户理所当然地担心将如此众多的家用产品连接到Internet。因此,Google宣布支持经....
的头像 倩倩 发表于 07-24 15:27 405次 阅读
Android Things 1.0版可供开发人员用来构建IoT产品

xCloud服务将使Xbox玩家可以在移动设备上玩游戏

“随着时间的流逝,我们将继续扩展我们如何将流媒体引入平台的一部分,以及玩不属于订阅的您拥有的游戏,”....
的头像 倩倩 发表于 07-23 16:25 244次 阅读
xCloud服务将使Xbox玩家可以在移动设备上玩游戏

Spencer在Xbox Wire博客文章中发表了一个重磅炸弹

视频游戏机已经具备播放以前几代游戏的能力,其中最著名的就是PlayStation 3,但这可以使微软....
的头像 倩倩 发表于 07-23 15:45 237次 阅读
Spencer在Xbox Wire博客文章中发表了一个重磅炸弹

微软取消了在线Xbox游戏的主要功能之一

该发言人没有概述微软为何停止为期一年的黄金发行。在线玩大多数Xbox内容需要金卡,并且每月提供免费游....
的头像 倩倩 发表于 07-23 15:33 331次 阅读
微软取消了在线Xbox游戏的主要功能之一

模块化工控单板计算机应用底板SBC860

SBC860应用底板数据手册
发表于 03-02 07:23 255次 阅读
模块化工控单板计算机应用底板SBC860

嵌入式的未来是什么?

有数据显示,预计到2012年全球将有30亿个嵌入式设备交付。未来软件将向服务和嵌入式两个方向延伸,嵌入式软件领域正成为全球巨头...
发表于 10-31 08:00 338次 阅读
嵌入式的未来是什么?

微软嵌入式在“软件+服务”化这个方向发展到了什么程度?

嵌入式系统在微软业务中地位日益提升,微软将继续加大其向“软件+服务”平台转化的力度。 ...
发表于 10-31 07:47 381次 阅读
微软嵌入式在“软件+服务”化这个方向发展到了什么程度?

阿里巴巴开源 Dragonwell JDK 最新版本 8.1.1-GA 发布

导读:新版本主要有三大变化:同步了 OpenJDK 上游社区 jdk8u222-ga 的最新更新;带来了正式的 feature:G1ElasticHeap;...
发表于 10-23 09:52 720次 阅读
阿里巴巴开源 Dragonwell JDK 最新版本 8.1.1-GA 发布

浅析开源软件LAMP

LAMP(源码编译)
发表于 10-15 10:16 261次 阅读
浅析开源软件LAMP

开源工具Sqoop的安装

Sqoop安装和导入导出
发表于 10-14 15:55 245次 阅读
开源工具Sqoop的安装

ELK开源工具

ELK日志分析系统
发表于 10-12 15:23 233次 阅读
ELK开源工具

请问TI-RIOS在工程中全部是开源的吗?

TI是否提供完全开源的TI-RIOS?
发表于 09-16 10:30 297次 阅读
请问TI-RIOS在工程中全部是开源的吗?

浅析Anaconda

什么是Anaconda?
发表于 09-06 07:45 364次 阅读
浅析Anaconda

WinCE启动为什么会频繁死机?

WindowsCE是微软公司嵌入式、移动计算平台的基础,它是一个开放的、可升级的32位嵌入式操作系统,是基于掌上型电脑类的电子设...
发表于 08-21 06:31 430次 阅读
WinCE启动为什么会频繁死机?