0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

你知道屏幕后是谁在和你对话吗?新研究开发仿真面对面对话系统

Hf1h_BigDataDig 来源:TW 2019-09-02 15:48 次阅读

基于深度神经网络仿真面对面对话系统

近日,CloudMinds和北京航空航天大学的研究人员基于深度学习提出了一种新的仿真面对面对话系统。CloudMinds是一家在机器人和云服务领域的领军企业,致力于成为针对各种机器人模型需求的供应商。

该会话系统包括用于收听和说话的两个序列到序列模型以及基于虚拟代理合成器的生成性对抗网络(GAN)模型。

当虚拟代理与人通信时,语音音频和面部图像被输入到系统中。面部图像由面部解析模块处理,产生面部动作和姿势。然后将生成的信息传递到基于序列到序列的收听模型中。当虚拟代理在收听时,输出被馈送到合成器中以产生逼真的面部图像作为非语言反应。

语音识别模型将语音音频变换为文本,然后传递到会话模块中以生成响应语句,该响应语句被传递到文本到语音(TTS)模块以合成语音。响应语句被传递到序列到序列的说话模型,其输出也被输入到虚拟合成器中以产生逼真的面部图像,从而呼应语音内容。头像合成器则用于在整个对话期间收听和说话。

本文显著改进了传统的基于3D模型的成果。为了训练模型,研究人员收集了大约700个ESPN视频,其中包含来自YouTube的面对面对话场景。

与传统3D模型的生成结果相比,该模型所生成的面部图像更接近现实。毋庸置疑的是,在使得会话更加逼真自然的领域上,该系统还有很大的潜力可供挖掘,未来它还可用于实现个性化表情会话。

原文:

https://arxiv.org/abs/1908.07750

使用DISCo方法改进钙成像分析

本文中,德国海德堡大学跨学科科学计算中心(IWR)的研究人员介绍了DISCo方法,这是一种使用深度学习,实例分割和相关性研究的新方法,可用于钙成像分析中的细胞分割步骤。

DISCo将深度学习网络的优势与最先进的实例分割程序相结合,允许直接提取单元实例而无需任何复杂的后处理步骤。他们还以非常有效的方式利用钙成像视频的时间背景来计算像素之间的分段相关性。然后以摘要图像的形式将此时间信息与基于形状的信息相结合。

DISCo的最大优势在于能够结合相关性和图像特征,而不只依赖于其中一种方法。因此,DISCo可以通过在Neurofinder数据集上仅使用单个模型来使神经研究人员获得良好的整体性能。此外,当在几个数据集系列上训练单个网络时,研究人员能够超越在Neurofinder数据集上训练的所有其他方法。

原文:

https://arxiv.org/abs/1908.07957

用于科研教育的低成本开源机器人赛车平台

华盛顿大学保罗G.艾伦计算机科学与工程学院的研究人员最近介绍了MuSHR,即多代理的非完整赛车系统。MuSHR是一个低成本、开源的机器人赛车平台,致力于教育和研究,由MuSHR的个人机器人实验室开发,旨在促进机器人领域的公民化。作为一个低成本的平台,参与者可以通过说明,开源文档和动手教程参与其中。

赛车的硬件设计基于一系列现成的组件,这些组件可以从世界各地的线上和线下硬件商店中轻松地找到,而软件架构则是在个人机器人实验室中开发的。该平台为华盛顿大学的移动机器人课程开发了一套演示系统和许多宝贵的实践经验,是机器人平台开发的里程碑。

MuSHR的低成本开发模式和综合的文档记录是宝贵的机器人研究资源。该平台向学术研究实验室,机器人研究者及机器人爱好者等展示各种机器人研究项目提供了一个出色的测试平台。

MuSHR具有开源指令和教程带领用户完成硬件开发。文档托管在Github上,免费供一般公众下载使用。

代码:

https://github.com/prl-mushr

原文:

https://arxiv.org/abs/1908.08031

三维扫描与CAD对象的联合嵌入

近日,慕尼黑工业大学、斯坦福大学以及 Facebook 人工智能研究所共同提出了一种学习三维扫描和CAD之间的联合嵌入空间的技术。而在这两者中有很多联系紧密且十分相似的事物。这一学习方法基于一种全新的3D CNN 技术,通过学习联合嵌入空间中事物的相似性来实现嵌入。

为了学习一个扫描对象和CAD模型可以相互交织的共享空间,研究人员提出使用堆叠沙漏的方式将前景、背景与扫描对象分开,并将其转换为完整的类CAD表示,以此将它整合到共享嵌入空间中。这样操作得到的嵌入空间可以用于CAD模型检索。为了更好地完成这一任务,研究人员引入了一个全新数据集,其中包括了扫描CAD相似性注释。在这一数据集的帮助下,他们能够对CAD模型检索进行细粒度的评估,并对杂乱、嘈杂部分进行扫描。

这一新型学习方式比现有的CAD模型在实例检索上的准确率高出10% 以上。

因此,它在CAD模型检索方面的表现比原有模型更好。学习这样的联合扫描- CAD嵌入空间不仅为CAD模型检索提供了新的解决方案,也为这两个领域之间的知识映射提供了新的可能性。

当然,虽然这个技术在扫描与学习CAD对象空间方面非常有效,但它仍然有很多局限性——目前研究人员仅考虑了扫描和CAD对象领域中对象的几何形状;而这篇论文中未提及的颜色信息可能是联合嵌入或CAD模型检索的另一强大信号

原文:

https://arxiv.org/abs/1908.06989

Google发布Turbo,可视化工具的里程碑式突破

Turbo 是由Google研究人员提出的一种着色工具,它既有Jet的优势功能,同时也解决了Jet的一些短板,例如细节错误、条带、和颜色混淆等。

在开发人员的精心调试下,Turbo的强大性能能够胜任各种可视化任务。在开发过程中,研究人员们制作了一个简单的交互界面,在其中他们能够使用7节立方条来调整RGB曲线,同时将样本结果与其他知名彩绘程序的结果进行比较。

Turbo可以作为顺序和发散的可视化工具,因此它很适合开发人员保存在自己的“工具箱”中。它用于解决均匀性不那么重要的数据可视化任务非常有效,尤其是在需要展现强烈对比的情况下。

Google的团队将这个工具用于实现视差贴图、误差贴图以及许多其他标量的可视化中。您可以在下方链接中找到在Python和C/C++ 中的使用这几技术的方法,以及多项式逼近的方法——用于可能查表查询不太方便的情况中。

Python:

https://gist.github.com/mikhailov-work/ee72ba4191942acecc03fe6da94fc73f

C/C++:

https://gist.github.com/mikhailov-work/6a308c20e494d9e0ccc29036b28faa7a

Polynomial approximation:

https://gist.github.com/mikhailov-work/0d177465a8151eb6ede1768d51d476c7

原文:

https://ai.googleblog.com/2019/08/turbo-improved-rainbow-colormap-for.html

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4570

    浏览量

    98704
  • AI
    AI
    +关注

    关注

    87

    文章

    26396

    浏览量

    264002

原文标题:狗还是机器人?谁在屏幕后和你对话?新研究开发仿真面对面对话系统 | 一周AI最火论文

文章出处:【微信号:BigDataDigest,微信公众号:大数据文摘】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    全网寻找“何同学,对话“极客”CEO

    点击蓝字 关注我们 还记得那个对话苹果CEO的何同学么? 自信自如的谈吐,收获全网点赞!  其实,给您一个机会, 您一样也可以是下一个“何同学”! 机会来啦,您来么? 2023年11月, 安森美
    的头像 发表于 10-27 09:35 225次阅读
    全网寻找“何同学,<b class='flag-5'>对话</b>“极客”CEO

    OpenHarmony Meetup 广州站 OpenHarmony正当时—技术开源

    OpenHarmony的魅力; 线下参与,先到先得,仅限20个名额! 报名截止时间8月23日24:00点 1、可获得惊喜开发者礼品一份 2、现场大咖面对面交流 3、互动体现打卡拍照 4、现场提问/专家技术解答
    发表于 08-14 18:09

    招募令!OpenHarmony Meetup 广州站

    者礼品一份 2、现场大咖面对面交流 3、互动体现打卡拍照 4、现场提问/专家技术解答 活动议程如下:
    发表于 08-14 15:53

    清听畅谈,轻松社交 森海塞尔推出全新对话清听耳机

    森海塞尔对话清听耳机 森海塞尔推出全新对话清听耳机 充满现代化设计风格的对话清听耳机让您听得更清晰,沟通更顺畅 想要在嘈杂的环境中更清晰地与人交流,森海塞尔推出的全新对话清听耳机是您的
    的头像 发表于 08-09 10:08 366次阅读
    清听畅谈,轻松社交 森海塞尔推出全新<b class='flag-5'>对话</b>清听耳机

    阔别两年,重返线下!上百位与会者齐聚“NVIDIA 专家面对面技术沙龙”,畅谈大模型最佳实践!

    2023 年 《NVIDIA 专家面对面技术沙龙­­­­——大语言模型专场》 于 7 月 30 日下午在北京顺利举行。阔别两年,首次重返线下!即便是滂沱大雨,也阻挡不了数百位与会者的热情。本次活动
    的头像 发表于 07-31 20:45 260次阅读
    阔别两年,重返线下!上百位与会者齐聚“NVIDIA 专家<b class='flag-5'>面对面</b>技术沙龙”,畅谈大模型最佳实践!

    Omniverse 先锋面对面:初创企业开发出只需智能手机就能将物体变成 3D 模型的应用

    “Omniverse 先锋面对面”系列文章 介绍使用 NVIDIA Omniverse 3D 模拟和协作平台推动艺术创作或设计流程的个人创作者和开发者。 AR-Generation 联合创始人
    的头像 发表于 07-27 18:15 342次阅读

    Omniverse 先锋面对面:创意工作室通过 AI 动画短片帮助了解镰状细胞病

      “Omniverse 先锋面对面”系列文章 介绍使用 NVIDIA Omniverse 3D 模拟和协作平台推动艺术创作或设计流程的个人创作者和开发者。 总部位于加州的 Elara
    的头像 发表于 06-29 21:35 278次阅读
    Omniverse 先锋<b class='flag-5'>面对面</b>:创意工作室通过 AI 动画短片帮助了解镰状细胞病

    块调用环境对话框操作

    块调用环境对话框 如果已在项目环境内部打开块,将显示此对话框。 利用此对话框中的选项,能够为需要调试的块准确地指定调用环境,也就是说仅当满足设置的条件时才显示程序状态。 "块调用环境"对话
    的头像 发表于 06-27 11:43 381次阅读
    块调用环境<b class='flag-5'>对话</b>框操作

    问答对话文本数据,构建智能问答对话系统的基础

    在人工智能领域的发展中,问答对话系统显得尤为重要。一方面,它为我们提供了常用的人机交互方式;另一方面,它也对互联网公司和其他机构提供了一种新的商业模式。不过,对话系统的核心技术之一就是
    的头像 发表于 06-18 23:02 339次阅读

    汇聚专业人才 共话创新未来|2023开放原子全球开源峰会TOC面对面分论坛圆满收官

    6月13日,由开放原子开源基金会主办的2023年开放原子全球开源峰会TOC面对面分论坛圆满举行。本场论坛旨在深入探讨TOC(Technical Oversight Committee)成员和导师
    的头像 发表于 06-16 11:55 721次阅读

    汇聚专业人才 共话创新未来|2023开放原子全球开源峰会TOC面对面分论坛圆满收官

    6 月 13 日,由开放原子开源基金会主办的 2023 年开放原子全球开源峰会 TOC 面对面分论坛圆满举行。本场论坛旨在深入探讨 TOC(Technical Oversight Committee
    的头像 发表于 06-16 10:41 508次阅读
    汇聚专业人才 共话创新未来|2023开放原子全球开源峰会TOC<b class='flag-5'>面对面</b>分论坛圆满收官

    推动产业场景化、规模化智能升级,思必驰推出全链路对话系统定制开发中台

    上述行业挑战,思必驰自主研发了全链路智能对话系统定制开发中台(DUI中台),可以实现场景化对话系统的柔性组合制造。 资料显示,DUI中台可进
    的头像 发表于 06-08 16:39 195次阅读

    技术的交流 思想的碰撞|2023开放原子全球开源峰会TOC面对面分论坛即将启幕

    由开放原子开源基金会主办的2023开放原子全球开源峰会TOC面对面分论坛即 将于6月13日在北京经开区北人亦创国际会展中心隆重举办。 作为开放原子开源基金会最高技术决策机构,TOC
    的头像 发表于 06-04 06:25 470次阅读
    技术的交流 思想的碰撞|2023开放原子全球开源峰会TOC<b class='flag-5'>面对面</b>分论坛即将启幕

    技术的交流 思想的碰撞|2023 开放原子全球开源峰会 TOC 面对面分论坛即将启幕

    由开放原子开源基金会主办的 2023 开放原子全球开源峰会 TOC 面对面分论坛即将于 6 月 13 日在北京经开区北人亦创国际会展中心隆重举办。 作为开放原子开源基金会最高技术决策机构,TOC
    的头像 发表于 06-02 11:15 279次阅读
    技术的交流 思想的碰撞|2023 开放原子全球开源峰会 TOC <b class='flag-5'>面对面</b>分论坛即将启幕

    ProDiag如何使用“添加新块”对话

    ProDiag FB是用ProDiag编程语言创建的,例如使用“添加新块”对话框。
    的头像 发表于 05-17 17:29 717次阅读
    ProDiag如何使用“添加新块”<b class='flag-5'>对话</b>框