0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

成千上万的样本,在用户中长大的语音助手

独爱72H 来源:刘林华 作者:电子发烧友 2018-12-29 11:07 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

12 月 7-8 日在北京举办的 ArchSummit 全球架构师峰会上,微软 Principal Software Manager 李想老师分享了微软小冰实时感官系统与未来发展趋势。以下为演讲内容,部分有删减。李想老师首先介绍了什么是微软小冰,然后从全双工语音感官和实时视觉感官这两个方面,来展望了微软小冰的未来发展趋势。

什么是微软小冰?

目前,微软小冰已经上线四年了,存在于五个国家、数十款产品之中,有着上亿用户。小冰产品大致可以分为三类:

ChatBot,即聊天机器人 / 智能语音助手。

Content Provider,即内容提供商。小冰逐渐有了它自己的社会化角色,不仅可以用非常接近人类的声音唱歌,还可以写诗,甚至还可以讲儿童故事。

Solutions,即解决方案。比如,小冰不仅可以在一些新闻客户端给新闻做一些评价,带动新闻的整体流量,增加整体活跃性,还可以帮一些商业机构发布商业简报等等。

2

小冰的情商

下面主要讨论的是小冰的 Chat Bot(聊天机器人)。

四年中,小冰研发团队在和同行业者朝着相似的目标以截然相反的路线前进。对于智能机器人,传统想法是要让人类更加接受它们,就必须让它们变得很有用,能够帮助人们去完成一个任务、十个任务,甚至更多。但是,小冰团队认为,在变得有用的更底端,其实还有一层“情商”,以此为基础再去一层一层完成任务就会变得更自然。

下面以狼和哈士奇为例来说明一下这个问题。狼其实是一种非常强的生物,但是在以人为本位的群体中,有些种族却濒临灭绝。而哈士奇却可以整天什么活都不干,就能够很好地融入人类中去。为什么呢?因为人其实是一种以情感为基础的生物,我们尝试赋予与之能够进行情感交流的对方,予以平等的权利。我们把生物能够运用的这种权利称之为情商。以情商为基础再去完成任务就会变得更加自然。比如哈士奇可以帮你开灯关灯了,你一定会把它捧到天上去。

对于小冰来说,情商高意味着什么呢?意味着它在聊天过程中很有趣吗?其实不止如此。情商高,在交互中主要体现为控制全程对话的能力。

传统的智能语音助手不会去过度关注对话的全程,而更加关注对话中的每一个细节。它会把每一句话都优化得特别好,甚至把对话形式分为:面向任务型的对话、面向知识型对话、无意义的闲聊。

那么这真的是无意义的闲聊吗?也不尽然。

我们知道,小冰背后是大数据,有着 Bing 搜索。从大数据的分析来看,其实人与人的对话 / 人与人工智能的对话,就如同河流一般奔涌向前,任何一句看似无意义的闲聊,都可能在十几轮甚至几十轮的迭代之后产生一个非常重要的结果。小冰可以不停地去迭代,去改变对话的走向,去改变对话的长度。它关注的是整个对话的全局,而不是一城一地的得失,正如古人所言,“不谋全局,则不足以谋一隅”,这就是所谓的控制整个对话全程的能力。

12 月 7-8 日在北京举办的 ArchSummit 全球架构师峰会上,微软 Principal Software Manager 李想老师分享了微软小冰实时感官系统与未来发展趋势。以下为演讲内容,部分有删减。李想老师首先介绍了什么是微软小冰,然后从全双工语音感官和实时视觉感官这两个方面,来展望了微软小冰的未来发展趋势。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 微软
    +关注

    关注

    4

    文章

    6723

    浏览量

    107400
  • 微软小娜
    +关注

    关注

    0

    文章

    3

    浏览量

    1417
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    非晶纳米晶的晶化温度究竟该如何精准测量

    走进一个云计算数据中心,成千上万的服务器正24小时高速运转——从日常的视频会议、电商交易,到AI大模型的训练、工业数据的实时分析,背后都离不开稳定的电力供应与高效的能量转换。而在这其中,电感器件作为“电力调节枢纽”,直接决定了整机的能效、体积与可靠性。
    的头像 发表于 12-11 10:08 168次阅读
    非晶纳米晶的晶化温度究竟该如何精准测量

    一文看懂AI大模型的并行训练方式(DP、PP、TP、EP)

    大家都知道,AI计算(尤其是模型训练和推理),主要以并行计算为主。AI计算中涉及到的很多具体算法(例如矩阵相乘、卷积、循环层、梯度运算等),都需要基于成千上万的GPU,以并行任务的方式去完成。这样
    的头像 发表于 11-28 08:33 1152次阅读
    一文看懂AI大模型的并行训练方式(DP、PP、TP、EP)

    上线!国产AI语音开发板,定制你的聊天伙伴助手

    ChatGPT语音助手)这次,安信可AiPi-PalChatV1,可直接调用三大国产AI模型(DeepSeek/豆包/通义问),轻松实现自然语言交互。01概述AiPi-P
    的头像 发表于 11-20 11:53 387次阅读
    上线!国产AI<b class='flag-5'>语音</b>开发板,定制你的聊天伙伴<b class='flag-5'>助手</b>

    戴尔科技网络弹性策略构筑系统级恢复力

    传统意义上的“内网”、“外网”在远程办公下变得模糊,防火墙之外,是成千上万不在管控中的终端设备。
    的头像 发表于 10-21 15:15 472次阅读

    级UE 并发测试:信而泰揭秘 5G 小基站安全与性能的 “极限挑战”

    中移动及基站厂商,以硬核技术交出了一份亮眼答卷,其UE模拟器产品及测试场景成为行业标杆。 一、 级UE 并发:重新定义小基站测试 “承载力” 在5G 小基站的测试领域, UE 模拟器 堪称“数字孪生引擎”—— 这是一种能虚拟出成千上万
    的头像 发表于 07-08 10:00 626次阅读
    <b class='flag-5'>万</b>级UE 并发测试:信而泰揭秘 5G 小基站安全与性能的 “极限挑战”

    语音助手只能聊天?启明云端AI语音交互方案偷偷修炼了音乐才艺!

    语音助手只能聊天?太out了!”语音交互的新乐章已经奏响!启明云端基于乐鑫科技芯片的AI语音方案正式解锁音乐技能树,只需一句指令,智能设备即刻变身专属点唱机。只要版权到位,想听什么?
    的头像 发表于 06-27 18:03 735次阅读
    <b class='flag-5'>语音</b><b class='flag-5'>助手</b>只能聊天?启明云端AI<b class='flag-5'>语音</b>交互方案偷偷修炼了音乐才艺!

    思必驰助力吉利领克900打造语音助手Lynkye

    近日,思必驰与吉利携手,为领克旗舰大六座SUV一领克900提供了全链路语音语言交互技术,助力打造领克全时语音助手Lynkye,重新定义人车交互的边界。
    的头像 发表于 05-29 15:53 1192次阅读

    IBM Spectrum LSF如何助力半导体企业应对AI时代的高性能芯片需求

    个作业,可能会瞬间挤爆计算资源。那如何把成千上万个作业有序的调度到大规模的集群中呢?这时候,就得请出 HPC(高性能计算)调度界的“大宗师”—— IBM Spectrum LSF!
    的头像 发表于 05-27 15:18 851次阅读

    飞凌嵌入式ElfBoard ELF 1板卡-uboot编译链接文件uboot.lds

    编译完成之后在uboot根目录下生成的uboot.lds是链接文件。链接器就是通过这个文件将成千上万的.o文件链接在一起,此文件是根据arch/arm/cpu/uboot.lds生成
    发表于 05-22 11:20

    智能家庭爱好者必看:树莓派语音助手打造指南!

    HomeAssistant是一个热门平台,可将各种智能设备整合在一起。在HomeAssistant中设置语音助手,可让你使用简单的免提命令控制家中设备。当你忙着做饭或双手不得闲,又需要立即控制灯光
    的头像 发表于 04-18 16:02 801次阅读
    智能家庭爱好者必看:树莓派<b class='flag-5'>语音</b><b class='flag-5'>助手</b>打造指南!

    上线!国产AI语音开发板,定制你的聊天伙伴助手,可直接调用DeepSeek/豆包/通义

    ChatGPT 语音助手:https://mp.weixin.qq.com/s?__biz=MzIzODA0NDgxNg==idx=1scene=21#wechat_redirect) 这次,安信可
    的头像 发表于 04-15 17:11 875次阅读
    上线!国产AI<b class='flag-5'>语音</b>开发板,定制你的聊天伙伴<b class='flag-5'>助手</b>,可直接调用DeepSeek/豆包/通义<b class='flag-5'>千</b>问

    Arm亮相2025年游戏开发者大会

    近日,成千上万的人聚集在美国旧金山的马斯康尼中心参加 2025 年游戏开发者大会 (GDC 2025)。全球开发者齐聚一堂,探讨如何利用技术塑造手游的未来。鉴于 99% 的高端智能手机均基于 Arm 技术打造,Arm 持续在提供创建沉浸式的新一代游戏体验所需的性能和图形能力方面发挥核心作用。
    的头像 发表于 04-01 13:51 1024次阅读

    思必驰天琴语音助手8.0深度融合DeepSeek

    在智能汽车加速向场景化服务迭代的进程中,智能语音助手已成为驾驶体验中不可或缺的一部分。思必驰天琴语音助手 8.0凭借其卓越的技术架构,深度整合DeepSeek实现能力升级,更以“四大智
    的头像 发表于 02-28 17:43 2358次阅读

    三分钟带你接入OpenAI构建个人语音助手

    上周,我们在用户群发布了基于AtomS3R与AtomicEchoBase接入OpenAI的个人语音助手Demo视频,得到了很多用户的喜欢。为此,我们特别制作了详细的教程和视频,按照步骤
    的头像 发表于 01-10 18:36 1724次阅读
    三分钟带你接入OpenAI构建个人<b class='flag-5'>语音</b><b class='flag-5'>助手</b>

    新思科技业界率先发布超以太网和UALink IP解决方案

    任何单个GPU、XPU或其他AI加速器都无法满足AI工作负载的巨大计算需求。为了满足这一需求,需要成千上万个,甚至不久的将来可能需要数十万个这样的加速器协同工作,共同分担处理负载。
    的头像 发表于 01-07 10:06 855次阅读
    新思科技业界率先发布超以太网和UALink IP解决方案