0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

微软黄学东:企业应用最后一个痛点是会议中的语音

DPVg_AI_era 来源:未知 作者:胡薇 2018-05-23 16:07 次阅读

昨天下午,微软全球技术院士黄学东博士、微软大中华区副总裁兼市场营销及运营总经理康容、ROOBO CTO雷宇接受了包括新智元在内的媒体专访,详细解答了微软的语音技术、产品落地以及生态合作。

在昨天的微软人工智能大会上,微软全球技术院士黄学东展示了微软多项语音、翻译等技术,微软Build大会上的“黑科技”全球首创AI会议系统再次被演示。

昨天下午,黄学东博士、微软大中华区副总裁兼市场营销及运营总经理康容、ROOBO CTO雷宇接受了包括新智元在内的媒体专访,详细解答了微软的语音技术、产品落地以及生态合作。

新智元根据现场速记进行整理,部分内容有删节。

黄学东:评价谷歌没有什么意思,微软的“全武功”最有意思

问:您一直关注语音技术,现在很多搜索引擎还是通过输入文字来进行交互,什么时候我们能够看到像语音识别或图像技术真正改变到搜索引擎现在的状况?

黄学东:搜索引擎现在很复杂,我做语音之前做过搜索引擎,后台要完全了解所有的文件内容和关键是字是什么东西,还要匹配用户意图,找到相应的文本,它也有很多人工智能深度学习的技术。

语音识别在现在的媒体阶段,是文本输入还是语音输入还是图像输入?基本上还是一个相对比较松的耦合。语音进步的主要标杆是把波形转换成文字,这个过程中中文字也可以有不同的选择,因为语音识别不是完全的准确,就像搜索引擎一样,有第一个好结果,有第二好结果、第三结果,把整个结果给搜索引擎,搜索引擎在搜索的时候可以搜索不仅仅是第一好的结果,而且把语音识别第二好的结果也考虑进去。现在工业界的状态基本上是这样。

问:麦克风阵列部分经常在语音识别场景下遇到噪音问题,微软可以解决这个问题吗?还是说未来我们可以有更好的方法?

黄学东:我们有麦克风阵列的核心技术,并且已经有长足的进步,在业界是领先的。再加上360度的摄像头,这两者的结合让会议“AI神器”达到了很高的高度。不管是讲了什么话,各方面的指标都上了一个台阶。今后,我们的前景非常非常乐观。

问:之前谷歌Duplex打电话号称已经通过了图灵测试,你对这个怎么评价?

黄学东:不敢评价。媒体上很多评价说他们在作假,很多人质疑谷歌,让谷歌发言人出来认证,他们不出来认证,也不说话。

微软会议“AI神器”在多人自由交谈的情况下能知道谁在说话,而且知道说了什么话,做了现场演示。不仅做了中文,还做了英文,这是我们要表达的微软在语音识别业界的领导地位,是全武功,那个武是武力的“武”,不是一二三四五的五。

所以说批评谷歌没有什么意思,我们的“全武功”最有意思。

不仅能支持全双工,而且能支持“全武功”

问:上午微软展示了人工智能的系统,有哪些东西是微软从底层基础研发到开放再到产品的生产制造?有哪些是把底层的技术开放给伙伴,他们基于平台和技术做产品的研发和人工智能应用产品?

黄学东:首先,这些是研究的演示,微软从来不预先宣布我们产品什么时候出来、以什么方式出来。我们产品有几个东西可以讲,第一是我们的认知服务,语音这一部分云的API、模型、服务,有一套新的规律,这是在微软Build大会上已经宣布了的。

第二是定制服务增加了语音合成,想要换成自己想要听的声音,可以上传三个小时、十个小时,越多质量越好,可以定制到你想要的声音。所以我们全线语音和翻译都实现了量身定制。

现在如果你是开发商要开发自己的音箱,可以用微软刚刚推出来的MSDDK,这是我们和ROOBO合作推出来的一个最新解决方案,不仅仅有微软和ROOBO合作推出来的硬件,而且有最新的麦克风阵列,包括四麦线性的和七麦原型的麦克风阵列。这个黑科技是绝对引导业界潮流的,我们不仅能支持全双工,而且能支持“全武功”。

康容:我补充一下,因为微软是一个平台和工具的企业,我们是提供平台和工具,我们的黑科技、研发团队、我们的大咖博士发明的东西,他们渐渐的会落地到我们自己的产品中,也会提供给我们的生态合作伙伴让他们来开发。

微软大中华区副总裁兼市场营销及运营总经理康容

今天早上看到哪一个黑科技会在什么时候落地,很难讲出来,但是迟早会发生。我们会尽快的落地,我们会看市场的需求。所以,我们听到越多的客户和合作伙伴的声音,我们就会加速某某功能尽量落地。我们一系列的很多新东西都会提供给生态一起来合作。

问:ROOBO本身是针对不同的应用场景解决人工智能软硬结合方案的设计,然后去生产销售,过去这几年做这种场景化的人工智能设计,然后再去推广。人工智能产品怎么更成功的被市场接受,让消费者更容易去掏钱买?如何落地和激活?为什么这次和微软合作语音的开发及机会在哪里?微软的技术怎么独特的激活这个市场?

雷宇:其实这两个问题是一个问题。我们知道AI落地没有一个通用AI可以应用到每个垂直领域,这里面最核心的问题是如何产品化。

康容与雷宇(右)

在我们创业过程中我们发现,所有的方案只考虑技术,不考虑内容和服务。这在本质上违反了市场原则,用户永远要的是服务和功能,我觉得技术只是提升它的体验,我觉得这是一个本质的问题。

我们的痛点是在通用AI技术上,没有达到我们满意的效果,所以我们需要和国际上最顶尖的公司进行合作。

微软认知服务是全面性,微软服务本身也是有机体,本身考虑的就很完善。我们和微软的合作,因为我们看到了“明天”的东西,可以少走一些弯路,多模态和多场景的东西必然带来很大的变革。

企业应用最后一个痛点:会议中的语音

问:微软开发出了很好的语音识别等的技术,你们打算用这些技术开发出一些什么样的产品?智能音箱有很多企业都在做,但是具体的有没有什么更好的应用可以为大家更好的服务呢?

黄学东:语音交互过程中,在所有的商业场景中,用电子邮件、微信等等其他的产品都已经数字化了,会议中的语音是现在没有数字化的一个主要媒体,这对生产力的提高、对消费的提高是最后的痛点。在企业的应用中,最后的一个痛点就在这个地方。

会议比较难做,不像全双工,只有两个人在讲话,超过三个人的会议就比两个人会议难很多。如果能做到七八个人开会,都可以转录和翻译,可以变成数字化的形式处理。

问:如何看待目前的人工智能市场?

黄学东:我觉得人工智能造就的“饼”足够大,传统公司和新生公司都可以在这个饼上发挥自己的空间,为用户提供更优质的服务。微软云是提供全球很宽泛的一个平台,它的覆盖力不管是全球语言还是数据中心的覆盖力都应该是引导潮流的。在这样一个平台上,微软的从计算机视觉到自然语言处理,再到语音和搜索、知识表达等服务,都是业界领导潮流的。

所以在这个平台上和人工智能的深度上微软有非常大的优势,所以我们希望在提供这个宽度和深度这样的架构下,有更多的开发商可以在这个平台上开发出我们还没有想到的应用,这个才是平台做的事情。大家要知道微软有广度且有深度,这个情况下开发商应该加入这个平台,在上面创造他们新的价值。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 微软
    +关注

    关注

    4

    文章

    6238

    浏览量

    103076
  • 人工智能
    +关注

    关注

    1776

    文章

    43820

    浏览量

    230574

原文标题:黄学东:微软“全武功”解决企业会议的痛点

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    语音识别控制

    3、语音指令 a、 开灯指令: 请开灯, 打开电灯,回来了 b、 关灯指令: 请关灯, 关闭电灯, 出去了,睡觉了。 c、 颜色指令: 改变颜色, 改颜色,变颜色, 换颜色。 d、亮度指令: 亮一点, 暗一点。 需要这个程序,
    发表于 04-08 14:04

    特信会议室屏蔽器:如何使用能确保会议安全保密性?|深圳特信电子.

    特信会议室屏蔽器:如何使用能确保会议安全保密性?|深圳特信电子在现代社会中,会议室屏蔽器被广泛应用于各种场合,以确保会议的机密性和安全性。会议
    发表于 03-29 09:14

    高效管理会议空间:了解会议室屏蔽器的作用与应用?|深圳特信电子有限公司.

    高效管理会议空间:了解会议室屏蔽器的作用与应用?|深圳特信电子有限公司在现代商务环境会议室屏蔽器作为种重要的设备,在保障
    发表于 03-11 09:08

    微软Outlook新增"In-person event"功能,提升混合会议体验 

    根据微软的介绍,混合办公已成为后疫情时代不可逆转的趋势,然而如何有效管理线上及线下融合的会议变得极具挑战性。为了解决这个问题,微软推出了“In-person event”功能,旨在协助企业
    的头像 发表于 02-27 11:27 154次阅读

    智能操控及无线测温产品在内蒙古立项目中的应用

    摘要: 为避免因电线接头松动、电缆老化等引发高温造成火灾,所造成的的经济损失巨大,在些电气设备如大电流电缆设备节点、电力设备局部异常升温部位、开关柜的动静触头,进线与出线母排接点、整流柜的电气
    发表于 02-20 11:04

    【飞腾派4G版免费试用】3.JITSI视频会议想开就开

    时长的会议软件呢?答案是有的,你只需要在 飞腾派 上搭建JITSI ,就可以拥有开源的、安全、支持视频会议和即时通讯的平台。 什么是JITSI Jitsi Meet 是
    发表于 12-25 18:44

    方言离线语音控制场景解决方案

      随着科技的不断发展,离线语音识别技术已经变得越来越成熟。在日常生活,老人或小孩可能会遇到些困难,如操作复杂的电子设备。为了解决这问题,离线
    发表于 11-17 17:57

    离线语音识别和控制的工作原理及应用

    风险。在某些需要高可靠性的应用场景,如智能客服、电话会议和智能交通等,离线语音识别能够发挥重要作用。 雷龙发展公司致力于为客户提供站式的离线语音解决方案。我们的服务涵盖了多个领域,包
    发表于 11-07 18:01

    离线语音与IoT结合:智能家居发展新增长

    开发整套方案落地的能力,避免了复杂的对接流程。期待起开启智能化的新时代! 启英泰伦:启英泰伦成立于 2015 年,四川省专精特新企业、成都市新经济示范企业、成都市高新区瞪羚
    发表于 10-17 11:06

    更懂企业用户,皓丽会议电视的双模式有什么不同?

    近期一款全新产品受到了广泛瞩目,皓丽最近推出的会议电视,是一款为企业用户打造的轻会议解决方案,也是能够移动布置的商用展示大屏,当然也可以是一款家用娱乐电视。那么这款全能型的会议电视其中
    的头像 发表于 07-24 14:40 4616次阅读
    更懂<b class='flag-5'>企业</b>用户,皓丽<b class='flag-5'>会议</b>电视的双模式有什么不同?

    视频会议进入云时代,为何企业需要华为云会议

    随着互联网技术的发展和工作习惯的变化,视频会议已经成为了企业沟通协作的重要方式。无论是内部培训、项目研讨、商务洽谈,还是政务交流、远程医疗、在线教育,视频会议都能够提供高效、便捷、安全的解决方案
    的头像 发表于 07-03 22:31 280次阅读

    云上办公时代,华为云会议如何保障企业的开会效率与数据安全?

    随着视频会议进入云时代,企业对于云会议的需求日益增长。华为云会议作为专业的视频会议云服务,深度理解企业
    的头像 发表于 07-03 22:31 245次阅读

    半导体企业如何决胜2023秋招?

    未来年决胜千里的重要时期,计熟事定,举必有功。然而,今年企业的招聘预算、需求都有所缩减,如何用有限的成本高效地找到符合的人才?如何减少和用人部门的沟通成本? 别急,我们来给你答案!作为同学和企业沟通
    发表于 06-01 14:52

    微软发布 Azure Linux 正式版

    服务(AKS)的开源容器主机操作系统,它针对 Azure 进行了优化,旨在使开发人员更容易使用微软的工具来部署和管理容器工作负载。Azure Linux 源于微软的 CBL-Ma
    发表于 05-28 08:34

    语音识别技术的概念及应用前景

    种最自然的交互方式,和IOT结合可以解决IOT控制配网麻烦、需要中心的,又可以让设备互联后共同为用户提供服务,实现
    发表于 05-27 09:41