0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

百度大脑语音能力引擎每天调用超百亿!

汽车玩家 来源: OFweek人工智能网 作者:Alter聊IT 2019-11-29 11:22 次阅读

刚刚结束的百度大脑语音能力引擎论坛,向外界披露了这样一个数字:百度大脑的语音能力引擎日均调用量已经超过100亿次。

对照国内8.54亿的网民规模,平均每个人要和百度大脑的语音能力引擎每天接触12次,场景涉及输入法的语音输入、智能音箱的语音对话、百度地图的语音导航、与各种机器人的有趣互动……无论是覆盖范围还是使用频次,早已超过99%的互联网服务。

可能在不少人的印象里,人工智能还是遥不可及的新事物,百度大脑用数据告诉了我们这样一个事实:人工智能并不遥远,甚至已经是生活中不可或缺的一部分。

01 日均调用100亿次的背后

如果仅仅盯着数字来看,100亿不可谓不庞大,也奠定了百度大脑语音应用规模第一的成绩。但比数字本身更有价值的是,百度大脑如何做到语音能力引擎日均调用量超过100亿次的规模,以及100亿次的语音到底“唤醒”了什么?

第一个问题的答案是开放。截止到目前,百度大脑已经开放了云、端、芯的全栈全场景语音开放能力,广泛应用于文娱、金融、政务等多个行业和场景,开发者们只需要一个简单的调用,即可为产品接入百度大脑的智能语音能力。

而从百度大脑语音能力引擎论坛传递的消息来看,百度大脑的语音引擎全新发布和升级了14大产品内容,包括基于百度鸿鹄语音芯片的4款硬件模组、开发板,针对智能家居、智能车载、智能IoT设备等端到端的软硬一体远场语音交互场景解决方案,语音自训练平台、呼叫中心语音解决方案的升级,以及6个在线语音合成精品音库和5个离线语音合成精品音的发布。

简单来说,百度大脑已经为语音能力引擎打造了一条应用落地的生态链,而且生态链所覆盖的场景和能力还在不断拓展。

至于第二个问题的答案,不妨先来看三个具体的应用案例。

创维AIoT研究院产品经理李凯在演讲中谈及创维和百度大脑的合作,在百度鸿鹄语音芯片等软硬件的赋能下,创维为产品增加了语音交互能力,涉及2500万台的电视装机量,用户只需要一个语音指令就能找到自己喜欢的电视节目,让电视的交互从遥控器直接进化到智能语音时代。

北京子杰宝贝科技有限公司将百度大脑的语音能力引擎带到了医疗领域,之前60%的医护人员每天要花费45分钟到90分钟的时间填写表单数据。依靠百度大脑的语音识别、自然语言处理等技术,医护人员如今用语音就能完成表单的录入。

善行智能在百度大脑的智能语音技术、智能OCR识别、智能物体识别等技术的加持下,打造了可以智能识别障碍物、物品、钱币等物体,并通过语音播报给用户的小Q智能导盲眼镜,帮助盲人群体独立的认知世界。

诚然,“100亿次日均调用量”的背后是人工智能落地应用的生态圈,为合作伙伴带来了转型的契机,为医护人员解决了工作的痛点,也让盲人群体感受到了AI的温暖。而这些仅仅是百度大脑技术赋能的冰山一角。

02 AI赛道中的“学霸”人设

除了智能语音的落地应用,百度大脑还在不断推动语音技术的发展,比如百度语音首席架构师贾磊提出的基于复数CNN网络的语音增强和语音识别一体化端到端建模技术,相较于传统基于数字信号处理的麦克阵列算法,新技术的错误率降低了30%以上,并且已经被集成到最新发布的百度鸿鹄芯片中。

身为人工智能赛道里的“学霸”,百度大脑并非是擅长语音技术的偏科生,而是一个典型的“别人家的孩子”。

在乌镇智库出品的《全球人工智能发展报告》中,专门罗列了中国AI专利ToP 10的企业,百度以935件的专利数量,毋庸置疑的成了榜单上的头名选手,并与腾讯、阿里等同一阵营的玩家们拉开了较大的差距。

在国际权威研究机构Forrester发布的计算机视觉公有云报告中,在百度大脑的AI视觉技术加持下,百度智能云处于中国市场“领导者”领域最上方 ,在数据、解决方案、应用场景、管理能力等多维度领先于阿里云、腾讯云等厂商。另一份《IDC MarketScape:2019中国AI云服务市场厂商评估》中,凭借在能力和市场两个维度的优异表现,百度智能云同样位居领导者象限最上方。

在4月初结束的ICME人脸106关键点检测比赛中,百度大脑力压阿里、华为、美团、中科大等选手拿到冠军;6月份的CVPR 2019上,百度大脑又在视频理解与分析、目标检测、图像超分辨、智能城市车辆识别、人脸&人体检测等领域斩获了10项冠军;11月份的ICCV 2019上,百度大脑视觉团队以mAP值57.13%的成绩夺得人脸检测的冠军,超过第二名0.47%……

如果从时间上看,2016年百度大脑对外开放至今不过三年时间,纵然离不开百度长期的技术积累,这么短时间里的全面开花无疑佐证了百度大脑的“学霸”人设。这样的成长速度与百度的技术基因、工程师文化等不无关系,或许还有另外一重原因。

2017年的时候,就有人将中美在人工智能赛道中的角色比作星球大战里的Luke和Darth Vader,甚至为双方进行了“战力”对比:美国AI公司的数量比中国高出1.82倍,流向美国的资金份额比中国高1.54倍,美国的AI人才库亦是中国的2.01倍……美国在人工智能领域的强力基础,有赖于Google、亚马逊、IBM、微软等先行者,中国人工智能的担子自然就落到了BAT身上。

某种程度上说,“学霸”百度大脑还肩负着抹平中美AI力量鸿沟的义务,而从一系列国际赛事上的表现、国际权威机构的认证来看,百度大脑也是中国AI领域当之无愧的头雁,构建起AI的全栈技术布局,平等的赋能每一位开发者,将是百度大脑现在和未来身体力行的使命所在。

03 百度大脑在持续刷新

百度首席技术官王海峰在百度大脑语音能力引擎论坛讲到进化和赋能:“AI技术的进化和产业赋能正向循环,相互促进,AI在应用场景中不断进化。”可以理解为这就是百度大脑对自身的使命,也促使百度大脑在持续“刷新”。

犹记得2016年的百度世界大会上,李彦宏用了相当长的篇幅来讲述这个“新概念”,彼时还只是记住了“百度大脑”这个名字,至于会产生什么样的影响,恐怕很多人并没有答案。然而短短三年的时间里,百度大脑早已成了生活中的一部分,百度输入法的语音输入,入住酒店时的刷脸认证,农田里的遥感无人机,工厂里的智能零件分拣……在那些看得到和看不见的生产生活场景中,都有着百度大脑的身影。

截止到目前,百度大脑已经开放了228项AI能力,拥有超过150万的开发者用户,当年李彦宏对百度大脑的寄托已经逐步实现。但百度大脑并没有止步于此,在完成AI能力与应用场景融合创新的第一步后,百度大脑在5.0升级时被定义为“软硬一体的AI大生产平台”,让AI迈入产业世界与工业大生产进行融合。

与之对应的是,语音技术推出了风格迁移的语音合成技术,仅需20句话就可以制作一个人的专属声音;视觉方面形成了适用于不同应用场景的技术矩阵,诸如车辆识别、物体识别、风格转化、人流量统计等等;语言与知识方面,构建了世界上最大的多元异构知识图谱……除了技术能力的刷新,百度还将算力、算法和数据打通,以百度智能云为依托,以百度大脑为核心,以飞桨为基础底座,为各行各业的智能化转型升级提供强有力的支撑。

市场的反映也印证了百度的正确性,仅以百度大脑人脸公有云服务为例,公有云日均调用量超过1亿,开发者超过13万,用户使用规模稳居业界第一。并且百度大脑在人脸识别领域积累了1000多家合作伙伴,落地了超过10万个项目,形成了丰富、完整的人脸产品矩阵。

同样“刷新”的还有百度大脑的人才体系。就在不久前,著名的计算机和大数据理论领域专家Jeffrey Vitter加入到百度研究院顾问委员会,美国俄勒冈大学教授窦德景也加盟百度研究院担任大数据实验室主任。从世界级科学家组成的顶级智囊,到百度庞大的一线工程师,百度大脑在为行业赋能,驱动AI走进工业大生产时代的同时,也在不断将AI技术做透、做精、做深。

“刷新”是百度大脑的底色,也是持续修炼内功让AI走进真实世界的态度。

04 写在最后

从2016到2019,人们对AI的理解已经不再局限于围棋大战,可在谈论AI的时候,核心算法上的瓶颈仍然是不少开发者的锥心之痛。百度大脑就像一个扛着挑战一路向前的勇士,在每一个关键节点上为业界开辟出一条条新路。

读懂了这一点,语音能力引擎的100亿次日均调用,注定只是百度大脑的一个小目标,因为“让开发者平等地获取AI能力”这条路本就没有终点。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    26332

    浏览量

    263936
  • 百度
    +关注

    关注

    9

    文章

    2164

    浏览量

    88901
收藏 人收藏

    评论

    相关推荐

    新品上市,公有云轻安防就选目凌云! #人工智能 #目 #目凌云 #百度智能云

    人工智能百度智能云
    jf_98614062
    发布于 :2024年02月19日 11:39:42

    百度搜索推出AI拜年新能力

    随着人工智能技术的迅猛发展,百度搜索始终站在技术前沿,致力于为用户提供更加智能化、便捷的服务。百度搜索重磅推出了AI拜年新能力,在春节期间,让用户能够更加轻松地表达祝福、传递情感。
    的头像 发表于 02-05 10:54 5563次阅读

    恩智浦发布新一代智能语音技术组合的语音识别引擎

    恩智浦发布新一代智能语音技术组合的语音识别引擎。本文将探讨开发人员在嵌入式语音控制设计中面临的挑战、恩智浦新的Speech to Intent引擎
    的头像 发表于 01-26 09:15 237次阅读
    恩智浦发布新一代智能<b class='flag-5'>语音</b>技术组合的<b class='flag-5'>语音</b>识别<b class='flag-5'>引擎</b>

    百度搜索exgraph图执行引擎设计与实践分享

    百度搜索exgraph图执行引擎设计重点分成三个部分:图描述语言、图执行引擎、对接扩展。
    的头像 发表于 01-16 10:27 197次阅读
    <b class='flag-5'>百度</b>搜索exgraph图执行<b class='flag-5'>引擎</b>设计与实践分享

    如何利用 S5PV210 的 G2D 引擎

    、SRC_COLOR_MODE 等等)之后发现液晶屏幕上竟然毫无动作,我上过百度,Bing甚至Google都看了,几乎没有找到任何关于 G2D 引擎在裸机下面使用的范例 甚至还有一个说法是 G2D 引擎
    发表于 01-04 21:56

    APUS入驻百度灵境矩阵,普惠AI大模型插件能力

    10月17日,APUS出席百度世界大会2023。会上,百度公布了灵境矩阵业务进展,APUS作为灵境矩阵首批合作伙伴正与百度携手拓展大模型能力边界、构建大模型应用生态。
    的头像 发表于 10-23 10:46 401次阅读
    APUS入驻<b class='flag-5'>百度</b>灵境矩阵,普惠AI大模型插件<b class='flag-5'>能力</b>

    鸿蒙升级3.0.0,百度导着航,系统中途会关闭我的定位

    然后百度显示没有定位了,就自动开启智能导航。系统决定我的定位开关设置在哪里,我记得以前开定位是手动开关的。升级后,下拉菜单打开定位,百度导航开着一会系统定位就被关闭了。害得我跑错了好多路。现在就是我的百度导航根本没法用
    发表于 09-03 23:34

    基于Kaldi的语音识别引擎的架构设计方案

    58自研语音识别引擎,最初是基于Kaldi框架进行开发,在自研初期上线了架构1.0版本,后续以降低机器资源、提升资源利用率、优化性能为目标进行了升级重构,上线了架构2.0版本。
    发表于 07-23 14:59 330次阅读
    基于Kaldi的<b class='flag-5'>语音</b>识别<b class='flag-5'>引擎</b>的架构设计方案

    GC:具有语音交互能力的机器人

    电子发烧友网站提供《GC:具有语音交互能力的机器人.zip》资料免费下载
    发表于 07-06 10:02 0次下载
    GC:具有<b class='flag-5'>语音</b>交互<b class='flag-5'>能力</b>的机器人

    楔形流量计-百度

    流量计
    嘉可自动化仪表
    发布于 :2023年06月24日 12:44:29

    射频导纳开关料位计-百度

    射频导纳
    嘉可自动化仪表
    发布于 :2023年06月15日 12:35:50

    雷达物位计-百度

    雷达物位计
    嘉可自动化仪表
    发布于 :2023年06月03日 09:47:24

    雷达料位计-百度

    雷达
    嘉可自动化仪表
    发布于 :2023年06月01日 10:56:53

    超越百度!微软必应成中国最大桌面搜索引擎

    行业芯事时事热点行业资讯
    电子发烧友网官方
    发布于 :2023年05月23日 10:42:32

    百度Apollo开放四大关键能力 发布《百度智能驾驶开放白皮书》

    日前,百度Apollo在上海车展前夕举办汽车智能化发布会,发布全新升级的驾舱图产品矩阵,并重磅发布《百度智能驾驶开放白皮书》,面向车企开放四大关键能力。 “百度智能汽车事业部成立以来,
    的头像 发表于 04-25 11:45 1661次阅读
    <b class='flag-5'>百度</b>Apollo开放四大关键<b class='flag-5'>能力</b> 发布《<b class='flag-5'>百度</b>智能驾驶开放白皮书》