0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

百度与科大讯飞的竞争正在从语音交互延伸到视觉交互等多模态技术上

电子工程师 来源:未知 作者:李倩 2018-03-22 09:28 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近两年来,随着人们越来越频繁使用智能产品,所产生的数据越来越庞大,这些数据又被大公司所利用,庞大的数据也将催生“机器人大脑”。

目前市面上已经诞生出越来越多的机器人产品,如:早教机器人、陪护机器人、商场机器人、银行机器人、法务机器人等等,但是在实际的场景应用中,机器人并不能带来真正的智能。

最主要的功能就是体现在机器人大脑,用专业术语讲就是“语义”,我们在语义的采集上还处在非常初级的阶段,如果处理不了语义理解,那机器人在实际场景中的应用就是一个“呆子”。

让机器人开口说话,除了语义之外,语音也是关键的技术,国内科大讯飞在语音技术上的造诣,让国内很多做机器人的企业受惠,其语音处理技术基本上已经能满足人们日常生活中的使用需求。

但是国内机器人产业接下来的发展将会开始加速,在这次1号机器人网研讨会上,不管是百度,还是科大讯飞所传递的信息就是已做好全面出击的准备。

虽然国内语音语义的发展正在加速,但是对机器人企业而言,速度还不够快,目前不管是百度,还是科大讯飞所提供的语音语义还是不能满足机器人在实际应用中的要求。

城市漫步总经理李正说:“在人们与机器人对话的过程中,一些简单的问题,机器人是可以回答,但是稍微复杂一些的问题,机器人就回答不了,BAT或科大讯飞所提供的语义,让机器人处在小孩3岁左右的智力水平。对很多机器人企业而言,目前的瓶颈也是在这里,很难有所突破。”

科大讯飞销售总监廖凯说:“其实讯飞也很苦恼,语音助理已经通过国家各种考试,很难说它的智力不行,讯飞高考机器人基于目前的成长速度,到2020年会考上一本,去年的数据显示,语文考了90多分,数学考了110多分。”

只能说人们日常交流中,所体现的语言很复杂,目前的大数据还不能够支撑人们复杂的日常交流。

百度自然语言技术开放负责人张晶晶说:“人工智能聪明程度其实很大程度上取决于数据,百度为什么在人工智能领域国内领先,因为背后是庞大的数据,比如百度搜索,每天有60亿次搜索,这些数据支撑百度深度语义理解,像这种过亿用户的APP,百度有14个,这些数据支撑了百度大脑每时每刻都在进化。”

“国内各大平台,如:百度UNIT、讯飞AIUI、小i机器人、思必驰等,其实各家的侧重点不同,因此,最终的测试结果也会不同,像百度的对话效果只有达到95%以上才会放出来。”

但是在这次1号机器人网研讨会上,机器人企业对各大平台所提供的语义依然不是特别满意。

或许国内各大机器人企业过于依赖BAT等企业,希望依靠BAT大企业的投入完善语音语义技术,但是百度已经在语音语义上投入了3亿元,虽然技术积累很快,但是目前的瓶颈是依然还不能支撑机器人日常复杂的对话交流。

狗尾草联合创始人张博说:“3至5岁小孩,同一个问题,在每个年龄段寻求的答案都不同,所以对语义的要求非常高,如果真要做好语义理解,就需要把语义理解做的足够细,再接入知识图谱,如果是批量的知识图谱,那就需要各大平台开放知识库,让机器人企业去调用,满足更高级开发的产品需求。”

从这次1号机器人网研讨会上反馈,现阶段让各大平台完全开放知识库不现实,像百度、科大讯飞、小i机器人等投入巨资打造知识库,机器人企业想调用深层次语义,就需要支付相应的报酬。

当然很多机器人企业对语音还是另有看法,比如AI与UI,明明很多场景直接通过UI就可以解决的事情,干嘛非要用语音,把简单的事情复杂化。

这个问题的着重点在于,目前看来语音确实还不是最好用的产品,但是长远看语音将会是最便捷的交互方式。

当汽车和火车刚发明的时候,跑起来还没有马车快,但是终究汽车和火车是发展方向。

科大讯飞廖凯说:“人与机器发生交互的时候,输入输出信息有两种,我们从机器身上获取的信息,最简单的方式就是视觉,一目了然;但我们输出的信息最自然的方式是语音。这是语音的特性,未来一定会颠覆传统以键盘或触屏的输出方式。”

接下来,我们回到产品上来,对机器人企业而言,现阶段就算依靠BAT等企业的语音语义技术,也不能让产品具备高智慧,充其量只能达到小孩3岁左右的智力水平。

所以未来的方向在于细分场景,比如:订机票、订酒店等,采用百度和科大讯飞的语音语义可以非常成熟的完成,让用户从查询机票到预订票到购买机票等全过程,期间进行的多轮复杂人机对话可达7层以上。

因此,在一些细分商用场景,语音已经可以做到替代客服的工作,对机器人企业而言,如何让机器人+语音语义+使用场景落地才是接下来重点思考的方向。

百度张晶晶认为,通过百度大数据分析,儿童故事机的市场规模很大,目前正是更新换代的时间节点,因此,百度对儿童领域的投入会有所加大。

科大讯飞廖凯说:“今年大型商用机器人会有所发展,目前讯飞晓曼机器人已经入驻红星美凯龙、居然之家,以及一些零售商场。晓曼机器人目前已经可以做到导航领路、提供资讯、针对商场还提供了一套机器人营销方案,通过大数据帮助商家提高客户的转化率。”

目前国内大型商用机器人研发投入大,但是相对售价高、利润高,很多机器人企业在大型商用机器人身上舍得投入,因此,对科大讯飞而言,也有更强的动力去做技术的迭代。

如果从竞争的角度去分析,目前百度和科大讯飞提供的语音语义方案是旗鼓相当。

但是接下来的竞争将会更加深入,涉及到多模态技术交互。

科大讯飞在AIUI的构架下,加入手势识别、图像识别,使得人机交互技术更加复杂;百度也是一样,在提供语音交互的基础上加入图像识别,提供一站式服务。

因此,百度与科大讯飞的竞争正在从语音交互延伸到视觉交互等多模态技术上,对机器人企业而言,全新的时代即将来临,在主流人工智能企业激烈的竞争下,能够享受到的技术红利是,可以以低成本的方案去创造一台全新的机器人。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    213

    文章

    30619

    浏览量

    219684
  • 科大讯飞
    +关注

    关注

    19

    文章

    852

    浏览量

    63196
  • 自然语言
    +关注

    关注

    1

    文章

    292

    浏览量

    13926

原文标题:百度与科大讯飞竞争将从语音扩散到视觉

文章出处:【微信号:robot-1hjqr,微信公众号:1号机器人网】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    端到端语音交互革命:百度智能云联合地瓜机器人,重塑AI陪伴体验

    总监孙颖欣在地瓜机器人的DDC2025 人机交互分论坛指出,大模型时代的交互方式经历了三个关键阶段的演进:第一阶段是文本、语音交互第二阶段
    发表于 12-01 01:07 1332次阅读
    端到端<b class='flag-5'>语音</b><b class='flag-5'>交互</b>革命:<b class='flag-5'>百度</b>智能云联合地瓜机器人,重塑AI陪伴体验

    科大发布星火X1.5及系列AI产品

    11月6日,第八届世界声博会暨2025科大全球1024开发者节发布会上,科大以《更懂你的
    的头像 发表于 11-10 11:49 632次阅读

    大模型驱动下的人机交互革命,“超拟真人互动” 让玩具读懂你的情绪

    电子发烧友网报道(文/黄山明)日前,在大湾区AI玩具生态大会上,百度智能云正式发布基于“超拟真人互动”理念的智能硬件模态交互解决方案。该方案通过大模型与
    的头像 发表于 10-31 09:21 6128次阅读
    大模型驱动下的人机<b class='flag-5'>交互</b>革命,“超拟真人互动” 让玩具读懂你的情绪

    “芯”声代,智未来—VS680本地语音交互系统 #语音交互 #芯片

    语音交互
    深蕾半导体
    发布于 :2025年09月17日 10:59:30

    米尔RK3576部署端侧模态轮对话,6TOPS算力驱动30亿参数LLM

    “看图说话+语音问答”的融合交互。 五、结论与未来发展方向如果说 “大模型云” 是 AI 的 “星辰大海”,那么 “模态落地端侧” 就
    发表于 09-05 17:25

    超拟人交互API上线

    让AI感知用户情绪,从冰冷服务进化成为心意相通的助手,这并非存在于《Her》或《钢铁侠》科幻电影。大模型加持的语音交互全新升级,能够轻松应对轮对话,而且实现情绪响应和个性定制。
    的头像 发表于 07-10 15:21 1286次阅读

    汽车模态交互测试:智能交互的深度验证

    在汽车智能座舱测试的关键进程中,北京沃华慧通测控技术有限公司展现出了独特的价值与优势。作为一家专注于测控技术领域的企业,沃华慧通在智能座舱测试方面积累了丰富的经验和专业的技术能力。其研发的测试设备能够精准模拟各种复杂的车载环境,
    的头像 发表于 06-25 09:00 1214次阅读
    汽车<b class='flag-5'>多</b><b class='flag-5'>模态</b><b class='flag-5'>交互</b>测试:智能<b class='flag-5'>交互</b>的深度验证

    打破交互困局:科大这样出手

    十年深耕,科大智能交互如何引领未来
    的头像 发表于 06-17 11:50 876次阅读
    打破<b class='flag-5'>交互</b>困局:<b class='flag-5'>科大</b><b class='flag-5'>讯</b><b class='flag-5'>飞</b>这样出手

    移远通信智能模组全面接入模态AI大模型,重塑智能交互新体验

    随着千行业数智化进程的不断加速,模态AI大模型的应用需求不断攀升,图像、语音、视频多样化的交互
    发表于 03-21 14:12 427次阅读
    移远通信智能模组全面接入<b class='flag-5'>多</b><b class='flag-5'>模态</b>AI大模型,重塑智能<b class='flag-5'>交互</b>新体验

    移远通信智能模组全面接入模态AI大模型,重塑智能交互新体验

    随着千行业数智化进程的不断加速,模态AI大模型的应用需求不断攀升,图像、语音、视频多样化的交互
    的头像 发表于 03-20 19:03 669次阅读
    移远通信智能模组全面接入<b class='flag-5'>多</b><b class='flag-5'>模态</b>AI大模型,重塑智能<b class='flag-5'>交互</b>新体验

    模态交互技术解析

    模态交互 模态交互( Multimodal Interaction )是指通过多种感官通道(
    的头像 发表于 03-17 15:12 3565次阅读

    科大Air 2电纸书和掌阅Ocean4 Plus区别

    首先说说科大Air 2,这款设备的核心亮点在于它的AI功能和办公属性。8.2英寸的墨水屏,分辨率高达1920*1440,显示效果非常细腻,阅读时眼睛不会感到疲劳。它的屏占比达到了88.5%,
    发表于 03-03 14:01

    科大推出大模型极速超拟人交互软硬件方案

    随着大模型技术的不断发展,大模型的应用越来越受到行业的重视。如何在智能硬件的语音交互快速应用和普及大模型,一直是业内热议和探索的话题。
    的头像 发表于 01-16 11:07 1218次阅读

    科大即将发布星火深度推理模型X1

    ,标志着科大飞在AI技术领域的又一次重大突破。星火深度推理模型X1将为科大
    的头像 发表于 01-08 10:30 1031次阅读

    科大AI虚拟人交互平台荣获行业最高评级

    近日,科大的AI虚拟人交互平台顺利完成中国信通院人工智能研究所组织的大模型数字人基础能力分级测试,并获得最高等级L5认证,系国内首批。
    的头像 发表于 12-13 11:39 1462次阅读