0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AIoT下的多模态演变之路 垂直领域竞争激烈

MZjJ_DIGITIMES 来源:cg 2019-01-05 09:45 次阅读

2018年人工智能AI)行业成为了最受关注的热点之一,不同场景的AI芯片层出不穷,成为了智能时代的“入场券”,大多数业者称“得芯者得天下”,将2018年定义为“芯片元年”。

语音垂直应用领域,“造芯”似已成为云知声、出门问问、Rokid 、思必驰、科大讯飞从算法出发“软硬兼施”一条必走之途,但也显得语音AI市场变得异常竞争激烈。

在此背景下,2018年5月,云知声推出首款物联网AI芯片——雨燕(Swift),通过“唯快不破”的发展思路,很快在语音识别风口中和科大讯飞比肩,并完成C轮1亿美元的融资跻身国内众多AI独角兽榜单中的一员。

而在2019年开年之际,云知声继续抢跑,于1月2日召开了“2019云知声多模态AI芯片战略发布会”,会上正式公布了其多模态AI技术,以及正在研发中的多款定位不同场景的AI芯片,包括实用性更广的超轻量级物联网语音芯片雨燕(Lite)、可面向智慧城市场景提供对语音和图像等多模态计算支持的海豚(Dolphin),以及面向智慧出行场景的车规级芯片雪豹(Leopard)。以上三款芯片计划于2019年启动量产。

AIoT下的多模态演变之路

云知声创始人兼CEO黄伟认为,5G与人工智能的结合将真正促使万物智联(AIoT)的落地与实现。可以预见的是,未来巨量的多维数据(如语音、图像、视频等)集中处理与边缘式分布计算的需求,势必将进一步挑战AI底层支持硬件——芯片的计算能力。

与此同时,AI应用对于端云互动有着强需求。强大的云会让端能力更强,而强大的端则可提升数据处理的实时性和有效性,进而增强云的能力。二者需要紧密结合,这要求对芯片设计和云端架构进行统一考量。传统的通用方案架构由于在高实时性、高智能化场景中的算力有限,且无法平衡好成本、功耗、安全性等诸多现实需求,因此具备多维度AI数据集中处理能力的多模态AI芯片将成必由之路。

为实现多模态AI芯片的战略落地,目前云知声已在加速技术布局,并在机器视觉方面取得飞速进展。其中,面向机器视觉的轻量级图像信号处理器已可实现在不依赖外部内存的情况下,在30 fps的速率下实时对传感器的图片进行预处理,以进一步提高后续机器视觉处理模块的处理速度和效果。借助基于人脸信息分析的多模态技术,已可实现人脸/物体识别、表情分析、标签化、唇动状态跟踪等功能,可为产品交互和用户体验提供更多的可玩性和灵活性。

此外,云知声发布多模态人工智能核心IP——DeepNet2.0,可兼容LSTM/CNN/RNN/TDNN等多种推理网络,支持可重构计算与Winograd处理,最高可配置算力达4T。目前云知声DeepNet2.0已在FPGA上得到验证,将在2019年落地的全新多模态AI芯片海豚(Dolphin)上落地。

直面思必驰、科大讯飞垂直领域竞争

语音识别与语义分析,这是人们比较能理解的人工智能应用领域。虽然在这条起跑线上,云知声后来追上,但不难发现,与其业务重合度较高的莫过于思必驰和科大讯飞两家公司

梳理之下可以看出,在产品线竞争上,云知声围绕智能家居、智能车载、机器人、智慧医疗和智慧教育等的五大领域四面受敌。

云知声产品线中的智能家居方案、智能车载方案和机器人方案,直面与思必驰构成业务重叠,竞争态势强烈。据思必驰CMO龙梦竹曾介绍,思必驰车载语音在智能车载后装市场占据约60%的份额,在智能后视镜领域约为70%,HUD领域已高达80%。

在智慧医疗与智慧教育领域里,科大讯飞仍是摆在眼前的不小阻力。除了双方均大力布局将语音转成结构化电子病历系统与智能口语评测外,科大讯飞还在医学影像辅助诊断和基于认知计算的辅助诊疗系统方面有所布局,并且根据科大讯飞2017年财报表示,其智慧教育产品已经覆盖全国15000余所学校,深度用户超过1500万,占总主营业务收入的25.54%。

因此,对于云知声而言,面对行业里既有科大讯飞这样的“老大”,又有不断加码人工智能投入的BAT等巨头,由应用场景来定义AI芯片的研发与产品形态无疑是其独立发展的最佳路径。

以语音病历系统为例。医生在说话时,能轻松地与电脑、iPad、移动查房设备等建立联系;说话的内容会被转录成文字并显示在医院专门的HIS、PACS、CIS等系统中。但是在医疗这个专业性非常强的领域,常规语音识别系统并不能完美胜任。

为此,云知声针对医院不同科室的业务进行了梳理,整理了超过30GB的医疗文本资料,并对这些资料进行分类、检索等处理,使得定制语音模型覆盖各个科室常用病症、药品名称、操作步骤等关键信息,使语音识别准确率超过95%。同时,针对医生的口音问题,云知声提出了无监督自适应技术,提高对医生口语的识别率。

所以,在这一轮人工智能风潮的到来,最重要的是芯片定位。云知声的做法是,针对细分客户的需求做极致化服务,从算法公司的角度出发做芯片,软硬结合打造出一个好用的芯片,欲成为语音交互佼佼者,同时希望推出语音AI芯片打造生态,从而实现价值的提升。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 语音交互
    +关注

    关注

    3

    文章

    272

    浏览量

    27819
  • AI芯片
    +关注

    关注

    17

    文章

    1648

    浏览量

    34379

原文标题:“声”势惊人 AI语音交互芯片 启动新一轮垂直领域战场

文章出处:【微信号:DIGITIMES,微信公众号:DIGITIMES】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    广和通AIoT模组及解决方案亮相MWC 2024

    2月26日,世界移动通信大会2024(MWC 2024)在巴塞罗那盛大开幕,以“未来先行”为主题,吸引了全球移动运营商、垂直行业客户及生态伙伴的瞩目。广和通携“提速互联 智向未来”的主题参展,展示了其在AI应用、5G-A、5G FWA等领域的最新成果,为
    的头像 发表于 02-27 09:52 203次阅读

    日中在汽车芯片领域竞争激烈

    相较之下,中国大陆电动汽车品牌繁多且市场竞争激烈。无论是内设芯片团队的传统汽车厂商,或是专注电动汽车品牌的投资机构,中国大陆均全情投入各类汽车芯片的研发。
    的头像 发表于 01-03 13:59 230次阅读

    锂电池回收企业间的竞争变得十分激烈

    2023年随着锂盐价格大幅下跌及锂电池回收行业的产能大幅度增长,锂电池回收企业间的竞争变得十分激烈
    的头像 发表于 12-29 10:26 479次阅读
    锂电池回收企业间的<b class='flag-5'>竞争</b>变得十分<b class='flag-5'>激烈</b>

    人工智能领域模态的概念和应用场景

    随着人工智能技术的不断发展,多模态成为了一个备受关注的研究方向。多模态技术旨在将不同类型的数据和信息进行融合,以实现更加准确、高效的人工智能应用。本文将详细介绍多模态的概念、研究内容和应用场景,并探讨人工智能
    的头像 发表于 12-15 14:28 3047次阅读

    大模型+多模态的3种实现方法

    我们知道,预训练LLM已经取得了诸多惊人的成就, 然而其明显的劣势是不支持其他模态(包括图像、语音、视频模态)的输入和输出,那么如何在预训练LLM的基础上引入跨模态的信息,让其变得更强大、更通用呢?本节将介绍“大模型+多
    的头像 发表于 12-13 13:55 718次阅读
    大模型+多<b class='flag-5'>模态</b>的3种实现方法

    红外技术为AIoT领域带来了哪些变革?

    AIoT(人工智能物联网)作为一个融合了人工智能和物联网技术的新兴领域,引起了广泛的关注。最近几年,红外技术在AIoT中的应用越来越显著。这种融合为我们带来了更智能、更高效的解决方案,并在多个
    的头像 发表于 11-03 17:04 630次阅读
    红外技术为<b class='flag-5'>AIoT</b><b class='flag-5'>领域</b>带来了哪些变革?

    特斯拉交付创纪录,电动车市场竞争激烈,线路板是您的竞争优势

    特斯拉交付创纪录,电动车市场竞争激烈,线路板是您的竞争优势
    的头像 发表于 10-20 15:50 229次阅读

    英码科技精彩亮相火爆的IOTE 2023,多面赋能AIoT产业发展!

    “亮眼”》 的主题演讲。大会上,李总从边缘智能的方向,分享了AI视觉市场需求的变化以及如何把AIoT市场蛋糕做大的新思路;在演讲中他提到,当前市场标品竞争激烈,大量长尾需求无人问津,而目前AI场景化
    发表于 09-25 10:03

    以四点法为例讲解模态识别方法

    导读:模态分析是研究结构动力特性一种近代方法,是系统辨别方法在工程振动领域中的应用。模态是机械结构的固有振动特性,每一个模态具有特定的固有频率、阻尼比和
    的头像 发表于 08-24 11:42 2170次阅读
    以四点法为例讲解<b class='flag-5'>模态</b>识别方法

    更强更通用:智源「悟道3.0」Emu多模态大模型开源,在多模态序列中「补全一切」

    当前学界和工业界都对多模态大模型研究热情高涨。去年,谷歌的 Deepmind 发布了多模态视觉语言模型 Flamingo ,它使用单一视觉语言模型处理多项任务,在多模态大模型领域保持较
    的头像 发表于 07-16 20:45 402次阅读
    更强更通用:智源「悟道3.0」Emu多<b class='flag-5'>模态</b>大模型开源,在多<b class='flag-5'>模态</b>序列中「补全一切」

    led显示2023年竞争会更激烈???

    一步促进了市场竞争激烈化。 LED直显产品“价格两极化” 目前,LED直显产品中“大众产品和J端产品的价格走势正在加速分化”,呈现出市场发展的不平衡格局。 一方面,P1.2及其以上间距指标的LED直显产品价格持续走低。P1.2 产品每平米价格已经下降到
    的头像 发表于 06-26 09:24 292次阅读
    led显示2023年<b class='flag-5'>竞争</b>会更<b class='flag-5'>激烈</b>???

    AIoT方案 | 智慧新能源光伏家用储能方案

    AIoT
    jf_99080906
    发布于 :2023年06月25日 19:11:39

    如何减小模态转换的影响呢?

    “传输通道结构发生变化时,在两种结构的交界处电磁场的模态(也就是场型、分布)会发生变化,进而产生模态转换。”
    的头像 发表于 06-16 11:19 1012次阅读
    如何减小<b class='flag-5'>模态</b>转换的影响呢?

    电源管理IC下游市场向高端工业和汽车领域转型,这家芯片设计厂商值得关注

    仪器等领域,其中, 通讯设备和消费类电子是当下电源管理IC最大的终端应用市场。因为低端电源管理IC行业的技术准入门槛较低,价格战愈发激烈;同时伴随着新能源、AIoT、人工智能、机器人等新兴应用
    发表于 06-09 15:06

    ImageBind:跨模态之王,将6种模态全部绑定!

    最近,很多方法学习与文本、音频等对齐的图像特征。这些方法使用单对模态或者最多几种视觉模态。最终嵌入仅限于用于训练的模态对。因此,视频 - 音频嵌入无法直接用于图像 - 文本任务,反之亦然。学习真正的联合嵌入面临的一个主要障碍是缺
    的头像 发表于 05-11 09:30 673次阅读
    ImageBind:跨<b class='flag-5'>模态</b>之王,将6种<b class='flag-5'>模态</b>全部绑定!