0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AIoT下的多模态演变之路 垂直领域竞争激烈

MZjJ_DIGITIMES 来源:cg 2019-01-05 09:45 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

2018年人工智能AI)行业成为了最受关注的热点之一,不同场景的AI芯片层出不穷,成为了智能时代的“入场券”,大多数业者称“得芯者得天下”,将2018年定义为“芯片元年”。

语音垂直应用领域,“造芯”似已成为云知声、出门问问、Rokid 、思必驰、科大讯飞从算法出发“软硬兼施”一条必走之途,但也显得语音AI市场变得异常竞争激烈。

在此背景下,2018年5月,云知声推出首款物联网AI芯片——雨燕(Swift),通过“唯快不破”的发展思路,很快在语音识别风口中和科大讯飞比肩,并完成C轮1亿美元的融资跻身国内众多AI独角兽榜单中的一员。

而在2019年开年之际,云知声继续抢跑,于1月2日召开了“2019云知声多模态AI芯片战略发布会”,会上正式公布了其多模态AI技术,以及正在研发中的多款定位不同场景的AI芯片,包括实用性更广的超轻量级物联网语音芯片雨燕(Lite)、可面向智慧城市场景提供对语音和图像等多模态计算支持的海豚(Dolphin),以及面向智慧出行场景的车规级芯片雪豹(Leopard)。以上三款芯片计划于2019年启动量产。

AIoT下的多模态演变之路

云知声创始人兼CEO黄伟认为,5G与人工智能的结合将真正促使万物智联(AIoT)的落地与实现。可以预见的是,未来巨量的多维数据(如语音、图像、视频等)集中处理与边缘式分布计算的需求,势必将进一步挑战AI底层支持硬件——芯片的计算能力。

与此同时,AI应用对于端云互动有着强需求。强大的云会让端能力更强,而强大的端则可提升数据处理的实时性和有效性,进而增强云的能力。二者需要紧密结合,这要求对芯片设计和云端架构进行统一考量。传统的通用方案架构由于在高实时性、高智能化场景中的算力有限,且无法平衡好成本、功耗、安全性等诸多现实需求,因此具备多维度AI数据集中处理能力的多模态AI芯片将成必由之路。

为实现多模态AI芯片的战略落地,目前云知声已在加速技术布局,并在机器视觉方面取得飞速进展。其中,面向机器视觉的轻量级图像信号处理器已可实现在不依赖外部内存的情况下,在30 fps的速率下实时对传感器的图片进行预处理,以进一步提高后续机器视觉处理模块的处理速度和效果。借助基于人脸信息分析的多模态技术,已可实现人脸/物体识别、表情分析、标签化、唇动状态跟踪等功能,可为产品交互和用户体验提供更多的可玩性和灵活性。

此外,云知声发布多模态人工智能核心IP——DeepNet2.0,可兼容LSTM/CNN/RNN/TDNN等多种推理网络,支持可重构计算与Winograd处理,最高可配置算力达4T。目前云知声DeepNet2.0已在FPGA上得到验证,将在2019年落地的全新多模态AI芯片海豚(Dolphin)上落地。

直面思必驰、科大讯飞垂直领域竞争

语音识别与语义分析,这是人们比较能理解的人工智能应用领域。虽然在这条起跑线上,云知声后来追上,但不难发现,与其业务重合度较高的莫过于思必驰和科大讯飞两家公司。

梳理之下可以看出,在产品线竞争上,云知声围绕智能家居、智能车载、机器人、智慧医疗和智慧教育等的五大领域四面受敌。

云知声产品线中的智能家居方案、智能车载方案和机器人方案,直面与思必驰构成业务重叠,竞争态势强烈。据思必驰CMO龙梦竹曾介绍,思必驰车载语音在智能车载后装市场占据约60%的份额,在智能后视镜领域约为70%,HUD领域已高达80%。

在智慧医疗与智慧教育领域里,科大讯飞仍是摆在眼前的不小阻力。除了双方均大力布局将语音转成结构化电子病历系统与智能口语评测外,科大讯飞还在医学影像辅助诊断和基于认知计算的辅助诊疗系统方面有所布局,并且根据科大讯飞2017年财报表示,其智慧教育产品已经覆盖全国15000余所学校,深度用户超过1500万,占总主营业务收入的25.54%。

因此,对于云知声而言,面对行业里既有科大讯飞这样的“老大”,又有不断加码人工智能投入的BAT等巨头,由应用场景来定义AI芯片的研发与产品形态无疑是其独立发展的最佳路径。

以语音病历系统为例。医生在说话时,能轻松地与电脑、iPad、移动查房设备等建立联系;说话的内容会被转录成文字并显示在医院专门的HIS、PACS、CIS等系统中。但是在医疗这个专业性非常强的领域,常规语音识别系统并不能完美胜任。

为此,云知声针对医院不同科室的业务进行了梳理,整理了超过30GB的医疗文本资料,并对这些资料进行分类、检索等处理,使得定制语音模型覆盖各个科室常用病症、药品名称、操作步骤等关键信息,使语音识别准确率超过95%。同时,针对医生的口音问题,云知声提出了无监督自适应技术,提高对医生口语的识别率。

所以,在这一轮人工智能风潮的到来,最重要的是芯片定位。云知声的做法是,针对细分客户的需求做极致化服务,从算法公司的角度出发做芯片,软硬结合打造出一个好用的芯片,欲成为语音交互佼佼者,同时希望推出语音AI芯片打造生态,从而实现价值的提升。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 语音交互
    +关注

    关注

    3

    文章

    354

    浏览量

    29212
  • AI芯片
    +关注

    关注

    17

    文章

    2163

    浏览量

    36865

原文标题:“声”势惊人 AI语音交互芯片 启动新一轮垂直领域战场

文章出处:【微信号:DIGITIMES,微信公众号:DIGITIMES】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    ADPD4100/ADPD4101模态传感器前端:功能特点与应用解析

    ADPD4100/ADPD4101模态传感器前端:功能特点与应用解析 一、引言 在电子设计领域,传感器前端的性能对整个系统的表现起着至关重要的作用。ADPD4100/ADPD4101作为
    的头像 发表于 03-27 14:50 161次阅读

    ADPD4000/ADPD4001:模态传感器前端的卓越之选

    传感器前端,为众多应用领域带来了新的解决方案。本文将详细介绍ADPD4000/ADPD4001的特性、工作原理、应用模式以及相关寄存器配置,希望能为电子工程师们在设计过程中提供有价值的参考。 文件下载: ADPD4000.pdf 一、产品特性剖析 1.1
    的头像 发表于 03-27 14:45 171次阅读

    ADPD4200 模态传感器前端:功能、应用与设计要点

    ADPD4200 模态传感器前端:功能、应用与设计要点 在当今的电子设计领域模态传感器前端的应用越来越广泛,它能够集成多种功能,满足不
    的头像 发表于 03-27 09:35 167次阅读

    海光DCU完成Qwen3.5模态MoE模型全量适配

    近日,海光DCU完成Qwen3.5-397B MoE旗舰模态模型、Qwen3.5-35B-A3B MoE模态模型全量适配、精度对齐与推理部署验证。本次适配依托FlagOS专属vLL
    的头像 发表于 03-26 09:35 666次阅读

    模态大模型驱动的复杂环境精准导航避障系统平台的应用

    模态大模型驱动的复杂环境精准导航避障系统平台的应用
    的头像 发表于 12-22 13:15 393次阅读
    <b class='flag-5'>多</b><b class='flag-5'>模态</b>大模型驱动的复杂环境精准导航避障系统平台的应用

    商汤科技正式发布并开源全新模态模型架构NEO

    商汤科技正式发布并开源了与南洋理工大学S-Lab合作研发的全新模态模型架构 —— NEO,为日日新SenseNova 模态模型奠定了新一代架构的基石。
    的头像 发表于 12-08 11:19 1153次阅读
    商汤科技正式发布并开源全新<b class='flag-5'>多</b><b class='flag-5'>模态</b>模型架构NEO

    格灵深瞳模态大模型Glint-ME让图文互搜更精准

    在电商、安防等场景,图文互搜应用广泛。随着以CLIP为代表的模态表征方法相继提出,过去单一模态搜索(文搜文、图搜图)被突破,模型可以同时理解文本、图像、音频乃至视频,实现跨
    的头像 发表于 11-02 15:56 1843次阅读
    格灵深瞳<b class='flag-5'>多</b><b class='flag-5'>模态</b>大模型Glint-ME让图文互搜更精准

    亚马逊云科技上线Amazon Nova模态嵌入模型

    Embeddings模态嵌入模型现已在Amazon Bedrock上线,这是一款专为Agentic RAG与语义搜索应用打造的顶尖模态嵌入模型。该模型是首个通过单一模型支持文本、
    的头像 发表于 10-29 17:15 365次阅读
    亚马逊云科技上线Amazon Nova<b class='flag-5'>多</b><b class='flag-5'>模态</b>嵌入模型

    米尔RK3576部署端侧模态轮对话,6TOPS算力驱动30亿参数LLM

    开源模态模型的快速移植,形成 “芯片 - 工具链 - 模型” 的协同生态。 当 RK3576 证明 “端侧能跑好转好多模态对话” 时,边缘 AI 的竞争已从 “能否实现” 转向 “
    发表于 09-05 17:25

    浅析模态标注对大模型应用落地的重要性与标注实例

    ​在人工智能迈向AGI通用智能的关键道路上,大模型正从单一的文本理解者,演进为能同时看、听、读、想的“多面手”。驱动这一进化的核心燃料,正是高质量的模态数据,而将原始数据转化为“机器可读教材
    的头像 发表于 09-05 13:49 2742次阅读

    基于米尔瑞芯微RK3576开发板的Qwen2-VL-3B模型NPU模态部署评测

    AIoT 旗舰 瑞芯微 NPU SDK:RKNN 和 RKLLM 二、环境准备 步骤 1:登录开发板,下载必备资料 步骤 2:替换 NPU Driver 后编译 Ubuntu 并刷机 三、模态
    发表于 08-29 18:08

    电子发烧友工程师看!电子领域评职称,技术之路更扎实

    电子发烧友的各位工程师、硬件开发者们,咱们每天在平台查芯片手册、讨论电路设计难题、分享嵌入式项目经验,从调试 PCB 板到开发 AIoT 系统,靠的都是过硬的技术实力 —— 而电子领域的职称评审
    发表于 08-20 13:53

    商汤科技模态通用智能战略思考

    时间是最好的试金石,AI领域尤其如此。当行业热议大模型走向时,商汤早已锚定“模态通用智能”——这是我们以深厚研究积累和实践反复验证的可行路径。
    的头像 发表于 08-14 09:33 1297次阅读

    模态感知+豆包大模型!家居端侧智能升级

    的关键力量。星宸科技与豆包大模型的合作,将这一技术趋势落实到实际应用场景中,在智能家居、可穿戴设备以及连锁店等领域引发了深刻变革。   智能家居升级   陈立敬指出:“智能家居2.0需要大模型大脑”。在智能家居领域
    的头像 发表于 06-21 00:06 7322次阅读
    <b class='flag-5'>多</b><b class='flag-5'>模态</b>感知+豆包大模型!家居端侧智能升级

    模态+空间智能:盾华以AI+智慧路灯杆,点亮城市治理新方式

    模态+空间智能:盾华以AI+智慧路灯杆,点亮城市治理新方式
    的头像 发表于 06-12 10:17 775次阅读
    <b class='flag-5'>多</b><b class='flag-5'>模态</b>+空间智能:盾华以AI+智慧路灯杆,点亮城市治理新方式