0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

DeepX的AI加速器能够脱颖而出吗?

Astroys 来源:Astroys 2023-06-08 16:48 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

在评估AI硬件时,规格竞赛(能效、性能和对各种算法的支持)绝对是重要的。

但是,当系统公司把在GPU上开发的AI模型移植到其他类型的硬件时发生的精度损失怎么处理呢?这就是DeepX的特色。

上周,AI芯片初创公司DeepX的创始人Lokwon Kim,在加州Santa Clara的展会上推出了一系列AI加速器。Kim声称,这些芯片将实现“无处不在的AI,人人可用的AI。”

Kim选择了嵌入式视觉峰会作为他的首次公开亮相。需明确的是,DeepX是一个刚加入这个拥挤赛道的初创公司。然而,DeepX在韩国却有着深厚的根基。通过向韩国政府积极地营销,Kim已经把DeepX在AI领域的研发变成了一个国家项目。

DeepX从政府那里筹集了4000万美元,还在韩国的风投圈中筹集了2000万美元。根据Kim的说法,今年晚些时候将计划进行B轮融资。

DeepX正在推出一系列用于边缘设备嵌入式视觉产品的AI加速器。它还开发了包括编译器和运行时在内的软件开发套件DXNN。DeepX认为DXNN是其皇冠上的明珠。

据报道,DXNN可以简化深度学习模型部署到DeepX的AI SoC的过程。其编译器提供了高性能量化、模型优化和NPU推理编译的工具。其运行时包括NPU设备驱动程序、带有API的运行时和NPU固件。

最重要的是,该公司声称,DXNN支持“以浮点格式训练的DNN模型的自动量化”。

DeepX并没有凭空创造出其AI硬件架构。Kim说,自2016年创立公司以来,“我们实际上已经与数百家全球公司坐下来进行了面谈。”

Kim观察到,“可扩展性、AI精度以及功率/性能效率”是边缘AI系统开发者一直在苦苦挣扎的三个领域。DeepX的目标是在其AI加速器上实现GPU级的AI精度,同时提供高吞吐量和低功耗。

DeepX的源起

在DeepX之前,Kim是Apple的AP的首席设计师,参与开发了A10、A11 Bionic和A12 Bionic。

Kim创办DeepX的灵感来源于他2010年在IBM的T.J. Watson研究中心做访问学者的经历。他当时的工作是开发深度学习MPU,这是DARPA指派给IBM的一个项目。

当时Kim是UCLA的博士生,自那以后,他一直沉迷于在MPU上运行DNN的想法。

即使在加入Apple后,Kim也一直坚持着自己的AI创业梦想。“我实际上已经把我的想法带给了Apple的高层管理人员。”他们拒绝了,于是Kim结束了在Apple的工作,并返回韩国。

Kim表示,他非常敬仰张忠谋。半导体行业对张忠谋的贡献有很大的感激之情。张忠谋离开美国,在台湾创办了TSMC。这个起初并不被看好的企业最终成为了全球最大的代工巨头。

Kim说,TSMC对台湾的重要性(无论是经济上还是政治上)已不言而喻。通过利用AI的力量,Kim希望在他的祖国取得类似的重要地位。

这是一个大胆的说法。但是Kim的想法反映了这个时代。无论是好是坏,地缘政治已经成为先进半导体发展的内在因素。

战略

DeepX设计了同属一系列的四款AI加速器,所有的焦点都集中在视觉应用上。其策略是为多个边缘视觉AI领域提供可扩展的解决方案。

DX-L1,适用于IP摄像头、车内监控、机器人摄像头和无人机等摄像头应用。

DX-L1包含四核RISC-V、ISP、MIPI和视频编码器,提供12 eTOPS的AI性能。Kim指的eTOPS是“相当于GPU的TOPS的性能度量标准”。

DX-L2支持3-4个摄像头的边缘AI视觉系统,提供38 eTOPS。

DX-M1,配备了双核ARM核和ISP,支持10个摄像头,提供200 eTOPS。

DX-H1,提供1600 eTOPS,将以PCIe卡的形式生产,可以部署在能够执行大规模AI操作的边缘服务器中。通过支持10,000个摄像头,DX-H1可以服务于安装了大量监控摄像头的工厂。H1具有与M1类似的双核ARM核和ISP模块。

所有四种芯片都由三星代工,其中L1和L2采用28nm制程。M1是14nm,H1则使用5nm工艺。价格范围从10美元(L1)、20美元(L2)到50美元(M1)和1500美元(H1)不等。

准确性

除了提供低功耗和性能效率外,DeepX还将资源集中在量化工作上,以保证GPU级的准确性。

基于自身经验,DeepX专注于解决准确性降低的问题上。Kim指出,将原本在浮点格式GPU上训练的AI模型移植到其它硬件上,都会导致准确性降低。

因此,DeepX的团队寻找了每个数据路径中准确性降低的点。结果就是DeepX在其SDK,即DXNN中称之为“世界顶级的量化器”。

396034be-05d8-11ee-962d-dac502259ad0.jpg

市场细分

过去几年中,许多AI硬件创业公司被汽车行业所诱惑,梦想着他们的AI芯片将成为下一代车辆平台的计算机大脑。

相反,Kim得出的结论是,对于一家初创公司来说,向车厂销售AI芯片是一个糟糕的选择。因为汽车芯片需要经过漫长的验证时间,ASIL B和C等认证作业增加了很多困难。即使解决了这些障碍,芯片销量也微乎其微。

相反,Kim的策略是与车厂合作,为DeepX MPU授权IP,包括软件。Kim解释说,DeepX一直被OEM忽视,现在却开始收到OEM要求评估DeepX芯片的请求。

这可能意味着两件事。

首先,许多欧洲车厂向Kim暗示,他们对下一代车辆平台仍未做出决定。

其次,一些领先的车厂已经投入资源使用Nvidia的GPU开发自己的AI模型。但现在,当他们将模型移植到其他硬件上时,准确性降低问题正在出现。这迫使他们重新寻找另一种AI硬件解决方案。

Kim表示,DeepX只会为车厂提供IP授权。对于其他应用领域,其业务模式则是直接销售芯片。

Kim表示,DeepX的AI芯片的最佳应用场景是机器人,无论是配送机器人还是在工厂内作业的机器人。

Nvidia显然已经通过GPU赢得了AI市场。然而,AI竞赛的下一章或许在于如何将在GPU上训练的AI模型有效地移植到非GPU硬件上。





审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 加速器
    +关注

    关注

    2

    文章

    841

    浏览量

    40236
  • SoC设计
    +关注

    关注

    1

    文章

    151

    浏览量

    19598
  • MPU
    MPU
    +关注

    关注

    0

    文章

    463

    浏览量

    51561
  • NPU
    NPU
    +关注

    关注

    2

    文章

    386

    浏览量

    21342
  • ai硬件
    +关注

    关注

    1

    文章

    38

    浏览量

    2653

原文标题:DeepX的AI加速器能够脱颖而出吗?

文章出处:【微信号:Astroys,微信公众号:Astroys】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    如何使用 powerquad 加速器中的一些功能以及 CMSIS 原始实现中的一些功能?

    )。 如何使用 powerquad 加速器中的一些功能以及 CMSIS 原始实现中的一些功能。 Example: I do not want to call arm_mat_trans_q15 powerquad
    发表于 04-03 06:37

    罗氏中国加速器科研坊正式启动

    "罗氏中国加速器科研坊"在上海举办,首批来自三甲医院的二十多位临床科研人员,参加了为期五天的肿瘤临床开发训练营。
    的头像 发表于 03-28 09:55 331次阅读

    为何选择Altera FPGA实现传感接口

    面向多种实时边缘应用场景,基于 FPGA 的传感解决方案正以卓越的可扩展性、后量子密码 (PQC) 级安全及 AI 能力脱颖而出
    的头像 发表于 01-19 09:43 2415次阅读
    为何选择Altera FPGA实现传感<b class='flag-5'>器</b>接口

    新思科技全面驾驭AI芯片设计复杂性

    AI 芯片正推动着万物智能时代的到来:作为高度专用化的处理加速器AI 芯片专为处理复杂算法与海量数据集而设计。但在当今快速变化、竞争激烈的市场中,要打造一款
    的头像 发表于 12-24 17:13 1374次阅读
    新思科技全面驾驭<b class='flag-5'>AI</b>芯片设计复杂性

    工业级-专业液晶图形显示加速器RA8889ML3N简介+显示方案选型参考表

    本帖最后由 MTCN2013 于 2025-11-17 15:23 编辑 专业液晶图形显示加速器能够有效减少对MCU运算资源的占用,对于只需普通单片机运算资源的仪器仪表来说,专业图形显示加速器
    发表于 11-14 16:03

    边缘计算中的AI加速器类型与应用

    人工智能正在推动对更快速、更智能、更高效计算的需求。然而,随着每秒产生海量数据,将所有数据发送至云端处理已变得不切实际。这正是边缘计算中AI加速器变得不可或缺的原因。这种专用硬件能够直接在边缘设备上
    的头像 发表于 11-06 13:42 986次阅读
    边缘计算中的<b class='flag-5'>AI</b><b class='flag-5'>加速器</b>类型与应用

    亚马逊云科技第三期创业加速器圆满收官 助力初创释放Agentic AI潜力 加速全球化进程

    北京——2025年10月28日 ,亚马逊云科技第三期创业加速器项目圆满收官。35家入营企业齐聚一堂,分享了各自的业务发展情况,以及参与本期加速器的收获及体验。第三期创业加速器持续聚焦AI
    的头像 发表于 10-29 15:18 1055次阅读

    航裕电源以大电流技术为国内外超导加速器项目提供优质方案

    航裕电源:以大电流技术,护航尖端科技 大科学装置建设热潮中,超导加速器作为探索微观世界、推动前沿科研的 “国之重”,对供电系统的稳定性、精度及功率提出极致要求。航裕电源以31.5kA、80kA万安
    的头像 发表于 10-12 15:02 1746次阅读

    智能电子指路牌公司排名 TOP1:如何在叁仟智慧城市细分市场中脱颖而出

    在智能电子指路牌行业蓬勃发展的当下,众多企业纷纷角逐,而杭州叁仟智慧城市科技有限公司却能一路披荆斩棘,荣登行业排名榜首。这家公司究竟凭借何种实力,在激烈的市场竞争中脱颖而出,成为行业内的标杆呢
    的头像 发表于 08-22 15:23 620次阅读

    40个项目脱颖而出!2025英特尔人工智能大赛圆满收官,下一个AI应用浪潮开启

    8月16日,2025英特尔人工智能创新大赛决赛暨颁奖典礼在深圳举行。英特尔副总裁、中国软件技术事业部总经理李映表示:“此次大赛,来自全国2817支年青队伍中有40个优秀团队和作品脱颖而出,围绕工业
    的头像 发表于 08-22 10:56 7857次阅读
    40个项目<b class='flag-5'>脱颖而出</b>!2025英特尔人工智能大赛圆满收官,下一个<b class='flag-5'>AI</b>应用浪潮开启

    Andes晶心科技推出新一代深度学习加速器

    高效能、低功耗 32/64 位 RISC-V 处理核与 AI 加速解决方案的领导供货商—Andes晶心科技(Andes Technology)今日正式发表最新深度学习加速器 Ande
    的头像 发表于 08-20 17:43 3108次阅读

    固态铝电解电容:如何凭借高纹波电流承载能力脱颖而出

    固态铝电解电容作为电子元器件领域的重要成员,凭借其高纹波电流承载能力在众多应用场景中脱颖而出。纹波电流是指叠加在直流电流上的交流分量,它对电容器的性能和寿命有着直接影响。在电源滤波、DC-DC转换
    的头像 发表于 08-10 15:08 1552次阅读

    高压放大器在粒子加速器研究中的应用

    的奥秘提供重要手段。 一、高压放大器在粒子加速器中的关键作用 (一)提供稳定的直流高电压 粒子加速器的电源系统需要提供高精度的直流高电压,以维持加速电场的稳定,而高压放大器能够放大低电
    的头像 发表于 06-19 17:09 708次阅读
    高压放大器在粒子<b class='flag-5'>加速器</b>研究中的应用

    粒子加速器 —— 科技前沿的核心装置

    粒子加速器全称“荷电粒子加速器”,是一种利用电磁场在高真空环境中对带电粒子(如电子、质子、离子)进行加速和控制,使其获得高能量的特种装置。粒子加速器技术现已发展成为集高能物理、核物理、
    的头像 发表于 06-19 12:05 4064次阅读
    粒子<b class='flag-5'>加速器</b> —— 科技前沿的核心装置

    边缘AI运算革新 DeepX DX-M1 AI加速卡结合Rockchip RK3588多路物体检测解决方案

    度等性能表现。 通过结合 Orange Pi 5 Plus(Rockchip RK3588) 与 DeepX AI 加速卡,这套解决方案以极高性价比为基础,能够为工业电脑提供即插即用的
    的头像 发表于 05-06 14:15 1249次阅读
    边缘<b class='flag-5'>AI</b>运算革新 <b class='flag-5'>DeepX</b> DX-M1 <b class='flag-5'>AI</b><b class='flag-5'>加速</b>卡结合Rockchip RK3588多路物体检测解决方案