0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

DeepX的AI加速器能够脱颖而出吗?

Astroys 来源:Astroys 2023-06-08 16:48 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

在评估AI硬件时,规格竞赛(能效、性能和对各种算法的支持)绝对是重要的。

但是,当系统公司把在GPU上开发的AI模型移植到其他类型的硬件时发生的精度损失怎么处理呢?这就是DeepX的特色。

上周,AI芯片初创公司DeepX的创始人Lokwon Kim,在加州Santa Clara的展会上推出了一系列AI加速器。Kim声称,这些芯片将实现“无处不在的AI,人人可用的AI。”

Kim选择了嵌入式视觉峰会作为他的首次公开亮相。需明确的是,DeepX是一个刚加入这个拥挤赛道的初创公司。然而,DeepX在韩国却有着深厚的根基。通过向韩国政府积极地营销,Kim已经把DeepX在AI领域的研发变成了一个国家项目。

DeepX从政府那里筹集了4000万美元,还在韩国的风投圈中筹集了2000万美元。根据Kim的说法,今年晚些时候将计划进行B轮融资。

DeepX正在推出一系列用于边缘设备嵌入式视觉产品的AI加速器。它还开发了包括编译器和运行时在内的软件开发套件DXNN。DeepX认为DXNN是其皇冠上的明珠。

据报道,DXNN可以简化深度学习模型部署到DeepX的AI SoC的过程。其编译器提供了高性能量化、模型优化和NPU推理编译的工具。其运行时包括NPU设备驱动程序、带有API的运行时和NPU固件。

最重要的是,该公司声称,DXNN支持“以浮点格式训练的DNN模型的自动量化”。

DeepX并没有凭空创造出其AI硬件架构。Kim说,自2016年创立公司以来,“我们实际上已经与数百家全球公司坐下来进行了面谈。”

Kim观察到,“可扩展性、AI精度以及功率/性能效率”是边缘AI系统开发者一直在苦苦挣扎的三个领域。DeepX的目标是在其AI加速器上实现GPU级的AI精度,同时提供高吞吐量和低功耗。

DeepX的源起

在DeepX之前,Kim是Apple的AP的首席设计师,参与开发了A10、A11 Bionic和A12 Bionic。

Kim创办DeepX的灵感来源于他2010年在IBM的T.J. Watson研究中心做访问学者的经历。他当时的工作是开发深度学习MPU,这是DARPA指派给IBM的一个项目。

当时Kim是UCLA的博士生,自那以后,他一直沉迷于在MPU上运行DNN的想法。

即使在加入Apple后,Kim也一直坚持着自己的AI创业梦想。“我实际上已经把我的想法带给了Apple的高层管理人员。”他们拒绝了,于是Kim结束了在Apple的工作,并返回韩国。

Kim表示,他非常敬仰张忠谋。半导体行业对张忠谋的贡献有很大的感激之情。张忠谋离开美国,在台湾创办了TSMC。这个起初并不被看好的企业最终成为了全球最大的代工巨头。

Kim说,TSMC对台湾的重要性(无论是经济上还是政治上)已不言而喻。通过利用AI的力量,Kim希望在他的祖国取得类似的重要地位。

这是一个大胆的说法。但是Kim的想法反映了这个时代。无论是好是坏,地缘政治已经成为先进半导体发展的内在因素。

战略

DeepX设计了同属一系列的四款AI加速器,所有的焦点都集中在视觉应用上。其策略是为多个边缘视觉AI领域提供可扩展的解决方案。

DX-L1,适用于IP摄像头、车内监控、机器人摄像头和无人机等摄像头应用。

DX-L1包含四核RISC-V、ISP、MIPI和视频编码器,提供12 eTOPS的AI性能。Kim指的eTOPS是“相当于GPU的TOPS的性能度量标准”。

DX-L2支持3-4个摄像头的边缘AI视觉系统,提供38 eTOPS。

DX-M1,配备了双核ARM核和ISP,支持10个摄像头,提供200 eTOPS。

DX-H1,提供1600 eTOPS,将以PCIe卡的形式生产,可以部署在能够执行大规模AI操作的边缘服务器中。通过支持10,000个摄像头,DX-H1可以服务于安装了大量监控摄像头的工厂。H1具有与M1类似的双核ARM核和ISP模块。

所有四种芯片都由三星代工,其中L1和L2采用28nm制程。M1是14nm,H1则使用5nm工艺。价格范围从10美元(L1)、20美元(L2)到50美元(M1)和1500美元(H1)不等。

准确性

除了提供低功耗和性能效率外,DeepX还将资源集中在量化工作上,以保证GPU级的准确性。

基于自身经验,DeepX专注于解决准确性降低的问题上。Kim指出,将原本在浮点格式GPU上训练的AI模型移植到其它硬件上,都会导致准确性降低。

因此,DeepX的团队寻找了每个数据路径中准确性降低的点。结果就是DeepX在其SDK,即DXNN中称之为“世界顶级的量化器”。

396034be-05d8-11ee-962d-dac502259ad0.jpg

市场细分

过去几年中,许多AI硬件创业公司被汽车行业所诱惑,梦想着他们的AI芯片将成为下一代车辆平台的计算机大脑。

相反,Kim得出的结论是,对于一家初创公司来说,向车厂销售AI芯片是一个糟糕的选择。因为汽车芯片需要经过漫长的验证时间,ASIL B和C等认证作业增加了很多困难。即使解决了这些障碍,芯片销量也微乎其微。

相反,Kim的策略是与车厂合作,为DeepX MPU授权IP,包括软件。Kim解释说,DeepX一直被OEM忽视,现在却开始收到OEM要求评估DeepX芯片的请求。

这可能意味着两件事。

首先,许多欧洲车厂向Kim暗示,他们对下一代车辆平台仍未做出决定。

其次,一些领先的车厂已经投入资源使用Nvidia的GPU开发自己的AI模型。但现在,当他们将模型移植到其他硬件上时,准确性降低问题正在出现。这迫使他们重新寻找另一种AI硬件解决方案。

Kim表示,DeepX只会为车厂提供IP授权。对于其他应用领域,其业务模式则是直接销售芯片。

Kim表示,DeepX的AI芯片的最佳应用场景是机器人,无论是配送机器人还是在工厂内作业的机器人。

Nvidia显然已经通过GPU赢得了AI市场。然而,AI竞赛的下一章或许在于如何将在GPU上训练的AI模型有效地移植到非GPU硬件上。





审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 加速器
    +关注

    关注

    2

    文章

    836

    浏览量

    39711
  • SoC设计
    +关注

    关注

    1

    文章

    151

    浏览量

    19471
  • MPU
    MPU
    +关注

    关注

    0

    文章

    442

    浏览量

    51035
  • NPU
    NPU
    +关注

    关注

    2

    文章

    358

    浏览量

    20833
  • ai硬件
    +关注

    关注

    0

    文章

    29

    浏览量

    2610

原文标题:DeepX的AI加速器能够脱颖而出吗?

文章出处:【微信号:Astroys,微信公众号:Astroys】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    边缘计算中的AI加速器类型与应用

    人工智能正在推动对更快速、更智能、更高效计算的需求。然而,随着每秒产生海量数据,将所有数据发送至云端处理已变得不切实际。这正是边缘计算中AI加速器变得不可或缺的原因。这种专用硬件能够直接在边缘设备上
    的头像 发表于 11-06 13:42 422次阅读
    边缘计算中的<b class='flag-5'>AI</b><b class='flag-5'>加速器</b>类型与应用

    亚马逊云科技第三期创业加速器圆满收官 助力初创释放Agentic AI潜力 加速全球化进程

    北京——2025年10月28日 ,亚马逊云科技第三期创业加速器项目圆满收官。35家入营企业齐聚一堂,分享了各自的业务发展情况,以及参与本期加速器的收获及体验。第三期创业加速器持续聚焦AI
    的头像 发表于 10-29 15:18 741次阅读

    智能电子指路牌公司排名 TOP1:如何在叁仟智慧城市细分市场中脱颖而出

    在智能电子指路牌行业蓬勃发展的当下,众多企业纷纷角逐,而杭州叁仟智慧城市科技有限公司却能一路披荆斩棘,荣登行业排名榜首。这家公司究竟凭借何种实力,在激烈的市场竞争中脱颖而出,成为行业内的标杆呢
    的头像 发表于 08-22 15:23 376次阅读

    Andes晶心科技推出新一代深度学习加速器

    高效能、低功耗 32/64 位 RISC-V 处理核与 AI 加速解决方案的领导供货商—Andes晶心科技(Andes Technology)今日正式发表最新深度学习加速器 Ande
    的头像 发表于 08-20 17:43 1832次阅读

    固态铝电解电容:如何凭借高纹波电流承载能力脱颖而出

    固态铝电解电容作为电子元器件领域的重要成员,凭借其高纹波电流承载能力在众多应用场景中脱颖而出。纹波电流是指叠加在直流电流上的交流分量,它对电容器的性能和寿命有着直接影响。在电源滤波、DC-DC转换
    的头像 发表于 08-10 15:08 1052次阅读

    粒子加速器 —— 科技前沿的核心装置

    粒子加速器全称“荷电粒子加速器”,是一种利用电磁场在高真空环境中对带电粒子(如电子、质子、离子)进行加速和控制,使其获得高能量的特种装置。粒子加速器技术现已发展成为集高能物理、核物理、
    的头像 发表于 06-19 12:05 2529次阅读
    粒子<b class='flag-5'>加速器</b> —— 科技前沿的核心装置

    边缘AI运算革新 DeepX DX-M1 AI加速卡结合Rockchip RK3588多路物体检测解决方案

    度等性能表现。 通过结合 Orange Pi 5 Plus(Rockchip RK3588) 与 DeepX AI 加速卡,这套解决方案以极高性价比为基础,能够为工业电脑提供即插即用的
    的头像 发表于 05-06 14:15 1249次阅读
    边缘<b class='flag-5'>AI</b>运算革新 <b class='flag-5'>DeepX</b> DX-M1 <b class='flag-5'>AI</b><b class='flag-5'>加速</b>卡结合Rockchip RK3588多路物体检测解决方案

    3大优势,让锂电池外壳气密性检测仪脱颖而出

    应运而生,凭借三大显著优势,在众多同类产品中脱颖而出。优势一:高精度检测技术。锂电池外壳气密性检测仪采用先进的传感技术和算法,能够实现对锂电池外壳微小泄漏的精准识别
    的头像 发表于 04-18 13:42 460次阅读
    3大优势,让锂电池外壳气密性检测仪<b class='flag-5'>脱颖而出</b>

    第三期 “亚马逊云科技创业加速器” 正式启动

    新 助力生成式 AI 初创企业释放潜能,加速全球化进程   北京 ——2025 年 4 月 18 日 亚马逊云科技今日宣布,第三期 "亚马逊云科技创业加速器" 正式启动。亚马逊云科技将联合包括启明创
    发表于 04-18 10:46 942次阅读

    嵌入式AI加速器DRP-AI 详细介绍

    的嵌入式设备。此外,人工智能正在不断发展,新的算法不时被开发出来。 在人工智能快速发展的过程中,瑞萨开发了人工智能加速器(DRP-AI)和软件(DRP-AI翻译),既提供高性能又提供
    的头像 发表于 03-15 16:13 1523次阅读
    嵌入式<b class='flag-5'>AI</b><b class='flag-5'>加速器</b>DRP-<b class='flag-5'>AI</b> 详细介绍

    英特尔Gaudi 2D AI加速器助力DeepSeek Janus Pro模型性能提升

    Pro模型进行了深度优化。 这一优化举措使得AI开发者能够以更低的成本和更高的效率实现复杂任务的部署与优化。英特尔Gaudi 2D AI加速器通过其卓越的计算能力和高度优化的软件栈,
    的头像 发表于 02-10 11:10 926次阅读

    DeepSeek发布Janus Pro模型,英特尔Gaudi 2D AI加速器优化支持

    Gaudi 2D AI加速器现已针对该模型进行了全面优化。这一优化举措使得AI开发者能够更轻松地实现复杂任务的部署与优化,从而有效满足行业应用对于推理算力的迫切需求。 英特尔Gaudi
    的头像 发表于 02-08 14:35 912次阅读

    消息称AMD Instinct MI400 AI加速器将配备8个计算芯片

    近日,据外媒 videocardz 报道,参考 AMD 最新推出的 AMD - GFX 补丁程序,其中暗示 AMD 旗下的 Instinct MI400 AI 加速器设计将有重大变革,其将配备 8
    的头像 发表于 02-05 15:07 1374次阅读

    苹果加入UALink联盟,共推AI加速器新标准

    苹果公司已正式成为Ultra Accelerator Link(UALink)联盟的一员,并获得了该联盟董事会席位。UALink联盟由超过65家成员组成,专注于开发下一代人工智能加速器架构,旨在推动AI技术的快速发展。
    的头像 发表于 01-22 18:18 1156次阅读

    英伟达AI加速器新蓝图:集成硅光子I/O,3D垂直堆叠 DRAM 内存

    加速器设计的愿景。 英伟达认为未来整个 AI 加速器复合体将位于大面积先进封装基板之上,采用垂直供电,集成硅光子 I/O 器件,GPU 采用多模块设计,3D 垂直堆叠 DRAM 内存,并在模块内直接整合
    的头像 发表于 12-13 11:37 1027次阅读
    英伟达<b class='flag-5'>AI</b><b class='flag-5'>加速器</b>新蓝图:集成硅光子I/O,3D垂直堆叠 DRAM 内存