0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

与GPU能效齐平,低功耗AI公司的转型

E4Life 来源:电子发烧友网 作者:周凯扬 2023-10-23 09:03 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/周凯扬)随着LLM在内的AI模型从规模和计算复杂性上成倍增加,与数年前相比,训练优秀AI模型的成本已经上升到了一个新的高度。从最近不断溢价、缺货抢货的GPU市场也可以看出,硬件成本已经成了AI发展的最大瓶颈。

为了训练高质量的AI模型,堆硬件数量几乎是避无可避的。为此,越来越多的AI芯片厂商看到了这个缺口,力求以自己的高性能硬件产品来填补竞品造成的缺口。甚至不少此前专注在低功耗/边缘AI计算的半导体公司,也计划冲击着更高的算力。

Leapmind

Leapmind是一家来自日本的边缘AI公司,其主要产品为超低功耗的AI推理加速器IP,Efficiera。Efficiera专门针对FPGAASIC/ASSP设备上的CNN推理计算进行了优化,仅需极小的面积和功耗就能实现优异的算力,所以很适合集成在边缘设备中。

虽然主打超低功耗,但Efficiera的性能表现却一点都不差,根据Leapmind的综合测试,在7nm工艺和533MHz的主频下,Efficiera可以实现107.8TOPS/W的能效表现。加上Efficiera对CNN的优化,使其非常适合用于图像识别类的应用,比如AR/VR、智能相机等。据Leapmind透露,他们已经在台积电28nm和12nm上用此IP完成了数个SoC开发项目。

不过,Leapmind的野心并没有止步于此,他们同样看中了LLM大模型市场,计划开发一款新的AI芯片来解决性能瓶颈问题。Leapmind指出,新的AI芯片将专注于AI模型训练和推理,目标性能是2PFLOPS,且旨在实现与同等性能GPU 10倍差距的性价比。

这一AI芯片的特点包括,与Efficiera一样,强调低精度计算下的性能表现,比如FP8等,从而减少所需的晶体管数量,也减少DRAM的带宽压力。同时Leapmind也会开源相关的驱动程序和编译器,毕竟开发AI模型所需的软件栈绝对不是Leapmind这个体量的公司能解决的问题。

Mythic

数字AI芯片的竞争或许异常激烈,但模拟AI芯片却是Mythic的主战场。他们打造的模拟矩阵处理器M1076芯片,可以实现单芯片25TOPS的性能,标准功耗却只有3W到4W左右。

其模拟存内计算架构利用高密度的模拟内存来片上存储神经网络,而不是像数据芯片一样需要片外数据交换,这种架构为其提供了远低于数字芯片的功耗和延迟,为此更适合用于图像传感类的应用,比如物体识别等。

不过M1076的推出似乎并没有给这家公司带来足够的客户和利润,哪怕他们甚至打入了洛克希德马丁的供应链。从去年底开始,就有报道称Mythic已经耗尽资金,无力进行下一代模拟存内计算架构的研发。直到今年3月,现有投资者和Catapult Ventures等新投资者为其再度注入了1300万美元的资金,才将其从危机中挽救回来。

获得新一轮融资后的Mythic的目标仍是做边缘端的AI计算,但他们已经准备好对标桌面级GPU的算力表现了,为AR头显等算力需求持续拔高的机器视觉应用提供硬件支持。Mythic表示,新的M2000将进一步降低大小、功耗和成本,同时具备部署高性能机器视觉的能力,进一步扩大应用领域。

写在最后

其实对于多数AI初创芯片公司来说,虽然竞争对手数量庞大,但低功耗AI芯片仍是一个相对更容易入局的市场。反倒是到了与GPU拼性能的时候,他们的竞争对手往往变成了GPU大厂或云服务厂商,所以必须得具备独一无二的特性和足够高的性价比,才能吸引到客户以及投资。但这也恰好证明了多数AI芯片的扩展性,同样的架构在边缘AI芯片上实现后,也能广泛用于更大规模的高性能AI芯片上,但他们的差异化战略能否一并成功延续过来,仍需要接受局面完全不同的市场考验。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5272

    浏览量

    136072
  • AI
    AI
    +关注

    关注

    91

    文章

    41156

    浏览量

    302620
  • 低功耗
    +关注

    关注

    12

    文章

    4037

    浏览量

    106853
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    智芯科以超低功耗VAD语音芯片赋AI穿戴超长续航

    举办,智芯科受邀出席,带来主题为《超低功耗VAD语音芯片-赋AI穿戴超长续航》的分享,以核心芯片技术突破,为AI穿戴产业的续航难题提供全新解决方案,引发行业广泛关注。
    的头像 发表于 03-12 16:02 2205次阅读

    如何确保CAT.1模组的高性能与低功耗

    提升 协议栈深度裁剪:针对物联网小数据包、低频次的特征,对LTE协议栈进行深度优化和裁剪,减少不必要的信令交互和处理开销。 AI辅助调度(部分高端应用):结合端侧AI算法,模组可
    发表于 03-05 11:41

    使用NORDIC AI的好处

    Nordic 的 Edge AI 主要有以下几个好处(基于官方资料总结): 极低功耗、延长电池寿命 在本地运行 AI,减少无线传输次数,而无线收发是最耗电的部分。设备只需上传“结果/事件”,而不是
    发表于 01-31 23:16

    专为边缘而生:深度解析昆仑芯K100 AI加速卡,释放128 TOPS极致

    昆仑芯K100边缘AI加速卡以75W超低功耗实现128 TOPS的INT8算力,重新定义边缘推理标准。其半高半长设计搭载8GB HBM内存与256GB/s带宽,支持INT8至FP3
    的头像 发表于 12-14 11:12 3190次阅读
    专为边缘而生:深度解析昆仑芯K100 <b class='flag-5'>AI</b>加速卡,释放128 TOPS极致<b class='flag-5'>能</b><b class='flag-5'>效</b>

    什么是低功耗设计,如何评估低功耗MCU性能?

    电流不可能无止尽的小,为了维持工作稳定,总是要消耗一点点电流的。做得过小反而不利于工作稳定。 以国产低功耗MCU为例,我们来看看CW32L是什么情况? CW32L是武汉芯源半导体有限公司低功耗系列
    发表于 12-12 07:43

    高能低功耗、小体积,炬芯科技发布全新CGM连续血糖监测方案

    及数字健康设备提供小体积、低功耗、高能的解决方案 ,为医疗级连续血糖监测系统提供可靠的硬件基础。 随着数字医疗与生理数据监测需求不断发展,传统CGM设备在功耗、体积及无线传输性能上仍面临挑战。炬芯科技凭借在
    的头像 发表于 12-01 16:57 946次阅读
    高能<b class='flag-5'>效</b>、<b class='flag-5'>低功耗</b>、小体积,炬芯科技发布全新CGM连续血糖监测方案

    低功耗异步SRAM系列的应用优点

    在各类电子设备与嵌入式系统中,存储器的性能与功耗表现直接影响着整体设计的稳定与效率。低功耗SRAM,特别是异步SRAM系列,凭借其出色的比与高可靠性,正成为越来越多工业控制、通信设
    的头像 发表于 11-25 15:42 537次阅读
    <b class='flag-5'>低功耗</b>异步SRAM系列的应用优点

    MCU主频与低功耗设计黄金法则

    快速完成然后深度睡眠”策略:这是低功耗设计的黄金法则。 1、让MCU在尽可能高的、比合理的频率下运行,最快速度完成任务。 2、完成任务后,立即进入尽可能深的低功耗模式 (如 Sto
    发表于 11-18 07:48

    基于TE Connectivity Alcoswitch 12mm防破坏开关的技术解析与应用指南

    TE Connectivity (TE)/Alcoswitch 12mm防破坏开关采用大尺寸按钮和LED指示灯 ,可简化面板安装工业和建筑应用中的用户界面。这些开关通过后面板上
    的头像 发表于 11-03 11:00 734次阅读
    基于TE Connectivity Alcoswitch 12mm防破坏<b class='flag-5'>齐</b><b class='flag-5'>平</b>开关的技术解析与应用指南

    Arm投资的超低功耗AI芯片公司Ambiq 上市

    电子发烧友网报道(文/李弯弯)美国时间2025年7月30日,专注于超低功耗半导体方案的AI芯片公司Ambiq Micro在纽约证券交易所正式挂牌交易。此次IPO发行400万股,每股定价24美元,募资
    的头像 发表于 08-11 07:12 9554次阅读

    浙江移动携手华为全面推进AI+赋应用百花齐放

    AI作为新质生产力的核心驱动力,正加速浙江移动自有业务的数智化转型。浙江移动携手华为,全面推进AI+赋应用“百花齐放”,赋一线工作提质提
    的头像 发表于 07-28 10:07 1016次阅读

    低功耗Wi-Fi 6模块物联网:NRF7002

    ; · ‌医疗穿戴设备‌:通过低功耗特性延长设备续航,保障连续监测需求。 市场前景展望随着边缘AI应用和智能汽车电子架构的升级,高性能无线模块已成为硬件创新的核心组件之一。迅通科技通过PTR7002展现了其在
    发表于 05-21 17:10

    交流充电桩负载提升技术

    0.5W以下。 交流充电桩的提升需融合材料科学、电力电子与信息技术,通过器件革新、拓扑优化、智能控制及系统集成实现全方位降耗。未来,随着SiC/GaN成本下降与能源互联网发展,充电桩将逐步从“能源消耗节点”转型为“智慧能源枢
    发表于 05-21 14:38

    比达2TOPS/W!解密边缘AI芯片低功耗设计之法

    、部署成本及用户体验。   为什么边缘AI 芯片需要低功耗设计?   从应用场景层面来看,首先是设备供电受限,如智能手表、无线传感器、可穿戴设备等依赖电池供电,低功耗设计直接决定续航时间。在太阳
    的头像 发表于 05-17 00:07 4830次阅读

    正点原子Linux最小系统板RK3506B资料发布!超低功耗,满载功耗低发热小,实现性能与双突破!

    正点原子Linux最小系统板RK3506B资料发布!超低功耗,满载功耗低发热小,实现性能与双突破! 正点原子RK3506B开发板基于RK3506B处理器,搭载四核强芯,3
    发表于 05-15 15:27