0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

从14nm到3nm:AI ASIC算力、能效双突破

Carol Li 来源:电子发烧友网 作者:李弯弯 2025-07-26 07:22 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/李弯弯)2025年,全球AI芯片市场正迎来一场结构性变革。在英伟达GPU占据主导地位的大格局下,ASIC(专用集成电路)凭借针对AI任务的定制化设计,成为推动算力革命的新动力引擎。数据显示,中国AI芯片市场规模预计将从2024年的1425亿元迅猛增长至2029年的1.34万亿元,其中,ASIC架构产品将在国内市场占据主导地位。

AI ASIC是专为人工智能算法打造的专用集成电路。其核心特征在于,通过硬件层面的深度定制,在特定场景下实现极致的能效比。与传统通用芯片(如CPU、GPU)不同,AI ASIC从设计之初便围绕矩阵运算、并行处理等AI核心需求进行架构优化,使硬件结构与算法高度融合,形成了“算法-芯片”协同优化的技术范式。

以云天励飞的DeepEdge10为例,该芯片采用14nm Chiplet工艺,集成自主设计的神经网络处理器(NNP400T),通过D2D Chiplet技术实现8T - 256T的算力覆盖,能够支持7B至130B参数规模的大模型边缘端推理。在智慧交通场景中,这种设计使芯片将目标检测延迟降低至5ms以内,功耗相较于GPU方案减少了60%,充分展现了AI ASIC在特定场景下的优势。

技术突破:ASIC的四大核心优势

ASIC通过去除通用芯片中的冗余功能模块,实现了计算效率的巨大提升。谷歌TPU v5的实测数据表明,其能效比达到英伟达H100的1.43倍;在BERT模型推理任务中,每瓦特性能提升了3.2倍。这一优势得益于ASIC的三大设计原则:其一,算力密度优化,采用3D堆叠技术提高晶体管密度;其二,电压域精细管理,通过动态电压频率调整(DVFS)降低闲置功耗;其三,内存墙突破,集成HBM3e内存,带宽高达1.2TB/s。

在量产阶段,ASIC的单位算力成本展现出显著优势。亚马逊Trainium2的测算显示,其训练成本相较于GPU方案降低了40%,推理成本下降了55%。在万卡级集群部署中,这种成本优势更为突出:构建10万卡集群时,ASIC方案可节省初始投资约12亿美元,进一步凸显了ASIC在成本控制方面的潜力。

架构创新方面,ASIC也取得重大突破。云天励飞提出的“算力积木”架构,通过标准化计算单元(如4TOPS的NPU核心)的灵活组合,实现了从8T到256T的算力弹性扩展。该架构支持7B、14B、130B等不同规模模型的边缘部署。在深圳地铁人脸识别系统中,它实现了98.7%的准确率,同时保持15W的低功耗,为架构创新提供了成功范例。

生态协同效应在ASIC领域也日益显著。头部企业正在构建“芯片-算法-应用”的垂直生态。寒武纪推出的MLU370 - X8芯片,配套Cambricon Neuware软件栈,提供了从模型量化到部署的全流程工具链,将模型转换时间从小时级压缩至分钟级,有力推动了生态协同发展。

AI ASIC:应用场景与产业格局

AI ASIC凭借其独特优势,在多个领域实现了广泛应用,应用场景从云端到边缘全域深度渗透,全球产业格局也在不断演变。

在智慧城市基础设施方面,以深圳龙岗区的智慧交通项目为例,云天励飞的ASIC芯片为2000路摄像头的实时分析提供了强大支持,日均处理10亿帧图像,将事故响应时间从3分钟大幅缩短至20秒。其边缘计算架构通过本地化处理,避免了1.2PB/天的数据上传,年节省带宽成本超千万元,展现了在智慧城市建设中的重要作用。

工业自动化领域,博创科技PLC芯片在汽车生产线上的应用表明,ASIC方案将运动控制延迟从500μs降至80μs,满足了0.1mm级定位精度要求。在三一重工的智能工厂中,ASIC驱动的视觉检测系统实现了每分钟120件的检测速度,缺陷检出率高达99.97%,为工业自动化升级提供了有力支撑。

消费电子领域,小米14 Ultra手机搭载的ASIC影像芯片,通过定制化ISP架构实现了4K 120fps视频的实时HDR处理,功耗较前代降低了35%。在OPPO Find X8中,ASIC芯片支持的AI降噪算法将暗光拍摄噪点减少了62%,动态范围提升了4档,提升了消费电子产品的性能和用户体验。

从产业格局来看,国际巨头积极布局。博通凭借55% - 60%的市场份额领跑全球,其为谷歌设计的TPU系列已迭代至第七代Ironwood,采用3nm工艺,算力达到42.5 EFLOPS,较前代提升了300%。Marvell的定制计算产品线覆盖AI加速、安全加密等六大领域,客户包括亚马逊、微软等顶级云厂商,展现出国际巨头在ASIC领域的强大实力。

中国企业也在迅速崛起。寒武纪的思元590芯片采用7nm工艺,集成512TOPS算力。在MLPerf基准测试中,ResNet50模型推理吞吐量达到每秒3800张图像。云天励飞与深圳国创合作的具身智能机器人,搭载自研ASIC芯片,实现了每秒45万亿次计算的实时环境感知,彰显了中国企业在ASIC领域的创新能力和发展潜力。

生态协同创新方面,中国企业也在不断推进。芯原股份推出的“IP Power House”模式,提供了从芯片设计到量产的全流程服务,其NPU IP已被12家客户的26款芯片采用。在华为昇腾生态中,ASIC芯片与MindSpore框架深度适配,将模型训练效率提升了40%,推动了中国ASIC产业生态的完善。

总结

行业普遍共识认为,未来十年AI计算将呈现“GPU + ASIC”的混合架构特征。黄仁勋在斯坦福大学的演讲中指出,到2035年,机器人系统将产生现有大模型10万倍的数据量,这需要ASIC在边缘端提供每秒百万亿次级的实时计算能力。吴雄昂预测,2030年ASIC与GPU将在AI芯片市场平分秋色,形成技术生态的平衡发展。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    湘军,让变成生产

    脑极体
    发布于 :2025年11月25日 22:56:58

    国产芯片真的 “稳” 了?这家企业的 14nm 制程,已经悄悄渗透这些行业…

    最近扒了扒国产芯片的进展,发现中芯国际(官网链接:https://www.smics.com)的 14nm FinFET 制程已经不是 “实验室技术” 了 —— 消费电子的中端处理器,汽车电子
    发表于 11-25 21:03

    国产AI芯片真能扛住“内卷”?海思昇腾的这波操作藏了多少细节?

    最近行业都在说“AI的命门”,但国产芯片真的能接住这波需求吗? 前阵子接触到海思昇腾910B,实测下来有点超出预期——7nm工艺下
    发表于 10-27 13:12

    MediaTek发布天玑座舱S1 Ultra芯片

    MediaTek 3nm 旗舰座舱芯片——天玑 座舱 S1 Ultra 正式亮相,以先进的生成式 AI 技术和卓越的 3nm 制程,带来远超同级的
    的头像 发表于 10-23 11:39 619次阅读

    台积电预计对3nm涨价!软银豪掷54亿美元收购ABB机器人部门/科技新闻点评

    在十一黄金周和国庆假期后第一天工作日,科技圈接连发生三件大事:1、台积电预计将对3nm实施涨价策略;2、日本巨头软银宣布54亿美元收购ABB机器人部门;3、AMD和OPen AI达成巨额
    的头像 发表于 10-09 09:51 9558次阅读
    台积电预计对<b class='flag-5'>3nm</b>涨价!软银豪掷54亿美元收购ABB机器人部门/科技新闻点评

    睿海光电领航AI光模块:超快交付与全场景兼容赋时代——以创新实力助力全球客户构建高效底座

    到全场景兼容,800G量产突破1.6T前瞻布局,睿海光电始终以客户需求为导向,以技术创新为引擎,为全球AI基础设施建设提供坚实底座。凭借智能制造实力与开放生态策略,睿海光电正携手合
    发表于 08-13 19:03

    存储:首款2nm定制SRAM来了!

    电子发烧友网综合报道,Marvell 美满电子当地时间 17 日宣布推出业界首款 2nm 定制 SRAM,可为 AI xPU 设备提供至高 6Gb(即 768MB)的高速片上缓存。
    的头像 发表于 06-21 00:57 7169次阅读

    台积电2nm良率超 90%!苹果等巨头抢单

    当行业还在热议3nm工艺量产进展时,台积电已经悄悄把2nm技术推到了关键门槛!据《经济日报》报道,台积电2nm芯片良品率已突破 90%,实现重大技术飞跃!
    的头像 发表于 06-04 15:20 885次阅读

    云端终端:RAKsmart服务器构筑AI云平台智慧城市全栈解决方案

    传统服务器方案常面临分散、运维复杂、比低等问题,导致AI算法难以高效落地。而RAKsmart服务器凭借其技术创新与全栈服务能力,正在
    的头像 发表于 05-09 09:47 483次阅读

    突破14nm工艺壁垒:天准科技发布TB2000晶圆缺陷检测装备

    TB2000已正式通过厂内验证,将于SEMICON 2025展会天准展台(T0-117)现场正式发布。 这标志着公司半导体检测装备已具备14nm及以下先进制程的规模化量产检测能力。这是继TB1500突破40nm节点后,天准在高端
    的头像 发表于 03-26 14:40 628次阅读

    DeepSeek推动AI需求:800G光模块的关键作用

    集群的部署过程中,带宽瓶颈成为制约发挥的关键因素,而光模块的速率跃升成为突破这一瓶颈的核心驱动力。 光模块速率跃升 随着
    发表于 03-25 12:00

    此芯首款高AI SoC芯片P1:性能与应用全解析

    此芯推出首款高AI SOC芯片P1,采用6nm工艺,集成45TOPS AI
    的头像 发表于 03-14 16:32 1361次阅读
    此芯首款高<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>AI</b> SoC芯片P1:性能与应用全解析

    台积电加大亚利桑那州厂投资,筹备量产3nm/2nm芯片

    据最新消息,台积电正计划加大对美国亚利桑那州工厂的投资力度,旨在推广“美国制造”理念并扩展其生产计划。据悉,此次投资将着重于扩大生产线规模,为未来的3nm和2nm等先进工艺做准备。
    的头像 发表于 02-12 17:04 937次阅读

    消息称台积电3nm、5nm和CoWoS工艺涨价,即日起效!

    )计划2025年1月起对3nm、5nm先进制程和CoWoS封装工艺进行价格调整。 先进制程2025年喊涨,最高涨幅20% 其中,对3nm、5nm
    的头像 发表于 01-03 10:35 1021次阅读