0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

大算力芯片面临的技术挑战和解决策略

亿铸科技 来源:亿铸科技 2024-10-23 14:50 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

在湾芯展SEMiBAY2024《HBM与存储器技术与应用论坛》上,亿铸科技创始人、董事长兼CEO熊大鹏发表了题为《超越极限:大算力芯片面临的技术挑战和解决策略》的演讲。

熊大鹏博士提出,在AI大模型技术的推动下,算力迎来需求拐点,硬件架构将成为满足算力需求的关键路径之一,未来算力增长将以存储单元为中心

大模型时代的机遇与挑战

在AI大模型时代,随着数据、算力、参数量的不断提升,模型能力显著增强。熊大鹏博士指出,大模型已经从量变逐渐演变为质变,当模型体量足够大时,会出现类似人类“开悟”的涌现能力,大模型的推理能力将显著提升。这一变化预示着AI应用的最后一公里即将打通,业务落地将推动对AI计算能力的需求迎来拐点。

Omdia最新报告《云计算和数据中心人工智能处理器预测》显示,用于云计算和数据中心人工智能的GPU和其他加速芯片的市场规模已从2022年的不到100亿美元增长到2024年的780亿美元,并预计到2029年将达到1510亿美元。然而,2026年市场可能会出现一个明显的拐点,增长动力将从技术采用转向人工智能应用需求的变化。

此外,IDC预测,未来的人工智能服务器将注重提高计算能力和处理效率(能效比),以适应更复杂、更大规模的人工智能应用。预计到2027年,用于推理的AI算力占比将达到72.6%,未来有望达到95%为推理,5%为训练。

应用落地需要硬件架构突破

然而,现有的芯片硬件性能提升速度已难以满足算法模型急剧增长的算力需求。摩尔定律,这个曾经指导半导体行业发展的黄金法则,如今正面临前所未有的挑战。国信证券经济研究所报告指出,大模型参数规模每18个月增长35倍,而摩尔定律下的芯片仅增长2倍。因此,探索和发展新的硬件架构成为算力突破的关键路径之一。

熊大鹏博士强调,在现有的硬件架构下,目前AI芯片面临着“三堵墙”问题:存储墙、能耗墙和编译墙。存储墙是指存储器的数据访问速度跟不上计算单元的数据处理速度,导致性能瓶颈的问题。

同时,由于存储墙的存在则带来了能耗墙和编译墙的问题。能耗墙是指随着芯片性能的提升,能耗和散热问题成为限制进一步性能提升的主要因素。编译墙则是随着AI模型的复杂性增加,编译器需要处理的数据量和计算任务也急剧增加,这使得静态编译优化变得非常困难,手动优化又消耗了大量时间和成本。

存算一体开启算力第二增长曲线

面对这一挑战,亿铸科技选择创新,用“存算一体超异构”架构这一全新的芯片设计思路,极大地减少了数据搬运的延迟,提升了整体的计算效率和能效比。

熊大鹏博士指出,想要打破AI芯片“三堵墙”,就需要从算力的第一性原理(阿姆达尔定律)来着手,将数据搬运量大幅下降,使得F值接近于0,才能保证有效算力密度线性增长。目前业内主要存在两种解决方式:一种是存内计算,另一种是近存计算。

存内计算是通过将存储和计算功能融合,减少数据搬运延迟,提升性能和能效。在理想状态下,F=0,能够实现存储与计算无缝融合。近存计算则是将存储单元和计算单元通过先进封装集成在一起,增加访存带宽、减少数据搬移时延,以提升整体计算效率。

熊大鹏博士强调,通过存算一体架构等技术,可以突破传统计算模式的瓶颈,实现更高的有效算力,打破有效算力的天花板。未来,以算力单元为中心的时代即将结束,算力第二增长曲线将以存储单元为中心。

熊大鹏博士表示,亿铸科技自成立以来,始终致力于通过存算一体,提供贡献更具性价比、更高能效比、更大算力发展空间的AI大算力芯片发展新路径。2023年3月,面对ChatGPT等大模型带来的AI算力挑战,亿铸科技首次提出“存算一体超异构”,为大模型时代AI大算力芯片发展提供全新思路。

未来,随着AI技术的不断进步,算力的需求也在不断增长。亿铸科技将通过创新的存算一体架构,为AI芯片的发展提供新的方向。在大模型时代,亿铸科技的技术和产品将为AI技术的发展提供强大的支持,推动整个行业向前发展。随着亿铸科技技术的不断成熟和应用的不断扩展,我们有理由期待,AI芯片技术将迎来一个新的发展阶段,为科技进步做出更大的贡献!

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    462

    文章

    53539

    浏览量

    459160
  • 算力
    +关注

    关注

    2

    文章

    1385

    浏览量

    16566
  • 亿铸科技
    +关注

    关注

    0

    文章

    32

    浏览量

    1722

原文标题:亿新闻 | 湾芯展演讲回顾:以AI芯片架构创新,迎接算力增长新拐点

文章出处:【微信号:亿铸科技,微信公众号:亿铸科技】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    湘军,让变成生产

    脑极体
    发布于 :2025年11月25日 22:56:58

    IP广域网助力互联网建设进入快车道

    人工智能大模型等应用爆发式发展带动了智能需求激增,全国各地纷纷建设大量智中心。在迎来新机遇的同时,力行业也面临数据安全、提高企业用
    的头像 发表于 09-25 10:40 494次阅读

    FOPLP工艺面临挑战

    FOPLP 技术目前仍面临诸多挑战,包括:芯片偏移、面板翘曲、RDL工艺能力、配套设备和材料、市场应用等方面。
    的头像 发表于 07-21 10:19 1144次阅读
    FOPLP工艺<b class='flag-5'>面临</b>的<b class='flag-5'>挑战</b>

    【「芯片 | 高性能 CPU/GPU/NPU 微架构分析」阅读体验】+NVlink技术从应用到原理

    工作者身份的转变期),便对这项技术深深痴迷,但当时主流的RTX20系列,需要2080级别以上的才支持,鉴于个人实力,便将目光放在了9系卡上,这也就是「芯片 | 书中讲的pascal
    发表于 06-18 19:31

    AI 时代来袭,手机芯片面临哪些新挑战

    边缘AI、生成式AI(GenAI)以及下一代通信技术正为本已面临高性能与低功耗压力的手机带来更多计算负载。领先的智能手机厂商正努力应对本地化生成式AI、常规手机功能以及与云之间日益增长的数据传输需求
    的头像 发表于 06-10 08:34 942次阅读
    AI 时代来袭,手机<b class='flag-5'>芯片面临</b>哪些新<b class='flag-5'>挑战</b>?

    AIGC基础设施技术架构与行业实践

    AIGC基础设施技术架构与行业实践 一、硬件层:AI的物理载体 芯片
    的头像 发表于 05-29 07:44 604次阅读
    AIGC<b class='flag-5'>算</b><b class='flag-5'>力</b>基础设施<b class='flag-5'>技术</b>架构与行业实践

    中国为何同时面临过剩与短缺 ?

    中国为何同时面临过剩与短缺 ?
    的头像 发表于 04-24 15:02 1024次阅读
    中国为何同时<b class='flag-5'>面临</b><b class='flag-5'>算</b><b class='flag-5'>力</b>过剩与短缺 ?

    芯片的生态突围与革命

    电子发烧友网报道(文 / 李弯弯)大芯片,即具备强大计算能力的集成电路芯片,主要应用于高性能计算(HPC)、人工智能(AI)、数据中心、自动驾驶等需要海量数据并行计算的场景。随着
    的头像 发表于 04-13 00:02 2611次阅读

    领域常用名词解释

    本文系统地整理和解释了领域中常用的数十个关键名词,并按照以下维度进行了分类:基础概念、系统架构、硬件架构、基础运算类型、计算模式、相关软件架构与部署模式、浮点精度格式、
    的头像 发表于 04-07 11:21 1209次阅读
    <b class='flag-5'>算</b><b class='flag-5'>力</b>领域常用名词解释

    维谛技术(Vertiv)发布兆瓦级UPS新品,破局高密AI负载供电挑战

    在AI时代,数据中心需要什么样的供电系统?随着AIGC业务需求的快速发展,导致机柜功率密度迅速增加,高密负载对数据中心的影响正日益加大。作为关键环节的供电系统,正面临
    的头像 发表于 04-03 11:01 955次阅读
    维谛<b class='flag-5'>技术</b>(Vertiv)发布兆瓦级UPS新品,破局高密AI<b class='flag-5'>算</b><b class='flag-5'>力</b>负载供电<b class='flag-5'>挑战</b>

    DeepSeek对芯片的影响

    DeepSeek模型,尤其是其基于MOE(混合专家)架构的DeepSeek-V3,对芯片的要求产生了深远影响。为了更好地理解这一影响,我们可以从几个方面进行分析。一.MOE架构对
    的头像 发表于 02-07 10:02 1624次阅读
    DeepSeek对<b class='flag-5'>芯片</b><b class='flag-5'>算</b><b class='flag-5'>力</b>的影响

    中心的如何衡量?

    作为当下科技发展的重要基础设施,其的衡量关乎其能否高效支撑人工智能、大数据分析等智能应用的运行。以下是对智中心算衡量的详细阐述:一、
    的头像 发表于 01-16 14:03 4212次阅读
    <b class='flag-5'>算</b>智<b class='flag-5'>算</b>中心的<b class='flag-5'>算</b><b class='flag-5'>力</b>如何衡量?

    国内汽车芯片面临挑战及发展建议

    摘 要 随着汽车向电动化、智能化加速发展,汽车产业链、供应链、价值链重塑,以芯片为主的零部件重要性日益凸显。从技术角度看,大 智能驾驶和智能座舱计算
    的头像 发表于 01-02 10:50 6309次阅读
    国内汽车<b class='flag-5'>芯片面临</b>的<b class='flag-5'>挑战</b>及发展建议

    AMD MI300X AI芯片面临挑战

    近日,据芯片顾问机构Semianalysis经过5个月的深入调查后指出,AMD最新推出的“MI300X”AI芯片在软件缺陷和性能表现上未能达到预期,因此在挑战NVIDIA市场领导地位方面显得
    的头像 发表于 12-25 10:57 1124次阅读