0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AI大模型需求持续激增,中国AI芯片如何?

章鹰观察 来源:电子发烧友 作者:章鹰 2024-02-24 09:07 次阅读

2月21日,英伟达(Nvidia)公布截止到2024年1月28日的第四季度营收,收入达到221亿美元,比较上一季度增长22%,较去年同期增长265%。英伟达2024财年收入增长126%,达到609亿美元。

wKgZomXb5ICASzjqAADUIV0l9xQ214.jpg
在公布强劲财报后,Nvidia周四股价飙升16%,市值增加约2770亿美元,令其总市值接近2万亿美元。击败Facebook母公司Meta Platform在今年2月早前达到的1,960亿美元,成为华尔街史上单日市值增加最多的企业。
wKgZomXb5IeACoF-AAFfas9ULQw284.jpg
Nvidia创始人兼首席执行官黄仁勋表示:“加速计算和生成式AI已经达到一个转折点。全球企业、行业和各个国家的需求都在激增。由于生成式AI以及整个行业从中央处理器转向英伟达制造的加速器,对英伟达GPU的需求将保持高位。”

摩根士丹利分析师Joseph Moore表示,Nvidia的表现超过预期,直到几个季度前,我们从未见过超过20亿美元的季度收入指引,但在AI激增期间,这已经成为常规。AI需求的强劲持续令人瞩目。

2022年10月和2023年10月,美国商务部工业和安全局(BIS)两次更新对中国的先进半导体和计算设备的出口管制,英伟达中国特供版GPU产品A800、H800芯片均已经于去年11月17日起在中国禁售。除此之外,AMD发布的性能最强的MI300X、MI300A、MI250X也不能卖到中国。在ChatGPT、AI大模型带动下各国算力需求激增,中国芯片厂商如何挖掘这个市场的商机?本文进行主要的分析。

阿里云平头哥

2023年的云栖大会上,阿里巴巴集团董事会主席蔡崇信阐释了阿里云的新愿景:“打造AI时代最开放的云”。 他表示,随着AI大模型技术的迅速发展,智能化时代正在开启,AI将成为各行各业的新型生产力,并对算力提出更高要求。

成立于2018年的阿里平头哥,正处于云计算的拐点之上。这是一家阿里巴巴全资的半导体芯片公司,业务主体拥有端云一体全栈产品系列,涵盖数据中心芯片、IoT 芯片、处理器 IP 授权等,实现芯片端到端设计链路全覆盖。

阿里平头哥 2019 年 9 月推出了其首款高性能人工智能推理芯片──含光800,基于 12nm 制程与自研架构,整合 170 亿晶体管,性能峰值算力达 820 TOPS。 在业界标准的 ResNet-50测试中,推理性能达到 78563 IPS,能效比达 500 IPS/W。

2023 年 8 月,阿里平头哥发布了首个自研 RISC-V AI 平台,支持运行 170 余个主流 AI 模型,推动 RISC-V 进入高性能 AI 应用时代。同时,平头哥宣布玄铁处理器 C920 全新升级,C920 执行 GEMM(矩阵的矩阵乘法) 计算较 Vector 方案可提速 15 倍。
wKgZomXb5JKAaWOAAADi7Es3yt4134.jpg
11月21日,平头哥玄铁RiSC-V上新了三款处理器:首次实现AI矩阵扩展的C907、满足Vector1.0标准的C920,以及实时处理器R910,将加速推动RiSC-V在自动驾驶、人工智能、企业级SSD网络通信等场景和领域的大规模商用落地。C920较上一代提升了最高3.9倍的AI性能,可以跑Transformer模型,适合机器学习、自动驾驶领域。

华为昇腾910系列

Nvidia在最新提交给美国证券交易所的一份档案,认定华为是AI芯片领域的主要竞争对手。Nvidia指出,与华为在AI芯片领域进行竞争,包括GPU、CPU网络芯片。

在2018 全联接大会上,华为提出 AI 战略和全栈全场景 AI 解决方案,并发布了 2 颗全新的 AI 芯片:昇腾 910(Ascend 910)和昇腾 310(Ascend 310)。


两款 AI 芯片均基于华为自研达芬奇架构,其中 Ascend 910(用于训练)采用 7nm 制程,半精度达256TFOPs,功耗为 350W,运算密度号称超越了 NVIDIA Tesla V100 和Google TPU v3。

Nvidia在2020 年和 2022 年推出了 A100 和 H100 芯片,占据了全球 AI 芯片市场的最大份额,华为昇腾910B据称采用的是7nm制程。业界认为,华为昇腾 910B 能力已经基本做到可对标 Nvidia A100。

华为计算官网显示,基于昇腾 910(Ascend 910)和昇腾 310(Ascend 310),华为还推出了Atlas AI 计算解决方案。华为目前 Atlas 300T 产品有三个型号,分别对应升腾 910A、910B、910 Pro B,最大 300W 功耗,前两者 AI 算力均为 256 TFLOPS,而 910 Pro B 可达 280 TFLOPS(FP16)。

此前路透社的报道,国内搜索巨头百度向华为下了订单,购买昇腾910B用于AI服务器。

最新中国移动智算中心AI服务器采购大单,华为昇腾再次成为赢家。此次四家中标候选人中,河南昆仑为超聚变全资子公司,与华鲲振宇、烽火通信(控股子公司长江计算)、神州数码均为华为昇腾认证的合伙伙伴。

百度昆仑芯3代

百度集团执行副总裁、百度ACG(智能云事业群)总裁沈抖表示,未来所有的企业都会强依赖大模型,而且所有的产品都会基于大模型来开发。

昆仑芯1代AI芯片于2020年量产,在百度搜索引擎、小度等业务中部署数万片,是国内唯一一款经历过互联网大规模核心算法考验的云端AI芯片。昆仑芯2代AI芯片于2021年8月量产,是国内首款采用GDDR6显存的通用AI芯片,相比昆仑芯1代AI芯片性能提升2-3倍,且在通用性、易用性方面也有显著增强。

而昆仑芯2代则采用了TSMC 7nm工艺,性能和功耗都有显著提升。昆仑芯3代则大概率采用了7nm+ EUV工艺,进一步提升了性能和功耗比。此前,百度李彦宏的宣布第三代昆仑芯片将于2024年初上市。

寒武纪推出思元370、590系列及加速卡

2022年,寒武纪首颗训推一体的Chiplet智能芯片思元370及系列加速卡初次亮相WAIC,思元370是寒武纪第三代云端产品,采用7nm制程工艺,最大算力高达256TOPS(INT8),是寒武纪第二代云端推理产品思元270算力的2倍。同时,思元370芯片支持LPDDR5内存,内存带宽是思元270的3倍,可在板卡有限的功耗范围内给人工智能芯片分配更多的能源,输出更高的算力。

而寒武纪在2016年成立,专注于人工智能芯片产品的研发与技术创新,提供云边端一体、软硬件协同、训练推理融合、具备统一生态的系列化智能芯片产品和平台化基础系统软件,产品广泛应用于服务器厂商和产业公司。

据悉,寒武纪最新一代思元590在性能上对标英伟达A100、A800,有可能在2024年上半年量产,成为国产替代的备选之一。

近年来寒武纪陆续推出思元、玄思等芯片/加速卡产品系列。 在目前AI算力建设大爆炸时期,特别是高端进口算力芯片受限下,国产替代的需求或让寒武纪公司的芯片在算力时代抢得一定的市场份额。

沐曦:推出人工智能推理GPU曦思N100和通用计算芯片曦云C500

沐曦集成电路公司于2020年在上海成立,致力于为异构计算提供安全可靠的GPU芯片及解决方案,打造全栈GPU芯片产品。

2022年,沐熙集成电路推出了曦思N100,现处于规模化量产和大规模出货状态。曦思N100是沐曦面向人工智能推理场景推出的高效能GPU产品,内置 MXN100 异构 GPGPU 处理器以及 HBM2E 显存,单卡算力达 160TOPS(INT8)和 80TFLOPS(FP16),能够提供最高 128 路编码和 96 路解码的视频处理能力,兼容 HEVC、H.264、AV1、AVS2 等多种视频格式,最高支持 8K 分辨率。

此外,沐曦首款面向人工智能训练及通用计算的旗舰产品曦云C500在2023年6月流片,这款芯片基于自研的高性能GPU IP,特别适合千亿参数AI大模型的训练和推理,能够提供构建高密度算力和云计算部署的优秀国产GPU解决方案,在2023年底实现规模量产。

小结:

分析师估计中国人工智能芯片市场价值70亿美元。目前在大模型推理方面,国内 AI 芯片910B仅能达到Nvidia公司A100的60%-70%左右,集群的模型训练难以为继。而就在2月21日,Nvidia CEO黄仁勋向媒体表示,英伟达目前正在向客户提供两款面向中国市场的新型人工智能(AI)芯片样品,以在美国采取对华芯片出口管制措施的背景下维持该公司在中国市场的地位。

此外,除了华为昇腾外,寒武纪、沐曦、天数智芯都公布过AI训练及推理芯片,但是AI芯片生态尚未有效建立,和Nvidia CUDA生态对比,还有不少短板。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    26459

    浏览量

    264085
收藏 人收藏

    评论

    相关推荐

    risc-v多核芯片AI方面的应用

    RISC-V多核芯片AI方面的应用主要体现在其低功耗、低成本、灵活可扩展以及能够更好地适应AI算法的不同需求等特点上。 首先,RISC-V适合用于高效设计实现,其内核面积更小,功耗更
    发表于 04-28 09:20

    防止AI模型被黑客病毒入侵控制(原创)聆思大模型AI开发套件评测4

    ,应用场景和安全需求会有所不同。我会帮助客户构建安全的 AI模型。上面的只是一些基本的安全措施,在实际中我可以利用eFPGA芯片对上述的功能进行加速,下面我编写一个加速代码: //
    发表于 03-19 11:18

    AI模型远程控制启动车辆(原创)

    AI模型
    还没吃饭
    发布于 :2024年03月18日 15:18:29

    使用cube-AI分析模型时报错的原因有哪些?

    使用cube-AI分析模型时报错,该模型是pytorch的cnn转化成onnx ``` Neural Network Tools for STM32AI v1.7.0 (STM.
    发表于 03-14 07:09

    台积电:AI芯片先进封装需求强劲,供不应求将持续至2025年

    近日,台积电在法人说明会上表示,由于人工智能(AI芯片先进封装需求持续强劲,目前产能无法满足客户的需求,供不应求的状况可能延续到2025年
    的头像 发表于 01-22 15:59 379次阅读

    AI模型可以取代大学教育吗?

    AI模型
    电子发烧友网官方
    发布于 :2024年01月02日 16:27:52

    AI模型怎么解决芯片过剩?

    AI模型
    电子发烧友网官方
    发布于 :2024年01月02日 15:42:05

    AI模型会不会取代电子工程师?

    AI模型
    电子发烧友网官方
    发布于 :2024年01月02日 15:11:43

    AI模型可以设计电路吗?

    AI模型
    电子发烧友网官方
    发布于 :2024年01月02日 15:09:29

    #芯片 #AI 世界最强AI芯片H200性能大揭秘!

    芯片AI
    深圳市浮思特科技有限公司
    发布于 :2023年11月15日 15:54:37

    【KV260视觉入门套件试用体验】Vitis AI 构建开发环境,并使用inspector检查模型

    FFT运算(Vivado) 四、硬件加速之—使用PL加速矩阵乘法运算(Vitis HLS) 五、Vitis AI 构建开发环境,并使用inspector检查模型 六、Vitis AI 进行模型
    发表于 10-14 15:34

    盘古ai模型用的什么芯片

    盘古ai模型用的什么芯片? 盘古AI模型是一种基于深度学习算法的人工智能技术,它是由中国互联
    的头像 发表于 08-31 09:01 2412次阅读

    全球AI招聘需求激增21倍 三六零加码9大类别岗位招聘

    自年初 ChatGPT 爆火后,入局大模型已成为科技公司的新赛道。百模大战开启,大模型技术的持续研发也促使AI行业人才需求大增。
    的头像 发表于 08-25 15:35 190次阅读
    全球<b class='flag-5'>AI</b>招聘<b class='flag-5'>需求</b><b class='flag-5'>激增</b>21倍 三六零加码9大类别岗位招聘

    中国模型为什么更关注产业?#AI技术 #大模型 #AI产业

    ai技术
    脑极体
    发布于 :2023年05月30日 12:08:54

    中国开源未来发展峰会“问道 AI 分论坛”即将开幕!

    过去几个月,AI 几乎已经成为全民热议的话题。各式开源大模型、训练框架层出不穷;AI 技术也加速应用在各个领域和行业,例如服务运营优化、解决供应链问题等等;数据库、云计算、大前端等多类技术领域产品
    发表于 05-09 09:49