0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

不堪忍受英伟达霸权,微软、OpenAI纷纷自研AI芯片

科技云报到 来源:jf_60444065 作者:jf_60444065 2023-10-11 14:25 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

科技云报道原创。

英伟达是当之无愧的“AI算力王者”,A100、H100系列芯片占据金字塔顶尖位置,是ChatGPT这样的大型语言模型背后的动力来源。

但面对英伟达的独霸天下,科技巨头们都纷纷下场自研AI芯片。

10月6日,媒体援引知情人士消息称,微软计划在下个月的年度开发者大会上推出首款为人工智能设计的芯片,来降低成本并减少对英伟达的依赖。

同一天,据媒体消息显示,ChatGPT开发商OpenAI也正在探索AI芯片的可能性,并已评估潜在的收购目标,以加速自研芯片的研发。

事实上,不仅是微软、OpenAI试图自研AI芯片,AWS、谷歌、Meta等科技巨头都已下场自研。

在酝酿数年后,这是否意味着英伟达的独霸时代即将结束?

巨头纷纷自研AI芯片

目前,包括谷歌、AWS、阿里巴巴、百度、华为等国内外云服务大厂都已有自研 AI 芯片用于数据中心,微软和Meta也有相关计划。所以对于头部的AI技术大厂来说,自研AI芯片已经是一大趋势。

微软早就自研芯片

作为全球头部云厂商,微软Azure需要大量AI处理器。尤其是和OpenAI合作以后,有消息称微软至少订购了数十万颗英伟达芯片。

因此,这几年微软在芯片研发上加快了进程,先是建立由前英特尔高管Rani Borkar领导的芯片部门;后又各处招兵买马,其中就包括前苹果芯片架构师Filippo;此外还和AMD展开了密切合作。

自2019年以来,微软就开始研发一款名为"雅典娜"(Athena)的定制AI芯片,用于为大型语言模型提供动力,目前已在测试阶段。

Athena的首个目标是为OpenAI提供算力引擎,以替代昂贵的英伟达A100/H100。如果明年大规模推出,Athena将允许微软内部和OpenAI的团队同时训练和推理模型。

SemiAnalysis的分析师迪伦·帕特尔(Dylan Patel)表示,开发类似于雅典娜的芯片可能每年需要花费1亿美元左右,ChatGPT每天的运营成本约70万美元,大部分成本来源于昂贵的服务器,如果雅典娜芯片与英伟达的产品拥有同等竞争力,每个芯片的成本将可以降低三分之一。

有知情人爆料,微软在芯片研发上已砸入了近20亿美元。

OpenAI计划收购

据媒体消息称,OpenAI也正在探索制造自研人工智能芯片,并已开始评估潜在的收购目标。

报道称,至少从去年开始,OpenAI就已讨论各种方案,以解决AI芯片短缺问题。

OpenAI已将获取更多AI芯片列为公司首要任务,讨论方案包括自研AI芯片,与包括英伟达在内的其他芯片制造商更密切地合作,以及在英伟达之外实现供应商多元化。

谷歌最早自研TPU芯片

早在2013年,谷歌就已秘密研发一款专注于AI机器学习算法的芯片,并将其用在内部的云计算数据中心中,以取代英伟达的GPU

2016年5月,这款自研芯片公诸于世,即TPU。TPU可以为深度学习模型执行大规模矩阵运算,例如用于自然语言处理、计算机视觉和推荐系统的模型,其最初专为谷歌的超级业务云计算数据中心而生。

2020年,谷歌实际上已在其数据中心部署了人工智能芯片TPU v4。

AWS推出训练和推理芯片

从2013年推出首颗Nitro1芯片至今,AWS是最先涉足自研芯片的云厂商,已拥有网络芯片、服务器芯片、人工智能机器学习自研芯片3条产品线。

2018年初,科技媒体Information爆料亚马逊已经开始设计定制AI芯片。

AWS自研AI芯片版图包括推理芯片Inferentia和训练芯片Trainium。2018年底,AWS推出自研AI推理芯片Inferentia,可以以低成本在云端运行图像识别、语音识别、自然语言处理、个性化和欺诈检测等大规模机器学习推理应用程序。

2020年底,AWS推出专用于训练机器学习模型的Trainium。

2023年初,专为人工智能打造的Inferentia 2发布。Inf2实例最多可支持1750亿个参数,这使其成为大规模模型推理的有力竞争者。

在AWS、微软和谷歌这三家中,亚马逊是唯一一家在服务器中提供两种类型芯片(标准计算芯片和用于训练与运行机器学习模型的专用芯片)的云提供商,其在2015年收购以色列芯片设计公司Annapurna Labs为这些努力奠定了基础。

Meta基于RISC-V开源架构自研

直到2022年,Meta Platforms还主要使用CPU和专为加速AI算法而设计的定制芯片组合来运行其AI工作负载。

后来,Meta取消了于2022年大规模推出定制芯片的计划,转而订购了价值数十亿美元的英伟达GPU。

如今为了扭转局面,Meta已经在开发内部芯片,并于5月19日公布了AI训练与推理芯片项目。

据介绍,MTIA芯片的功耗仅为25瓦,占英伟达等市场领先供应商芯片功耗的一小部分,并使用了RISC-V(第五代精简指令处理器)开源架构。

值得注意的是,Meta于5月初收购了英国AI芯片独角兽Graphcore的AI网络技术团队,为其自研AI芯片奠定了基础。

英伟达能否被撼动?

埃森哲公司报告指出,如今技术行业的AI渗透度明显高出其他行业,而未来企业的成长潜力取决于其能在多大程度上应用生成式AI。更关键的是,熟练运用新技术也将成为国家发展的关键。

如今,AI技术在数据中心、智能汽车、游戏等的应用落地方面取得了丰硕的成果,要实现AI大规模应用,背后必定要有大量AI芯片的算力支持。

数据显示,英伟达的GPU是全球应用最为广泛的 AI 芯片。

英伟达独立GPU市场份额达80%,在高端GPU市场份额高达90%。2020年,全世界跑AI的云计算与数据中心,80.6%都由英伟达GPU驱动。2021年,英伟达表示,全球前500个超算中,大约七成是由英伟达芯片驱动的。

显而易见,英伟达已经垄断了全球算力。

随着AWS、谷歌、微软等巨头加入自研AI芯片的道路,英伟达的垄断地位是否能被撼动呢?

首先,芯片设计技术非常复杂。

高算力芯片的首要挑战就是其复杂度,从芯片设计角度,高性能计算芯片中的计算单元、存储访问以及芯片间的互联都是需要仔细考虑。

英伟达之所以引领GPU创新,源于其架构底座不断迭代,从2008年的Tesla架构到2020年的Ampere架构,每一次都是对硬件的升级与改进。代际之间产品性能提升显著,性能和市场份额均领先全球。

其次,不可一世的CUDA生态。

比造芯更难的是搭建生态,全球GPU生态都来自CUDA。

CUDA,是英伟达2006年推出的通用并行计算架构生态,使GPU能够解决复杂的计算问题。

毋庸置疑,CUDA是迄今为止最发达、最广泛的生态系统,也是深度学习库最有力的支持。

虽然有PyTorch支持更多GPU厂商,再加上OpenAI的Triton搅局,但无法撼动CUDA的统治地位。

随着人工智能领域的蓬勃发展,GPU和CUDA被从业者视为标配,使用GPU做加速计算已成为行业主流。虽然英伟达GPU本身硬件平台的算力卓越,但其强大的CUDA软件生态才是推升GPU计算生态普及的关键力量。

当前CUDA 广泛功能已与英伟达GPU硬件深度耦合,开发者早已熟悉其专有的编程语言CUDA,用于制作GPU驱动的应用程序。

如果换到其他厂商的定制芯片,就需要学习全新的软件语言了,如何说服开发者使用这些AI芯片呢?

最后,芯片的具体生产也是一个挑战。

如何确保芯片生产的良率,以及如何在高级封装和先进工艺节点产能仍然有可能紧张的几年内,获得足够的产能以量产,也是各大巨头需要解决的问题。

总体而言,想要撼动英伟达的垄断地位,并不是一朝一夕的事。各大科技巨头要想在AI算力芯片上突围,就必须在底座、专利、核心技术、人才建设、生态建设等各方面下大功夫。

【关于科技云报道】

专注于原创的企业级内容行家——科技云报道。成立于2015年,是前沿企业级IT领域Top10媒体。获工信部权威认可,可信云、全球云计算大会官方指定传播媒体之一。深入原创报道云计算、大数据、人工智能、区块链等领域。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 微软
    +关注

    关注

    4

    文章

    6752

    浏览量

    108081
  • 英伟达
    +关注

    关注

    23

    文章

    4115

    浏览量

    99616
  • AI芯片
    +关注

    关注

    17

    文章

    2164

    浏览量

    36869
  • OpenAI
    +关注

    关注

    9

    文章

    1249

    浏览量

    10279
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    中国AI芯片市场:华为将占半壁江山,英伟跌落,这家第二

    2026年华为将占据中国AI芯片市场50%的份额,成为该领域的绝对领导者。   目前,英伟(NVIDIA)以39%的市场份额位居中国AI
    的头像 发表于 12-07 11:04 9893次阅读
    中国<b class='flag-5'>AI</b><b class='flag-5'>芯片</b>市场:华为将占半壁江山,<b class='flag-5'>英伟</b><b class='flag-5'>达</b>跌落,这家第二

    英伟达到博通:OpenAI芯片版图浮出水面,开启推理效率革命

    吉瓦(GW)的定制AI芯片与网络系统机架。这一合作成为博通在AI时代端到端的技术实力,标志着其技术能力已实现从底层研发到大规模工程落地的完整闭环。         博通技术底座赋能,成Open
    的头像 发表于 10-15 09:05 8066次阅读
    从<b class='flag-5'>英伟</b>达到博通:<b class='flag-5'>OpenAI</b><b class='flag-5'>自</b><b class='flag-5'>研</b><b class='flag-5'>芯片</b>版图浮出水面,开启推理效率革命

    芯片霸主变身基建巨头:英伟千亿美元绑定OpenAI,首期部署明年上线

    人民币),并携手建设至少10吉瓦(GW)的人工智能数据中心。   这一合作不仅是科技史上最大规模的AI基础设施项目之一,更标志着英伟AI生态中角色的根本性转变——从单纯的硬件供应商
    的头像 发表于 09-24 09:35 8050次阅读
    <b class='flag-5'>芯片</b>霸主变身基建巨头:<b class='flag-5'>英伟</b><b class='flag-5'>达</b>千亿美元绑定<b class='flag-5'>OpenAI</b>,首期部署明年上线

    阿里神秘AI芯片曝光:多项参数超越英伟A800

    电子发烧友网报道(文/梁浩斌)今年8月底传出阿里巴巴开发新AI芯片的消息后,这款芯片一直非常神秘,没有太多详细的性能参数信息。根据此前曝光的消息,阿里
    的头像 发表于 09-18 09:46 8908次阅读
    阿里神秘<b class='flag-5'>AI</b><b class='flag-5'>芯片</b>曝光:多项参数超越<b class='flag-5'>英伟</b><b class='flag-5'>达</b>A800

    成功点亮并上车!对标Orin X,Momenta芯片来了

    年时间,其芯片也终于接近落地。   对标Orin-X,接口兼容8650,目标快速上车   据透露,Momenta的智驾
    的头像 发表于 08-14 09:10 8639次阅读
    成功点亮并上车!对标Orin X,Momenta<b class='flag-5'>自</b><b class='flag-5'>研</b><b class='flag-5'>芯片</b>来了

    微软发布AI芯片Maia 200,性能超越谷歌TPU和亚马逊Trainium

    电子发烧友网综合报道 美东时间1月26日,微软重磅发布第二代人工智能芯片Maia 200,这一举措成为微软减少对
    的头像 发表于 01-27 16:46 7496次阅读
    <b class='flag-5'>微软</b>发布<b class='flag-5'>AI</b><b class='flag-5'>芯片</b>Maia 200,性能超越谷歌TPU和亚马逊Trainium

    AI业界新闻:OpenAI官宣首颗芯片 黄仁勋时隔9年再次给马斯克“送货”

    给大家带来一些AI业界新闻: OpenAI官宣首颗芯片 OpenAI宣布与博通合作
    的头像 发表于 10-14 18:42 2099次阅读

    第四次工业革命AI将实现十亿倍增长 | 中国AI芯片英伟的角色

    内容提要:黄仁勋BG2专访:英伟OpenAI、算力未来与美国梦AI规模定律与推理的革命:在传统的AI规模定律(预训练、后训练)之上,引入
    的头像 发表于 09-29 07:20 1341次阅读
    第四次工业革命<b class='flag-5'>AI</b>将实现十亿倍增长 | 中国<b class='flag-5'>AI</b><b class='flag-5'>芯片</b>与<b class='flag-5'>英伟</b><b class='flag-5'>达</b>的角色

    今日看点:苹果认证中国快充品牌遭美调查;英伟拟向OpenAI投资最高1000亿美元

    英伟拟向OpenAI投资最高1000亿美元 近日,英伟OpenAI宣布达成合作,包括建设庞
    发表于 09-23 10:09 505次阅读

    OpenAI将与博通合作量产自AI芯片 博通第四财季AI芯片收入展望超预期

    据外媒《金融时报》的报道称 OpenAI 将与博通公司开启大规模的合作,希望能够借住博通推动OpenAI  AI
    的头像 发表于 09-05 11:06 2026次阅读

    理想芯片预计明年量产上车

    据《晚点Auto》爆料称,现在理想汽车智驾芯片M100已完成样片回片并进入路测阶段,做道路测试就已经意味着迈过了量产前的关键阶段。爆料称预计在2026年量产上车;该芯片在运行大语言
    的头像 发表于 08-29 14:39 1003次阅读

    英伟HBM基础裸片

    电子发烧友网综合报道,据台媒消息,传闻英伟已开始开发自己的HBM基础裸片,预计英伟HB
    的头像 发表于 08-21 08:16 3029次阅读

    外媒:英伟正开发新款中国特供芯片B30A 或为旗舰AI芯品B300的阉割版

    ;或为旗舰AI芯品B300的阉割版 ;估计性能只有B300的50%--70%。 据外媒路透社报道,为了中国市场;英伟正在加速研发基于最新Blackwell架构的AI
    的头像 发表于 08-20 15:19 4057次阅读
    外媒:<b class='flag-5'>英伟</b><b class='flag-5'>达</b>正开发新款中国特供<b class='flag-5'>芯片</b>B30A 或为旗舰<b class='flag-5'>AI</b>芯品B300的阉割版

    摆脱依赖英伟OpenAI首次转向使用谷歌芯片

    地使用非英伟芯片,更显示出其正在逐步摆脱对英伟芯片的深度依赖,在算力布局上迈出了重要战略调整
    的头像 发表于 07-02 00:59 8582次阅读