0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

微软力推自研Maia 200芯片

科技绿洲 2026-05-25 11:05 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

微软于近日正式宣布大力推广自研AI芯片"迈亚200"(Maia 200),剑指大模型推理场景的成本优化。微软官方数据显示,在处理典型GPT-4级模型推理任务时,Maia 200的单位算力成本相比英伟达A100 GPU低约15%,相比H100 GPU低约10%。成本优势源自芯片架构对推理场景的深度定制:内存带宽提升20%,功耗降低12%,让每瓦算力输出更高效。

Maia 200采用台积电3纳米工艺制造,单颗芯片集成超过1400亿个晶体管,配备原生FP8/FP4张量核心。内存系统搭载216GB HBM3e高带宽内存,读写速度高达7TB/s,另配272MB片上SRAM及专用DMA引擎和数据传输架构,确保海量模型参数高效流转。

在750W的SoC热设计功耗范围内,Maia 200可提供超过10 PetaFLOPS的FP4性能和超过5 PetaFLOPS的FP8性能。微软云与AI业务负责人Scott Guthrie称其为"所有超大规模云服务商中性能最强的自研芯片",并表示Maia 200的FP4性能是亚马逊第三代Trainium的三倍,FP8性能超越谷歌第七代TPU。微软称该芯片每美元性能比当前部署的最新一代硬件提升了30%。

Maia 200目前已在微软内部Bing Chat、Copilot、Microsoft 365 Copilot及Microsoft Foundry等服务中规模化使用,运行稳定率达99.9%。芯片已部署于微软美国中部数据中心区域(爱荷华州德梅因附近),后续将扩展至美国西部3区(亚利桑那州菲尼克斯附近)及更多区域。

Azure官方透露,2025年其AI服务成本中GPU采购和运维占比超45%,Maia 200的应用有望将这一比例降至30%以内。微软计划2026年内向部分头部企业客户开放Maia 200云服务接入权限,首批覆盖金融、医疗等对推理成本敏感的行业。客户无需修改现有模型代码即可快速部署,部署时间缩短约30%。

Maia SDK已于5月21日同步开放预览,包含PyTorch集成、Triton编译器、优化内核库及Maia底层编程语言访问权限,开发者可在代码生命周期早期阶段优化效率。

微软CEO纳德拉明确表示,公司将坚持"自研+外购"双轨策略,会继续向英伟达AMD采购芯片,维持与两家公司的紧密合作。Maia 200并非要替代英伟达,而是在推理这一AI成本占比最高的环节(麦肯锡报告指出推理成本占企业AI总支出60%以上)构建自主可控的算力底座。

据The Information报道,Anthropic正与微软就租用Maia 200芯片驱动的服务器展开谈判,旨在获取更多算力以应对旗下Claude模型日益增长的推理需求。若谈判成功,微软将赢得首个极具分量的外部客户,为其在自研芯片领域追赶谷歌和亚马逊的努力注入一剂强心针。

与此同时,英伟达并未坐视挑战。据《华尔街日报》报道,英伟达计划在6月GTC大会发布新款推理GPU,针对云服务商需求优化成本与功耗;AMD的MI300X芯片也在积极拓展云服务市场,与Maia 200形成直接竞争。AI芯片自主化已成为云服务商提升竞争力的核心策略,Maia 200的推出无疑将加速这一格局的演变。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 微软
    +关注

    关注

    4

    文章

    6764

    浏览量

    108161
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5324

    浏览量

    136213
  • AI芯片
    +关注

    关注

    17

    文章

    2184

    浏览量

    36888
  • 大模型
    +关注

    关注

    2

    文章

    3864

    浏览量

    5298
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    成功点亮并上车!对标Orin X,Momenta芯片来了

    电子发烧友网报道(文/梁浩斌)近日有消息称,辅助驾驶系统供应商Momenta的芯片已经成功点亮,并开始进行装车测试。   这也意味着,2023年Momenta从外部合作转向
    的头像 发表于 08-14 09:10 8806次阅读
    成功点亮并上车!对标Orin X,Momenta<b class='flag-5'>自</b><b class='flag-5'>研</b><b class='flag-5'>芯片</b>来了

    押注ASIC!微软联合Anthropic,“背刺”英伟达?

    仍落后于云计算竞争对手亚马逊和谷歌。   今年1月,微软发布了第二代Maia AI芯片,但尚未通过Azure云服务正式对外提供。一位知情人士表示,Anthropic目前尚未就使用Maia
    的头像 发表于 05-25 09:14 638次阅读

    加快进程!Meta计划2027年底前推出四代AI芯片

    电子发烧友网报道(文/李弯弯)近日,Meta对外宣布,计划在2027年底前推出四代人工智能芯片,旨在满足自身快速增长的AI计算需求,降低对外部芯片供应商的依赖。Meta表示,未来几
    的头像 发表于 03-16 08:57 1.2w次阅读

    阿里AI芯片“真武”亮相 “通云哥”黄金三角浮出水面

    1月29日上午,平头哥官网悄然上线一款名为“真武810E”的高端AI芯片,此前被央视《新闻联播》曝光的阿里芯片PPU正式亮相。这是通义实验室、阿里云和平头哥组成的阿里巴巴AI黄金三
    的头像 发表于 01-29 09:42 801次阅读
    阿里<b class='flag-5'>自</b><b class='flag-5'>研</b>AI<b class='flag-5'>芯片</b>“真武”亮相 “通云哥”黄金三角浮出水面

    微软发布AI芯片Maia 200,性能超越谷歌TPU和亚马逊Trainium

    电子发烧友网综合报道 美东时间1月26日,微软重磅发布第二代人工智能芯片Maia 200,这
    的头像 发表于 01-27 16:46 7622次阅读
    <b class='flag-5'>微软</b>发布AI<b class='flag-5'>芯片</b><b class='flag-5'>Maia</b> <b class='flag-5'>200</b>,性能超越谷歌TPU和亚马逊Trainium

    云巨头算力战升级!微软新一代3nm AI推理芯片性能提升30%,落地数据中心

    据外媒报道,微软发布新一代人工智能芯片Maia 200,这款芯片有望成为英伟达旗舰处理器以及云服务竞争对手亚马逊、谷歌同类产品的替代选择。
    的头像 发表于 01-27 12:29 1w次阅读
    云巨头算力战升级!<b class='flag-5'>微软</b>新一代3nm AI推理<b class='flag-5'>芯片</b>性能提升30%,落地数据中心

    今日看点:微软发布新定制 AI 芯片 Maia 200;国芯科技累计出货2500万颗创新高

    微软发布新定制 AI 芯片 Maia 200   近日,微软在官方博客正式发布了其定制 AI 加速芯片
    发表于 01-27 10:23 1219次阅读

    1600TOPS!美国新势力车企5nm芯片,转用激光雷达硬刚特斯拉

    电子发烧友网报道(文/梁浩斌)新势力车企芯片似乎已经成为一个共识,近年来,蔚来、小鹏陆续实现了自动驾驶
    的头像 发表于 12-22 08:02 1.1w次阅读
    1600TOPS!美国新势力车企<b class='flag-5'>自</b><b class='flag-5'>研</b>5nm<b class='flag-5'>芯片</b>,转用激光雷达硬刚特斯拉

    18A工艺大单!英特尔将代工微软AI芯片Maia 2

    电子发烧友网综合报道 据科技媒体SemiAccurate报道,微软已正式向英特尔晶圆代工(Intel Foundry)下达订单,委托其使用先进的18A工艺节点生产下一代AI加速器Maia 2
    的头像 发表于 10-21 08:52 6365次阅读

    速腾聚创全栈数字激光雷达芯片通过AEC-Q认证

    10月14日,速腾聚创宣布旗下数字激光雷达的两款核心芯片通过AEC-Q102车规级可靠性认证,成为全球率先实现数字激光雷达发射、接收、处理全链路芯片均达车规标准的科技企业。   据
    的头像 发表于 10-15 17:12 763次阅读

    AI业界新闻:OpenAI官宣首颗芯片 黄仁勋时隔9年再次给马斯克“送货”

    给大家带来一些AI业界新闻: OpenAI官宣首颗芯片 OpenAI宣布与博通合作AI芯片
    的头像 发表于 10-14 18:42 2193次阅读

    江波龙UFS4.1主控芯片,顺序读取速率高达4350MB/s,性能对标主流产品

    电子发烧友网报道(文/黄晶晶)近年来,江波龙主控芯片取得较大的进展。截止至2025年7月底,江波龙主控芯片全系列产品累计实现超过8000万颗的批量部署,并且部署规模仍在保持快速增长
    的头像 发表于 09-04 09:15 1.2w次阅读
    江波龙<b class='flag-5'>自</b><b class='flag-5'>研</b>UFS4.1主控<b class='flag-5'>芯片</b>,顺序读取速率高达4350MB/s,性能对标主流产品

    集创北方联合发布首颗RRAM AMOLED显示驱动芯片

    近日,集创北方携手清华大学集成电路学院团队与新忆科技共同推出首颗采用RRAM新型存储技术的AMOLED显示驱动芯片(DDIC)“集忆智显”系列首款芯片R100,这也是集创北方首次在
    的头像 发表于 08-30 11:50 1982次阅读
    集创北方联合发布首颗<b class='flag-5'>自</b><b class='flag-5'>研</b>RRAM AMOLED显示驱动<b class='flag-5'>芯片</b>

    理想芯片预计明年量产上车

    据《晚点Auto》爆料称,现在理想汽车智驾芯片M100已完成样片回片并进入路测阶段,做道路测试就已经意味着迈过了量产前的关键阶段。爆料称预计在2026年量产上车;该芯片在运行大语言
    的头像 发表于 08-29 14:39 1075次阅读

    Arm CEO:公司正在芯片

    据外媒路透社报道,Arm CEO Rene Haas透露,Arm正在投资开发自有芯片,并计划将部分利润投资于制造自己的芯片和其他组件。与之对应的是Arm预测的下一财季经营业绩也会因为
    的头像 发表于 07-31 11:49 842次阅读