0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

微软发布AI芯片Maia 200,性能超越谷歌TPU和亚马逊Trainium

Carol Li 来源:电子发烧友网 作者:李弯弯 2026-01-27 16:46 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网综合报道 美东时间1月26日,微软重磅发布第二代自研人工智能芯片Maia 200,这一举措成为微软减少对英伟达芯片依赖、高效驱动自身服务的关键一步,也标志着其在自研芯片领域取得重大进展。

Maia 200采用台积电先进的3纳米工艺制造,现已开始部署至爱荷华州的数据中心,后续还将进驻凤凰城地区。微软云与AI业务负责人Scott Guthrie在博客文章中宣称,Maia 200是“微软有史以来部署的最高效推理系统”,每美元性能相比微软当前最新一代硬件提升30%。

从性能指标来看,Maia 200表现卓越。在FP4精度下,其性能是第三代亚马逊Trainium芯片的三倍;FP8性能则超越谷歌第七代TPU。微软已向开发者、学术界和前沿AI实验室开放Maia 200软件开发工具包的预览版,并计划未来向更多客户开放该芯片的云服务租用。

Maia 200被设计为专门的推理加速器,重点优化AI生成内容(如回答用户提问)这类持续计算任务,旨在降低运行ChatGPT、Copilot等服务的调用成本。它可服务于包括OpenAI最新GPT - 5.2模型在内的多种AI模型,为Microsoft Foundry和Microsoft 365 Copilot带来成本优势。

在可持续性方面,微软执行副总裁斯科特·盖茨在宣传视频中强调,Maia 200采用更高效的水冷设计方案,可实现“零浪费”,有效减少数据中心对当地环境与水资源的压力。

回顾微软自研AI芯片之路,距离发布第一代人工智能芯片Maia 100已过去两年。2023年11月,微软在Ignite大会上发布Maia 100,采用台积电5纳米工艺,运用CoWoS - S封装技术,拥有1050亿个晶体管,略少于AMD MI300(1530亿)。它主要用途是AI训练与推理,侧重于大语言模型(LLM),内存配置为64GB HBM2E,带宽约1.6TB/s - 1.8TB/s,采用液冷散热方式,专为高密度数据中心设计。

Maia 100并非单纯追求极致算力,而是为优化微软Azure云服务的特定场景而生,用于运行Bing、GitHub Copilot以及OpenAI的模型。微软采用垂直集成思路,从芯片、服务器主板到机架冷却系统协同设计。其独特的“MX”数据类型是一大亮点,微软引入自定义的MX数据格式,支持亚8位(Sub - 8 - bit)计算,通过软硬件协同设计,在保持模型精度的同时,显著提升计算密度和能效,特别适合大语言模型的推理任务。

在设计上,Maia 100有取有舍。短板在于片外内存带宽(HBM)约为1.6TB/s,略低于英伟达H100和谷歌TPU v5,因其基于LLM热潮前设计;长板则是拥有强大的片上网络(NoC)和集群互联能力,每个芯片内置RDMA以太网接口,集群间互联带宽高达4.8 Tbps,可通过极快网络弥补单点显存不足,适合大规模分布式训练。为方便开发者使用,Maia 100支持OpenAI Triton和标准的PyTorch框架,开发者无需重写大量代码就能将模型迁移到Maia硬件上。

微软此次发布Maia 200,凸显了科技巨头争夺AI算力自主权的激烈竞争。在英伟达芯片供应紧张且成本高昂的背景下,微软、亚马逊和谷歌均加快自研芯片进程,力求为云客户提供成本更低、集成更顺畅的替代方案。微软已表示正在设计Maia 300后续产品,未来其在AI芯片领域的发展值得期待。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 微软
    +关注

    关注

    4

    文章

    6760

    浏览量

    108158
  • AI芯片
    +关注

    关注

    17

    文章

    2181

    浏览量

    36886
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    谷歌发布第八代TPU,训练推理分离,搭载自研CPU

    电子发烧友网报道(文/李弯弯)在2026年4月22日举行的谷歌云Next大会上,谷歌正式发布了第八代张量处理单元(TPU)。此次发布的产品包
    的头像 发表于 04-24 09:03 6397次阅读
    <b class='flag-5'>谷歌</b><b class='flag-5'>发布</b>第八代<b class='flag-5'>TPU</b>,训练推理分离,搭载自研CPU

    直击英伟达腹地?谷歌TPU v7开放部署,催生OCS产业链红利

    Processing Unit, TPU)构建了一套完整的AI算力基础设施体系。   11月,谷歌宣布第七代 TPU v7(代号 Ironwood)将在后续几周大规模上市。与此消息同
    的头像 发表于 11-27 08:53 9863次阅读
    直击英伟达腹地?<b class='flag-5'>谷歌</b><b class='flag-5'>TPU</b> v7开放部署,催生OCS产业链红利

    谷歌联手黑石砸250亿美元造AI云公司

    近日,谷歌母公司Alphabet与全球最大私募巨头黑石集团正式宣布:双方将联手成立一家全新的AI云计算公司。黑石掏出50亿美元真金白银作为初始股权资本,并持有多数股权;谷歌则拿出自家王牌——T
    的头像 发表于 05-21 11:18 458次阅读

    云巨头算力战升级!微软新一代3nm AI推理芯片性能提升30%,落地数据中心

    据外媒报道,微软发布新一代人工智能芯片Maia 200,这款芯片有望成为英伟达旗舰处理器以及云服
    的头像 发表于 01-27 12:29 1w次阅读
    云巨头算力战升级!<b class='flag-5'>微软</b>新一代3nm <b class='flag-5'>AI</b>推理<b class='flag-5'>芯片</b><b class='flag-5'>性能</b>提升30%,落地数据中心

    今日看点:微软发布新定制 AI 芯片 Maia 200;国芯科技累计出货2500万颗创新高

    工艺制造,目前已开始部署于微软数据中心。   Maia 200 在特定性能指标上显著优于同类产品:其 FP4 性能达到了
    发表于 01-27 10:23 1211次阅读

    什么是TPU?万协通带你看懂AI算力的“变形金刚”

    ”——TPU(Tensor Processing Unit)。 今天,作为国产可重构TPU芯片的先行者,万协通将带你剥开晦涩的技术外壳,看懂这块决定AI未来的核心硬件,以及中国
    的头像 发表于 01-13 13:22 523次阅读
    什么是<b class='flag-5'>TPU</b>?万协通带你看懂<b class='flag-5'>AI</b>算力的“变形金刚”

    AI芯片大单!Anthropic从博通采购100万颗TPU v7p芯片

    Anthropic供应基于TPU v7p的机架级 AI 系统,绕过TPU芯片的另一开发参与方谷歌。不过
    的头像 发表于 01-06 08:38 1.1w次阅读

    HBM3E反常涨价20%,AI算力竞赛重塑存储芯片市场格局

    明年HBM3E价格,涨幅接近20%。   此次涨价背后,是AI算力需求爆发与供应链瓶颈的共同作用。随着英伟达H200谷歌TPU亚马逊
    的头像 发表于 12-28 09:50 8009次阅读

    亚马逊云科技推出全新的Amazon AI Factories 将客户现有基础设施转化为高性能AI环境

    亚马逊云科技在2025 re:Invent全球大会上,宣布推出全新的Amazon AI Factories,助力企业将现有基础设施转化为高性能AI环境。
    的头像 发表于 12-13 13:44 937次阅读

    亚马逊发布新一代AI芯片Trainium3,性能提升4倍

    Trainium 4的开发计划。亚马逊表示,这款芯片能够比英伟达市场领先的图形处理单元(GPU)更便宜、更高效地驱动AI模型背后的密集计算。     作为
    的头像 发表于 12-09 08:37 9018次阅读
    <b class='flag-5'>亚马逊</b><b class='flag-5'>发布</b>新一代<b class='flag-5'>AI</b><b class='flag-5'>芯片</b><b class='flag-5'>Trainium</b>3,<b class='flag-5'>性能</b>提升4倍

    谷歌发布最强自研TPU性能比前代提升4倍

    电子发烧友网报道(文/李弯弯)近日,谷歌云在官方博客上正式宣布,公司成功推出第七代TPU(张量处理器)“Ironwood”,该芯片预计在未来几周内正式上市。   “Ironwood”由谷歌
    的头像 发表于 11-13 07:49 9161次阅读
    <b class='flag-5'>谷歌</b>云<b class='flag-5'>发布</b>最强自研<b class='flag-5'>TPU</b>,<b class='flag-5'>性能</b>比前代提升4倍

    18A工艺大单!英特尔将代工微软AI芯片Maia 2

    电子发烧友网综合报道 据科技媒体SemiAccurate报道,微软已正式向英特尔晶圆代工(Intel Foundry)下达订单,委托其使用先进的18A工艺节点生产下一代AI加速器Maia 2
    的头像 发表于 10-21 08:52 6362次阅读

    微软Visual Studio 2026 发布AI 深度融合、性能提升

    “  微软发布 Visual Studio 2026 预览版,新版本以深度融合的 AI Copilot 为核心,结合全新的 Fluent Design 界面与显著的性能提升,旨在打造前
    的头像 发表于 09-16 11:17 2475次阅读
    <b class='flag-5'>微软</b>Visual Studio 2026 <b class='flag-5'>发布</b>!<b class='flag-5'>AI</b> 深度融合、<b class='flag-5'>性能</b>提升

    新思科技携手微软借助AI技术加速芯片设计

    近日,微软Build大会在西雅图盛大开幕,聚焦AI在加速各行业(包括芯片设计行业)科学突破方面的变革潜力。作为Microsoft Discovery平台发布的启动合作伙伴,新思科技亮相
    的头像 发表于 06-27 10:23 1330次阅读

    AlphaEvolve有望革新AI玩具芯片设计,算法进化驱动能效与成本双突破

    的完整程序生成,解决传统依赖专家经验的算法设计难题。   而这款产品的发布,或许会对AI玩具芯片设计将产生多维度革新性帮助。例如在芯片架构上的自动化优化,AlphaEvolve已成功优
    的头像 发表于 06-18 00:09 4069次阅读