0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

云天励飞推出IPU-X6000加速卡,针对大模型推理任务设计

云天励飞 来源:云天励飞 2024-07-24 11:03 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近期,云天励飞推出IPU-X6000加速卡。该产品具备256T算力、128GB显存容量、486GB/S显存带宽;采用C2C Mesh互联技术,可实现卡间高速互联,带宽达64GB/s,最大可实现64张卡的互联;可应用于语言、视觉、多模态等各类大模型的推理加速,目前已适配云天天书、通义千问、百川智能、Llama2/3等近10个主流大模型。

IPU-X6000加速卡内置全国产工艺打造的大算力芯片DeepEdge200,该芯片采用D2D Chiplet技术,是基于DeepEdge10芯片平台打造的最新成果。DeepEdge10是云天励飞于2023年底正式发布的全国产14nm Chiplet大模型推理芯片。

IPU-X6000单卡可实现130B参数量大模型推理,在执行70B参数量大模型推理时性能达11 tokens/s,有望在大模型推理领域逐步实现国产替代。今年以来,大模型全面进入应用落地阶段,推理算力需求随之不断增长。根据IDC数据,预计到2026年中国数据中心用于推理的负载将达到62.2%。

作为国内领先的人工智能企业,云天励飞不仅持续开展芯片、大模型等关键核心技术的自主研发工作,也一直持续推进大模型等创新技术的应用落地,在推理算力领域进行了完备的部署。

今年云天励飞与德元方惠签署协议,提供总算力规模约4000 PFLOPS的AI训练及推理异构算力服务,预计未来3年将为云天励飞贡献约16亿的营收。

云天励飞推出的X6000加速卡,专门针对大模型推理任务设计,打造了一系列符合大模型演进趋势的统一工具链,包括分布式并行策略、基于硬件的流水线排布、先进的量化策略、多机并行的编译机制等,在同等条件下能够做到推理性能更高、消耗成本更低。未来X6000将进一步支撑云天励飞智算运营业务,为行业带来更丰富的算力服务。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 加速卡
    +关注

    关注

    1

    文章

    75

    浏览量

    11369
  • 云天励飞
    +关注

    关注

    0

    文章

    187

    浏览量

    12703
  • 大模型
    +关注

    关注

    2

    文章

    3862

    浏览量

    5295

原文标题:云天励飞推出全新云端推理加速卡X6000,夯实智算运营底座

文章出处:【微信号:IntelliFusion2,微信公众号:云天励飞】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    AMD正式推出Instinct MI350P PCIe GPU加速卡

    AMD于2026年5月8日正式推出Instinct MI350P PCIe GPU加速卡,作为四年来首款面向企业级市场的PCIe接口Instinct系列产品,其以“精简架构+极致能效”为核心,专为AI推理
    的头像 发表于 05-08 11:25 656次阅读

    云天完成DeepSeek-V4系列模型关键机制适配验证

    4月24日,DeepSeek-V4 系列模型发布。围绕该模型 CSA/HCA 混合注意力机制带来的新型计算需求,云天依托自研 GPNPU
    的头像 发表于 04-30 17:09 5255次阅读

    云天中标湛江市AI渗透支撑新质生产力基础设施建设项目

    日前,云天中标湛江市AI渗透支撑新质生产力基础设施建设项目。根据项目规划,公司将基于自研国产AI推理加速卡,参与建设AI
    的头像 发表于 03-14 09:04 858次阅读

    国内首个国产AI推理集群落地,采用云天全自研AI推理芯片

    3 月 12 日,云天中标湛江市AI渗透支撑新质生产力基础设施建设项目,中标金额4.2亿元。项目将基于云天
    发表于 03-12 11:10 1372次阅读

    百亿Token一分钱!云天喊出“推理成本万倍降”,公布三年三芯路线图

    电子发烧友网报道(文/莫婷婷)当前,全球人工智能迈入具身智能(Agentic AI)时代,云天董事长兼CEO陈宁博士在“大算力芯片战略前瞻会”上再次强调:公司将聚焦大模型
    的头像 发表于 02-09 14:54 5945次阅读
    百亿Token一分钱!<b class='flag-5'>云天</b><b class='flag-5'>励</b><b class='flag-5'>飞</b>喊出“<b class='flag-5'>推理</b>成本万倍降”,公布三年三芯路线图

    云天正式举办大算力芯片战略前瞻会

    2月3日,云天正式举办“大算力芯片战略前瞻会”,首次对外公布未来三年的大算力 AI 推理芯片战略布局。
    的头像 发表于 02-06 17:23 3958次阅读

    云天与360集团签署战略合作协议

    12月22日,云天与360集团签署战略合作协议。双方将围绕“纳米AI”算力底座建设、大模型安全能力提升以及智慧生活产品打造等方向,充分发挥各自在资源、场景与技术方面的优势,联合打造
    的头像 发表于 12-25 17:09 695次阅读

    云天:AI推理需求狂飙,国产算力芯片机遇期加速到来

    今年来自国内外的半导体创新领袖企业高管们又带来哪些前瞻观点?此次,电子发烧友网特别采访了云天,以下是这家公司对2026年半导体产业的分析与展望。
    的头像 发表于 12-23 10:13 1.2w次阅读
    <b class='flag-5'>云天</b><b class='flag-5'>励</b><b class='flag-5'>飞</b>:AI<b class='flag-5'>推理</b>需求狂飙,国产算力芯片机遇期<b class='flag-5'>加速</b>到来

    云天AI推理芯片如何赋能千行百业

    11月26日,云天会客厅第二期生态沙龙暨深商联高科技高成长创新营走进上市公司活动圆满举办。来自深圳科技领域的多位企业负责人齐聚云天,共同探讨AI
    的头像 发表于 12-03 13:58 823次阅读

    云天亮相2025中国国际半导体博览会

    2025年11月23日,第二十二届中国国际半导体博览会(IC China 2025)在北京国家会议中心启幕。在24日举办的 “人工智能及大模型芯片论坛” 上,云天智算研究院副院长沈
    的头像 发表于 11-25 11:29 899次阅读

    算力密度翻倍!江原D20加速卡发布,一双芯重构AI推理标杆

    的关键技术瓶颈。   在此背景下,江原科技推出采用自研AI芯片的AI加速卡江原D10,并在今年5月实现量产交付。在大算力AI芯片全流程国产化产业链实现首次突破后,11月11日,江原科技再次发布新一代全国产AI加速卡——江原D20
    的头像 发表于 11-14 08:21 1.1w次阅读
    算力密度翻倍!江原D20<b class='flag-5'>加速卡</b>发布,一<b class='flag-5'>卡</b>双芯重构AI<b class='flag-5'>推理</b>标杆

    云天与金蝶达成战略合作

    11月4日,在2025金蝶全球创见者大会上,云天与金蝶签署战略合作协议。
    的头像 发表于 11-05 18:09 1872次阅读

    云天亮相2025湾区半导体产业生态博览会

    在2025湾区半导体产业生态博览会(湾芯展)上,云天以“算力积木”为核心理念,携全栈AI推理产品体系重磅亮相,集中展示了从芯片到模组再到整机的完整布局,全面呈现在AI
    的头像 发表于 10-16 17:45 1165次阅读

    云天正式加入OISA生态

    近日,云天正式加入 OISA 生态,携手产业伙伴共同推动国产 AI 芯片互联体系建设,为中国算力生态注入新的动力。
    的头像 发表于 10-11 13:59 892次阅读

    云天亮相2025全球AI芯片峰会

    9 月 17 日,全球 AI 芯片峰会在上海举行,云天董事长兼 CEO 陈宁出席并发表演讲。
    的头像 发表于 09-17 17:56 1625次阅读