0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

沐曦付轩:蹄急而步稳,GPU助力ChatGPT快、准、稳全面发展

沐曦MetaX 来源:沐曦MetaX 2023-06-20 10:57 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

2023年6月17日,由绍兴市人民政府主办的 2023 中国(绍兴)集成电路产业峰会隆重举行,“ChatGPT风向下的集成电路新趋势”论坛及集成电路项目路演也同期举行,为百余位产业从业者提供深入了解行业发展动态和交流合作的机会。沐曦首席解决方案架构师付轩受邀参会并发表演讲。

付轩在“ChatGPT风向下的集成电路新趋势”论坛中发表主题为《蹄急而步稳:ChatGPT与高性能GPU战略概览》的主题演讲,分析了ChatGPT的应用特点及软硬件需求,指出以ChatGPT为代表的大模型发展需要大的通用算力与矩阵算力作为支撑,并且作为基于GPU生态发展起来的模型,对GPU显存、GPU间互联通信、通用GPU编程框架及软件生态等多方面均有很高的要求。因此,作为算力底座的GPU不仅需要算得快,还要算得准、算得稳,不仅要提供高效计算,还要保证结果准确,并且灵活可靠。

对此,可以采取以下策略:首先,针对ChatGPT大模型训练,大集群3D并行是一种有效方式,能够集张量并行、流水并行和数据并行为一体,与只有数据并行的小模型相比,是一种完全不同的复杂并行结构。在大模型推理方面,推理精度要求高,延迟容忍度高,带来越来越多的云端高算力推理需求,更适合在数据中心中运行,也符合“东数西算”的战略规划。同时,基于高性能GPU生态的算法创新实现算子提速并极大减少显存消耗,通用算力与矩阵算力的高效协作实现算子融合加速,稳定可靠的千卡大集群、GPU软硬件结合、“训推一体”优化保障训练和推理的精度,均是能够使大模型计算实现快、准、稳的可行性措施。

沐曦作为一家提供全栈GPU芯片及解决方案的企业,其旗舰产品曦云C500系列通用GPU采用沐曦自研IP,能够提供强大的多精度混合算力,同时配以大容量存储和新一代高速IO接口及多卡互联技术,不论在矩阵算力、通用算力还是显存规格方面均可全面支持大模型推理和训练,并广泛应用于人工智能、数据中心以及教育和科研等多种场景。同时,沐曦自主研发的MXMACA软件栈能够全面兼容主流GPU生态,为客户提供软硬件一体的应用解决方案。目前,曦云MXC500芯片已于2023年6月13日成功回片点亮,预计将于今年年底实现量产。

总的来说,ChatGPT对于硬件和软件均有需求,我们要更好地利用现有的GPU生态,发挥通用算力与矩阵算力的全面优势,做好算子的算法创新和加速。同时,在做千卡大集群时,单节点内的多GPU互联也是必须的。此外,当前各种大模型创新层出不穷,我们要把各种各样的大模型迁移到曦云C500上来,因此生态兼容也至关重要。做到以上几点,大模型就能够更好地在国内实现高效迭代与应用落地。

关于沐曦

沐曦致力于为异构计算提供安全可靠的GPU芯片及解决方案,打造全栈GPU芯片产品,推出MXN系列GPU(曦思)用于AI推理,MXC系列GPU(曦云)用于AI训练及通用计算,以及MXG系列GPU(曦彩)用于图形渲染,满足数据中心对“高能效”及“高通用性”的算力需求。沐曦产品均采用完全自主研发的GPU IP,拥有完全自主的指令集和架构,配以兼容主流GPU生态的完整软件栈(MXMACA),具备高能效和高通用性的天然优势,能够为客户构建软硬件一体的全面生态解决方案,是“双碳”背景下推动数据中心建设和产业数字化、智能化转型升级的算力基石。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 集成电路
    +关注

    关注

    5464

    文章

    12681

    浏览量

    375670
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5271

    浏览量

    136059
  • ChatGPT
    +关注

    关注

    31

    文章

    1600

    浏览量

    10391

原文标题:沐曦付轩:蹄急而步稳,GPU助力ChatGPT快、准、稳全面发展

文章出处:【微信号:沐曦MetaX,微信公众号:沐曦MetaX】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    股份云C系列GPU产品Day 0适配MiniMax M2.7模型

    4月12日,MiniMax新一代Agent旗舰大模型M2.7开源。股份云C系列GPU已完成对 M2.7的Day 0深度适配,将为M2.7提供澎湃算力支持。
    的头像 发表于 04-13 17:08 452次阅读
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b>股份<b class='flag-5'>曦</b>云C系列<b class='flag-5'>GPU</b>产品Day 0适配MiniMax M2.7模型

    股份云C系列GPU产品Day 0适配智谱GLM-5.1旗舰模型

    4月8日,智谱新一代旗舰模型GLM-5.1实现开源。目前,股份云 C 系列 GPU已完成该系列模型Day 0 全量适配,再度以全栈自主技术实力,领跑国产
    的头像 发表于 04-09 11:25 351次阅读

    股份GPU产品正式接入华佗开源生态

    股份坚持“自主创新与开放兼容”双轨战略,以自研MXMACA软件栈为核心,构建硬件与应用的桥梁,并承载开源核心使命。该栈于2025年2月正式开源,致力于打造开放的GPU编程接口标准,大幅降低开发门槛,有效破解跨平台兼容难题,驱
    的头像 发表于 03-16 14:40 1333次阅读
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b>股份<b class='flag-5'>GPU</b>产品正式接入华佗开源生态

    股份云C系列GPU全面适配通义千问Qwen3.5三款新模型

    今日,通义千问团队正式开源发布Qwen3.5系列中等规模模型,推出包括Qwen3.5-35B-A3B、Qwen3.5-122B-A10B、Qwen3.5-27B三个版本。股份旗下云C系列
    的头像 发表于 02-28 10:05 715次阅读
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b>股份<b class='flag-5'>曦</b>云C系列<b class='flag-5'>GPU</b><b class='flag-5'>全面</b>适配通义千问Qwen3.5三款新模型

    股份云C系列GPU深度适配通义千问Qwen3.5模型

    今天,通义千问今天正式发布 Qwen3.5,并推出Qwen3.5系列的第一款模型 Qwen3.5-397B-A17B 的开放权重版本。股份云C系列GPU 完成对Qwen 3.5模
    的头像 发表于 02-26 14:26 778次阅读
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b>股份<b class='flag-5'>曦</b>云C系列<b class='flag-5'>GPU</b>深度适配通义千问Qwen3.5模型

    云C500/C550 GPU产品适配智谱GLM-OCR模型

    今天,智谱AI正式发布并开源GLM-OCR,以 “小尺寸、高精度” 实现文档解析能力新标杆。股份云C500/C550 GPU充分发挥高生态兼容性、软硬协同能力优势,高效完成与智谱
    的头像 发表于 02-03 11:36 917次阅读
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b><b class='flag-5'>曦</b>云C500/C550 <b class='flag-5'>GPU</b>产品适配智谱GLM-OCR模型

    云C500/C550 GPU产品适配PaddleOCR-VL-1.5模型

    PaddleOCR-VL 系列的全新迭代版本PaddleOCR-VL-1.5今天正式上线,云C500/C550 Day 0 适配PaddleOCR-VL-1.5模型,助力Padd
    的头像 发表于 01-30 10:19 1300次阅读
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b><b class='flag-5'>曦</b>云C500/C550 <b class='flag-5'>GPU</b>产品适配PaddleOCR-VL-1.5模型

    股份正式推出索X系列全新GPU品牌与产品线

    1月27日,股份(股票代码:688802.SH)正式推出索X系列全新GPU品牌与产品线。该系列产品是面向科学智能场景深度优化的高性能计算芯片,旨在以强大计算能力赋能前沿科研领域,
    的头像 发表于 01-28 17:14 841次阅读

    股份云C系列GPU Day 0适配智谱GLM-4.6V多模态大模型

    12月8日智谱AI发布并开源 GLM-4.6V 系列多模态大模型,股份云C系列GPU完成Day 0适配。
    的头像 发表于 12-17 14:28 821次阅读
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b>股份<b class='flag-5'>曦</b>云C系列<b class='flag-5'>GPU</b> Day 0适配智谱GLM-4.6V多模态大模型

    股份GPU加速技术助力药物研发降本增效

    股份科学计算团队近期取得突破性进展,成功将主流分子动力学模拟引擎GROMACS中的FEP计算全流程部署于GPU执行,并实现2.5倍性能提升,相关成果获得GROMACS官方团队的高度认可,该
    的头像 发表于 12-02 15:58 894次阅读

    瀚海量子与股份达成战略合作 量子计算软件领军者+高性能GPU芯片领军者

    当量子计算软件领军者遇上高性能GPU芯片领军者,国产算力领域迎来一项重磅合作。 近日, 合肥瀚海量子科技有限公司(简称“瀚海量子”)与集成电路(上海)股份有限公司(简称“
    的头像 发表于 11-24 19:02 3372次阅读

    股份与上海电信完成首期GPU生态专家认证培训

    近期,集成电路(上海)股份有限公司(以下简称“股份”)携手上海电信天翼云能力运营中心(以下简称“云能力运营中心”)顺利完成了首期GPU
    的头像 发表于 10-31 10:33 649次阅读

    首款全国产通用GPU芯片发布 集成推出云C600

    集成电路(南京)有限公司近日正式发布了首款全国产通用GPU——云C600,这标志着国产高性能GPU实现历史性突破。 据新华日报报道显示
    的头像 发表于 10-19 20:04 4.7w次阅读

    GPU与龙蜥操作系统完成适配

    集成电路(上海)股份有限公司(以下简称"")于 2020 年 9 月成立于上海,其拥有技术完备、设计和产业化经验丰富的团队,曾主导过十多款世界主流高性能
    的头像 发表于 10-17 15:06 1380次阅读

    硅基流动携手首发基于云的Kimi K2推理服务

    天网络”)运营的云C550 三千卡通用 GPU 国产集群。此次合作标志着硅基流动正式将该国产集群纳入算力网络,进一为大模型产业落地提
    的头像 发表于 07-23 17:33 2143次阅读