0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

GPU如何突破算力供需瓶颈

沐曦MetaX 来源:沐曦MetaX 2023-08-22 10:26 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近日,2023中国算力大会在宁夏银川举行,沐曦集成电路(上海)有限公司(下称“沐曦”)联合创始人、CTO兼首席硬件架构师彭莉受邀出席由中国信息通信研究院、中国互联网协会联合举办的智能计算论坛,并担任演讲嘉宾,探讨后GPT时代算力需求激增带来的挑战以及GPU如何突破算力供需瓶颈、推动人工智能产业普惠化发展。

沐曦联合创始人、CTO兼首席硬件架构师彭莉

发表主题演讲

在题为“后GPT时代的算力需求”的演讲中,彭莉预测大模型商业模式将分为通用计算市场和专用定制化市场两大类:在通用计算市场,大语言模型将终结多数NLP任务,NLP技术水平被强行拉平,通用大模型或被大厂“垄断”;而在专用定制化市场,开源大模型将呈现百花齐放的发展态势,可针对私有数据、敏感数据进行快速定制和领域对齐,大模型开发和部署能力将趋于普及化。

彭莉指出,区别于传统AI,生成式AI技术可以借助接入类ChatGPT应用发挥显著的技术优势,为大语言模型的开发降本增效,同时也对算力提出更高和更迫切的要求。由于大模型训练的一次性成本被大规模推理摊薄,大模型盈利的一大难点是降低推理成本。沐曦致力于打造高效通用的GPU芯片及软硬件一体的生态解决方案,通过GPU软件生态优势、硬件架构优势、先进封装等方面全面提升GPU算力,降低大模型训练和推理的算力成本,在产品路线和生态战略上均可满足大模型对算力基础设施的大规模需求,为推进智能产业可持续发展打造坚实的算力底座。

审核编辑:彭菁

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 集成电路
    +关注

    关注

    5446

    文章

    12465

    浏览量

    372685
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5099

    浏览量

    134458
  • 硬件
    +关注

    关注

    11

    文章

    3555

    浏览量

    68744
  • 沐曦
    +关注

    关注

    0

    文章

    54

    浏览量

    1654
  • 大模型
    +关注

    关注

    2

    文章

    3440

    浏览量

    4964
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    湘军,让变成生产

    脑极体
    发布于 :2025年11月25日 22:56:58

    从材料到集成:光子芯片技术创新,突破瓶颈

    时延、高带宽、低功耗的数据处理能力。随着人工智能需求呈爆发式增长,光子芯片技术路线呈现出多元化的发展态势。   主流技术路线:从材料创新到系统集成的突破   当前,光子芯片领域形成了多种主流技术路线。硅基光子集
    的头像 发表于 08-21 09:15 7959次阅读

    热插拔集群

    能力‌ 服务器节点热插拔‌:集群服务器支持在线更换计算节点(如2U服务器容纳12个热插拔AI节点,单节点集成5个卡)。 GPU/卡扩
    的头像 发表于 06-26 09:20 706次阅读

    【「芯片 | 高性能 CPU/GPU/NPU 微架构分析」阅读体验】+NVlink技术从应用到原理

    前言 【「芯片 | 高性能 CPU/GPU/NPU 微架构分析」书中的芯片知识是比较接近当前的顶尖芯片水平的,同时包含了芯片架构的基础知识,但该部分知识比较晦涩难懂,或许是由于我一直从事的事芯片
    发表于 06-18 19:31

    30+AI 热管理材料供应商推荐

    随着AI大模型、自动驾驶等需求激增,高芯片功耗突破1000W,封装基板与散热材料成为性能瓶颈。基板:ABF载板供需缺口超30%(Tech
    的头像 发表于 04-25 14:33 716次阅读
    30+AI <b class='flag-5'>算</b><b class='flag-5'>力</b>热管理材料供应商推荐

    搭建中心,从了解的GPU 特性开始

    ABSTRACT摘要本文介绍如何搭建,并介绍A100、H100、H200和B200这些GPU的特性。JAEALOT2025年4月23日随着人工智能、大数据和高性能计算(HPC)的快速发展,市场上
    的头像 发表于 04-24 11:08 2983次阅读
    搭建<b class='flag-5'>算</b><b class='flag-5'>力</b>中心,从了解的<b class='flag-5'>GPU</b> 特性开始

    芯片的生态突围与革命

    据的爆发式增长,大芯片已成为科技竞争的核心领域之一。   大芯片的核心应用场景丰富多样。在人工智能训练与推理方面,大模型(如 GPT、Llama)的训练需要超大规模
    的头像 发表于 04-13 00:02 2610次阅读

    DeepSeek推动AI需求:800G光模块的关键作用

    集群的部署过程中,带宽瓶颈成为制约发挥的关键因素,而光模块的速率跃升成为突破这一瓶颈的核心
    发表于 03-25 12:00

    信而泰CCL仿真:解锁AI极限,智中心网络性能跃升之道

    中心RoCE网络提供精准评估方案,助力企业突破瓶颈,释放AI澎湃动力! 什么是智中心 智
    的头像 发表于 02-24 17:34 985次阅读
    信而泰CCL仿真:解锁AI<b class='flag-5'>算</b><b class='flag-5'>力</b>极限,智<b class='flag-5'>算</b>中心网络性能跃升之道

    GPU 加速计算:突破传统瓶颈的利刃

    ,犹如一把利刃,成功突破了传统瓶颈。 传统的 CPU 计算在面对大规模并行计算任务时,往往显得力不从心。CPU 核心数量有限,且设计侧重于复杂的逻辑控制和串行处理,无法高效处理海
    的头像 发表于 02-17 10:36 516次阅读

    中科曙光助力浙江精准医疗实验室突破瓶颈

    水平具有重要意义。 然而,在冷冻电镜等应用场景中,瓶颈一直是制约科研进展的关键因素之一。为了突破这一瓶颈,实验室引入了中科曙光的高端计算
    的头像 发表于 02-13 14:42 889次阅读

    GPU租用平台有什么好处

    当今,GPU租用平台为科研机构、企业乃至个人开发者提供了灵活高效的解决方案。下面,AI部落小编带您深入探讨
    的头像 发表于 02-07 10:39 715次阅读

    中心的如何衡量?

    作为当下科技发展的重要基础设施,其的衡量关乎其能否高效支撑人工智能、大数据分析等智能应用的运行。以下是对智中心算衡量的详细阐述:一、
    的头像 发表于 01-16 14:03 4200次阅读
    <b class='flag-5'>算</b>智<b class='flag-5'>算</b>中心的<b class='flag-5'>算</b><b class='flag-5'>力</b>如何衡量?

    未来边缘GPU在车联网中的创新应用(下)

    本文来源:壹灵海科技随着5G通信技术的普及和人工智能技术的飞速发展,边缘GPU将在车联网领域发挥更加重要的作用。5G网络的高带宽和低延迟特性为车联网提供了强大的支持,使得车辆能够实时地交换大量
    的头像 发表于 12-19 11:16 826次阅读
    未来边缘<b class='flag-5'>GPU</b><b class='flag-5'>算</b><b class='flag-5'>力</b>在车联网中的创新应用(下)