近日,2023中国算力大会在宁夏银川举行,沐曦集成电路(上海)有限公司(下称“沐曦”)联合创始人、CTO兼首席硬件架构师彭莉受邀出席由中国信息通信研究院、中国互联网协会联合举办的智能计算论坛,并担任演讲嘉宾,探讨后GPT时代算力需求激增带来的挑战以及GPU如何突破算力供需瓶颈、推动人工智能产业普惠化发展。
在题为“后GPT时代的算力需求”的演讲中,彭莉预测大模型商业模式将分为通用计算市场和专用定制化市场两大类:在通用计算市场,大语言模型将终结多数NLP任务,NLP技术水平被强行拉平,通用大模型或被大厂“垄断”;而在专用定制化市场,开源大模型将呈现百花齐放的发展态势,可针对私有数据、敏感数据进行快速定制和领域对齐,大模型开发和部署能力将趋于普及化。
彭莉指出,区别于传统AI,生成式AI技术可以借助接入类ChatGPT应用发挥显著的技术优势,为大语言模型的开发降本增效,同时也对算力提出更高和更迫切的要求。由于大模型训练的一次性成本被大规模推理摊薄,大模型盈利的一大难点是降低推理成本。沐曦致力于打造高效通用的GPU芯片及软硬件一体的生态解决方案,通过GPU软件生态优势、硬件架构优势、先进封装等方面全面提升GPU算力,降低大模型训练和推理的算力成本,在产品路线和生态战略上均可满足大模型对算力基础设施的大规模需求,为推进智能产业可持续发展打造坚实的算力底座。
关于沐曦
沐曦致力于为异构计算提供安全可靠的GPU芯片及解决方案,打造全栈GPU芯片产品,推出曦思N系列GPU用于AI推理,曦云C系列GPU用于千亿参数AI大模型训练及通用计算,以及曦彩G系列GPU用于图形渲染,满足数据中心对“高能效”及“高通用性”的算力需求。沐曦产品均采用完全自主研发的GPU IP,拥有完全自主的指令集和架构,配以兼容主流GPU生态的完整软件栈(MXMACA),具备高能效和高通用性的天然优势,能够为客户构建软硬件一体的全面生态解决方案,是“双碳”背景下推动数据中心建设和产业数字化、智能化转
-
集成电路
+关注
关注
5446文章
12465浏览量
372672 -
gpu
+关注
关注
28文章
5099浏览量
134447 -
智能计算
+关注
关注
0文章
195浏览量
17031 -
沐曦
+关注
关注
0文章
54浏览量
1653
原文标题:沐曦彭莉:后GPT时代GPU如何降低算力门槛
文章出处:【微信号:沐曦MetaX,微信公众号:沐曦MetaX】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
强强联合:之江实验室与沐曦股份共建智算集群联合实验室
首款全国产通用GPU芯片发布 沐曦集成推出曦云C600
沐曦GPU与龙蜥操作系统完成适配
沐曦曦云C系列产品已支持TileLang
书生大模型实战营沐曦魔乐专场MeetUP精彩回顾
沐曦全链路算力方案亮相WAIC 2025
沐曦亮相2025世界人工智能大会
硅基流动携手沐曦首发基于曦云的Kimi K2推理服务
PaddleScience完成与沐曦AI芯片适配
沐曦曦云C500通用计算GPU与百度飞桨完成Ⅱ级兼容性测试
澎峰科技与沐曦完成联合测试,实现全面兼容
澎峰科技计算软件栈与沐曦GPU完成适配和互认证
国产智算集群黑马!曦源一号SADA算力集群综合评测表现优异

沐曦彭莉谈后GPT时代的算力需求
评论