近日,2023中国算力大会在宁夏银川举行,沐曦集成电路(上海)有限公司(下称“沐曦”)联合创始人、CTO兼首席硬件架构师彭莉受邀出席由中国信息通信研究院、中国互联网协会联合举办的智能计算论坛,并担任演讲嘉宾,探讨后GPT时代算力需求激增带来的挑战以及GPU如何突破算力供需瓶颈、推动人工智能产业普惠化发展。
沐曦联合创始人、CTO兼首席硬件架构师彭莉
发表主题演讲
在题为“后GPT时代的算力需求”的演讲中,彭莉预测大模型商业模式将分为通用计算市场和专用定制化市场两大类:在通用计算市场,大语言模型将终结多数NLP任务,NLP技术水平被强行拉平,通用大模型或被大厂“垄断”;而在专用定制化市场,开源大模型将呈现百花齐放的发展态势,可针对私有数据、敏感数据进行快速定制和领域对齐,大模型开发和部署能力将趋于普及化。
彭莉指出,区别于传统AI,生成式AI技术可以借助接入类ChatGPT应用发挥显著的技术优势,为大语言模型的开发降本增效,同时也对算力提出更高和更迫切的要求。由于大模型训练的一次性成本被大规模推理摊薄,大模型盈利的一大难点是降低推理成本。沐曦致力于打造高效通用的GPU芯片及软硬件一体的生态解决方案,通过GPU软件生态优势、硬件架构优势、先进封装等方面全面提升GPU算力,降低大模型训练和推理的算力成本,在产品路线和生态战略上均可满足大模型对算力基础设施的大规模需求,为推进智能产业可持续发展打造坚实的算力底座。
审核编辑:彭菁
-
集成电路
+关注
关注
5469文章
12740浏览量
376237 -
gpu
+关注
关注
28文章
5321浏览量
136208 -
硬件
+关注
关注
13文章
3666浏览量
69232 -
沐曦
+关注
关注
1文章
118浏览量
1894 -
大模型
+关注
关注
2文章
3863浏览量
5296
发布评论请先 登录
AI时代算力瓶颈如何破?先进封装成半导体行业竞争新高地
时延小于1毫秒,工信部发布全光算力网络重磅利好政策
企业如何突破AI算力困局?2026 年异构算力管理平台推荐
拆解存算一体技术瓶颈,亿铸科技如何逐个突破
容量与能效双突破!美光245TB SSD现已出货,为AI算力“提速”
GPU 利用率<30%?这款开源智算云平台让算力不浪费 1%
友思特方案 | 突破 Jetson平台的接口性能瓶颈,Gidel 基于FPGA的高速边缘AI视觉系统
GPU如何突破算力供需瓶颈
评论