0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

沐曦彭莉谈后GPT时代的算力需求

沐曦MetaX 来源:沐曦MetaX 2023-08-22 10:26 次阅读

近日,2023中国算力大会在宁夏银川举行,沐曦集成电路(上海)有限公司(下称“沐曦”)联合创始人、CTO兼首席硬件架构师彭莉受邀出席由中国信息通信研究院、中国互联网协会联合举办的智能计算论坛,并担任演讲嘉宾,探讨后GPT时代算力需求激增带来的挑战以及GPU如何突破算力供需瓶颈、推动人工智能产业普惠化发展。

在题为“后GPT时代的算力需求”的演讲中,彭莉预测大模型商业模式将分为通用计算市场和专用定制化市场两大类:在通用计算市场,大语言模型将终结多数NLP任务,NLP技术水平被强行拉平,通用大模型或被大厂“垄断”;而在专用定制化市场,开源大模型将呈现百花齐放的发展态势,可针对私有数据、敏感数据进行快速定制和领域对齐,大模型开发和部署能力将趋于普及化。

彭莉指出,区别于传统AI,生成式AI技术可以借助接入类ChatGPT应用发挥显著的技术优势,为大语言模型的开发降本增效,同时也对算力提出更高和更迫切的要求。由于大模型训练的一次性成本被大规模推理摊薄,大模型盈利的一大难点是降低推理成本。沐曦致力于打造高效通用的GPU芯片及软硬件一体的生态解决方案,通过GPU软件生态优势、硬件架构优势、先进封装等方面全面提升GPU算力,降低大模型训练和推理的算力成本,在产品路线和生态战略上均可满足大模型对算力基础设施的大规模需求,为推进智能产业可持续发展打造坚实的算力底座。

关于沐曦

沐曦致力于为异构计算提供安全可靠的GPU芯片及解决方案,打造全栈GPU芯片产品,推出曦思N系列GPU用于AI推理,曦云C系列GPU用于千亿参数AI大模型训练及通用计算,以及曦彩G系列GPU用于图形渲染,满足数据中心对“高能效”及“高通用性”的算力需求。沐曦产品均采用完全自主研发的GPU IP,拥有完全自主的指令集和架构,配以兼容主流GPU生态的完整软件栈(MXMACA),具备高能效和高通用性的天然优势,能够为客户构建软硬件一体的全面生态解决方案,是“双碳”背景下推动数据中心建设和产业数字化、智能化转

审核编辑:汤梓红
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 集成电路
    +关注

    关注

    5321

    文章

    10746

    浏览量

    353468
  • gpu
    gpu
    +关注

    关注

    27

    文章

    4424

    浏览量

    126724
  • 智能计算
    +关注

    关注

    0

    文章

    147

    浏览量

    16403
  • 沐曦
    +关注

    关注

    0

    文章

    25

    浏览量

    1088

原文标题:沐曦彭莉:后GPT时代GPU如何降低算力门槛

文章出处:【微信号:沐曦MetaX,微信公众号:沐曦MetaX】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    TC275如何设定GPT模块分频?

    在illd里没找到相关函数,请问各位高手如何设定GPT模块分频,谢谢。
    发表于 02-22 07:37

    iBeLink KS MAX 10.5T大领跑KAS新领域

    —KHeavyHash。在市场上,有一款挖掘机可以满足这个要求,那就是iBeLink ks max 10.5T。 iBeLink ks max 10.5T是一款专为Kaspa挖掘而设计的挖掘机,它的
    发表于 02-20 16:11

    使用TC21x的GPT实现1m计时器执行定时任务,怎么配置GTM和GPT

    专家们好,我想使用TC21x的GPT实现1m计时器执行定时任务,不知道怎么配置GTM和GPT
    发表于 02-06 06:47

    请问用强大的SOC来控制汽车是不是能够大幅减少MCU的使用数量?

    来自一位用户的咨询,麻烦帮忙解答,越详细越好,有图有真相,可以适当提供一些英飞凌解决方案和产品推荐。 用强大的SOC来控制汽车是不是能够大幅减少MCU的使用数量? 未来电动汽车会使用SOC来代替大量MCU?
    发表于 02-02 07:16

    大茉莉X16-P,5800M大称王称霸

    Rykj365
    发布于 :2024年01月25日 14:54:52

    GPT EVAL_BDPS_DRIVER可以使用GPT12 IP或GTM IP来实现连续定时器和单次定时器吗?

    GPT EVAL_BDPS_DRIVER可以使用GPT12 IP或GTM IP来实现连续定时器和单次定时器? 是吗?
    发表于 01-22 08:16

    【飞腾派4G版免费试用】仙女姐姐的嵌入式实验室之五~LLaMA.cpp及3B“小模型”OpenBuddy-StableLM-3B

    、计算机时代、互联网时代,而这个时代叫做 ——人工智能时代 想象 GPT 是一位语言天才,她擅长制作一种特殊的串联词语游戏。这个游戏的目标是
    发表于 12-22 10:18

    GPU如何突破算力供需瓶颈

    演讲嘉宾,探讨后GPT时代算力需求激增带来的挑战以及GPU如何突破算力供需瓶颈、推动人工智能产业普惠化发展。   沐曦联合创始人、CTO兼首席硬件架构师彭莉 发表主题演讲 在题为“后GPT
    的头像 发表于 08-22 10:26 933次阅读

    chatGPT和GPT4有什么区别

    chatGPT和GPT4有什么区别 GPT(Generative Pre-trained Transformer)系列模型由OpenAI公司开发,是一组用于自然语言处理(NLP)任务的人工智能模型
    的头像 发表于 08-09 15:18 1806次阅读

    OpenAI已为GPT-5申请商标,GPT-5要来了?

    OpenAI 此前曾在前几代模型(例如 GPT-4 和 GPT-3.5)的商标申请中,使用过同样的“用于使用语言模型的可下载计算机软件”这一描述。但很遗憾,最新申请文件中透露的唯一关键细节就只有“GPT-5”字样,并不代表 Op
    的头像 发表于 08-02 15:51 474次阅读
    OpenAI已为<b class='flag-5'>GPT</b>-5申请商标,<b class='flag-5'>GPT</b>-5要来了?

    直播倒计时 | 《GPT 时代人类再腾飞》新书共读

    GPT 时代人类再腾飞》是全球首部由 ChatGPT 与人类合著的创新力作,全书以领英创始人、OpenAI 早期投资人里德·霍夫曼与 GPT-4 的对话为主线,展现了 GPT-4 如
    的头像 发表于 07-19 00:15 380次阅读
    直播倒计时 | 《<b class='flag-5'>GPT</b> <b class='flag-5'>时代</b>人类再腾飞》新书共读

    态势感知与GPT

     GPT是一种基于Transformer的预训练语言模型,可以用于自然语言处理中的各种任务。在态势感知中,GPT可以用来对文本进行分类和情感分析,从而帮助用户了解当前的舆情和社会热点。例如,在某个
    的头像 发表于 07-07 11:23 359次阅读

    GPT-4催生的接口IP市场空间

    GPT-4大语言模型公布以来,百度、阿里、知乎、出门问问等国内互联网公司纷纷跟进,在近两个月中相继推出了自家的产品。日前,鲜有公开演讲的奇绩创坛创始人兼CEO陆奇也分享了他对大模型时代的宏观思考
    的头像 发表于 07-03 14:17 521次阅读

    GPT-4处于一个什么样的编码地位

      面试环节第一步——回答问题,写软件需求 面试环节第二步——上手写代码 测试用例   比 ChatGPT 背后 GPT-3.5 更为强大的模型 GPT-4,已正式对外发布。在 OpenAI 官方
    的头像 发表于 06-16 10:42 441次阅读
    <b class='flag-5'>GPT</b>-4处于一个什么样的编码地位

    如何将分区格式从MBR更改为GPT

    deployment stage Partitioning》里面有改成mbr的说明。 Q1)imx8m系列的默认分区格式是gpt吗? 我目前正在使用 LF_v5.15.5-1.0.0_images_iMX8MPEVK
    发表于 05-17 09:29