0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

商汤大装置加速大模型能力下沉,构建智能计算新生态

商汤科技SenseTime 来源:商汤科技SenseTime 2024-03-29 15:21 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

大模型技术持续突破前沿,如何加速向产业“下沉”?

3月23~24日,2024全球开发者先锋大会(GDC)在上海成功举办。期间,商汤科技大装置执行总监成功,以及商汤科技大装置产品总监陈希受邀出席大会分论坛活动,围绕大模型前沿开发、智能计算创新等话题分享前瞻洞见,共话智能生态构建

以体系化基础能力支撑,加速大模型向下演进

去年以来,生成式AI取得了飞跃式的发展,并不断从单一模态向多模态演进。那么,还有哪些因素是大模型发展的关键?

在GDC 2024大模型前沿论坛上,商汤科技大装置执行总监成功认为,大模型在很多场景下已经具备了强大的基础能力,但在推理和规划执行能力方面还需要继续突破。同时,效率和成本也是大模型发展的关键因素,需要以更低的成本、更快的速度触达应用并形成闭环。

其一是多模态融合的挑战,需要有效地将更多不同模态进行深度融合,提高模型对多模态数据的理解和处理能力。

其二是模型性能与成本平衡的挑战,需要在模型小型化的同时尽可能保持原有模型性能,特别是满足个人场景下端侧模型、端云协同的应用需求。

此外,随着大模型尺度的提升和训练数据的增加,行业还需要一套高效的大规模基础设施,以提供包括高质量的数据管线、全面的评价体系、完善的工具链等体系化的底层支撑。

成功表示,SenseCore 商汤大装置沉淀了整套大模型基础设施能力,不仅可服务于众多企业和科研院所的开发者,很快也会向个人开发者全面开放

在AI基础设施之上,SenseCore 商汤大装置将推出全新升级的大模型服务平台和开发者工具,并向社区免费提供千万级算力补贴、万亿token大模型调用资源。 商汤希望通过大装置激发整个社区的力量,携手更多开发者共同探索大模型能力前沿,拓展技术边界。

高效率、低成本智算基础设施

赋能AI生产新范式

大模型时代,计算量、模型参数和数据集规模都在快速增长从而不断推升模型的“智能”水平,其背后遵循的就是尺度定律。同时,随着AI在各行各业的落地向深水区挺进,人工智能基础设施化已成为必然趋势。

在GDC 2024曙光智能计算开发者讲坛上,商汤科技大装置产品总监陈希分享了依托SenseCore商汤大装置,商汤科技在智能计算领域的探索和实践。

第一,加速国产算力布局。通过与众多国产算力厂商合作,商汤与上下游产业伙伴共同推动国产生态建设,完成多款芯片与框架适配,落地1500P国产算力集群,积极推进芯片评价标准和体系的完善,加速整个国产算力商业化进程。

第二,持续探索尺度定律边界。随着大模型的参数量朝向万亿以上级别激增,稳定、高效的超大规模算力调度和训推引擎成为核心基石。 SenseCore 商汤大装置拥有万卡规模异构算力池,可满足万亿参数大模型训推需求,实现分钟级容错以达成30天以上大规模长时间训练不间断。 另外在推理侧,自研推理引擎在大语言、多模态模型性能表现提升2倍;通过训练、微调、推理混部,资源利用率提升40%,为用户提供极致性价比服务。

第三,建设面向开发者友好的AI基础设施。面对愈发高频次、高效率的模型迭代需求,SenseCore商汤大装置拥有领先的AI 原生云算力产品体系,为客户打造0门槛,一站式的极致开发体验,缩短大模型开发周期。

根据国际知名调研机构弗若斯特沙利文(Frost & Sullivan)联合头豹研究院发布的《2023年中国AI开发平台市场报告》,商汤大装置成为AI开发平台领军者,市场综合竞争表现国内第一,全球位居第二,仅次于亚马逊云。 以人工智能大模型开发、生产、应用为核心,商汤致力于通过高效率、低成本、规模化的下一代的人工智能基础设施与服务,深化AI算力生态建设,助力发展数字经济产业全生态。




审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1821

    文章

    50512

    浏览量

    267746
  • 商汤科技
    +关注

    关注

    8

    文章

    626

    浏览量

    37704
  • 大模型
    +关注

    关注

    2

    文章

    3863

    浏览量

    5297
  • 生成式AI
    +关注

    关注

    0

    文章

    538

    浏览量

    1144

原文标题:GDC 2024 | 商汤大装置加速大模型能力下沉,构建智能计算新生态

文章出处:【微信号:SenseTime2017,微信公众号:商汤科技SenseTime】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    润和软件亮相2026开放计算ROCm生态大会

    4月18日,2026开放计算ROCm生态大会在中国(南京)软件谷成功举办。本次大会以“开源共生 智能共赢——构建开放AI新生态”为主题,由A
    的头像 发表于 04-22 17:20 598次阅读
    润和软件亮相2026开放<b class='flag-5'>计算</b>ROCm<b class='flag-5'>生态</b>大会

    商汤科技以AI技术加强网络生态治理

    点亮美好生活两大方向,全面展示企业在人工智能治理领域的深耕成果与实践经验,助力青年学子提升AI风险识别能力,了解大模型发展趋势,与新时代青年共话AI向善、网络清朗的美好未来。
    的头像 发表于 03-30 09:47 646次阅读

    2026商汤奖学金申报正式开启

    随着大模型能力持续跃升,OpenClaw等新一代智能体应用的出现,也让“AI真正开始做事”变得更加可感。一个从模型突破走向场景落地、从能力
    的头像 发表于 03-23 10:49 513次阅读

    聚焦感知层核心环节 三清互联构建智能配电网产业新生态

    ,以完善的产品布局、成熟的技术积累与深度的行业适配能力构建起覆盖研发、生产、服务的全链条产业生态,为智能配电网高质量发展提供坚实保障。 在电力物联网的四层架构中,感知层是数据采集与指
    的头像 发表于 03-12 11:19 239次阅读

    商汤科技正式开源空间智能模型日日新SenseNova-SI-1.3

    商汤科技正式开源空间智能模型日日新SenseNova-SI-1.3,在空间测量、视角转换、综合推理等核心任务中展现出显著提升,另外对比之前的版本增强了回答简答题的能力
    的头像 发表于 02-10 14:12 691次阅读
    <b class='flag-5'>商汤</b>科技正式开源空间<b class='flag-5'>智能</b><b class='flag-5'>模型</b>日日新SenseNova-SI-1.3

    商汤科技日日新Seko系列模型与寒武纪成功适配

    12月15日,商汤科技基于在生成式AI与多模态交互领域的技术积累,正式发布Seko2.0——行业首个多剧集生成智能体。该智能体在多剧集视频生成的一致性方面展现出显著优势,其背后依托的是商汤
    的头像 发表于 12-17 14:06 677次阅读

    商汤绝影亮相2025长安汽车科技生态大会

    9月5日-8日,商汤绝影受邀参加2025世界智能产业博览会「长安汽车科技生态大会」,作为长安汽车合作伙伴参与行业技术交流,现场展出绝影端侧多模态大模型、AiOS及New Member三
    的头像 发表于 09-10 16:33 1976次阅读

    腾视科技AI大模型应用:提效、破局与落地,重塑智能新生态

    在这场数字化转型的浪潮中,腾视科技AI大模型凭借其强大的提效能力、破局的创新思维以及切实的落地实践,已然成为重塑智能新生态的重要力量。从企业办公中的高效决策支持,到教育科研里的学术探索
    的头像 发表于 08-18 14:06 1918次阅读
    腾视科技AI大<b class='flag-5'>模型</b>应用:提效、破局与落地,重塑<b class='flag-5'>智能</b><b class='flag-5'>新生态</b>

    商汤装置重磅发布多项标志性成果

    在2025世界人工智能大会(WAIC 2025)期间,作为“最懂大模型的AI基础设施”,商汤装置重磅发布多项标志性成果,持续打造AI基础设施发展新范式,力推动产业
    的头像 发表于 08-05 10:07 1213次阅读

    商汤装置算力Mall重磅发布

    近日,商汤科技联合华为、库帕思、海光、寒武纪、曦望Sunrise、壁仞科技、麒麟软件、摩尔线程等十余家国产生态伙伴,共同发布“商汤装置算力Mall”。
    的头像 发表于 08-05 10:05 1356次阅读

    商汤装置发布基于DeepLink的异构混合调度方案

    日前,在2025世界人工智能大会(WAIC)期间,商汤装置发布基于DeepLink的异构混合调度方案,将DeepLink深度融入商汤装置
    的头像 发表于 08-05 10:01 1303次阅读

    商汤装置赋能WAIC 2025主题曲首发

    在2025世界人工智能大会(WAIC)上,一首由AI创作的英文主题曲《AI For Good》引发了热烈关注。悠扬的旋律与激昂的歌词背后,是中国原创音乐大模型“音潮”的全流程创作能力,而支撑这一前沿突破的,是
    的头像 发表于 07-26 14:52 1540次阅读

    云知声与商汤科技达成战略合作

    终端等核心领域展开深度合作,探索大模型在垂直行业的落地实践。通过模型能力的深度融合,双方将在语音与视觉等多模态交互方面协同创新,为行业客户提供更自然、更高效的智能交互体验,
    的头像 发表于 06-20 14:52 1206次阅读

    爆款应用背后的商汤装置

    由想法流打造的“造梦次元”,是由多模态AI驱动的新一代内容平台,得益于商汤装置AIGC解决方案从算力到模型的端到端支持,通过算力和模型模型
    的头像 发表于 06-18 16:44 1207次阅读

    商汤科技“小浣熊家族”与蚂蚁集团旗下智能体开发平台“蚂蚁百宝箱”正式达成生态合作

    登陆到支付宝平台。 在数据要素价值加速释放与大模型深度赋能的背景下,新应用场景加速落地,市场需求涌现。数字生活平台上的商家及生态方,需要更加轻量化、
    的头像 发表于 06-09 15:09 1575次阅读
    <b class='flag-5'>商汤</b>科技“小浣熊家族”与蚂蚁集团旗下<b class='flag-5'>智能</b>体开发平台“蚂蚁百宝箱”正式达成<b class='flag-5'>生态</b>合作