0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

商汤大装置加速大模型能力下沉,构建智能计算新生态

商汤科技SenseTime 来源:商汤科技SenseTime 2024-03-29 15:21 次阅读

大模型技术持续突破前沿,如何加速向产业“下沉”?

3月23~24日,2024全球开发者先锋大会(GDC)在上海成功举办。期间,商汤科技大装置执行总监成功,以及商汤科技大装置产品总监陈希受邀出席大会分论坛活动,围绕大模型前沿开发、智能计算创新等话题分享前瞻洞见,共话智能生态构建

以体系化基础能力支撑,加速大模型向下演进

去年以来,生成式AI取得了飞跃式的发展,并不断从单一模态向多模态演进。那么,还有哪些因素是大模型发展的关键?

在GDC 2024大模型前沿论坛上,商汤科技大装置执行总监成功认为,大模型在很多场景下已经具备了强大的基础能力,但在推理和规划执行能力方面还需要继续突破。同时,效率和成本也是大模型发展的关键因素,需要以更低的成本、更快的速度触达应用并形成闭环。

其一是多模态融合的挑战,需要有效地将更多不同模态进行深度融合,提高模型对多模态数据的理解和处理能力。

其二是模型性能与成本平衡的挑战,需要在模型小型化的同时尽可能保持原有模型性能,特别是满足个人场景下端侧模型、端云协同的应用需求。

此外,随着大模型尺度的提升和训练数据的增加,行业还需要一套高效的大规模基础设施,以提供包括高质量的数据管线、全面的评价体系、完善的工具链等体系化的底层支撑。

成功表示,SenseCore 商汤大装置沉淀了整套大模型基础设施能力,不仅可服务于众多企业和科研院所的开发者,很快也会向个人开发者全面开放

在AI基础设施之上,SenseCore 商汤大装置将推出全新升级的大模型服务平台和开发者工具,并向社区免费提供千万级算力补贴、万亿token大模型调用资源。 商汤希望通过大装置激发整个社区的力量,携手更多开发者共同探索大模型能力前沿,拓展技术边界。

高效率、低成本智算基础设施

赋能AI生产新范式

大模型时代,计算量、模型参数和数据集规模都在快速增长从而不断推升模型的“智能”水平,其背后遵循的就是尺度定律。同时,随着AI在各行各业的落地向深水区挺进,人工智能基础设施化已成为必然趋势。

在GDC 2024曙光智能计算开发者讲坛上,商汤科技大装置产品总监陈希分享了依托SenseCore商汤大装置,商汤科技在智能计算领域的探索和实践。

第一,加速国产算力布局。通过与众多国产算力厂商合作,商汤与上下游产业伙伴共同推动国产生态建设,完成多款芯片与框架适配,落地1500P国产算力集群,积极推进芯片评价标准和体系的完善,加速整个国产算力商业化进程。

第二,持续探索尺度定律边界。随着大模型的参数量朝向万亿以上级别激增,稳定、高效的超大规模算力调度和训推引擎成为核心基石。 SenseCore 商汤大装置拥有万卡规模异构算力池,可满足万亿参数大模型训推需求,实现分钟级容错以达成30天以上大规模长时间训练不间断。 另外在推理侧,自研推理引擎在大语言、多模态模型性能表现提升2倍;通过训练、微调、推理混部,资源利用率提升40%,为用户提供极致性价比服务。

第三,建设面向开发者友好的AI基础设施。面对愈发高频次、高效率的模型迭代需求,SenseCore商汤大装置拥有领先的AI 原生云算力产品体系,为客户打造0门槛,一站式的极致开发体验,缩短大模型开发周期。

根据国际知名调研机构弗若斯特沙利文(Frost & Sullivan)联合头豹研究院发布的《2023年中国AI开发平台市场报告》,商汤大装置成为AI开发平台领军者,市场综合竞争表现国内第一,全球位居第二,仅次于亚马逊云。 以人工智能大模型开发、生产、应用为核心,商汤致力于通过高效率、低成本、规模化的下一代的人工智能基础设施与服务,深化AI算力生态建设,助力发展数字经济产业全生态。




审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1776

    文章

    43845

    浏览量

    230600
  • 商汤科技
    +关注

    关注

    8

    文章

    417

    浏览量

    35879
  • 大模型
    +关注

    关注

    2

    文章

    1516

    浏览量

    1103
  • 生成式AI
    +关注

    关注

    0

    文章

    349

    浏览量

    212

原文标题:GDC 2024 | 商汤大装置加速大模型能力下沉,构建智能计算新生态

文章出处:【微信号:SenseTime2017,微信公众号:商汤科技SenseTime】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    商汤科技发布5.0多模态大模型,综合能力全面对标GPT-4 Turbo

    商汤科技发布5.0多模态大模型,综合能力全面对标GPT-4 Turbo 4月23日,商汤科技董事长兼CEO徐立在2024商汤技术交流日上发布
    的头像 发表于 04-24 16:49 455次阅读

    数势科技副总裁宋丽出席百度智能云GENERATE全球生态大会,共商大模型生态

    2024年4月9日,百度智能云首届“百度智能云GENERATE全球生态大会”在成都举办。大会带来了百度智能云在大模型时代的全
    的头像 发表于 04-10 16:49 161次阅读
    数势科技副总裁宋丽出席百度<b class='flag-5'>智能</b>云GENERATE全球<b class='flag-5'>生态</b>大会,共商大<b class='flag-5'>模型</b><b class='flag-5'>生态</b>

    商汤科技作亮相2024全球开发者先锋大会

    2024全球开发者先锋大会(GDC)在上海圆满落幕。商汤科技作为业内翘楚,其大装置执行总监成功和产品总监陈希受邀参加了此次大会的分论坛活动,就大模型前沿开发、智能
    的头像 发表于 03-29 10:24 218次阅读

    商汤与华为昇腾共筑人工智能产业新生态

    近日,华为对SenseCore商汤装置AI云及商汤日日新·商量SenseChat大语言模型进行了全面评测,结果喜人。这两款产品均成功通过华为Atlas系列服务器的兼容性测试,并荣获H
    的头像 发表于 03-25 09:36 346次阅读

    商汤科技与库醇科技达成合作 为垂域大模型构建高质量大规模的领域微调数据

    近日,商汤科技与库醇科技(StockVins)达成合作,双方将基于商汤领先的算法能力和库醇在葡萄酒行业的深厚积累, 共 同打造智能化葡萄酒管理、仓储和推荐系统 ,革新大众体验葡萄酒的方
    的头像 发表于 01-10 09:46 480次阅读
    <b class='flag-5'>商汤</b>科技与库醇科技达成合作 为垂域大<b class='flag-5'>模型</b><b class='flag-5'>构建</b>高质量大规模的领域微调数据

    什么是加速计算加速计算的应用场景和解决方案

    前所未有的处理能力,在云基础设施中发挥着核心作用,因为它有助于更高效、更有效地管理数据中心的海量信息。此外,加速计算还能提供必要的计算能力
    的头像 发表于 12-28 10:07 1079次阅读
    什么是<b class='flag-5'>加速</b><b class='flag-5'>计算</b>?<b class='flag-5'>加速</b><b class='flag-5'>计算</b>的应用场景和解决方案

    思必驰DFM-2大模型助力构建产业新生态

    近日,思必驰DFM-2大模型通过《生成式人工智能服务管理暂行办法》备案,成为江苏省本土人工智能首个通过大模型备案的企业,后续思必驰DFM-2大模型
    的头像 发表于 12-20 13:35 492次阅读

    思必驰探讨大模型下的智能座舱新生态

    为应对行业挑战,思必驰发布了定位为“针对垂域的、具有通用智能的行业语言大模型”DFM-2。它不仅具备通用语言计算模型的所有AGI特性,包括文案创作、代码生成、逻辑推理、常识问答、多轮
    发表于 12-19 14:55 210次阅读
    思必驰探讨大<b class='flag-5'>模型</b>下的<b class='flag-5'>智能</b>座舱<b class='flag-5'>新生态</b>

    什么是Ada4528号卫星输出的当前能力下沉能力?

    什么是Ada4528号卫星输出的当前能力下沉能力? 感谢 谢谢
    发表于 11-24 08:15

    商汤打出“数字中国”建设大模型组合拳

    提供宏观尺度的解译能力,“洞察地球奥秘”。 以 商汤琼宇SenseSpace高精实景三维重建平台 提供精细化建模能力,“还原真实世界”。 从 二维到三维的大模型组合拳 ,是
    的头像 发表于 11-09 13:35 338次阅读
    <b class='flag-5'>商汤</b>打出“数字中国”建设大<b class='flag-5'>模型</b>组合拳

    商汤科技(西南)人工智能计算中心“点亮”,AGI基础设施加速产业数字化升级

    —2025年)》 早在2022年初,位于 基于SenseCore商汤装置AI云服务产品体系,以南岸区重庆经开区为起点,商汤科技将充分利用在人工智能领域的深厚技术积累与丰富落地经验,结
    的头像 发表于 10-25 16:25 285次阅读
    <b class='flag-5'>商汤</b>科技(西南)人工<b class='flag-5'>智能</b><b class='flag-5'>计算</b>中心“点亮”,AGI基础设施<b class='flag-5'>加速</b>产业数字化升级

    通过“3D城市模型加速发展的智能城市、数字孪生的构建、电子领域的数据驱动

    通过“3D城市模型加速发展的智能城市、数字孪生的构建、电子领域的数据驱动
    的头像 发表于 10-16 17:36 368次阅读
    通过“3D城市<b class='flag-5'>模型</b>”<b class='flag-5'>加速</b>发展的<b class='flag-5'>智能</b>城市、数字孪生的<b class='flag-5'>构建</b>、电子领域的数据驱动

    算力为基,共筑AI新生态

    NEWS 9月22日,华为全联接大会2023期间,华为计算产品线总裁张熙伟发表《算力为基,共筑AI新生态》主题演讲,他表示: 华为将 深耕算力底座,聚焦鲲鹏、昇腾基础软硬件创新,携手伙伴与开发者
    的头像 发表于 09-22 23:00 478次阅读
    算力为基,共筑AI<b class='flag-5'>新生态</b>

    营造人工智能模型产业生态

     打造良好的人工智能大规模模型产业生态,需要着力解决目前中国人工智能大规模模型发展面临的尖端计算
    的头像 发表于 06-14 09:19 534次阅读

    让大模型“百花齐放”,商汤装置SenseCore提供一片沃土

    上下游及高校与科研院所共同开展资源共享、技术交流和项目合作;同时, 商汤还被授予“新片区智算产业链链主”企业 。 大模型迭代和处理能力日日更新 商汤科技前瞻打造了软硬结合的AGI基础设
    的头像 发表于 06-05 01:00 1138次阅读
    让大<b class='flag-5'>模型</b>“百花齐放”,<b class='flag-5'>商汤</b>大<b class='flag-5'>装置</b>SenseCore提供一片沃土