0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

商汤日日新大模型全面升级,SenseCore可支持20个千亿参数量大模型同时训练

Carol Li 来源:电子发烧友网 作者:李弯弯 2023-07-13 00:13 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/李弯弯)今年4月10日,商汤科技正式首次公布“日日新SenseNova”大模型体系。在日前的2023世界人工智能大会上,商汤科技宣布“商汤日日新SenseNova”大模型体系将多方位全面升级,并宣布在该体系下一系列的大模型产品更新和落地成果。

“日日新SenseNova”全面升级及应用落地

商汤科技发布的“商量”2.0版本,是一个千亿级参数的自然语言处理模型,它突破了大语言模型输入长度的限制,推出不同参数量级的模型版本,可完美适配移动端、云端等不同终端及场景的应用需求,降低部署成本。

商汤还推出小模型商量S版(SenseChat S)等不同参数量级的模型版本,小模型不但性能上有一定突破,在前端的运行上也能够跑到高通骁龙8 Gen2的终端芯片上,适配移动端等不同终端及场景的应用需求。

另外,商汤全新的秒画3.0,模型参数从今年4月首发的10亿提升至70亿量级;如影SenseAvatar 2.0数字人生成平台,相较1.0版本的语音和口型流畅度提升30%以上,实现4K高清视频效果,并带来AIGC生成形象及数字人歌唱功能。

基于神经辐射场技术(NeRF)的大场景3D内容生成平台商汤琼宇SenseSpace2.0,在空间重建效率上提升20%,渲染性能提升50%,每100平方公里场景的建图仅需38小时即可完成(1200 TFLOPS/秒算力支持),同等工作量由人工建图需要10000人天。

商汤格物SenseThings 2.0对小物体的纹理及材质还原达到毫米级精细度,并突破对高反光和镜面物体的采集难题。

在应用上,比如格物在线下场景的落地,商汤科技灵境空间事业部总监李宇飞介绍,目前,“格物”支持多种物品品类的复刻,并突破了行业难题——高反光、镜面物体的复刻,比如珠宝首饰、小家电、金属物件等。

传统的重建技术通常难以解决高反光,镜面物体的采集和复刻。然而,“格物”不仅可以避免伤害和改变物品的情况,还能精确还原物品的外观和特征。除此之外,“格物”包含一键成图和一键成片等再创作服务。通过一键成图功能,用户可以生成商品与场景融合的海报,或者试穿试戴的真人海报,相比其他AI技术只能部分还原商品细节,一键成图可以100%还原商品的各个视角和效果。

再比如影SenseAvatar 2.0数字人生成平台,商汤数字人在金融领域,银行、保险、券商等担任智能客服、智慧营销等工作,接入大语言模型能力,还能提供投研分析、研报撰写等新功能,实现降本增效。挂载金融知识库后,还能100%基于客户的产品说明进行内容问答输出,并实现信息及时更新。此外,商汤如影2.0生成的数字人,正在进入多个头部企业的直播间、短视频频道。

“大模型+大装置”的AGI战略布局

2022年,以GPT为代表的预训练大模型带来新一波AI应用的爆发,大模型的研发依赖于大规模智能计算基础设施。商汤科技坚持“大模型+大装置”的AGI战略布局。商汤科技打造了人工智能基础设施AI大装置SenseCore,打通算力、算法和平台,并在此基础上建立商汤“日日新SenseNova”大模型及研发体系。

根据该公司2022年度报告,商汤SenseCore AI大装置持续扩建,完成2.7万块GPU的部署并实现了5.0 exaFLOPS算力输出能力,以AIaaS的模式面向行业伙伴提供服务,全面赋能商汤自身以及行业伙伴的大模型生产。SenseCore目前可有效支持最多20个千亿参数量大模型(以千卡并行)同时训练,最高可支持万亿参数超大模型的训练。

目前,SenseCore已支持了超过10个大模型训练项目,包括语言大模型、文生图模型、视觉大模型、多模态模型等自研模型和客户自定义模型。同时商汤面向8家大型客户支持了7000多张GPU的计算资源,以服务其自定义的大模型训练任务。

SenseCore提供的AIaaS具体包括了计算基础设施服务(IaaS)、深度学习平台服务(PaaS)、模型部署及推理服务(MaaS)三大部分的能力。

1、强大的计算基础设施(IaaS):SenseCore提供高性能计算资源(例如GPU集群和高速网络),以支持大型模型训练所需的强大算力。分布式训练构架支持千卡级别的大规模分布式训练,千卡并行效率达91.5%,最高支持4,000块GPU卡的单任务训练,有效降低训练时间,提升计算效率。2022年,位于上海临港的商汤AIDC开放运营,是由公司自建的大规模、低碳节能的先进计算基础设施,是目前亚洲最大的人工智能算力中心之一。上海临港AIDC的开业大大增强了SenseCore的高性能算力供应能力。

2、易用的深度学习平台、丰富的开发工具、预训练模型库和开源体系(PaaS):商汤提供易用的开发工具和深度学习平台,协助内外部高效构建和优化模型。也提供涵盖多个领域和场景的预训练模型库。用户可基于这些模型进行二次开发,大幅缩短研发周期,降低研发成本和风险。同时,公司开源了OpenMMLab、OpenGVLab、OpenDILab、OpenXRLab及OpenPPL五大平台,包含了共计2,500多种预训练模型及400多种算法,这些开源体系吸引全球AI开发者的参与,在Github上获得77,000+的星标。

3、灵活的模型部署及推理服务(MaaS):SenseCore支持用户将训练好的AI模型一键跨平台部署到云端、边缘设备或混合环境中。公司针对30款芯片、100多种平台进行了常规模型的适配和优化,支持大规模的实时推理。提供模型压缩、模型融合等优化工具和技术,进一步提高模型在部署和推理阶段的性能。

小结

过去几个月时间,国内外已经涌现出大量大模型产品,如今,探索大模型应用落地已经成为当前业界关注的焦点。目前包括商汤科技在内的不少企业已经在多个领域实现应用。此外,无论是大模型的训练还是推理都离不开算力的支持,而在这方面,商汤科技也早有布局。在算力匮乏的当下,大模型+大装置的战略路线对于其后续的发展,也极其有利。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 商汤
    +关注

    关注

    0

    文章

    95

    浏览量

    4420
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    商汤科技正式开源空间智能模型日日新SenseNova-SI-1.3

    商汤科技正式开源空间智能模型日日新SenseNova-SI-1.3,在空间测量、视角转换、综合推理等核心任务中展现出显著提升,另外对比之前的版本增强了回答简答题的能力。
    的头像 发表于 02-10 14:12 576次阅读
    <b class='flag-5'>商汤</b>科技正式开源空间智能<b class='flag-5'>模型</b><b class='flag-5'>日日新</b>SenseNova-SI-1.3

    避繁就简!商汤日日新模型灵性巧解数学难题,获赞“机器的审美”

    、字节跳动,让数学与AI同台碰撞,开展了一场真刀真枪的“图灵测试”。 现场,面对数学家抛出的难题,商汤科技“日日新”大模型在解答复分析计算积分、微分几何证明等问题中,展示了惊人的进化力。 在计算一
    的头像 发表于 01-12 11:41 410次阅读
    避繁就简!<b class='flag-5'>商汤</b><b class='flag-5'>日日新</b>大<b class='flag-5'>模型</b>灵性巧解数学难题,获赞“机器的审美”

    商汤科技日日新V6.5荣获2025年多模态大模型全国第一

    近日,权威大模型评测基准 SuperCLUE 发布《中文多模态视觉语言模型测评基准12月报告》,商汤日日新V6.5(SenseNova V6.5 Pro)以75.35的总分位列国内第一
    的头像 发表于 01-06 14:44 907次阅读
    <b class='flag-5'>商汤</b>科技<b class='flag-5'>日日新</b>V6.5荣获2025年多模态大<b class='flag-5'>模型</b>全国第一

    商汤科技日日新Seko系列模型与寒武纪成功适配

    12月15日,商汤科技基于在生成式AI与多模态交互领域的技术积累,正式发布Seko2.0——行业首个多剧集生成智能体。该智能体在多剧集视频生成的一致性方面展现出显著优势,其背后依托的是商汤自研的日日新Seko系列
    的头像 发表于 12-17 14:06 581次阅读

    商汤科技正式发布并开源全新多模态模型架构NEO

    商汤科技正式发布并开源了与南洋理工大学S-Lab合作研发的全新多模态模型架构 —— NEO,为日日新SenseNova 多模态模型奠定了新一代架构的基石。
    的头像 发表于 12-08 11:19 1149次阅读
    <b class='flag-5'>商汤</b>科技正式发布并开源全新多模态<b class='flag-5'>模型</b>架构NEO

    在Ubuntu20.04系统中训练神经网络模型的一些经验

    , batch_size=512, epochs=20)总结 这个核心算法中的卷积神经网络结构和训练过程,是用来对MNIST手写数字图像进行分类的。模型将图像作为输入,通过卷积和池化层提取图像的特征,然后通过全连接层进行分类预
    发表于 10-22 07:03

    商汤日日新V6.5多模态大模型登顶全球权威榜单

    根据权威评测平台OpenCompass多模态大模型学术榜单(Multi-modal Academic Leaderboard)最新数据显示,商汤日日新 V6.5」(SenseNova-V6.5
    的头像 发表于 09-10 09:55 930次阅读

    商汤日日新模型赋能紫光汉图打造激光多功能一体机

    商汤日日新模型赋能紫光汉图,为一线教师打造全新教学生产力。
    的头像 发表于 08-19 15:51 1048次阅读
    <b class='flag-5'>商汤</b><b class='flag-5'>日日新</b>大<b class='flag-5'>模型</b>赋能紫光汉图打造激光多功能一体机

    小米AI眼镜×商汤日日新 商汤日日新”大模型交互平台「商量」已探索性接入小米AI眼镜

    程度:据国内XR Vision报道,小米AI眼镜首销3天销量或已接近5万副,创下了中国AI眼镜最快销售纪录。 作为小米长期生态合作伙伴,商汤日日新”大模型交互平台「商量」已探索性接入小米AI 眼镜,成为用户的 “第二大脑”,帮
    的头像 发表于 08-07 15:35 9707次阅读
    小米AI眼镜×<b class='flag-5'>商汤</b><b class='flag-5'>日日新</b> <b class='flag-5'>商汤</b>“<b class='flag-5'>日日新</b>”大<b class='flag-5'>模型</b>交互平台「商量」已探索性接入小米AI眼镜

    看点:商汤日日新”拟接入小米AI眼镜 鸿利智汇:部分产品已应用于小米汽车

    给大家带来一些业界资讯: 商汤日日新”拟接入小米AI眼镜 据商汤科技透露,作为小米长期生态合作伙伴,商汤日日新”大
    的头像 发表于 08-07 14:47 1122次阅读

    商汤日日新SenseNova融合模态大模型 国内首家获得最高评级的大模型

    近日,中国信息通信研究院(以下简称“中国信通院”)完成可信AI多模态大模型首轮评估。 商汤日日新SenseNova融合模态大模型在所有模型
    的头像 发表于 06-11 11:57 1553次阅读

    商汤科技日日新V6大模型斩获“双料第一” 一项国内榜首,一全球第一

    卫冕“双冠”! 通用语言能力并列国内榜首、多模态能力全球最强,商汤日日新V6」近期斩获“双料第一”。 5月28日,权威大模型测评机构SuperCLUE《中文大模型基准测评2025年5
    的头像 发表于 05-30 11:13 1720次阅读
    <b class='flag-5'>商汤</b>科技<b class='flag-5'>日日新</b>V6大<b class='flag-5'>模型</b>斩获“双料第一” 一项国内榜首,一<b class='flag-5'>个</b>全球第一

    商汤科技与上海徐汇区文旅局达成合作

    近日,商汤科技与上海徐汇区文旅局达成合作,基于商汤最新AI大模型日日新SenseNova V6,打造智慧文旅新技术与应用成果,可为游客提供拟人化的“贴身导游”服务。
    的头像 发表于 04-24 16:23 1102次阅读

    AI原生架构升级:RAKsmart服务器在超大规模模型训练中的算力突破

    近年来,随着千亿参数模型的崛起,AI训练对算力的需求呈现指数级增长。传统服务器架构在应对分布式训练、高并发计算和显存优化等场景时逐渐显露瓶颈。而RAKsmart为超大规模
    的头像 发表于 04-24 09:27 896次阅读

    商汤科技助力如影数字人超级直播间全新升级

    作为数字人全行业首创,如影数字人超级直播间实现多模态智能运营,依托“商汤日日新SenseNova”多模态大模型,直播间具备智能选品、直播间复刻、素材提炼等能力,能够大幅提高运营效率。
    的头像 发表于 04-23 16:31 1081次阅读