0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

商汤科技推出“日日新”融合大模型

商汤科技SenseTime 来源:商汤科技SenseTime 2025-01-10 15:59 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

今年大模型还要如何进化,还有怎样的想象空间?

刚刚,商汤正式推出“日日新”融合大模型,领先实现原生融合模态,深度推理能力与多模态信息处理能力均大幅提升,并在两大权威评测榜单夺得第一,成为“双冠王”。

国内权威大模型测评机构SuperCLUE最新发布的《中文大模型基准测评2024年度报告》:商汤“日日新”融合大模型以总分68.3的优异成绩,与 DeepSeek V3 一起并列国内榜首,成为年度第一。

在近期另一个权威综合评测机构OpenCompass的多模态评测中,商汤以同一款模型同样取得了榜单第一,分数大幅领先GPT-4o。

“一个模型、双料冠军”,意味着商汤科技率先在原生融合模态训练取得实质性突破,这将引领业界从大语言模型和多模态大模型分立的普遍现状,走向真正意义的模型一统。

商汤“日日新”突破了模态融合的技术,跨越了模态之间的鸿沟,就为深度推理能力和多模态信息的结合铺平了道路。

文理兼修,能写能看能推理

商汤“日日新”融合大模型性能上文理兼修,在SuperCLUE年度评测中,文科成绩以81.8分位列全球第一,超越OpenAI的o1模型;理科成绩夺得金牌,其中计算维度以78.2分位列国内第一。

实现原生模态融合后,“日日新”融合大模型不止能达到人类“看”和“想”的水平,还可以帮助你解决更多复杂问题,看不清的字体、数据图表里的信息、文学创作与撰写……这些都可以实现。

融合模态开拓应用新维度

在实际应用场景中,相较于传统大语言模型仅支持单一文本输入的模式,"日日新"融合大模型展现出显著优势,尤其是在自动驾驶、视频交互、办公教育、金融、园区管理、工业制造等天然拥有丰富模态信息的场景中。

“日日新"融合大模型能够有效满足用户对图像、视频、语音、文本等多源异构信息的综合处理与识别需求。

例如,在办公、金融领域,其行业属性拥有很多复杂的富模态文档:表格、文本、图片、视频,以及融合上述形式的丰富信息,基于“日日新”融合大模型的商汤应用——办公小浣熊就可以高效地完成处理分析相关的复杂任务。

与此同时,基于融合大模型的优势,商汤“日日新”在视觉交互上也有丰富的应用场景,例如,在线上教育、语音客服等场景,均可以结合语音和自然语言来提升交互体验。

去年年底开始,原生多模态大模型就逐渐成为业内探讨的重要方向。然而由于数据和训练方法的局限,业内很多机构的尝试并不成功——多模态训练过程往往会导致纯语言任务尤其是指令跟随和推理任务的性能严重下降。

得益于在计算机视觉领域十年深耕以及人工智能赋能场景的丰富经验,商汤一直坚信多模态模型是 AI 2.0 进行场景落地的必由之路,对于多模态大模型的研发也有自己的独特见解。在推动语言模型和多模态模型融合的过程中,发展出两项关键的创新技术:融合模态数据合成与融合任务增强训练,进而完成“日日新”融合大模型的训练,推向市场。

在预训练阶段,商汤不仅采用了天然存在的海量图文交错数据,还通过逆渲染、基于混合语义的图像生成等方法合成了大量融合模态数据,在图文模态之间建立起大量交互桥梁,使得模型基座对于模态之间的丰富关系有更扎实的掌握,也为更好地完成跨模态任务打下坚实的基础,从而实现整体性能的提升。

在后训练阶段,商汤基于对广泛业务场景的认知,构建了大量的跨模态任务,包括视频交互、多模态文档分析、城市场景理解、车载场景理解等。通过把这些任务融入到增强训练的过程,商汤的融合模态模型不仅被激发出强大的对多模态信息进行整合理解分析的能力,而且还形成了对业务场景有效的响应能力,走通了应用落地反哺基础模型迭代的闭环。

实现多模态交互与深度融合、走向真正意义的模型一统,是走向世界模型的必经之路,商汤科技已在该赛道实现领跑优势。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1819

    文章

    50287

    浏览量

    266826
  • 商汤科技
    +关注

    关注

    8

    文章

    618

    浏览量

    37669
  • 大模型
    +关注

    关注

    2

    文章

    3747

    浏览量

    5268

原文标题:商汤推出“日日新”融合大模型,勇夺“双冠王”

文章出处:【微信号:SenseTime2017,微信公众号:商汤科技SenseTime】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    商汤科技正式开源空间智能模型日日新SenseNova-SI-1.3

    商汤科技正式开源空间智能模型日日新SenseNova-SI-1.3,在空间测量、视角转换、综合推理等核心任务中展现出显著提升,另外对比之前的版本增强了回答简答题的能力。
    的头像 发表于 02-10 14:12 573次阅读
    <b class='flag-5'>商汤</b>科技正式开源空间智能<b class='flag-5'>模型</b><b class='flag-5'>日日新</b>SenseNova-SI-1.3

    避繁就简!商汤日日新模型灵性巧解数学难题,获赞“机器的审美”

    、字节跳动,让数学与AI同台碰撞,开展了一场真刀真枪的“图灵测试”。 现场,面对数学家抛出的难题,商汤科技“日日新”大模型在解答复分析计算积分、微分几何证明等问题中,展示了惊人的进化力。 在计算一个复杂的广义积分
    的头像 发表于 01-12 11:41 407次阅读
    避繁就简!<b class='flag-5'>商汤</b><b class='flag-5'>日日新</b>大<b class='flag-5'>模型</b>灵性巧解数学难题,获赞“机器的审美”

    商汤科技日日新V6.5荣获2025年多模态大模型全国第一

    近日,权威大模型评测基准 SuperCLUE 发布《中文多模态视觉语言模型测评基准12月报告》,商汤日日新V6.5(SenseNova V6.5 Pro)以75.35的总分位列国内第一
    的头像 发表于 01-06 14:44 903次阅读
    <b class='flag-5'>商汤</b>科技<b class='flag-5'>日日新</b>V6.5荣获2025年多模态大<b class='flag-5'>模型</b>全国第一

    商汤科技日日新Seko系列模型与寒武纪成功适配

    12月15日,商汤科技基于在生成式AI与多模态交互领域的技术积累,正式发布Seko2.0——行业首个多剧集生成智能体。该智能体在多剧集视频生成的一致性方面展现出显著优势,其背后依托的是商汤自研的日日新Seko系列
    的头像 发表于 12-17 14:06 576次阅读

    商汤科技正式发布并开源全新多模态模型架构NEO

    商汤科技正式发布并开源了与南洋理工大学S-Lab合作研发的全新多模态模型架构 —— NEO,为日日新SenseNova 多模态模型奠定了新一代架构的基石。
    的头像 发表于 12-08 11:19 1141次阅读
    <b class='flag-5'>商汤</b>科技正式发布并开源全新多模态<b class='flag-5'>模型</b>架构NEO

    商汤如影图片数字人技术闪耀央视舞台

    依托商汤日日新模型的多模态能力,只需上传一张人物照片,输入文字脚本或音频文件,AI 就能自动生成人物动态视频,并支持多种语言,实现了与真人几乎无差别的口型匹配、动作呼应和情绪表达。
    的头像 发表于 09-22 16:18 1123次阅读

    商汤日日新V6.5多模态大模型登顶全球权威榜单

    根据权威评测平台OpenCompass多模态大模型学术榜单(Multi-modal Academic Leaderboard)最新数据显示,商汤日日新 V6.5」(SenseNova-V6.5
    的头像 发表于 09-10 09:55 924次阅读

    商汤日日新模型赋能紫光汉图打造激光多功能一体机

    商汤日日新模型赋能紫光汉图,为一线教师打造全新教学生产力。
    的头像 发表于 08-19 15:51 1045次阅读
    <b class='flag-5'>商汤</b><b class='flag-5'>日日新</b>大<b class='flag-5'>模型</b>赋能紫光汉图打造激光多功能一体机

    小米AI眼镜×商汤日日新 商汤日日新”大模型交互平台「商量」已探索性接入小米AI眼镜

    程度:据国内XR Vision报道,小米AI眼镜首销3天销量或已接近5万副,创下了中国AI眼镜最快销售纪录。 作为小米长期生态合作伙伴,商汤日日新”大模型交互平台「商量」已探索性接入小米AI 眼镜,成为用户的 “第二大脑”,帮
    的头像 发表于 08-07 15:35 9700次阅读
    小米AI眼镜×<b class='flag-5'>商汤</b><b class='flag-5'>日日新</b> <b class='flag-5'>商汤</b>“<b class='flag-5'>日日新</b>”大<b class='flag-5'>模型</b>交互平台「商量」已探索性接入小米AI眼镜

    看点:商汤日日新”拟接入小米AI眼镜 鸿利智汇:部分产品已应用于小米汽车

    给大家带来一些业界资讯: 商汤日日新”拟接入小米AI眼镜 据商汤科技透露,作为小米长期生态合作伙伴,商汤日日新”大
    的头像 发表于 08-07 14:47 1117次阅读

    商汤日日新SenseNova融合模态大模型 国内首家获得最高评级的大模型

    近日,中国信息通信研究院(以下简称“中国信通院”)完成可信AI多模态大模型首轮评估。 商汤日日新SenseNova融合模态大模型在所有
    的头像 发表于 06-11 11:57 1550次阅读

    商汤科技日日新V6大模型斩获“双料第一” 一项国内榜首,一个全球第一

    卫冕“双冠”! 通用语言能力并列国内榜首、多模态能力全球最强,商汤日日新V6」近期斩获“双料第一”。 5月28日,权威大模型测评机构SuperCLUE《中文大模型基准测评2025年5
    的头像 发表于 05-30 11:13 1717次阅读
    <b class='flag-5'>商汤</b>科技<b class='flag-5'>日日新</b>V6大<b class='flag-5'>模型</b>斩获“双料第一” 一项国内榜首,一个全球第一

    商汤科技与敦煌当代美术馆达成战略合作

    敦煌的星辰在壁画上流转了二十个世纪,而今正折射出数字文明的光辉。近日,商汤科技与敦煌当代美术馆正式达成战略合作,基于商汤科技最新日日新模型体系,双方将共同推动人工智能技术在文化旅游领
    的头像 发表于 05-08 16:48 1119次阅读

    商汤科技与上海徐汇区文旅局达成合作

    近日,商汤科技与上海徐汇区文旅局达成合作,基于商汤最新AI大模型日日新SenseNova V6,打造智慧文旅新技术与应用成果,可为游客提供拟人化的“贴身导游”服务。
    的头像 发表于 04-24 16:23 1100次阅读

    商汤科技助力如影数字人超级直播间全新升级

    作为数字人全行业首创,如影数字人超级直播间可实现多模态智能运营,依托“商汤日日新SenseNova”多模态大模型,直播间具备智能选品、直播间复刻、素材提炼等能力,能够大幅提高运营效率。
    的头像 发表于 04-23 16:31 1079次阅读