0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

商汤日日新·商量大模型位列国内大模型第一梯队

商汤科技SenseTime 来源:商汤科技SenseTime 2024-11-08 15:38 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

模型表现好,金牌少不了。

刚刚,中文大模型测评基准SuperCLUE发布《中文大模型基准测评2024年10月报告》:

商汤日日新·商量大模型(SenseChat5.5)凭借出色的能力表现,总得分位列国内大模型第一梯队,获得金牌。

本次SuperCLUE10月报告覆盖23个国内模型,聚焦语言大模型的通用能力评估,分为三大维度:除了考察“文科”、“理科”基础能力外,还有考察模型更高阶能力的“Hard”附加任务,总共2900+道题:

【理科任务】分为计算、逻辑推理、代码、工具使用测评集;

【文科任务】分为知识百科、语言理解、长文本、角色扮演、生成与创作、安全六大测评集;

【Hard任务】分为精确指令遵循测评集,复杂任务高阶推理测评集。

商汤SenseChat5.5在多项评测任务中均位列第一梯队,文科中语言理解、安全等维度表现突出,也是理科中逻辑推理、代码学科的“尖子生”。

值得注意的是,在【Hard】的两项任务——精准指令遵循和高阶推理中,商汤SenseChat5.5是唯一两项任务均位于国内第一梯队的大模型,体现了模型优秀的复杂推理智能。

未来,商汤将继续坚持基础大模型的持续研发与投入,不断提升真正高阶推理及“慢思考”能力。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 商汤科技
    +关注

    关注

    8

    文章

    618

    浏览量

    37673
  • 大模型
    +关注

    关注

    2

    文章

    3765

    浏览量

    5269

原文标题:近3000道题,商汤大模型拿了金牌

文章出处:【微信号:SenseTime2017,微信公众号:商汤科技SenseTime】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    小米杀进第一梯队!旗舰大模型登场,硬扛MiniMax2.7和千问Qwen3.5

    3月19日,小米技术在微博上官宣,小米迈向Agent时代的旗舰基座模型Xiaomi MiMo-V2-Pro正式发布。小米MiMo大模型系列重磅三连更,包括旗舰基座大模型MiMo-V2-Pro、全模态Agent
    的头像 发表于 03-19 11:54 9682次阅读
    小米杀进<b class='flag-5'>第一梯队</b>!旗舰大<b class='flag-5'>模型</b>登场,硬扛MiniMax2.7和千问Qwen3.5

    商汤科技正式开源空间智能模型日日新SenseNova-SI-1.3

    商汤科技正式开源空间智能模型日日新SenseNova-SI-1.3,在空间测量、视角转换、综合推理等核心任务中展现出显著提升,另外对比之前的版本增强了回答简答题的能力。
    的头像 发表于 02-10 14:12 594次阅读
    <b class='flag-5'>商汤</b>科技正式开源空间智能<b class='flag-5'>模型</b><b class='flag-5'>日日新</b>SenseNova-SI-1.3

    避繁就简!商汤日日新模型灵性巧解数学难题,获赞“机器的审美”

    、字节跳动,让数学与AI同台碰撞,开展了场真刀真枪的“图灵测试”。 现场,面对数学家抛出的难题,商汤科技“日日新”大模型在解答复分析计算积分、微分几何证明等问题中,展示了惊人的进化力
    的头像 发表于 01-12 11:41 415次阅读
    避繁就简!<b class='flag-5'>商汤</b><b class='flag-5'>日日新</b>大<b class='flag-5'>模型</b>灵性巧解数学难题,获赞“机器的审美”

    商汤科技日日新V6.5荣获2025年多模态大模型全国第一

    近日,权威大模型评测基准 SuperCLUE 发布《中文多模态视觉语言模型测评基准12月报告》,商汤日日新V6.5(SenseNova V6.5 Pro)以75.35的总分
    的头像 发表于 01-06 14:44 922次阅读
    <b class='flag-5'>商汤</b>科技<b class='flag-5'>日日新</b>V6.5荣获2025年多模态大<b class='flag-5'>模型</b>全国<b class='flag-5'>第一</b>

    知行科技如何用小算力跻身第一梯队

    当时当刻,量产Deadline、模型算法高上限低下限的特性,还有全行业追高阶、追标配的焦灼气氛都沉沉地压在知行科技泊车团队每个同学心头,天还没亮,每个人都在咬牙坚持。
    的头像 发表于 12-25 09:21 625次阅读

    商汤科技日日新Seko系列模型与寒武纪成功适配

    12月15日,商汤科技基于在生成式AI与多模态交互领域的技术积累,正式发布Seko2.0——行业首个多剧集生成智能体。该智能体在多剧集视频生成的致性方面展现出显著优势,其背后依托的是商汤自研的
    的头像 发表于 12-17 14:06 589次阅读

    商汤科技正式发布并开源全新多模态模型架构NEO

    商汤科技正式发布并开源了与南洋理工大学S-Lab合作研发的全新多模态模型架构 —— NEO,为日日新SenseNova 多模态模型奠定了新
    的头像 发表于 12-08 11:19 1155次阅读
    <b class='flag-5'>商汤</b>科技正式发布并开源全新多模态<b class='flag-5'>模型</b>架构NEO

    商汤日日新V6.5多模态大模型登顶全球权威榜单

    根据权威评测平台OpenCompass多模态大模型学术榜单(Multi-modal Academic Leaderboard)最新数据显示,商汤日日新 V6.5」(SenseNova-V6.5
    的头像 发表于 09-10 09:55 938次阅读

    商汤日日新模型赋能紫光汉图打造激光多功能体机

    商汤日日新模型赋能紫光汉图,为线教师打造全新教学生产力。
    的头像 发表于 08-19 15:51 1059次阅读
    <b class='flag-5'>商汤</b><b class='flag-5'>日日新</b>大<b class='flag-5'>模型</b>赋能紫光汉图打造激光多功能<b class='flag-5'>一</b>体机

    商汤大装置跻身中国大模型推理算力厂商第一梯队

    近日,IDC发布首个《2025中国大模型推理算力市场分析报告》。
    的头像 发表于 08-14 09:29 5045次阅读

    小米AI眼镜×商汤日日新 商汤日日新”大模型交互平台「商量」已探索性接入小米AI眼镜

    程度:据国内XR Vision报道,小米AI眼镜首销3天销量或已接近5万副,创下了中国AI眼镜最快销售纪录。 作为小米长期生态合作伙伴,商汤日日新”大模型交互平台「
    的头像 发表于 08-07 15:35 9712次阅读
    小米AI眼镜×<b class='flag-5'>商汤</b><b class='flag-5'>日日新</b> <b class='flag-5'>商汤</b>“<b class='flag-5'>日日新</b>”大<b class='flag-5'>模型</b>交互平台「<b class='flag-5'>商量</b>」已探索性接入小米AI眼镜

    看点:商汤日日新”拟接入小米AI眼镜 鸿利智汇:部分产品已应用于小米汽车

    给大家带来些业界资讯: 商汤日日新”拟接入小米AI眼镜 据商汤科技透露,作为小米长期生态合作伙伴,商汤
    的头像 发表于 08-07 14:47 1130次阅读

    商汤日日新SenseNova融合模态大模型 国内首家获得最高评级的大模型

    近日,中国信息通信研究院(以下简称“中国信通院”)完成可信AI多模态大模型首轮评估。 商汤日日新SenseNova融合模态大模型在所有模型
    的头像 发表于 06-11 11:57 1560次阅读

    商汤科技日日新V6大模型斩获“双料第一国内榜首,个全球第一

    卫冕“双冠”! 通用语言能力并列国内榜首、多模态能力全球最强,商汤日日新V6」近期斩获“双料第一”。 5月28日,权威大模型测评机构Sup
    的头像 发表于 05-30 11:13 1728次阅读
    <b class='flag-5'>商汤</b>科技<b class='flag-5'>日日新</b>V6大<b class='flag-5'>模型</b>斩获“双料<b class='flag-5'>第一</b>” <b class='flag-5'>一</b>项<b class='flag-5'>国内</b>榜首,<b class='flag-5'>一</b>个全球<b class='flag-5'>第一</b>

    商汤科技与上海徐汇区文旅局达成合作

    近日,商汤科技与上海徐汇区文旅局达成合作,基于商汤最新AI大模型日日新SenseNova V6,打造智慧文旅新技术与应用成果,可为游客提供拟人化的“贴身导游”服务。
    的头像 发表于 04-24 16:23 1111次阅读