0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

商汤科技发布5.0多模态大模型,综合能力全面对标GPT-4 Turbo

A面面观 2024-04-24 16:49 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

商汤科技发布5.0多模态大模型,综合能力全面对标GPT-4 Turbo

4月23日,商汤科技董事长兼CEO徐立在2024商汤技术交流日上发布了行业首个云、端、边全栈大模型产品矩阵,能够满足不同规模场景应用需求;升级“日日新SenseNova 5.0”大模型体系,综合能力全面对标GPT-4 Turbo。

此外对于文生视频徐立也表示商汤科技很快就会发布相关的平台产品。

备受瞩目的商汤科技“日日新SenseNova” 5.0多模态大模型独特地采用了混合专家(MoE)架构,能够无缝支持多达10T Tokens的中英文训练数据,并在此基础上,推理合成数据更是可高达数千亿Token。尤为值得一提的是,该模型在进行推理计算时,其上下文窗口可以扩展至约200K Token范围,使得其综合能力中的知识、推理、数学、代码等方面均能全面对标GPT-4Turbo。

商汤科技的领导团队表示,这是业界首个真正意义上的“云、端、边”全栈大模型产品矩阵,旨在满足各种规模场景的应用需求。他们坚信,公司的技术领先地位将进一步加速生成式AI向产业落地的全面跃迁,从而实现大模型的按需所取。

商汤科技的董事长兼首席执行官徐立先生表示,在遵循尺度定律(Scaling Law)的原则下,商汤科技始终致力于推动自身大模型的研发工作,并将持续探索大模型能力的KRE三层架构(知识-推理-执行),不断突破大模型能力的边界。他充满信心地指出,“我们深信,2024年将会是端侧大模型爆发的重要年份。”

据了解,自去年4月首次亮相以来,商汤科技的“日日新SenseNova”大模型体系已经成功推出了五个重大版本迭代。而此次的更新重点则集中在提升了知识、数学、推理以及代码能力等多个方面,全面对标GPT-4 Turbo,并在主流客观评测中达到甚至超过了GPT-4 Turbo的水平。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 商汤科技
    +关注

    关注

    8

    文章

    619

    浏览量

    37681
  • 大模型
    +关注

    关注

    2

    文章

    3773

    浏览量

    5273
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    商汤科技正式开源模态自主推理模型SenseNova-MARS

    今日,商汤正式开源模态自主推理模型 SenseNova-MARS(8B/32B 双版本),其在模态
    的头像 发表于 01-30 10:13 786次阅读
    <b class='flag-5'>商汤</b>科技正式开源<b class='flag-5'>多</b><b class='flag-5'>模态</b>自主推理<b class='flag-5'>模型</b>SenseNova-MARS

    商汤开源SenseNova-MARS:突破模态搜索推理天花板

    今日,商汤正式开源模态自主推理模型 SenseNova-MARS(8B/32B 双版本),其在模态
    的头像 发表于 01-29 23:53 259次阅读
    <b class='flag-5'>商汤</b>开源SenseNova-MARS:突破<b class='flag-5'>多</b><b class='flag-5'>模态</b>搜索推理天花板

    瑞芯微RK182X全面适配主流模态模型

    、大语言模型模态及音频等各类主流AI框架,为全球超过5000家合作伙伴提供从算法到产品到场景的高效转化路径。
    的头像 发表于 01-27 16:16 1109次阅读

    商汤科技日日新V6.5荣获2025年模态模型全国第一

    近日,权威大模型评测基准 SuperCLUE 发布《中文模态视觉语言模型测评基准12月报告》,商汤
    的头像 发表于 01-06 14:44 933次阅读
    <b class='flag-5'>商汤</b>科技日日新V6.5荣获2025年<b class='flag-5'>多</b><b class='flag-5'>模态</b>大<b class='flag-5'>模型</b>全国第一

    商汤科技日日新Seko系列模型与寒武纪成功适配

    12月15日,商汤科技基于在生成式AI与模态交互领域的技术积累,正式发布Seko2.0——行业首个剧集生成智能体。该智能体在
    的头像 发表于 12-17 14:06 601次阅读

    商汤科技正式发布并开源全新模态模型架构NEO

    商汤科技正式发布并开源了与南洋理工大学S-Lab合作研发的全新模态模型架构 —— NEO,为日日新SenseNova
    的头像 发表于 12-08 11:19 1157次阅读
    <b class='flag-5'>商汤</b>科技正式<b class='flag-5'>发布</b>并开源全新<b class='flag-5'>多</b><b class='flag-5'>模态</b><b class='flag-5'>模型</b>架构NEO

    GPT-5.1发布 OpenAI开始拼情商

    OpenAI正式上线了 GPT-5.1 Instant 以及 GPT-5.1 Thinking 模型;有网友实测发现OpenAI新发布GPT
    的头像 发表于 11-13 15:49 820次阅读

    亚马逊云科技上线Amazon Nova模态嵌入模型

    Embeddings模态嵌入模型现已在Amazon Bedrock上线,这是一款专为Agentic RAG与语义搜索应用打造的顶尖模态
    的头像 发表于 10-29 17:15 372次阅读
    亚马逊云科技上线Amazon Nova<b class='flag-5'>多</b><b class='flag-5'>模态</b>嵌入<b class='flag-5'>模型</b>

    商汤日日新V6.5模态模型登顶全球权威榜单

    Pro)模态模型以82.2的综合成绩登顶榜首,领先Gemini 2.5 Pro以及GPT-5等国际顶尖
    的头像 发表于 09-10 09:55 949次阅读

    米尔RK3576部署端侧模态轮对话,6TOPS算力驱动30亿参数LLM

    配合,三者各司其职、无缝衔接,共同构建起完整的模态对话能力轮对话系统架构 1. 图像视觉编码器(Vision Encoder) 模型
    发表于 09-05 17:25

    商汤科技模态通用智能战略思考

    时间是最好的试金石,AI领域尤其如此。当行业热议大模型走向时,商汤早已锚定“模态通用智能”——这是我们以深厚研究积累和实践反复验证的可行路径。
    的头像 发表于 08-14 09:33 1310次阅读

    “端云+模态”新范式:《移远通信AI大模型技术方案白皮书》正式发布

    7月28日,移远通信联合智次方研究院正式发布《AI大模型技术方案白皮书》(以下简称“白皮书”)。这份白皮书系统梳理了AI大模型的技术特点、产业发展态势与多元应用场景,以及移远通信“端云+
    的头像 发表于 07-28 13:08 1418次阅读
    “端云+<b class='flag-5'>多</b><b class='flag-5'>模态</b>”新范式:《移远通信AI大<b class='flag-5'>模型</b>技术方案白皮书》正式<b class='flag-5'>发布</b>

    云知声与商汤科技达成战略合作

    近日,云知声智能科技股份有限公司(以下简称“云知声”)与上海商汤智能科技有限公司(以下简称“商汤科技”)正式签署战略合作协议。双方将基于各自领域的技术积累与资源优势,围绕模态
    的头像 发表于 06-20 14:52 1135次阅读

    商汤日日新SenseNova融合模态模型 国内首家获得最高评级的大模型

    近日,中国信息通信研究院(以下简称“中国信通院”)完成可信AI模态模型首轮评估。 商汤日日新SenseNova融合模态
    的头像 发表于 06-11 11:57 1568次阅读

    商汤科技日日新V6大模型斩获“双料第一” 一项国内榜首,一个全球第一

    卫冕“双冠”! 通用语言能力并列国内榜首、模态能力全球最强,商汤「日日新V6」近期斩获“双料第一”。 5月28日,权威大
    的头像 发表于 05-30 11:13 1738次阅读
    <b class='flag-5'>商汤</b>科技日日新V6大<b class='flag-5'>模型</b>斩获“双料第一” 一项国内榜首,一个全球第一