0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

商汤科技发布5.0多模态大模型,综合能力全面对标GPT-4 Turbo

A面面观 2024-04-24 16:49 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

商汤科技发布5.0多模态大模型,综合能力全面对标GPT-4 Turbo

4月23日,商汤科技董事长兼CEO徐立在2024商汤技术交流日上发布了行业首个云、端、边全栈大模型产品矩阵,能够满足不同规模场景应用需求;升级“日日新SenseNova 5.0”大模型体系,综合能力全面对标GPT-4 Turbo。

此外对于文生视频徐立也表示商汤科技很快就会发布相关的平台产品。

备受瞩目的商汤科技“日日新SenseNova” 5.0多模态大模型独特地采用了混合专家(MoE)架构,能够无缝支持多达10T Tokens的中英文训练数据,并在此基础上,推理合成数据更是可高达数千亿Token。尤为值得一提的是,该模型在进行推理计算时,其上下文窗口可以扩展至约200K Token范围,使得其综合能力中的知识、推理、数学、代码等方面均能全面对标GPT-4Turbo。

商汤科技的领导团队表示,这是业界首个真正意义上的“云、端、边”全栈大模型产品矩阵,旨在满足各种规模场景的应用需求。他们坚信,公司的技术领先地位将进一步加速生成式AI向产业落地的全面跃迁,从而实现大模型的按需所取。

商汤科技的董事长兼首席执行官徐立先生表示,在遵循尺度定律(Scaling Law)的原则下,商汤科技始终致力于推动自身大模型的研发工作,并将持续探索大模型能力的KRE三层架构(知识-推理-执行),不断突破大模型能力的边界。他充满信心地指出,“我们深信,2024年将会是端侧大模型爆发的重要年份。”

据了解,自去年4月首次亮相以来,商汤科技的“日日新SenseNova”大模型体系已经成功推出了五个重大版本迭代。而此次的更新重点则集中在提升了知识、数学、推理以及代码能力等多个方面,全面对标GPT-4 Turbo,并在主流客观评测中达到甚至超过了GPT-4 Turbo的水平。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 商汤科技
    +关注

    关注

    8

    文章

    591

    浏览量

    37329
  • 大模型
    +关注

    关注

    2

    文章

    3452

    浏览量

    4974
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    商汤科技正式发布并开源全新模态模型架构NEO

    商汤科技正式发布并开源了与南洋理工大学S-Lab合作研发的全新模态模型架构 —— NEO,为日日新SenseNova
    的头像 发表于 12-08 11:19 509次阅读
    <b class='flag-5'>商汤</b>科技正式<b class='flag-5'>发布</b>并开源全新<b class='flag-5'>多</b><b class='flag-5'>模态</b><b class='flag-5'>模型</b>架构NEO

    商汤日日新V6.5模态模型登顶全球权威榜单

    Pro)模态模型以82.2的综合成绩登顶榜首,领先Gemini 2.5 Pro以及GPT-5等国际顶尖
    的头像 发表于 09-10 09:55 504次阅读

    商汤科技模态通用智能战略思考

    时间是最好的试金石,AI领域尤其如此。当行业热议大模型走向时,商汤早已锚定“模态通用智能”——这是我们以深厚研究积累和实践反复验证的可行路径。
    的头像 发表于 08-14 09:33 1016次阅读

    商汤日日新SenseNova融合模态模型 国内首家获得最高评级的大模型

    近日,中国信息通信研究院(以下简称“中国信通院”)完成可信AI模态模型首轮评估。 商汤日日新SenseNova融合模态
    的头像 发表于 06-11 11:57 1164次阅读

    海康威视发布模态模型AI融合巡检超脑

    基于海康观澜大模型技术体系,海康威视推出新一代模态模型AI融合巡检超脑,全面升级人、车、行为、事件等算法,为行业带来全新的
    的头像 发表于 04-17 17:12 1358次阅读

    移远通信智能模组全面接入模态AI大模型,重塑智能交互新体验

    全系智能模组产品已全面接入火山引擎豆包VLM(视觉语言)模态AI大模型。这一突破性进展表明,搭载移远任意智能模组的终端设备,均可无缝融合
    发表于 03-21 14:12 427次阅读
    移远通信智能模组<b class='flag-5'>全面</b>接入<b class='flag-5'>多</b><b class='flag-5'>模态</b>AI大<b class='flag-5'>模型</b>,重塑智能交互新体验

    移远通信智能模组全面接入模态AI大模型,重塑智能交互新体验

    智能模组产品已全面接入火山引擎豆包VLM(视觉语言)模态AI大模型。这一突破性进展表明,搭载移远任意智能模组的终端设备,均可无缝融合
    的头像 发表于 03-20 19:03 668次阅读
    移远通信智能模组<b class='flag-5'>全面</b>接入<b class='flag-5'>多</b><b class='flag-5'>模态</b>AI大<b class='flag-5'>模型</b>,重塑智能交互新体验

    商汤“日日新”融合大模型登顶大语言与模态双榜单

    据弗若斯特沙利文(Frost & Sullivan, 简称“沙利文”)联合头豹研究院发布的《2025年中国大模型年度评测》结果显示:在语言和模态核心
    的头像 发表于 03-18 10:35 945次阅读

    海康威视发布模态模型文搜存储系列产品

    模态模型为安防行业带来重大技术革新,基于观澜大模型技术体系,海康威视将大参数量、大样本量的图文模态
    的头像 发表于 02-18 10:33 1028次阅读

    体验MiniCPM-V 2.6 模态能力

    模态组网
    jf_23871869
    发布于 :2025年01月20日 13:40:48

    如何在边缘端获得GPT4-V的能力:算力魔方+MiniCPM-V 2.6

    本 OpenCompass 榜单上(综合 8 个主流模态评测基准)平均得分 65.2,以8B量级的大小在单图理解方面超越了 GPT-4o mini、
    的头像 发表于 01-20 13:40 1115次阅读
    如何在边缘端获得<b class='flag-5'>GPT4</b>-V的<b class='flag-5'>能力</b>:算力魔方+MiniCPM-V 2.6

    商汤“日日新”融合大模型荣获双料冠军

    近日,商汤科技正式推出了其创新力作——“日日新”融合大模型。该模型在技术上实现了原生融合模态的突破,使得其深度推理能力
    的头像 发表于 01-13 16:10 847次阅读

    商汤科技推出“日日新”融合大模型

    刚刚,商汤正式推出“日日新”融合大模型,领先实现原生融合模态,深度推理能力模态信息处理
    的头像 发表于 01-10 15:59 1139次阅读

    一文说清楚什么是AI大模型

    DALL-E)、科学计算模型(如 AlphaFold)以及模态模型。这些模型通过海量数据训练,展现出高度的泛用性。 比较有代表性的大语言
    的头像 发表于 01-02 09:53 3981次阅读
    一文说清楚什么是AI大<b class='flag-5'>模型</b>

    商汤日日新模态模型权威评测第一

    刚刚,商汤科技日日新SenseNova模态模型,在权威综合评测权威平台OpenCompass的
    的头像 发表于 12-20 10:39 1505次阅读