0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

商汤小浣熊荣获中国信通院代码大模型能力评估“三好生”

商汤科技SenseTime 来源:商汤科技SenseTime 2024-06-13 15:37 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

“通用能力突出,专用场景全面,应用成熟度优秀”。

近日,商汤小浣熊代码大模型在中国信通院“可信AI代码大模型评估”中,荣获4+级最高评级,成为国内首批通过该项评估的企业之一。

商汤小浣熊在代码通用能力、专用场景和应用成熟度等多个评估维度中表现优秀。

b7e21aca-2957-11ef-91d2-92fbcf53809c.png

依据中国信通院《智能化软件工程技术和应用要求 第1部分:代码大模型》,此次评估聚焦大模型的通用能力、专用场景能力和应用成熟度三大部分,包括16个能力项、100多个能力要求,从输入多样性、任务多样性、语言完备度、结果可接收性、结果准确度等维度,考核代码大模型的全栈技术能力。

bbdbc130-2957-11ef-91d2-92fbcf53809c.png

图片来源:中国信通院

商汤小浣熊作为首批参评企业获得4+级评级,是本次评分最高的代码大模型之一。中国信通院测评结果显示:

通用能力方面,小浣熊在代码解释、代码转换等方面表现突出;

专用场景方面,小浣熊支持网站开发、桌面应用开发、移动应用开发、数据库开发等多个场景的开发能力;

应用成熟度方面,小浣熊在数据分类分级、模型性能、模型服务可维护性、风险可控性等方面均表现优秀。

「小浣熊家族」是基于商汤“日日新SenseNova”大模型体系打造的 AI Native 生产力系列工具,覆盖软件开发、数据分析、编程教育等多个场景,旨在通过先进的人工智能技术优化和提升工作效率。现已推出代码小浣熊和办公小浣熊两位产品成员。

代码小浣熊是基于大模型的软件智能研发助手,覆盖软件需求分析、架构设计、代码编写、软件测试等环节,满足用户代码编写、编程学习等各类需求,现已支持PythonJava、JavaScript、C++、Go、SQL等90+主流编程语言和VS Code、JetBrains全家桶、Android Studio等主流IDE。

办公小浣熊是基于大模型的大模型原生数据分析产品,可以通过用户的自然语言输入,自动将数据转化为有意义的分析和可视化结果。

小浣熊家族背后的「小浣熊代码大模型」,在权威测试集HumanEval Coding测试中一次通过率达到78.1%,在数据分析场景下的数据测试集(1000+题目)中以85.71%的正确率超过GPT-4。

自上线以来,小浣熊代码大模型累计为10万+个人用户提供服务,单日代码生成数量达到10亿+Tokens,总体平均代码采纳率超过30%,用户编码能效提升达到20%~78%。

目前,商汤小浣熊代码大模型已经被包括金融、新能源汽车等行业在内的200+企业客户使用,凭借突出的数理能力覆盖多元落地场景。

例如,在与金山办公的合作中,小浣熊代码大模型助力WPS 365打造更高效释放场景能力的智能办公平台,为用户多元、碎片化的办公需求提供新质生产力。

此外,基于小浣熊代码大模型,商汤科技与海通证券合作打造智能研发助手,辅助金融企业研发人员进行代码编程,为开发者提供代码智能补全与对话问答服务,可辅助生产约20%代码,降低开发技术门槛,有效提高开发效率。

未来,商汤小浣熊将持续降低大模型技术的开发和应用门槛,赋能更多场景创新。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 代码
    +关注

    关注

    30

    文章

    4941

    浏览量

    73155
  • 商汤
    +关注

    关注

    0

    文章

    82

    浏览量

    4271
  • 大模型
    +关注

    关注

    2

    文章

    3446

    浏览量

    4972

原文标题:首批通过,最高评级,商汤小浣熊喜提中国信通院代码大模型能力评估“三好生”

文章出处:【微信号:SenseTime2017,微信公众号:商汤科技SenseTime】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    华为获得中国信最高评级证书

    近期,依据CCSA TC610(SDN/NFV/AI标准与产业推进委员会)发布的《网络管理运维智能体测评方法-园区网》技术规范,中国信息通信研究(以下简称“中国信”)开展了华为公
    的头像 发表于 11-25 15:10 402次阅读

    商汤办公小浣熊与银河麒麟操作系统V11完成适配

    近日,在2025 中国操作系统产业大会上,商汤科技作为麒麟软件的生态伙伴受邀参与了“麒心伙伴5.0生态成长计划”启动仪式,同时商汤「办公小浣熊」也完成与银河麒麟操作系统 V11 的深度
    的头像 发表于 09-05 15:26 618次阅读

    中国中车通过中国信可信AI人工智能数据集质量四级评估

    2025年8月,中国中车集团有限公司顺利通过中国信可信AI人工智能数据集质量4级评估,成为制造行业中首个获得最高评级的中央企业。此次评估
    的头像 发表于 08-22 17:02 1205次阅读

    中国信发布“2025云计算十大关键词”

    日前,中国信正式发布“2025云计算十大关键词”,中国信云计算与大数据研究所所长何宝宏对“2025云计算十大关键词”进行了解读。十大关键词分别是:超大规模智算集群、大
    的头像 发表于 07-30 10:53 2856次阅读
    <b class='flag-5'>中国信</b>通<b class='flag-5'>院</b>发布“2025云计算十大关键词”

    燧原科技国产万卡集群通过中国信权威认证

    近日,中国信息通信研究(以下简称“中国信”)成功召开万卡智算集群服务推进方阵年中总交流会。会议期间,中国信
    的头像 发表于 07-04 16:50 948次阅读

    大华问数智能体一体机通过中国信权威评测认证

    日前,由中国通信标准化协会主办的2025数据智能大会在北京召开。会上,中国信息通信研究(以下简称“中国信”)发布了2025年上半年“大
    的头像 发表于 07-01 14:16 1207次阅读

    商汤大装置万象大模型开发平台获得中国信最高评级

    近日,中国信息通信研究(以下简称“中国信”)完成可信AI《大模型推理平台通用能力成熟度》首
    的头像 发表于 07-01 10:48 801次阅读

    商汤日日新SenseNova融合模态大模型 国内首家获得最高评级的大模型

    近日,中国信息通信研究(以下简称“中国信”)完成可信AI多模态大模型首轮评估
    的头像 发表于 06-11 11:57 1159次阅读

    商汤科技“小浣熊家族”与蚂蚁集团旗下智能体开发平台“蚂蚁百宝箱”正式达成生态合作

    打开蚂蚁百宝箱,跳出一只商汤浣熊商汤科技“小浣熊家族”与蚂蚁集团旗下智能体开发平台“蚂蚁百宝箱”正式达成生态合作,双方联合打造“AI数据分析助手”,为百宝箱广大用户提供大
    的头像 发表于 06-09 15:09 1207次阅读
    <b class='flag-5'>商汤</b>科技“小<b class='flag-5'>浣熊</b>家族”与蚂蚁集团旗下智能体开发平台“蚂蚁百宝箱”正式达成生态合作

    芯盾时代多款产品获得中国信权威认可

    近日,中国信息通信研究(以下简称“中国信”)旗下的网络安全卓越验证示范中心对“写境:AI+网络安全产品能力图谱”进行了更新。芯盾时代凭
    的头像 发表于 05-30 14:36 695次阅读

    商汤浣熊家族全面入驻联想生态全平台

    商汤和联想再次携手——商汤科技旗下生产力工具“小浣熊家族”全面入驻联想生态全平台!
    的头像 发表于 05-22 11:30 819次阅读

    百度文心大模型X1 Turbo获得信通当前大模型最高评级证书

    百度在520居然还领了个证?是它, 信通当前大模型最高评级证书 ! 在5月20日的百度AI Day 上,中国信公布了大模型推理
    的头像 发表于 05-21 18:19 1111次阅读
    百度文心大<b class='flag-5'>模型</b>X1 Turbo获得信通<b class='flag-5'>院</b>当前大<b class='flag-5'>模型</b>最高评级证书

    万里红入选中国信模型应用交付供应商名录

    近日,中国信息通信研究中国人工智能产业发展联盟(AIIA)联合发布了《大模型应用交付供应商名录(2025年Q1)》。该名录基于问卷调研统计,通过对政务、金融、医疗等十大重点行业大
    的头像 发表于 04-25 17:25 1124次阅读

    首批首家!DataCanvas Alaya NeW智算操作系统通过中国信“大模型计算资源调度平台” 标准评测

    1月8日,“大模型工程化成果发布会”在北京圆满召开。会上,中国信息通信研究(简称“中国信”)正式发布6项AIInfra(人工智能基础平
    的头像 发表于 01-10 11:24 821次阅读
    首批首家!DataCanvas Alaya NeW智算操作系统通过<b class='flag-5'>中国信</b>通<b class='flag-5'>院</b>“大<b class='flag-5'>模型</b>计算资源调度平台” 标准评测

    华为云云原生中间件 DCS &amp; DMS 通过中国信与全球 IPv6 测试中心双重能力检测

    【摘要】 近日,中国信息通信研究(以下简称“中国信”)与全球 IPv6 测试中心相继宣布,华为云的分布式缓存服务(Distributed Cache Service,简称 DCS
    的头像 发表于 12-18 09:18 1809次阅读
    华为云云原生中间件 DCS &amp; DMS 通过<b class='flag-5'>中国信</b>通<b class='flag-5'>院</b>与全球 IPv6 测试中心双重<b class='flag-5'>能力</b>检测