0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

云知声山海大模型位居全球大模型第一梯队

云知声 来源:云知声 2024-09-12 14:41 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

SuperCLUE发布《中文大模型基准测评2024上半年报告》,报告选取国内外有代表性的33个大模型在6月份的版本,通过多维度综合性测评,对国内外大模型发展现状进行观察与思考。

报告显示,云知声山海大模型在本次半年度评测中取得总分72的优异成绩,与360gpt2-pro、字节跳动豆包、月之暗面Kimi、百川智能Baichuan4并列国内大模型第四,稳居全球大模型第一梯队。

SuperCLUE作为国内权威通用大模型综合性测评基准,其前身可追溯至第三方中文语言理解评估基准CLUE(The Chinese Language Understanding Evaluation)。自2019年成立以来,CLUE基准一直致力于提供科学、客观、中立的语言模型评测,其先后推出了CLUE、FewCLUE、KgCLUE、DataCLUE等多个被广泛认可的评估标准。根据CLUE多年测评经验,SuperCLUE基于通用大模型在学术、产业与用户侧的广泛应用,构建了多层次、多维度的综合性测评基准。

作为一个完全独立的第三方评测机构,SuperCLUE采用自动化评测技术,有效消除人为因素带来的不确定性,确保提供无偏倚的客观评测结果。不同于传统测评通过选择题形式的测评,SuperCLUE纳入开放主观问题的测评,通过多维度多视角多层次的评测体系以及对话的形式,模拟大模型的应用场景,真实有效考察模型生成能力。与此同时,SuperCLUE根据全球的大模型技术发展趋势,不断升级迭代测评体系、测评维度和方法,以保证尽可能精准量化大模型的技术演进程度。

为进一步真实反映大模型能力,本次通用测评采用多维度、多层次的综合性测评方案,由理科、文科和Hard三大维度构成:理科任务分为计算、逻辑推理、代码测评集;文科任务分为知识百科、语言理解、长文本、角色扮演、生成与创作、安全和工具使用七大测评集;Hard任务聚焦精确指令遵循测评集,未来将陆续推出复杂多步推理和高难度问题解决等评测。

从代表通用能力的一级总分来看,山海大模型得分72,与360gpt2-pro、字节跳动豆包、月之暗面Kimi、百川智能Baichuan4并列国内大模型第四,位居全球大模型第一梯队。

具体到二级维度得分,山海大模型在理科和文科领域均表现优异——在理科能力方面,山海大模型以76分的高分紧随GPT-4o、GPT-4-Turbo-0409之后,力压一众国内大模型,并列排名国内第一;文科能力以75分的成绩并列国内第二,实力同样不容小觑。

在SuperCLUE基于基础能力和应用能力两个维度构建的模型象限图中,山海大模型被定位为“卓越领导者”。这一分类反映了山海大模型在基础和场景应用能力上均达到了领先水平,持续引领国内大模型技术发展和创新。

此外,与GPT4-Turbo-0409的对战胜率统计数据显示,山海胜率为17.67%,和率为65.37%,位列国内大模型第五,整体实力依旧不俗。

自2023年5月问世以来,山海大模型已相继在C-Eval全球大模型综合性评测、OpenCompass大模型评测、MedBench评测等多个权威评测中屡创佳绩,充分展现出业界一流的通用能力和领先于世界的行业大模型能力。

正如报告所言,随着技术进步和应用场景拓展,2024年下半年国内外大模型市场竞争将持续加剧,推动技术创新和产业升级。接下来,云知声将继续保持大模型能力稳步提升,以山海为抓手,在产业侧实现加速落地,致力成为真正助力各行各业的“新质生产力”。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 云知声
    +关注

    关注

    0

    文章

    328

    浏览量

    9464
  • 字节跳动
    +关注

    关注

    0

    文章

    352

    浏览量

    10127
  • 大模型
    +关注

    关注

    2

    文章

    3766

    浏览量

    5269

原文标题:SuperCLUE 2024半年度报告:云知声山海大模型位居全球大模型第一梯队,理科能力国内并列第一,文科能力并列国内第二

文章出处:【微信号:云知声,微信公众号:云知声】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    小米杀进第一梯队!旗舰大模型登场,硬扛MiniMax2.7和千问Qwen3.5

    3月19日,小米技术在微博上官宣,小米迈向Agent时代的旗舰基座模型Xiaomi MiMo-V2-Pro正式发布。小米MiMo大模型系列重磅三连更,包括旗舰基座大模型MiMo-V2-Pro、全模态Agent
    的头像 发表于 03-19 11:54 9710次阅读
    小米杀进<b class='flag-5'>第一梯队</b>!旗舰大<b class='flag-5'>模型</b>登场,硬扛MiniMax2.7和千问Qwen3.5

    正式推出Unisound U1-OCR文档智能基础大模型

    就在刚刚,正式推出 Unisound U1-OCR 文档智能基础大模型。作为首个工业级文档智能基座,该模型凭借 “性能 SOTA、可信
    的头像 发表于 02-26 17:28 889次阅读
    <b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>声</b>正式推出Unisound U1-OCR文档智能基础大<b class='flag-5'>模型</b>

    声发布“山海·知音”大模型2.0,医疗AI加速落地驱动业绩高增长

    今年1月,正式发布其自研大模型山海·知音”2.0版本,并同步披露2025年度业绩预告——全年营收预计同比增长超60%,净利润实现扭亏
    发表于 02-06 10:28 1117次阅读
    <b class='flag-5'>云</b><b class='flag-5'>知</b>声发布“<b class='flag-5'>山海</b>·知音”大<b class='flag-5'>模型</b>2.0,医疗AI加速落地驱动业绩高增长

    与嘉会医疗达成战略合作

    2月5日下午,国内人工智能技术与服务领军企业智能科技股份有限公司(以下简称“”)与中
    的头像 发表于 02-06 09:05 2541次阅读

    山海知音大模型2.0重磅发布

    随着智能体时代到来,在“山海·Atlas”通用智算基座持续演进基础上,年前实现了“山海·
    的头像 发表于 01-27 14:08 326次阅读
    <b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>声</b><b class='flag-5'>山海</b>知音大<b class='flag-5'>模型</b>2.0重磅发布

    荣登2025胡润中国人工智能企业50强榜单

    1月19日,全球权威榜单编制机构胡润研究院正式发布《2025胡润中国人工智能企业50强》榜单。(股票代码:09678.HK)凭借其在通用人工智能和语音识别与交互领域深厚的技术积累
    的头像 发表于 01-23 17:15 896次阅读

    荣登MedAIBench优秀国产医疗大模型榜单

    12月20日,国家人工智能应用中试基地(医疗)·浙江正式发布《MedAIBench测评榜(优秀国产医疗大模型)》。在这具备行业权威性与临床导向性的严格测评中,
    的头像 发表于 12-29 14:36 928次阅读

    山海医疗大模型问鼎MedBench4.0三项榜首

    12月16日,中文医疗大模型权威评测平台MedBench4.0发布最新评测结果。自主研发的“山海医疗大
    的头像 发表于 12-29 14:35 3552次阅读
    <b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>声</b><b class='flag-5'>山海</b>医疗大<b class='flag-5'>模型</b>问鼎MedBench4.0三项榜首

    推出医疗领域专家大模型山海·医大模型5.0”

    刚刚,正式推出医疗领域专家级大模型全新力作——“山海医大
    的头像 发表于 12-24 18:12 4637次阅读

    入选2025中国AI大模型产业创新服务商TOP20榜单

    荣誉,(股票代码:09678.HK)凭借自主研发的山海模型在技术创新、产业落地与生态构建方面的卓越表现,成功入选 "2025 中国
    的头像 发表于 12-08 18:04 1898次阅读

    多项业务营收大涨

    依托山海模型不断开拓阵地,开发了面向东盟等海外市场和国内方言市场的语音大模型
    的头像 发表于 09-10 15:44 815次阅读

    商汤大装置跻身中国大模型推理算力厂商第一梯队

    近日,IDC发布首个《2025中国大模型推理算力市场分析报告》。
    的头像 发表于 08-14 09:29 5048次阅读

    与商汤科技达成战略合作

    近日,智能科技股份有限公司(以下简称“”)与上海商汤智能科技有限公司(以下简称“商汤
    的头像 发表于 06-20 14:52 1134次阅读

    荣登甲子光年2025中国AI产业逐浪者榜单

    近日,由甲子光年主办的「AI共潮生·2025甲子引力X科技产业新风向」在上海工业智能中心成功举办。凭借山海模型的领先技术实力与多领域
    的头像 发表于 05-26 14:13 885次阅读

    再度登顶MedBench榜单

    近日,中文医疗大模型权威评测平台MedBench公布最新自测榜单结果,基于山海模型打造的
    的头像 发表于 05-20 10:12 919次阅读