0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

智谱AI领跑司南OpenCompass 2.0月度榜单,GLM-4展示强大实力

独角兽科技 来源:独角兽科技 作者:独角兽科技 2024-05-22 12:44 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近期,大模型开源开放评测体系司南(OpenCompass 2.0)公布了2024年4月大语言模型最新评测榜单,智谱AI的GLM-4继续保持国产大模型第一的领先身位。

wKgZomZNeAmAOZvZAALVoFD5HAQ911.png

大模型开源开放评测体系司南(OpenCompass 2.0)由上海人工智能实验室发布。其月度榜单从基础能力和综合能力的设计出发,构建了一套高质量的中英文双语评测基准体系,对主流开源模型和商业API模型进行了全面评测分析。评测榜单涉及的大语言模型和多模态大模型超过150个,更有包括Meta、阿里巴巴、腾讯、百度等30余家国内外企业和科研机构采用OpenCompass助力开展技术研发。

在4月客观评测榜单中,OpenCompass基于语言、知识、推理、数学、代码、智能体六个维度构建了15000余道高质量中英文双语问题,并引入OpenCompass团队首创的循环评估 (Circular Evalution) 策略,系统性分析了国内外大模型的客观性能。其中,GLM-4位列第四名,仅次于GPT-4-Turbo系列与Claude3-Opus,成为国内大模型客观评测月度总榜第一名。在语言维度方面,GLM-4分数达到57.7分表现突出,超过GPT-4-Turbo系列与Claude3-Opus。在知识维度上,GLM-4得到68.9分,超过第二名的GPT-4-Turbo-1106,与第三名Claude3-Opus不相上下。

wKgaomZNeBOAZ63KAAIJ06JMoBs074.png

值得一提的是,GLM-4此前便长期占据OpenCompass 2.0榜单前列,并多次在权威榜单与全球顶级大模型一较高下。清华《SuperBench大模型综合能力评测报告》显示,GLM-4在语义理解等方面的能力表现超过了GPT-4-Turbo等国际一流模型,在代码、智能体等方面,排名国内第一。在SuperCLUE-Fin(SC-Fin)中文原生金融大模型测评基准中,GLM-4斩获一项A+及多项A级评价,在国内大模型中排名第一。

据了解,GLM-4是由智谱AI于今年1月推出的新一代基座大模型。GLM-4整体性能逼近GPT-4,它可以支持更长的上下文,具备更强的多模态能力。同时,它的推理速度更快,支持更高的并发,大大降低推理成本。依托GLM-4 All Tools能力,GLM-4智能体能够实现自主根据用户意图,自动理解、规划复杂指令,自由调用网页浏览器、Code Interpreter代码解释器和多模态文生图大模型以完成复杂任务。

开发者可以通过智谱AI大模型开放平台bigmodel.cn接入GLM-4模型开放API,便捷高效地体验GLM-4的强大能力。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • API
    API
    +关注

    关注

    2

    文章

    2147

    浏览量

    66233
  • AI
    AI
    +关注

    关注

    89

    文章

    38091

    浏览量

    296586
  • 开源
    +关注

    关注

    3

    文章

    4031

    浏览量

    45568
  • 大模型
    +关注

    关注

    2

    文章

    3440

    浏览量

    4964
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    量产周期缩短至4,亿境虚拟全链路方案领跑AI眼镜赛道

    强大的硬件设计与系统级开发实力,亿境虚拟面向行业伙伴开放能力,提供从结构设计、光学模组到AI算法集成的一站式ODM解决方案。在AI智能眼镜还面临量产难题的当下,亿境虚拟优势如何将自身技
    的头像 发表于 10-30 09:17 5917次阅读
    量产周期缩短至<b class='flag-5'>4</b>个<b class='flag-5'>月</b>,亿境虚拟全链路方案<b class='flag-5'>领跑</b><b class='flag-5'>AI</b>眼镜赛道

    华为CANN与智GLM端侧模型完成适配

    已于728日正式开源其新一代基座模型GLM-4.5,其GLM端侧模型已完成与CANN的适配。这标志着国产大模型与计算架构在端云协同方向实现关键突破,国产AI生态正加速迈入深度融合阶段
    的头像 发表于 08-11 11:00 2196次阅读

    4K、多模态、长视频:AI视频生成的下一个战场,谁在领跑

    ,主体运动稳定性与画面自然较高。   相关技术报告显示,在国际知名评测榜单Artificial Analysis上,Seedance在文生视频、图生视频两项任务上均排名首位,超越Veo3、可灵2.0
    的头像 发表于 06-16 00:13 6917次阅读

    云知声荣登甲子光年2025中国AI产业逐浪者榜单

    近日,由甲子光年主办的「AI共潮生·2025甲子引力X科技产业新风向」在上海工业智能中心成功举办。云知声凭借山海大模型的领先技术实力与多领域产业落地成果,荣耀入选【星辰100】2025中国AI产业逐浪者
    的头像 发表于 05-26 14:13 621次阅读

    德赛西威与智达成战略合作

    上海车展期间,德赛西威与智正式官宣达成战略合作,双方携手打造“有灵魂、能进化”的下一代AI Native智能座舱解决方案。该方案将依托德赛西威在硬件架构、系统中间件、模型开发及上层应用等方面的整合能力,引入智
    的头像 发表于 05-08 14:37 919次阅读

    BOE(京东方)蝉联科睿唯安“全球百强创新机构”榜单全球第12名 强大创新实力再获国际认可

    312日,全球领先的专业信息服务提供商科睿唯安正式发布了“2025年全球百强创新机构”榜单,BOE(京东方)凭借卓越的创新实力和持续的技术引领再度上榜,蝉联全球第12名,是TOP2
    的头像 发表于 03-13 18:41 885次阅读

    软通动力荣获2024年AI4SE工作组优秀单位

    近日,中国人工智能发展产业联盟(AIIA)公布2024年AI4SE工作组优秀单位及突出贡献专家名单,软通动力凭借在智能化软件工程领域的杰出贡献荣登榜单,荣获“2024年
    的头像 发表于 01-24 16:35 1543次阅读

    GLM-PC 开放体验,多模态 Agent 升级

    123日,北京智华章科技有限公司宣布旗下智GLM-PC开放体验,标志着自主操作电脑的多模态Agent迎来重要升级。 GLM-PC是基于
    的头像 发表于 01-24 14:10 1184次阅读

    文库AI功能用户量飙升,“自由画布”公测启动

    文库在AI领域的强大实力,也反映了用户对AI功能的热烈追捧。 更令人瞩目的是,百文库的日活
    的头像 发表于 01-23 10:36 814次阅读

    上海寰创入选2024年“大零号湾”优质科创企业和企业家榜单

    近日,2024年“大零号湾”优质科创企业&企业家榜单发布暨2024年闵行区创新创业成果展示在大零号湾科创大厦举办。现场,2024年“大零号湾”优质科创企业&企业家
    的头像 发表于 01-15 14:37 852次阅读

    高通CES 2025展示AI创新成果

    方面的强大实力。 高通技术公司凭借其在AI领域的深厚积累,为PC、汽车、智能家居等多元终端品类带来了颠覆性的变革。在PC领域,高通展示了如何通过AI
    的头像 发表于 01-09 14:26 844次阅读

    推出深度推理模型GLM-Zero预览版

    近日,智公司正式发布了其深度推理模型GLM-Zero的预览版——GLM-Zero-Preview。这款模型标志着智谱在扩展强化学习技术训练推理模型方面的重大突破,成为其首个专注于增强AI
    的头像 发表于 01-03 10:42 764次阅读

    GLM-Zero深度推理模型预览版正式上线

    近日,智公司宣布其深度推理模型GLM-Zero的初代版本——GLM-Zero-Preview已正式上线。这款模型是智首个基于扩展强化学习技术训练的推理模型,标志着智谱在
    的头像 发表于 01-02 10:55 799次阅读

    中科曙光的“数智化”领跑实力

    近日,《咬文嚼字》编辑部发布2024年“十大流行语”引爆全网,其中,“数智化”、“水灵灵地”、“硬控”等,与中科曙光2024年取得的成果不谋而合,让我们一同看看中科曙光的“数智化”领跑实力!
    的头像 发表于 12-27 15:44 1173次阅读

    利用OpenVINO部署GLM-Edge系列SLM模型

    近期智发布了其最新的GLM-Edge系列SLM模型,GLM-Edge 系列是智谱在面向端侧真实落地使用的场景下的一次尝试,由两种尺寸的大语言对话模型和多模态理解模型组成
    的头像 发表于 12-09 16:12 2439次阅读