0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

智谱AI领跑司南OpenCompass 2.0月度榜单,GLM-4展示强大实力

独角兽科技 来源:独角兽科技 作者:独角兽科技 2024-05-22 12:44 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近期,大模型开源开放评测体系司南(OpenCompass 2.0)公布了2024年4月大语言模型最新评测榜单,智谱AI的GLM-4继续保持国产大模型第一的领先身位。

wKgZomZNeAmAOZvZAALVoFD5HAQ911.png

大模型开源开放评测体系司南(OpenCompass 2.0)由上海人工智能实验室发布。其月度榜单从基础能力和综合能力的设计出发,构建了一套高质量的中英文双语评测基准体系,对主流开源模型和商业API模型进行了全面评测分析。评测榜单涉及的大语言模型和多模态大模型超过150个,更有包括Meta、阿里巴巴、腾讯、百度等30余家国内外企业和科研机构采用OpenCompass助力开展技术研发。

在4月客观评测榜单中,OpenCompass基于语言、知识、推理、数学、代码、智能体六个维度构建了15000余道高质量中英文双语问题,并引入OpenCompass团队首创的循环评估 (Circular Evalution) 策略,系统性分析了国内外大模型的客观性能。其中,GLM-4位列第四名,仅次于GPT-4-Turbo系列与Claude3-Opus,成为国内大模型客观评测月度总榜第一名。在语言维度方面,GLM-4分数达到57.7分表现突出,超过GPT-4-Turbo系列与Claude3-Opus。在知识维度上,GLM-4得到68.9分,超过第二名的GPT-4-Turbo-1106,与第三名Claude3-Opus不相上下。

wKgaomZNeBOAZ63KAAIJ06JMoBs074.png

值得一提的是,GLM-4此前便长期占据OpenCompass 2.0榜单前列,并多次在权威榜单与全球顶级大模型一较高下。清华《SuperBench大模型综合能力评测报告》显示,GLM-4在语义理解等方面的能力表现超过了GPT-4-Turbo等国际一流模型,在代码、智能体等方面,排名国内第一。在SuperCLUE-Fin(SC-Fin)中文原生金融大模型测评基准中,GLM-4斩获一项A+及多项A级评价,在国内大模型中排名第一。

据了解,GLM-4是由智谱AI于今年1月推出的新一代基座大模型。GLM-4整体性能逼近GPT-4,它可以支持更长的上下文,具备更强的多模态能力。同时,它的推理速度更快,支持更高的并发,大大降低推理成本。依托GLM-4 All Tools能力,GLM-4智能体能够实现自主根据用户意图,自动理解、规划复杂指令,自由调用网页浏览器、Code Interpreter代码解释器和多模态文生图大模型以完成复杂任务。

开发者可以通过智谱AI大模型开放平台bigmodel.cn接入GLM-4模型开放API,便捷高效地体验GLM-4的强大能力。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • API
    API
    +关注

    关注

    2

    文章

    2507

    浏览量

    67138
  • AI
    AI
    +关注

    关注

    91

    文章

    41998

    浏览量

    303087
  • 开源
    +关注

    关注

    3

    文章

    4425

    浏览量

    46584
  • 大模型
    +关注

    关注

    2

    文章

    3864

    浏览量

    5298
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    新一代旗舰模型GLM-5.1上线华为云

    48日,智正式发布新一代旗舰模型GLM-5.1,发布当天已上线华为云,并成功对接华为云多款产品。该模型整体能力全面提升,是目前全球最强的开源模型,Coding能力刷新全球最佳成绩,
    的头像 发表于 04-10 10:11 449次阅读

    昆仑芯率先完成智新一代旗舰模型GLM-5.1深度支持

    今日,智正式开源新一代旗舰模型GLM-5.1。作为当前全球领先的开源大模型之一,GLM-5.1在长程任务(Long Horizon Task)处理能力上实现了显著突破。模型发布当日,昆仑芯即完成P800系列产品的适配工作,成为
    的头像 发表于 04-09 17:31 1499次阅读

    沐曦股份曦云C系列GPU产品Day 0适配智GLM-5.1旗舰模型

    48日,智新一代旗舰模型GLM-5.1实现开源。目前,沐曦股份曦云 C 系列 GPU已完成该系列模型Day 0 全量适配,再度以全栈自主技术实力
    的头像 发表于 04-09 11:25 555次阅读

    壁仞科技壁砺166系列产品Day 0适配智GLM-5.1旗舰模型

    48日,智正式上线并开源新一代旗舰模型GLM-5.1。作为目前全球最强的开源模型,GLM-5.1在长程任务(Long Horizon T
    的头像 发表于 04-09 11:23 527次阅读

    炬芯科技荣膺2025年中国AIoT行业AI硬核实力企业奖

    近日,2025“物联之星”中国AIoT行业年度榜单正式揭晓,炬芯科技凭借在端侧AI芯片领域的技术深度与规模化应用成果,从众多参评企业中脱颖而出,荣获2025年中国AIoT行业“AI
    的头像 发表于 03-17 17:07 2674次阅读

    华为昇腾深度适配智AI全新开源模型GLM-5

    2026年212日,智AI发布Agentic Engineering时代最好的开源模型GLM-5,从“写代码”到“写工程”的能力进一步演进。在Coding与Agent能力上取得开源
    的头像 发表于 02-25 14:41 1556次阅读
    华为昇腾深度适配智<b class='flag-5'>谱</b><b class='flag-5'>AI</b>全新开源模型<b class='flag-5'>GLM</b>-5

    大模型 ai coding 比较

    K2.5 93 57.5 ✅ 90 85 1M(100万tokens) 65 百万级长上下文、重构理解能力强、中文流畅 长文本知识库、文档分析、内容生成 ✅本次实测 + 之暗面公开数据 智GLM
    发表于 02-19 13:43

    大模型竞争白热化!智、MiniMax密集发布,DeepSeek V4路线图曝光

    211日晚间,智发布新一代旗舰模型GLM-5,智称,GLM-5在Coding与Agent能力上,取得开源SOTA表现,在真实编程场景的
    的头像 发表于 02-12 15:44 3.2w次阅读
    大模型竞争白热化!智<b class='flag-5'>谱</b>、MiniMax密集发布,DeepSeek V<b class='flag-5'>4</b>路线图曝光

    AI正式上线并开源全新一代大模型GLM-5

    AI正式上线并开源全新一代大模型GLM-5。作为面向复杂系统工程与长程Agent任务打造的新一代模型,GLM-5在Coding与Agent能力上实现开源SOTA表现,在真实编程场景
    的头像 发表于 02-12 14:40 1103次阅读

    曦云C系列GPU Day 0 适配智全新一代大模型GLM-5

    AI正式上线并开源全新一代大模型 GLM-5,沐曦股份实现 Day 0 深度适配。 GLM-5目前可于曦云 C 系列(C500/C550/C588)上稳定高效运行。 近期,智
    的头像 发表于 02-12 10:53 1247次阅读
    曦云C系列GPU Day 0 适配智<b class='flag-5'>谱</b>全新一代大模型<b class='flag-5'>GLM</b>-5

    深演智能Deep Agent入选2026年中国AI+营销实力平台TOP10榜单

    “2026年中国AI+营销年度实力平台TOP10” ,体现了行业对其在AI营销领域技术实力与实践成果的高度认可。
    的头像 发表于 02-11 16:43 1352次阅读

    沐曦曦云C500/C550 GPU产品适配智GLM-OCR模型

    今天,智AI正式发布并开源GLM-OCR,以 “小尺寸、高精度” 实现文档解析能力新标杆。沐曦股份曦云C500/C550 GPU充分发挥高生态兼容性、软硬协同能力优势,高效完成与智
    的头像 发表于 02-03 11:36 1048次阅读
    沐曦曦云C500/C550 GPU产品适配智<b class='flag-5'>谱</b><b class='flag-5'>GLM</b>-OCR模型

    广和通MagiCore 2.0机芯盒入选2025年AI+硬核应用创新榜单

    近日,在ICT行业权威全媒体平台C114通信网发起的“2025年AI+‘硬核’榜单”征集活动中,广和通凭借融合4G蜂窝连接和AI交互算法、
    的头像 发表于 02-02 14:35 606次阅读

    沐曦股份曦云C系列GPU Day 0适配智GLM-4.6V多模态大模型

    128日智AI发布并开源 GLM-4.6V 系列多模态大模型,沐曦股份曦云C系列GPU完成Day 0适配。
    的头像 发表于 12-17 14:28 927次阅读
    沐曦股份曦云C系列GPU Day 0适配智<b class='flag-5'>谱</b><b class='flag-5'>GLM</b>-4.6V多模态大模型

    华为CANN与智GLM端侧模型完成适配

    已于728日正式开源其新一代基座模型GLM-4.5,其GLM端侧模型已完成与CANN的适配。这标志着国产大模型与计算架构在端云协同方向实现关键突破,国产AI生态正加速迈入深度融合阶段
    的头像 发表于 08-11 11:00 2868次阅读