0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

智源研究院揭晓大模型测评结果,豆包与百川智能大模型表现优异

微云疏影 来源:综合整理 作者:综合整理 2024-05-20 09:26 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

5月18日,北京智源研究院发布了关于国内外各类开/闭源语言及多模态大模型性能评估的最新研究成果。此项研究覆盖了140余个语言模型的综合实力对比,包括其对中文文本理解和多模态图文问答等任务的处理能力。

研究发现,尽管国内头部语言模型在中文环境中的整体表现已接近国际一流水平,但仍存在能力发展不平衡的问题。

在多模态理解图文问答任务中,开源和闭源模型表现相当,而国产模型则表现出色。此外,在中文语境下的文生图能力方面,国产多模态模型与国际一流水平的差距相对较小。

具体到语言模型的排名,在中文语境下,字节跳动的豆包Skylark2以及OpenAI的GPT-4分别名列第一和第二。值得注意的是,国产大模型在理解中国用户需求方面具有明显优势。

在语言模型客观评价中,OpenAI的GPT-4和百川智能的Baichuan3分列第一和第二。同时,百度的文心一言4.0、智谱华章的GLM-4以及月之暗面的Kimi也跻身语言模型主客观评价的前五名。

在多模态理解模型的客观评价中,图文问答方面,阿里巴巴的通义Qwen-vl-max和上海人工智能实验室的InternVL-Chat-V1.5在某些指标上超越了OpenAI的GPT-4,LLaVA-Next-Yi-34B和上海人工智能实验室的Intern-XComposer2-VL-7B紧随其后。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 开源
    +关注

    关注

    3

    文章

    4344

    浏览量

    46441
  • 模型
    +关注

    关注

    1

    文章

    3817

    浏览量

    52265
  • 大模型
    +关注

    关注

    2

    文章

    3768

    浏览量

    5269
  • 百川智能
    +关注

    关注

    0

    文章

    18

    浏览量

    188
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    商汤大装置联合大晓机器人与广西产业技术研究院达成战略合作

    近日,商汤大装置联合大晓机器人与广西产业技术研究院达成战略合作,就AI基础设施建设、具身数据采集、世界模型研发、机器人应用场景拓展等领域达成深度合作。开启三方携手赋能具身智能产业发展的新篇章。
    的头像 发表于 03-20 17:40 1804次阅读

    国产算力首证具身大脑模型训练实力:摩尔线程联合智研究院完成RoboBrain 2.5全流程训练

    随着具身智能成为人工智能的下一个战略高地,底层算力底座的自主可控显得尤为关键。近日,摩尔线程联合北京智人工智能研究院(以下简称:智)基于
    的头像 发表于 01-14 09:05 762次阅读
    国产算力首证具身大脑<b class='flag-5'>模型</b>训练实力:摩尔线程联合智<b class='flag-5'>源</b><b class='flag-5'>研究院</b>完成RoboBrain 2.5全流程训练

    广电计量与长沙三大研究院达成战略合作

    11月26-27日,广电计量与长沙北斗产业安全技术研究院集团股份有限公司(简称“长沙北斗研究院”)、长沙量子测量产业技术研究院有限公司(简称“长沙量子研究院”)、湖南大学长沙半导体技术
    的头像 发表于 12-04 14:36 651次阅读

    广电计量携手南山研究院打造大健康产业新生态

    10月19日, “南山研究院南海四周年系列活动”在广东省南山医药创新研究院(简称“南山研究院”)成功举办。期间,南山研究院与广电计量等多家单位联合共建的华南医学健康功效循证评价中心正式
    的头像 发表于 10-23 17:42 1288次阅读

    澎峰科技加入智研究院FlagOS开源社区

    ,本次活动由北京市发展改革委、北京市科委中关村管委会、北京市经信局、中关村科学城管委会共同指导,由中国人工智能学会提供支持,并汇聚了清华大学、北京智人工智能研究院等多家权威机构与产业
    的头像 发表于 10-13 16:49 1408次阅读

    弘信电子携手百川智能推动医疗AI技术落地应用

    近日,百川智能正式发布开源医疗增强大模型Baichuan-M2,该模型以卓越性能问鼎全球开源医疗模型榜首,实现中国在医疗AI领域从跟跑到领跑
    的头像 发表于 08-19 10:58 1335次阅读
    弘信电子携手<b class='flag-5'>百川</b><b class='flag-5'>智能</b>推动医疗AI技术落地应用

    勇艺达人工智能研究院迎大咖加盟

    近日,深圳勇艺达总部隆重举行 “数智融合 聚贤赋能 —— 勇艺达人工智能研究院高端人才聘任仪式”,正式聘请黄道权先生与吴天准先生加盟,为研究院注入顶尖智慧力量,此举标志着勇艺达在人工智能
    的头像 发表于 07-10 18:04 1068次阅读

    模型推理显存和计算量估计方法研究

    随着人工智能技术的飞速发展,深度学习大模型在各个领域得到了广泛应用。然而,大模型的推理过程对显存和计算资源的需求较高,给实际应用带来了挑战。为了解决这一问题,本文将探讨大模型推理显存和
    发表于 07-03 19:43

    大华问数智能体一体机通过中国信通权威评测认证

    日前,由中国通信标准化协会主办的2025数据智能大会在北京召开。会上,中国信息通信研究院(以下简称“中国信通”)发布了2025年上半年“大模型驱动的
    的头像 发表于 07-01 14:16 1589次阅读

    商汤大装置万象大模型开发平台获得中国信通最高评级

    近日,中国信息通信研究院(以下简称“中国信通”)完成可信AI《大模型推理平台通用能力成熟度》首轮评估。
    的头像 发表于 07-01 10:48 1125次阅读

    多模态感知+豆包模型!家居端侧智能升级

    的关键力量。星宸科技与豆包模型的合作,将这一技术趋势落实到实际应用场景中,在智能家居、可穿戴设备以及连锁店等领域引发了深刻变革。   智能家居升级   陈立敬指出:“
    的头像 发表于 06-21 00:06 7327次阅读
    多模态感知+<b class='flag-5'>豆包</b>大<b class='flag-5'>模型</b>!家居端侧<b class='flag-5'>智能</b>升级

    商汤日日新SenseNova融合模态大模型 国内首家获得最高评级的大模型

    的大模型。 可信AI多模态大模型评估2025年1月启动,由中国信通人工智能研究所牵头,依据由业界60余家单位共同编制的《多模态大
    的头像 发表于 06-11 11:57 1561次阅读

    在V2板子上部署豆包模型调试指南

    在V2板子上部署豆包模型调试指南 准备阶段 首先,可以观看大模型实战(SC171开发套件V3)并下载工程源码,之后我们需要在板子上安装这个代码所要用到的一些库。 pip3 install
    发表于 05-25 10:17

    度文心大模型X1 Turbo获得信通当前大模型最高评级证书

    度在520居然还领了个证?是它, 信通当前大模型最高评级证书 ! 在5月20日的度AI Day 上,中国信通公布了大
    的头像 发表于 05-21 18:19 1396次阅读
    <b class='flag-5'>百</b>度文心大<b class='flag-5'>模型</b>X1 Turbo获得信通<b class='flag-5'>院</b>当前大<b class='flag-5'>模型</b>最高评级证书

    万里红入选中国信通模型应用交付供应商名录

    近日,中国信息通信研究院与中国人工智能产业发展联盟(AIIA)联合发布了《大模型应用交付供应商名录(2025年Q1)》。该名录基于问卷调研统计,通过对政务、金融、医疗等十大重点行业大模型
    的头像 发表于 04-25 17:25 1446次阅读