0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

号称全球最强开源模型 ——Qwen2.5 系列震撼来袭!PerfXCloud同步上线,快来体验!

胡优妮 来源:jf_33463055 作者:jf_33463055 2024-09-25 16:52 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

9月19日凌晨,阿里通义千问正式开源Qwen2.5系列大模型,最新发布包括了语言模型Qwen2.5,以及专门针对编程的Qwen2.5-Coder和数学的Qwen2.5-Math模型。PerfXCloud(澎峰云)大模型开发与服务平台第一时间支持Qwen2.5 72B并在平台完成上线,赶快来体验吧!

Qwen2.5系列模型

更大的训练数据集:Qwen2.5语言模型的所有尺寸都在最新的大规模数据集上进行了预训练,该数据集包含多达18Ttokens。相较于Qwen2,Qwen2.5获得了显著更多的知识(MMLU:85+),并在编程能力(HumanEval 85+)和数学能力(MATH 80+)方面有了大幅提升。

更强的指令遵循能力:新模型在指令执行、生成长文本(超过8K标记)、理解结构化数据(例如表格)以及生成结构化输出特别是JSON方面取得了显著改进。Qwen2.5模型总体上对各种system prompt更具适应性,增强了角色扮演实现和聊天机器人的条件设置功能。

长文本支持能力:与Qwen2类似,Qwen2.5语言模型支持高达128K tokens,并能生成最多8K tokens的内容。

强大的多语言能力:它们同样保持了对包括中文、英文、法文、西班牙文、葡萄牙文、德文、意大利文、俄文、日文、韩文、越南文、泰文、阿拉伯文等29种以上语言的支持。

专业领域的专家语言模型能力增强:即用于编程的Qwen2.5-Coder和用于数学的Qwen2.5-Math,相比其前身CodeQwen1.5和Qwen2-Math有了实质性的改进。具体来说,Qwen2.5-Coder在包含5.5T tokens编程相关数据上进行了训练,使即使较小的编程专用模型也能在编程评估基准测试中表现出媲美大型语言模型的竞争力。同时,Qwen2.5-Math支持中文和英文,并整合了多种推理方法,包括CoT(Chain of Thought)、PoT(Program of Thought)和TIR(Tool-Integrated Reasoning)。

wKgZombzzuyAIeM5AADwdHdI9ZU839.png

Qwen2.5-72B在多个基准测试中的结果

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 开源
    +关注

    关注

    3

    文章

    4461

    浏览量

    46712
  • 模型
    +关注

    关注

    1

    文章

    3914

    浏览量

    52429
  • 大模型
    +关注

    关注

    2

    文章

    3918

    浏览量

    5354
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    开发者分享 | 在 MCU 上探索 Qwen2.5 代码生成

    最近,我做了一个开发者实验:尝试把Qwen2.5-0.5B-Instruct部署到HPM6800EVK上,让它在板端完成本地推理。这里的“本地”不是把MCU当成串口终端,再去调用云端API;也不是由
    的头像 发表于 06-10 08:32 690次阅读
    开发者分享 | 在 MCU 上探索 <b class='flag-5'>Qwen2.5</b> 代码生成

    阿里巴巴正式发布全新一代千问旗舰模型Qwen3.7-Max

    5月20日,阿里巴巴正式发布全新一代千问旗舰模型Qwen3.7-Max。这款面向智能体时代全面设计的大模型,在三方机构Arena全球模型
    的头像 发表于 05-21 09:10 1820次阅读

    澎峰科技DF35 AI大模型推理一体机完成Qwen3.6系列模型全面适配

    今日,澎峰科技 DF35 AI大模型推理一体机 已完成对阿里云通义千问2026年4月最新开源Qwen3.6系列两大旗舰模型——
    的头像 发表于 04-28 16:16 431次阅读
    澎峰科技DF35 AI大<b class='flag-5'>模型</b>推理一体机完成<b class='flag-5'>Qwen</b>3.6<b class='flag-5'>系列</b><b class='flag-5'>模型</b>全面适配

    燧原科技L600极速适配小米MiMo-V2.5-Pro系列模型

    2026年4月28日,小米正式发布 MiMo-V2.5-Pro 系列模型,并于同日正式开源。燧原科技已同步完成对 MiMo-V
    的头像 发表于 04-28 15:21 510次阅读
    燧原科技L600极速适配小米MiMo-V<b class='flag-5'>2.5</b>-Pro<b class='flag-5'>系列</b><b class='flag-5'>模型</b>

    壁仞科技光速支持阿里Qwen3.6-35B-A3B大模型

    4月16日晚,阿里巴巴通义实验室正式宣布全量开源Qwen3.6-35B-A3B大模型。该模型为混合专家(MoE)模型,总参数量为350亿,激
    的头像 发表于 04-20 17:50 1758次阅读

    智谱新一代旗舰模型GLM-5.1上线华为云

    4月8日,智谱正式发布新一代旗舰模型GLM-5.1,发布当天已上线华为云,并成功对接华为云多款产品。该模型整体能力全面提升,是目前全球最强
    的头像 发表于 04-10 10:11 517次阅读

    阿里云发布新一代千问Qwen3.6-Plus,媲美Claude系列最强模型

    继今年2月16日,阿里云发布Qwen3.5 Plus之后,4月2日,阿里云发布新一代大语言模型Qwen3.6-Plus,迭代速度明显加快。相比前代产品,Qwen3.6-Plus实现了大
    的头像 发表于 04-03 14:00 1.2w次阅读
    阿里云发布新一代千问<b class='flag-5'>Qwen</b>3.6-Plus,媲美Claude<b class='flag-5'>系列</b><b class='flag-5'>最强</b><b class='flag-5'>模型</b>

    沐曦股份曦云C系列GPU全面适配通义千问Qwen3.5三款新模型

    今日,通义千问团队正式开源发布Qwen3.5系列中等规模模型,推出包括Qwen3.5-35B-A3B、Q
    的头像 发表于 02-28 10:05 925次阅读
    沐曦股份曦云C<b class='flag-5'>系列</b>GPU全面适配通义千问<b class='flag-5'>Qwen</b>3.5三款新<b class='flag-5'>模型</b>

    美格智能高算力AI模组+Qwen3.5,打造端侧最强AI智能体

    在人工智能技术飞速迭代的今天,大模型的“云端争霸”已渐入深水区,而一场关于“端侧智能”的静默革命正悄然兴起。随着Qwen3.5等高性能开源模型的问世,
    的头像 发表于 02-27 08:33 753次阅读
    美格智能高算力AI模组+<b class='flag-5'>Qwen</b>3.5,打造端侧<b class='flag-5'>最强</b>AI智能体

    摩尔线程MTT S5000全面适配Qwen3.5三款新模型

    开源Qwen3.5-397B-A17B之后,阿里再次宣布开源千问3.5最新三款中等规模模型Qwen3.5-35B-A3B、
    的头像 发表于 02-26 16:23 1003次阅读

    阿里巴巴开源全新一代大模型千问Qwen3.5-Plus

    千问3.5实现了底层模型架构的全面革新,此次发布的Qwen3.5-Plus版本总参数为3970亿,激活仅170亿,以小胜大,性能超过万亿参数的Qwen3-Max模型,部署显存占用降低6
    的头像 发表于 02-26 15:40 1508次阅读
    阿里巴巴<b class='flag-5'>开源</b>全新一代大<b class='flag-5'>模型</b>千问<b class='flag-5'>Qwen</b>3.5-Plus

    沐曦股份曦云C系列GPU深度适配通义千问Qwen3.5模型

    今天,通义千问今天正式发布 Qwen3.5,并推出Qwen3.5系列的第一款模型 Qwen3.5-397B-A17B 的开放权重版本。沐曦股
    的头像 发表于 02-26 14:26 994次阅读
    沐曦股份曦云C<b class='flag-5'>系列</b>GPU深度适配通义千问<b class='flag-5'>Qwen</b>3.5<b class='flag-5'>模型</b>

    月之暗面全新开源旗舰模型Kimi K2.5上线模力方舟

    模力方舟平台现已上线来自月之暗面(Moonshot AI)发布的全新开源旗舰模型Kimi K2.5
    的头像 发表于 01-29 10:20 1417次阅读
    月之暗面全新<b class='flag-5'>开源</b>旗舰<b class='flag-5'>模型</b>Kimi K<b class='flag-5'>2.5</b><b class='flag-5'>上线</b>模力方舟

    NVIDIA ACE现已支持开源Qwen3-8B小语言模型

    为助力打造实时、动态的 NPC 游戏角色,NVIDIA ACE 现已支持开源 Qwen3-8B 小语言模型(SLM),可实现 PC 游戏中的本地部署。
    的头像 发表于 10-29 16:59 1553次阅读

    阿里通义千问发布小尺寸模型Qwen3-4B,手机也能跑

    电子发烧友网综合报道 8月7日,阿里通义千问宣布发布更小尺寸新模型——Qwen3-4B-Instruct-2507和Qwen3-4B-Thinking-2507。目前新模型已在魔搭社区
    的头像 发表于 08-12 17:15 7205次阅读
    阿里通义千问发布小尺寸<b class='flag-5'>模型</b><b class='flag-5'>Qwen</b>3-4B,手机也能跑