9月19日凌晨,阿里通义千问正式开源Qwen2.5系列大模型,最新发布包括了语言模型Qwen2.5,以及专门针对编程的Qwen2.5-Coder和数学的Qwen2.5-Math模型。PerfXCloud(澎峰云)大模型开发与服务平台第一时间支持Qwen2.5 72B并在平台完成上线,赶快来体验吧!
Qwen2.5系列模型
更大的训练数据集:Qwen2.5语言模型的所有尺寸都在最新的大规模数据集上进行了预训练,该数据集包含多达18Ttokens。相较于Qwen2,Qwen2.5获得了显著更多的知识(MMLU:85+),并在编程能力(HumanEval 85+)和数学能力(MATH 80+)方面有了大幅提升。
更强的指令遵循能力:新模型在指令执行、生成长文本(超过8K标记)、理解结构化数据(例如表格)以及生成结构化输出特别是JSON方面取得了显著改进。Qwen2.5模型总体上对各种system prompt更具适应性,增强了角色扮演实现和聊天机器人的条件设置功能。
长文本支持能力:与Qwen2类似,Qwen2.5语言模型支持高达128K tokens,并能生成最多8K tokens的内容。
强大的多语言能力:它们同样保持了对包括中文、英文、法文、西班牙文、葡萄牙文、德文、意大利文、俄文、日文、韩文、越南文、泰文、阿拉伯文等29种以上语言的支持。
专业领域的专家语言模型能力增强:即用于编程的Qwen2.5-Coder和用于数学的Qwen2.5-Math,相比其前身CodeQwen1.5和Qwen2-Math有了实质性的改进。具体来说,Qwen2.5-Coder在包含5.5T tokens编程相关数据上进行了训练,使即使较小的编程专用模型也能在编程评估基准测试中表现出媲美大型语言模型的竞争力。同时,Qwen2.5-Math支持中文和英文,并整合了多种推理方法,包括CoT(Chain of Thought)、PoT(Program of Thought)和TIR(Tool-Integrated Reasoning)。

Qwen2.5-72B在多个基准测试中的结果
审核编辑 黄宇
-
开源
+关注
关注
3文章
4461浏览量
46712 -
模型
+关注
关注
1文章
3914浏览量
52429 -
大模型
+关注
关注
2文章
3918浏览量
5354
发布评论请先 登录
开发者分享 | 在 MCU 上探索 Qwen2.5 代码生成
阿里巴巴正式发布全新一代千问旗舰模型Qwen3.7-Max
澎峰科技DF35 AI大模型推理一体机完成Qwen3.6系列模型全面适配
壁仞科技光速支持阿里Qwen3.6-35B-A3B大模型
智谱新一代旗舰模型GLM-5.1上线华为云
阿里云发布新一代千问Qwen3.6-Plus,媲美Claude系列最强模型
美格智能高算力AI模组+Qwen3.5,打造端侧最强AI智能体
摩尔线程MTT S5000全面适配Qwen3.5三款新模型
阿里巴巴开源全新一代大模型千问Qwen3.5-Plus
沐曦股份曦云C系列GPU深度适配通义千问Qwen3.5模型
NVIDIA ACE现已支持开源Qwen3-8B小语言模型
阿里通义千问发布小尺寸模型Qwen3-4B,手机也能跑
号称全球最强开源模型 ——Qwen2.5 系列震撼来袭!PerfXCloud同步上线,快来体验!
评论