阿里巴巴最近发布了其通义千问系列的新成员——Qwen2大模型,并在Hugging Face和ModelScope两大平台上实现了同步开源。这一举措无疑为人工智能领域的研究者和开发者们提供了更多选择和可能。
Qwen2系列包含了五个不同尺寸的预训练和指令微调模型,从Qwen2-0.5B到Qwen2-72B,覆盖了从轻量级到超大规模的全面选择。这些模型不仅拥有强大的语言理解和生成能力,更在上下文长度上实现了进一步的扩展,最高支持达到128K tokens,为用户提供了更为广阔的信息处理空间。
通过开源,阿里旨在推动人工智能技术的普及和发展,让更多的研究者和开发者能够基于Qwen2大模型进行更深入的研究和应用。这一举措不仅展示了阿里巴巴在人工智能领域的深厚实力,也体现了其对于推动行业进步的积极态度。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。
举报投诉
-
人工智能
+关注
关注
1789文章
46642浏览量
237008 -
阿里巴巴
+关注
关注
7文章
1607浏览量
47057 -
大模型
+关注
关注
2文章
2273浏览量
2350
发布评论请先 登录
相关推荐
阿里Qwen2-Math系列震撼发布,数学推理能力领跑全球
阿里巴巴近期震撼发布了Qwen2-Math系列模型,这一系列模型基于其强大的Qwen2 LLM构
Qwen2强势来袭,AIBOX支持本地化部署
Qwen2是阿里通义推出的新一代多语言预训练模型,经过更深入的预训练和指令调整,在多个基准评测结果中表现出色,尤其在代码和数学方面有显著提升,同时拓展了上下文长度支持,最高可达128K
阿里云发布通义千问2.5大模型,多项能力超越GPT-4
阿里云隆重推出了通义千问 2.5 版,宣称其“技术进步,全面超越GPT-4”,尤其是在中文环境中的多种任务(如文本理解、文本生成、知识问答及生活建议、临时聊天及对话以及安全风险评估)方
联发科天玑9300等旗舰芯片搭载通义千问大模型,成功实现
通义千问大模型可在离线环境下轻松应对多轮AI对话。此外,阿里云也承诺与联发科进行深度合作,为全球手机制造商提供端侧大
联发科天玑9300搭载通义千问大模型,阿里云提供解决方案
通义千问大模型已开源多项版本,包括18亿、70亿、140亿及720亿参数等版本伴随视觉、音频多模态能力提升。阿里云于去年10月
评论