近日,阿里云通义宣布了一项重大开源举措,推出了支持100万Tokens上下文的Qwen2.5-1M模型。这一新模型在处理长文本任务中展现出了卓越的性能,稳定超越了GPT-4o-mini。
Qwen2.5-1M模型提供了7B和14B两种尺寸供用户选择,以满足不同场景下的需求。在处理长文本输入时,该模型能够保持稳定的性能,为用户提供更加准确、可靠的输出结果。
除了推出新模型外,阿里云通义还同时开源了推理框架。这一框架在处理百万级别长文本输入时,可实现近7倍的提速,极大地提升了用户的处理效率。通过这一框架,用户可以更加便捷地应用Qwen2.5-1M模型,实现长文本处理的高效化。
阿里云通义此次开源的Qwen2.5-1M模型和推理框架,为人工智能领域带来了新的突破。这一举措不仅提升了长文本处理的能力,也为用户提供了更加便捷、高效的使用体验。未来,阿里云通义将继续致力于人工智能技术的研发和创新,为用户提供更加卓越的产品和服务。
-
人工智能
+关注
关注
1813文章
49737浏览量
261540 -
模型
+关注
关注
1文章
3649浏览量
51713 -
阿里云
+关注
关注
3文章
1028浏览量
45502
发布评论请先 登录
上新:小米首个推理大模型开源 马斯克:下周推出Grok 3.5
壁仞科技完成阿里巴巴通义千问Qwen3全系列模型支持
利用英特尔OpenVINO在本地运行Qwen2.5-VL系列模型

阿里云通义开源长文本新模型Qwen2.5-1M
评论