0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

阿里通义千问发布小尺寸模型Qwen3-4B,手机也能跑

Carol Li 来源:电子发烧友网 作者:李弯弯 2025-08-12 17:15 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网综合报道 8月7日,阿里通义千问宣布发布更小尺寸新模型——Qwen3-4B-Instruct-2507和Qwen3-4B-Thinking-2507。目前新模型已在魔搭社区、HuggingFace正式开源。在非推理领域,Qwen3-4B-Instruct-2507全面超越闭源的GPT4.1-Nano。在推理领域,Qwen3-4B-Thinking-2507甚至可以媲美中等规模的Qwen3-30B-A3B(thinking)。官方表示,2507版本的Qwen3-4B模型对手机等端侧硬件部署尤为友好。


随着AI技术的广泛应用,不同场景对模型的需求呈现出多样化态势。在一些资源受限的边缘设备,如智能手机、智能手表、物联网终端等,大尺寸模型由于计算资源需求大、内存占用高,难以有效部署和运行。同时,对于一些对实时性要求极高的应用场景,如自动驾驶的实时决策、工业生产中的即时质量控制等,大模型的高延迟也成为制约其应用的瓶颈。在此背景下,小尺寸、低延迟且具备一定性能的模型成为市场的新需求。阿里通义千问敏锐地捕捉到这一趋势,适时推出了Qwen3-4B模型。

Qwen3-4B,从名称便可知其规模相对较小,“4B”代表着该模型拥有约40亿的参数。相较于那些拥有千亿甚至万亿参数的“巨无霸”模型,Qwen3-4B堪称“小个子”。

在语言理解方面,Qwen3-4B展现出了出色的表现。它能够精准理解人类输入的各种复杂语句,无论是日常交流中的口语化表达,还是专业领域的术语和复杂逻辑语句,都能快速把握其中的语义和意图。例如,在医疗领域,面对医生输入的包含专业医学词汇和复杂诊断逻辑的语句,Qwen3-4B可以准确理解病情信息,为后续的辅助诊断提供可靠依据。在法律场景中,对于法律条文的解读和法律案例的分析,它也能深入理解其中的法律关系和关键要点。

其文本生成能力同样可圈可点。Qwen3-4B可以生成高质量、连贯且符合语境的文本内容。无论是撰写新闻稿、故事创作、诗歌生成,还是进行商业文案的策划,它都能根据给定的主题和要求,快速生成富有创意和逻辑性的文本。而且,生成的文本在语法准确性和语义合理性上都有较高水准,大大减少了人工后期修改的工作量。

在多模态交互方面,Qwen3-4B也有积极探索。它不仅能够处理文本信息,还能与图像、音频等多种模态数据进行交互。例如,在图像描述生成任务中,它可以根据输入的图像,生成准确、生动的文字描述,详细阐述图像中的场景、人物、物体及其相互关系。在语音交互场景中,它能够理解语音输入的内容,并给出相应的语音或文本回复,实现自然流畅的人机对话。

值得一提的是,Qwen3-4B还具备良好的可扩展性和适应性。开发人员可以根据具体的应用需求,对其进行微调和优化,使其更好地适配不同的业务场景。同时,由于其小尺寸的特点,它在部署和运行过程中对硬件资源的要求较低,能够在各种资源有限的设备上稳定运行,大大降低了应用成本。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 阿里
    +关注

    关注

    6

    文章

    468

    浏览量

    34237
  • 通义千问
    +关注

    关注

    1

    文章

    42

    浏览量

    642
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    澎峰科技DF35 AI大模型推理一体机完成Qwen3.6系列模型全面适配

    今日,澎峰科技 DF35 AI大模型推理一体机 已完成对阿里通义2026年4月最新开源的
    的头像 发表于 04-28 16:16 134次阅读
    澎峰科技DF35 AI大<b class='flag-5'>模型</b>推理一体机完成<b class='flag-5'>Qwen</b>3.6系列<b class='flag-5'>模型</b>全面适配

    沐曦股份Day 0适配阿里Qwen3.6-35B-A3B模型

    阿里巴巴模型团队最新宣布,开源旗下多模态“智能体小钢炮” Qwen3.6-35B-A3B模型
    的头像 发表于 04-22 11:13 662次阅读
    沐曦股份Day 0适配<b class='flag-5'>阿里</b><b class='flag-5'>千</b><b class='flag-5'>问</b><b class='flag-5'>Qwen3.6-35B-A3B</b>大<b class='flag-5'>模型</b>

    海光信息DCU平台适配阿里通义Qwen3.6-35B-A3B模型

      近日,阿里通义正式开源多模态智能体大模型Qwen3.6-35B-A3B发布不到24小时,海光信息联合众智FlagOS社区完成该
    的头像 发表于 04-21 17:40 1645次阅读

    壁仞科技光速支持阿里Qwen3.6-35B-A3B模型

    4月16日晚,阿里巴巴通义实验室正式宣布全量开源Qwen3.6-35B-A3B模型。该模型为混
    的头像 发表于 04-20 17:50 1562次阅读

    阿里发布新一代Qwen3.6-Plus,媲美Claude系列最强模型

    继今年2月16日,阿里发布Qwen3.5 Plus之后,4月2日,阿里发布新一代大语言
    的头像 发表于 04-03 14:00 1.1w次阅读
    <b class='flag-5'>阿里</b>云<b class='flag-5'>发布</b>新一代<b class='flag-5'>千</b><b class='flag-5'>问</b><b class='flag-5'>Qwen</b>3.6-Plus,媲美Claude系列最强<b class='flag-5'>模型</b>

    天数智芯完成阿里通义Qwen3.5系列多模态模型全量适配

    近日,天数智芯携手众智FlagOS 社区完成阿里通义 Qwen3.5 系列多模态模型全量适
    的头像 发表于 03-26 09:25 2048次阅读

    沐曦股份曦云C系列GPU全面适配通义Qwen3.5三款新模型

    今日,通义团队正式开源发布Qwen3.5系列中等规模模型,推出包括
    的头像 发表于 02-28 10:05 746次阅读
    沐曦股份曦云C系列GPU全面适配<b class='flag-5'>通义</b><b class='flag-5'>千</b><b class='flag-5'>问</b><b class='flag-5'>Qwen</b>3.5三款新<b class='flag-5'>模型</b>

    阿里巴巴开源全新一代大模型Qwen3.5-Plus

    3.5实现了底层模型架构的全面革新,此次发布Qwen3.5-Plus版本总参数为3970亿,激活仅170亿,以小胜大,性能超过万亿参数
    的头像 发表于 02-26 15:40 1269次阅读
    <b class='flag-5'>阿里</b>巴巴开源全新一代大<b class='flag-5'>模型</b><b class='flag-5'>千</b><b class='flag-5'>问</b><b class='flag-5'>Qwen</b>3.5-Plus

    沐曦股份曦云C系列GPU深度适配通义Qwen3.5模型

    今天,通义今天正式发布 Qwen3.5,并推出Qwen3.5系列的第一款
    的头像 发表于 02-26 14:26 818次阅读
    沐曦股份曦云C系列GPU深度适配<b class='flag-5'>通义</b><b class='flag-5'>千</b><b class='flag-5'>问</b><b class='flag-5'>Qwen</b>3.5<b class='flag-5'>模型</b>

    阿里巴巴发布通义旗舰推理模型Qwen3-Max-Thinking

    今天,我们正式发布旗舰推理模型Qwen3-Max-Thinking,创下数项权威评测全球新纪录。
    的头像 发表于 01-27 15:47 609次阅读
    <b class='flag-5'>阿里</b>巴巴<b class='flag-5'>发布</b><b class='flag-5'>通义</b><b class='flag-5'>千</b><b class='flag-5'>问</b>旗舰推理<b class='flag-5'>模型</b><b class='flag-5'>Qwen3</b>-Max-Thinking

    广和通加速通义Qwen3在端侧全面落地

    6月,广和通宣布:率先完成通义Qwen3系列混合推理模型在高通QCS8550平台端侧的适配部署。广和通通过定制化混合精度量化方案与创新硬
    的头像 发表于 06-25 15:35 1384次阅读

    Arm CPU适配通义Qwen3系列模型

    近日,阿里巴巴开源了新一代通义模型 Qwen3,Arm 率先成为首批成功适配该
    的头像 发表于 05-12 16:37 1604次阅读

    NVIDIA RTX 5880 Ada与Qwen3系列模型实测报告

    近日,阿里巴巴通义团队正式推出新一代开源大语言模型——Qwen3 系列,该系列包含 6 款
    的头像 发表于 05-09 15:05 4693次阅读
    NVIDIA RTX 5880 Ada与<b class='flag-5'>Qwen3</b>系列<b class='flag-5'>模型</b>实测报告

    NVIDIA使用Qwen3系列模型的最佳实践

    阿里巴巴近期发布了其开源的混合推理大语言模型 (LLM) 通义
    的头像 发表于 05-08 11:45 3229次阅读
    NVIDIA使用<b class='flag-5'>Qwen3</b>系列<b class='flag-5'>模型</b>的最佳实践

    后摩智能NPU适配通义Qwen3系列模型

    近日,阿里云重磅推出Qwen3 系列开源混合推理模型。用时不到1天,后摩智能自研NPU迅速实现Qwen3 系列模型
    的头像 发表于 05-07 16:46 1563次阅读