0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

阿里通义千问发布小尺寸模型Qwen3-4B,手机也能跑

Carol Li 来源:电子发烧友网 作者:李弯弯 2025-08-12 17:15 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网综合报道 8月7日,阿里通义千问宣布发布更小尺寸新模型——Qwen3-4B-Instruct-2507和Qwen3-4B-Thinking-2507。目前新模型已在魔搭社区、HuggingFace正式开源。在非推理领域,Qwen3-4B-Instruct-2507全面超越闭源的GPT4.1-Nano。在推理领域,Qwen3-4B-Thinking-2507甚至可以媲美中等规模的Qwen3-30B-A3B(thinking)。官方表示,2507版本的Qwen3-4B模型对手机等端侧硬件部署尤为友好。


随着AI技术的广泛应用,不同场景对模型的需求呈现出多样化态势。在一些资源受限的边缘设备,如智能手机、智能手表、物联网终端等,大尺寸模型由于计算资源需求大、内存占用高,难以有效部署和运行。同时,对于一些对实时性要求极高的应用场景,如自动驾驶的实时决策、工业生产中的即时质量控制等,大模型的高延迟也成为制约其应用的瓶颈。在此背景下,小尺寸、低延迟且具备一定性能的模型成为市场的新需求。阿里通义千问敏锐地捕捉到这一趋势,适时推出了Qwen3-4B模型。

Qwen3-4B,从名称便可知其规模相对较小,“4B”代表着该模型拥有约40亿的参数。相较于那些拥有千亿甚至万亿参数的“巨无霸”模型,Qwen3-4B堪称“小个子”。

在语言理解方面,Qwen3-4B展现出了出色的表现。它能够精准理解人类输入的各种复杂语句,无论是日常交流中的口语化表达,还是专业领域的术语和复杂逻辑语句,都能快速把握其中的语义和意图。例如,在医疗领域,面对医生输入的包含专业医学词汇和复杂诊断逻辑的语句,Qwen3-4B可以准确理解病情信息,为后续的辅助诊断提供可靠依据。在法律场景中,对于法律条文的解读和法律案例的分析,它也能深入理解其中的法律关系和关键要点。

其文本生成能力同样可圈可点。Qwen3-4B可以生成高质量、连贯且符合语境的文本内容。无论是撰写新闻稿、故事创作、诗歌生成,还是进行商业文案的策划,它都能根据给定的主题和要求,快速生成富有创意和逻辑性的文本。而且,生成的文本在语法准确性和语义合理性上都有较高水准,大大减少了人工后期修改的工作量。

在多模态交互方面,Qwen3-4B也有积极探索。它不仅能够处理文本信息,还能与图像、音频等多种模态数据进行交互。例如,在图像描述生成任务中,它可以根据输入的图像,生成准确、生动的文字描述,详细阐述图像中的场景、人物、物体及其相互关系。在语音交互场景中,它能够理解语音输入的内容,并给出相应的语音或文本回复,实现自然流畅的人机对话。

值得一提的是,Qwen3-4B还具备良好的可扩展性和适应性。开发人员可以根据具体的应用需求,对其进行微调和优化,使其更好地适配不同的业务场景。同时,由于其小尺寸的特点,它在部署和运行过程中对硬件资源的要求较低,能够在各种资源有限的设备上稳定运行,大大降低了应用成本。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 阿里
    +关注

    关注

    6

    文章

    462

    浏览量

    34039
  • 通义千问
    +关注

    关注

    1

    文章

    37

    浏览量

    529
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    广和通加速通义Qwen3在端侧全面落地

    6月,广和通宣布:率先完成通义Qwen3系列混合推理模型在高通QCS8550平台端侧的适配部署。广和通通过定制化混合精度量化方案与创新硬
    的头像 发表于 06-25 15:35 788次阅读

    Arm CPU适配通义Qwen3系列模型

    近日,阿里巴巴开源了新一代通义模型 Qwen3,Arm 率先成为首批成功适配该
    的头像 发表于 05-12 16:37 1109次阅读

    NVIDIA RTX 5880 Ada与Qwen3系列模型实测报告

    近日,阿里巴巴通义团队正式推出新一代开源大语言模型——Qwen3 系列,该系列包含 6 款
    的头像 发表于 05-09 15:05 3803次阅读
    NVIDIA RTX 5880 Ada与<b class='flag-5'>Qwen3</b>系列<b class='flag-5'>模型</b>实测报告

    NVIDIA使用Qwen3系列模型的最佳实践

    阿里巴巴近期发布了其开源的混合推理大语言模型 (LLM) 通义
    的头像 发表于 05-08 11:45 2604次阅读
    NVIDIA使用<b class='flag-5'>Qwen3</b>系列<b class='flag-5'>模型</b>的最佳实践

    MediaTek天玑9400率先完成阿里Qwen3模型部署

    通义模型团队在天玑 9400 旗舰移动平台上率先完成 Qwen3 3)的端侧部署。未来,
    的头像 发表于 05-08 10:11 949次阅读

    后摩智能NPU适配通义Qwen3系列模型

    近日,阿里云重磅推出Qwen3 系列开源混合推理模型。用时不到1天,后摩智能自研NPU迅速实现Qwen3 系列模型
    的头像 发表于 05-07 16:46 1128次阅读

    B都有!BM1684X一键适配全系列Qwen3

    Qwen3发布,大小尺寸通吃Qwen3发布,登顶开源大模型排行榜!235
    的头像 发表于 04-30 18:37 1183次阅读
    几<b class='flag-5'>B</b>都有!BM1684X一键适配全系列<b class='flag-5'>Qwen3</b>

    上新:小米首个推理大模型开源 马斯克:下周推出Grok 3.5

    似乎国内外AI竞争日趋白热化,就在阿里巴巴发布Qwen3通义
    的头像 发表于 04-30 16:08 1134次阅读

    壁仞科技完成阿里巴巴通义Qwen3全系列模型支持

    4月29日,阿里巴巴通义发布并开源8款新版Qwen3
    的头像 发表于 04-30 15:19 1359次阅读

    低至¥2.27/h!就能使用全球最强开元模型—— QwQ-32B

    ABSTRACT摘要捷智算平台上新全球最强开元模型——QwQ-32B。JAEALOT2025年3月18日
    的头像 发表于 03-19 12:34 888次阅读
    低至¥2.27/h!就能使用全球最强开元<b class='flag-5'>模型</b>——<b class='flag-5'>千</b><b class='flag-5'>问</b> QwQ-32<b class='flag-5'>B</b>

    阿里最新消息:国家超算互联网平台、广州算力中心、多所高校接入通义模型

      国家超算互联网平台 接入阿里通义模型   3月10日,国家超算互联网平台接入
    的头像 发表于 03-14 11:54 1140次阅读

    利用英特尔OpenVINO在本地运行Qwen2.5-VL系列模型

    近期阿里通义实验室在 Hugging Face 和 ModelScope 上开源了 Qwen2.5-VL 的 Base 和 Instruct 模型,包含
    的头像 发表于 03-12 13:42 2309次阅读
    利用英特尔OpenVINO在本地运行<b class='flag-5'>Qwen</b>2.5-VL系列<b class='flag-5'>模型</b>

    摩尔线程支持阿里通义QwQ-32B开源模型

    近日,阿里云团队正式开源全新推理模型——通义QwQ-32B。摩尔线程在该
    的头像 发表于 03-07 17:48 1130次阅读
    摩尔线程支持<b class='flag-5'>阿里</b>云<b class='flag-5'>通义</b><b class='flag-5'>千</b><b class='flag-5'>问</b>QwQ-32<b class='flag-5'>B</b>开源<b class='flag-5'>模型</b>

    阿里通义Qwen2.5-Max模型全新升级

    近期,阿里通义团队为用户带来了一个振奋人心的好消息:其旗舰版模型Qwen2.5-Max迎来了全新升级发布
    的头像 发表于 02-05 14:07 1180次阅读

    阿里通义开源长文本新模型Qwen2.5-1M

    o-mini。 Qwen2.5-1M模型提供了7B和14B两种尺寸供用户选择,以满足不同场景下的需求。在处理长文本输入时,该
    的头像 发表于 02-05 14:01 792次阅读