Qwen3-VL 4B/8B全面适配，BM1684X成边缘最佳部署平台！-电子发烧友网

算能BM1684X上完成Qwen3-VL 4B/8B模型的适配，推理速度13.7/7.2 tokens/s，使其成为边缘部署多模态大模型的最佳选择。

近日，阿里千问正式开源Qwen3-VL系列的4B和8B版本模型，为边缘计算和端侧设备提供了更高效的多模态AI解决方案。算能BM1684X芯片已完成对该系列模型的适配，4B/8B模型在边缘端实现了13.7 /7.2 tokens/s的推理性能。

模型性能突破，小参数大能力

Qwen3-VL系列再添新成员——Dense架构的Qwen3-VL-8B、Qwen3-VL-4B 模型，本地部署友好，在MMMU、MathVista等基准测试中超越了同级别的其他模型，并在部分测试场景中展现出与更大规模模型相媲美的性能，通过架构优化，它有效解决了小模型中常见的视觉与文本能力不平衡问题，为边缘场景带来了更多解法。

Qwen3-VL 4B和8B模型在保持模型轻量化的同时，确保了多模态理解能力的完整性。这两个规模的模型均提供Instruct和Thinking两个版本，满足不同场景的应用需求。

Qwen3-VL模型能主动识别异常行为，自动调取多路摄像头追踪，并调用工具生成处置方案，实现从感知到决策的闭环；凭借增强的空间推理能力，系统可精准分析人员轨迹、识别异常聚集，构建动态安防态势图，预警潜在风险；进一步扩展了长上下文能力，支持对长视频的秒级精确定位，在文搜检索的基础上，提供有逻辑依据的事件分析，大幅提升调查效率。

另外，很多传统算法没有覆盖的corner case，不再需要人工标注训练，直接通过prompt调整即可实现，从"看得见"迈向"看得懂"，Qwen3-VL将为各种端侧设备的智能化升级注入新动力。