搜索历史

清空

搜索热词

0

聊天消息
系统消息
评论与回复

查看更多

查看更多

查看更多

VIP于到期续费

登录后你可以

下载海量资料
学习在线课程
观看技术视频
写文章/发帖/加入社区

会员中心

创作中心

发布

创作活动

完善资料让更多小伙伴认识你，还能领取20积分哦，立即完善>

3天内不再提示

几B都有！BM1684X一键适配全系列Qwen3

Qwen3发布，大小尺寸通吃

Qwen3一发布，登顶开源大模型排行榜！235B、32B、8B、4B、1.7B云边端全尺寸模型，BF16和FP8两种精度，一次性发布，无论云端大卡还是边缘AI设备，都可体验最新的大模型能力。

来看下Qwen3各个模型的benchmark得分：

这些年看多了大模型的迭代，各家都在玩参数竞赛和架构魔术，但阿里这次Qwen3的设计有点意思——它搞了个"混合模式"的机制，让模型能自己决定什么时候该"慢慢想"，什么时候该"快速答"。这玩意儿本质上是在延迟和精度之间做动态权衡，技术上不算新鲜（OpenAI的o3就玩过这套），但阿里的实现方式更像个老会计——给你个"思考预算"的开关，让用户自己把控成本。

BM1684X，Qwen3部署性价比之王

这种设计背后是典型的工程思维：既然大模型的推理成本居高不下，不如把选择权交给用户。就像当年CPU的动态调频技术，与其无脑跑满频，不如让系统根据负载灵活调节，但这种模式切换要在硬件层面做好流水线调度，否则切换时的上下文保存就能吃掉那点省下来的算力。

现在的大模型就像过度教育的孩子，解得了奥数题但算不清买菜账。Qwen3给"孩子"装了个手动挡，让用户自己决定什么时候该挂高档位冲刺，什么时候该低档省油，这种策略下每瓦特的性价比自然就上去了，而边缘和端侧的设备对成本更是敏感，那作为边缘大模型部署的性价比之王，BM1684X表现如何？

4B运行demo（SOC模式950Mhz 16.4tokens/s）

1.7B运行demo(SOC模式950Mhz 30.3 tokens/s)

一行代码适配，解锁全系模型

BM1684X 单芯配置16GB内存，20B以下的都可以在一颗芯片跑，32B用2颗就可以(32B dense模型性能约5 tokens/s)。

更详细的适配流程参考：https://github.com/sophgo/LLM-TPU/tree/main/models/Qwen3，拉取最新的tpu-mlir代码后，只需要一行代码即可转出bmodel，不用再通过onnx中介。

bmodel转好之后，可以用python或者cpp来跑：

限制我们适配新模型速度的不是工具链，而是模型下载速度，欢迎关注算能产品，解锁更多大模型部署方案，手中有BM1684X的同学可以玩起来了！

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

边缘AI

边缘AI

+关注

关注
0

文章
201

浏览量
5844
大模型

大模型

+关注

关注
2

文章
3442

浏览量
4969

评论

算能开发者社区
企业号

72 内容 12w+ 阅读 262 粉丝

我要咨询关注

Hot 探索ChatGLM2在算能BM1684X上INT8量化部署，加速大模型商业落地
Hot 重塑翻译与识别技术：开源语音识别模型Whisper的编译优化与部署
New Qwen3-VL 4B/8B全面适配，BM1684X成边缘最佳部署平台！
New RISC-V HPC新标杆Sophon SG2044深度评估：支持RVV v1.0适配GCC 15.2，多核性能潜力巨大！

精选推荐
更多

文章

资料

帖子

技术向高生态同行地平线首届技术生态大会绘就智能产业共进蓝图

章鹰观察
2小时前

279 阅读

从系统视角选时钟：一张“应用分层地图”讲清 TCXO / OCXO / SAW 的正确打开方式

FCom富士晶振
9小时前

557 阅读

基于AIK-RA8D1的人脸识别的应用演示

RA生态工作室
6天前

860 阅读

2025中国人工智能大会，藏着AI的行动派时刻

脑极体
1天前

1666 阅读

T型三电平拓扑架构深入剖析与碳化硅MOSFET技术优势的全面研究报告

杨茜
1天前

2810 阅读

基于openharmony适配移植的RatingBar实现显示评级

姚小熊27
0.09 MB

免费

0下载

存放OpenHarmony驱动子系统源码信息的HDF驱动框架

姚小熊27
1.78 MB

免费

8下载

BrachioGraph笔式绘图仪

张娟
42.14 MB

免费

0下载

aws-shell AWS CLI助手

殷谷光
0.08 MB

2积分

4下载

PrintableCheckList AirPrint一键打印清单

duke刘
11.41 MB

2积分

1下载

【乾芯QXS320F开发板试用】拿板第一天：环境准备

jf_87031193
1天前

101 阅读

【瑞萨RA6E2地奇星开发板试用】+ 2.串口打印测试

jf_43382582
1天前

186 阅读

【社区之星】李杨——把头扎进沙漠，发现沙子下是星辰大海

dianzi_0101
1天前

158 阅读

我们计划设计一个基于电容的自举电路，招募英雄！

jf_53150340
1天前

256 阅读

【瑞萨RA6E2地奇星开发板试用】+ 1.点灯测试1500ms跳转一次

jf_43382582
1天前

177 阅读

推荐企业号
更多

企业产品

资料

方案
更多

华秋（原“华强聚丰”）：

电子发烧友

华秋开发

华秋电路(原"华强PCB")

华秋商城(原"华强芯城")

华秋智造

My ElecFans

APP
网站地图

设计技术

可编程逻辑

电源/新能源

MEMS/传感技术

测量仪表

嵌入式技术

制造/封装

模拟技术

RF/无线

接口/总线/驱动

处理器/DSP

EDA/IC设计

存储技术

光电显示

EMC/EMI设计

连接器

行业应用

LEDs

汽车电子

音视频及家电

通信网络

医疗电子

人工智能

虚拟现实

可穿戴设备

机器人

安全设备/系统

军用/航空电子

移动通信

工业控制

便携设备

触控感测

物联网

智能电网

区块链

新科技

特色内容

专栏推荐

学院

设计资源

设计技术

电子百科

电子视频

元器件知识

工具箱

VIP会员

最新技术文章

产品地图

品牌地图

社区

小组

论坛

问答

评测试用

企业服务

产品

资料

文章

方案

企业

供应链服务

硬件开发

华秋电路

华秋商城

华秋智造

nextPCB

BOM配单

媒体服务

网站广告

在线研讨会

活动策划

新闻发布

新品发布

小测验

设计大赛

华秋

关于我们

投资关系

新闻动态

加入我们

联系我们

举报投诉

社交网络

微博

移动端

发烧友APP

硬声APP

WAP

联系我们

广告合作

王婉珠：wangwanzhu@elecfans.com

内容合作

黄晶晶：huangjingjing@elecfans.com

内容合作（海外）

张迎辉：mikezhang@elecfans.com

供应链服务 PCB/IC/PCBA

江良华：lanhu@huaqiu.com

投资合作

曾海银：zenghaiyin@huaqiu.com

社区合作

刘勇：liuyong@huaqiu.com

关注我们的微信

下载发烧友APP

电子发烧友观察

电子工程师社区

1-32层PCB打样·中小批量

元器件现货·全球代购·SmartBOM

SMT贴片·PCBA加工

PCB Manufacturer

华秋简介

企业动态

联系我们

企业文化

企业宣传片

加入我们

版权所有 © 湖南华秋数字科技有限公司

长沙市望城经济技术开发区航空路6号手机智能终端产业园2号厂房3层（0731-88081133）
电子发烧友 （电路图） 湘公网安备43011202000918 工商网监湘ICP备2023018690号-1