0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

不止手机!高通AI全面进击,芯片到加速卡,万卫星解读关键布局

章鹰观察 来源:章鹰观察 作者:章鹰 2026-03-30 10:37 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

个人智能体今年的演进出现哪些趋势?在以OpenClaw(小龙虾)大热的当下,芯片厂商如何考虑智能体在终端的应用前景和机会?这些热点问题在3月27日的CFMS MemoryS 2026 峰会上,来自高通公司AI产品技术中国区负责人万卫星给出了前瞻的技术分析和AI全栈技术解决方案。

AI应用四大阶段演进,端侧AI部署面临三大挑战

万卫星指出,AI在行业应用经历三个重要阶段,从感知AI、生成式AI向智能体AI演进,未来将进入物理AI时代。

感知AI主要包括多媒体信号、语音信号的理解,对图像的分类识别和智能降噪等传统领域的用例;生成式AI的特点是,在基于大量数据预训练的情况下,AI可以在有监督的情况下去解决一些具体的问题,比如说OpenAI的ChatGPT模型,以及文生图模型等等。智能体AI与生成式AI的重要区别是,基本上可以在无监督的情况下,自主的去理解用户意图,进行行动和决策,帮我们解决稍微复杂的任务。第四阶段物理AI,AI可以真正去理解我们的物理世界,根据真实物理世界的物理规定,对输入进行反馈和输出。这一技术还在早期应用阶段。

目前行业关注的第二阶段和第三阶段,我们看到的明显趋势是:能够在端侧运行的生成式AI模型,它的智能正在快速的提升。首先,端侧设备能够支持的模型参数量正在变得越来越大,比如在手机上我们已经可以运行10亿到100亿参数级别的大模型,在PC上可以运行130亿到200亿参数量的大模型。在车上,我们可以支持的模型参数量可能会更大,达到200~600亿的级别。

在更小型的设备上,比如AR眼镜和低功耗设备,我们也实现了让参数规模在10亿-40亿之间的模型完全在端侧运行。万卫星强调,相较于云端大模型,端侧模型的参数量仍然相对较小,但行业内的各种技术正在推动端侧大模型支持体量的提升,比如内存带宽提升,量化位宽技术的优化可以进一步压缩模型尺寸,这都意味着终端设备可以承载更丰富的模型。

尤其值得关注的是,高通已经将具备推理能力的大模型部署到端侧。而且在端侧大模型对应的各种的各类场景中,其支持的上下文长度也在提升。3年前,端侧上下文长度普遍仅限于1k-2k,2年前,大部分场景的上下文已经扩展到2k-4k;而2025年,高通在与合作伙伴的场景探索中,这个区间已提升到4k-8k。在一些特定场景中,甚至已经可以支持32k-128k的上下文长度。

在面对支持更多上下文的端侧部署挑战时,高通认为有三点:一、端侧内存规模的限制。虽然我们有很多技术手段能够压缩模型体积,但有限的内存终究会对可运行的模型大小设置上限,而模型大小的上限也意味着端侧AI能力的上限。二、内存带宽有限制,有限的带宽会影响大模型输出token(词元)的速度,进而影响到具体场景里面的用户体验。三、终端设备部署大模型,能效比和散热的问题不可避免。在多终端设备中,能效非常重要。我们要避免AI推理在运行时触发温控限制,避免引起设备发热。

智能体演进三大趋势,从端侧AI芯片到AI推理芯片全面覆盖

万卫星指出,个人AI将始于端侧,我们正在迈向以AI和用户为中心的多终端体验,终端侧智能体将能够提供更低时延、更好的个性化以及持续无感的用户体验。

当下,智能体从端侧智能体、智能体专业化、高度个性化和多模态为主要发展趋势,终端侧智能体不再是以前那种简单的对话类语音助手,而是变成能够充分理解用户意图、理解上下文、理解用户感知信息的真正懂你的AI助手。

在过去,个人AI更多是以手机为中心,耳机、眼镜、手表等其他设备是作为附属与手机连接。未来,我们正在迈向以AI和用户为中心的多终端体验。也就是说AI不再绑定某一个具体的设备,如果是通过个人AI或者智能体去理解用户的意图,再去执行用户的任务。个人AI通过混合架构在终端侧进行部署。在终端侧、本地边缘、网络边缘和中央云协同工作。

高通在去年也发布了多款可以提供充分算力去支撑个人AI场景的产品,包括第五代骁龙8至尊版移动平台、骁龙X2 Elite计算平台等。在数据中心侧,高通在MWC2026上正式发布了基于Qualcomm® AI200和AI250芯片的加速卡和机架系统。我们以行业领先的总体拥有成本(TCO)为高速数据中心生成式AI推理提供机架级性能与卓越内存容量。

在演讲最后,万卫星强调:“高通AI全栈能力,从手机、耳机、可穿戴设备、PC等消费电子产品,再到汽车、机器人,甚至到下一代的数据中心,我们都在用统一的AI架构去赋能所有的产品,核心就在于我们能够通过统一的技术路线,提供高性能、高能效的软硬件技术底座,让高通的AI能力得以从单个产品或者单颗芯片扩展成为规模化的跨终端、跨场景的平台级能力。”

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 高通
    +关注

    关注

    78

    文章

    7745

    浏览量

    200306
  • 智能体
    +关注

    关注

    1

    文章

    551

    浏览量

    11642
  • AI芯片
    +关注

    关注

    17

    文章

    2161

    浏览量

    36863
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    FPGA硬件加速卡设计原理图:1-基于Xilinx XCKU115的半PCIe x8 硬件加速卡 PCIe半 XCKU115-3-FLVF1924-E芯片

    FPGA硬件加速, PCIe半, XCKU115, 光纤采集, 信号计算板, 硬件加速卡
    的头像 发表于 02-12 09:52 525次阅读
    FPGA硬件<b class='flag-5'>加速卡</b>设计原理图:1-基于Xilinx XCKU115的半<b class='flag-5'>高</b>PCIe x8 硬件<b class='flag-5'>加速卡</b> PCIe半<b class='flag-5'>高</b> XCKU115-3-FLVF1924-E<b class='flag-5'>芯片</b>

    推理<2ms!Ultralytics最新YOLO26+树莓派+国产AI加速卡实现 500 FPS 端侧 AI 性能巅峰!

    关键词:YOLO26、树莓派、国产AI加速卡、M5Stack、边缘AI速度快、功耗低、纯国产,树莓派终于有了真正实用的AI
    的头像 发表于 01-30 16:11 5775次阅读
    推理<2ms!Ultralytics最新YOLO26+树莓派+国产<b class='flag-5'>AI</b><b class='flag-5'>加速卡</b>实现 500 FPS 端侧 <b class='flag-5'>AI</b> 性能巅峰!

    新品 | LLM-8850 Kit,高性能AI加速卡套件 DinMeter v1.1,1/32DIN标准嵌入式开发板

    LLM-8850KitLLM-8850Kit是一款面向边缘AI与嵌入式计算场景的高性能AI加速卡套件,由LLM-8850CardAI加速卡与LLM-8850PiHat转接板组成。核心
    的头像 发表于 01-30 16:11 1353次阅读
    新品 | LLM-8850 Kit,高性能<b class='flag-5'>AI</b><b class='flag-5'>加速卡</b>套件 DinMeter v1.1,1/32DIN标准嵌入式开发板

    高速信号处理设计方案:413-基于双XCVU9P+C6678的100G光纤加速卡

    C6678, XCVU9P, ZU19EG开发板,, 高速信号处理, 光纤加速卡, XCVU9P光纤加速卡
    的头像 发表于 01-08 16:06 432次阅读
    高速信号处理设计方案:413-基于双XCVU9P+C6678的100G光纤<b class='flag-5'>加速卡</b>

    昆仑芯R200 AI加速卡技术规格解析

    昆仑芯R200加速卡基于7nm XPU-R架构,在150W功耗下提供256 TOPS INT8算力,侧重高性能推理。配备最高32GB GDDR6内存(512GB/s带宽)及108路视频解码能力,支持
    的头像 发表于 12-14 13:12 1867次阅读
    昆仑芯R200 <b class='flag-5'>AI</b><b class='flag-5'>加速卡</b>技术规格解析

    迈向云端算力巅峰:昆仑芯K200 AI加速卡全面解读

    昆仑芯K200作为云端AI加速卡,在K100架构基础上全面升级。其INT8算力达256 TOPS,配备16GB HBM内存与512GB/s带宽,专为千亿参数大模型训练与并发推理优化。
    的头像 发表于 12-14 11:17 2259次阅读
    迈向云端算力巅峰:昆仑芯K200 <b class='flag-5'>AI</b><b class='flag-5'>加速卡</b><b class='flag-5'>全面</b><b class='flag-5'>解读</b>

    算力密度翻倍!江原D20加速卡发布,一双芯重构AI推理标杆

    关键技术瓶颈。   在此背景下,江原科技推出采用自研AI芯片AI加速卡江原D10,并在今年5月实现量产交付。在大算力
    的头像 发表于 11-14 08:21 1.1w次阅读
    算力密度翻倍!江原D20<b class='flag-5'>加速卡</b>发布,一<b class='flag-5'>卡</b>双芯重构<b class='flag-5'>AI</b>推理标杆

    AI赋能6G与卫星通信:开启智能天网新时代

    学习,AI可以智能识别和纠正信号错误。在2024年欧洲卫星通信展上,展示的AI信号处理系统使卫星通信的误码率从0.01%降至0.0001%,相当于每1000
    发表于 10-11 16:01

    虚拟电厂加速卡不是噱头!点规模VPP的性能分水岭

    。   此时仅靠边缘MPU/CPU的通用算力,可能无法及时处理数据清洗、异常检测、指令下发校验等任务,而加速卡(如 GPU、FPGA 加速卡)的并行计算能力可快速消化数据洪流,避免“小包风暴”导致的系统顿。   虚拟电厂对AG
    的头像 发表于 10-10 08:59 2806次阅读

    新品 | LLM-8850 Card, AX8850边缘设备AI加速卡

    LLM‑8850 Card是一款面向边缘设备的M.2M-KEY2242 AI加速卡,把42 mm的袖珍体积与AxeraAX8850 SoC的24 TOPS @ INT8算力结合起来,为
    的头像 发表于 09-26 18:18 1366次阅读
    新品 | LLM-8850 Card, AX8850边缘设备<b class='flag-5'>AI</b><b class='flag-5'>加速卡</b>

    智算加速卡是什么东西?它真能在AI战场上干掉GPU和TPU!

    随着AI技术火得一塌糊涂,大家都在谈"大模型"、"AI加速"、"智能计算",可真到了落地环节,算力才是硬通货。你有没有发现,现在越来越多的AI企业不光用GPU,也不怎么迷信TPU了?他
    的头像 发表于 06-05 13:39 1867次阅读
    智算<b class='flag-5'>加速卡</b>是什么东西?它真能在<b class='flag-5'>AI</b>战场上干掉GPU和TPU!

    410 基于 XCVU9P+ C6678 的 100G 光纤的加速卡

    基于 XCVU9P+ C6678 的 100G 光纤的加速卡
    的头像 发表于 05-08 08:32 856次阅读
    410 基于 XCVU9P+ C6678 的 100G 光纤的<b class='flag-5'>加速卡</b>

    边缘AI运算革新 DeepX DX-M1 AI加速卡结合Rockchip RK3588多路物体检测解决方案

    DeepX 推出了一款革命性的产品 DeepX DX-M1 AI 推理加速卡 采用 PCIe Gen3 M.2 M-Key 接口,具备高达 25 TOPS 的卓越运算性能,以及准确度、低功耗、低温
    的头像 发表于 05-06 14:15 1249次阅读
    边缘<b class='flag-5'>AI</b>运算革新 DeepX DX-M1 <b class='flag-5'>AI</b><b class='flag-5'>加速卡</b>结合Rockchip RK3588多路物体检测解决方案

    AI加速卡到底是个啥?一文让小白也能看懂AI时代的“超级计算器”!

    你有没有发现,现在人工智能(AI)越来越火了?聊天机器人能陪你谈天说地,自动驾驶汽车能自己避障,手机拍照能自动美颜……这些背后都离不开一种神秘的技术——AI加速卡
    的头像 发表于 04-28 14:46 5911次阅读
    <b class='flag-5'>AI</b><b class='flag-5'>加速卡</b>到底是个啥?一文让小白也能看懂<b class='flag-5'>AI</b>时代的“超级计算器”!

    寒武纪基于思元370芯片的MLU370-X8 智能加速卡产品手册详解

    MLU370-X8智能加速卡全面升级的数据中心训推一体AI加速卡,基于寒武纪全新一代思元370芯片,接口为PCIe 4.0 X16,是全
    的头像 发表于 04-24 17:57 6050次阅读
    寒武纪基于思元370<b class='flag-5'>芯片</b>的MLU370-X8 智能<b class='flag-5'>加速卡</b>产品手册详解