0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

端侧大模型迎来“轻”革命!移远通信 × RWKV 打造“轻量AI大脑”

移远通信 2025-07-27 19:02 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

7月27日,移远通信宣布与RWKV公司建立全面合作关系,双方将依托移远的算力平台,优化并支持RWKV最新模型架构,共同推动大模型在端侧设备的低资源占用部署。此次合作成果于2025世界人工智能大会(WAIC)首次亮相,标志着端侧大模型解决方案向更高性能、更广场景的应用迈出关键一步。


RWKV(Receptance Weighted Key Value)是全球领先的RNN大模型架构,它成功结合了递归神经网络(RNN)的恒定复杂度和高效串行推理,以及Transformer的并行处理优势,使其在文本生成、时间序列、图像和视频、语音和音乐等领域表现出色,推理成本和训练成本显著低于Transformer。


这项技术的核心突破在于引入RWKV算子替代Transformer的位置编码和多头注意力机制。这一革新有效解决了Transformer在处理长序列时的空间和时间复杂度问题,在确保模型性能不受影响的前提下,实现了内存占用恒定、token计算复杂度恒定,意味着运算过程更高效、更省力。这一特性让 RWKV 在端侧设备部署中展现出显著优势:处理长序列时速度更快、内存占用更低,相当于为终端设备配备了一个 “轻量化的AI大脑”。


在本次世界人工智能大会(WAIC)上,基于高通 QCS8550 平台的两大 RWKV 联合解决方案将重磅登场:


  • RWKV Chat:思考永续

RWKV Chat是一款离线AI聊天应用,无需联网即可实现推理、深度对话与文本续写,支持个性化会话配置,成为用户的“口袋级”生产力伙伴。例如其中的RWKV7-G1 2.9B模型在高通手机平台的速度可达30 token/s,且由于RWKV架构无需KV cache,在超长推理后仍然可以速度恒定,内存占用恒定。


RWKV Sudoku:超长CoT


RWKV 数独则展示了20M超小参数模型在超长链式推理(CoT)下的数学解题能力,凭借恒定内存与极少token消耗,轻松破解复杂数独,直观呈现RWKV架构在端侧的高效潜能。


在Transformer架构主导大模型领域的当下,移远通信以前瞻性的眼光,积极布局非Transformer的技术路线,致力于为客户提供更低算力、更少内存消耗的解决方案。
此次展出的RWKV7-G1 1.5B模型,经过移远通信的工程优化后,在SG885G模组上的实测数据表现亮眼,明显优于同等参数量的Transformer架构的模型,具体来说,
在Prefill阶段:

  • 平均耗时减少83%
  • 平均处理速度提升345%


在Decoding阶段:

  • 平均CPU使用减少23%
  • 平均内存使用减少36%
  • 平均功耗减少18%


303c3cf8-6ad9-11f0-a486-92fbcf53809c.jpg


移远通信的SG885G基于高通QCS8550平台开发,其AI综合算力高达48 TOPS,能够支撑7B左右参数级的多模态模型在本地化推理,从而实现实时视觉理解与多模态信息融合。在模型兼容性方面,移远构建了强大的端侧适配体系,率先实现对Llama、通义千问、DeepSeek等主流开源模型的全方位兼容,兼容的参数范围覆盖0.5B至8B,打造出了功能强大的端侧大模型超级平台。此外,在架构创新上,SG885G支持运行非Transformer路线的RWKV7架构,这一特征显著降低了对算力和内存的需求。



移远通信首席运营官张栋表示:“此次与RWKV的战略合作,是移远通信 ‘让终端拥有AI大心脏’技术理念的关键落地!RWKV的线性注意力架构,突破性地解决了端侧设备的长序列处理瓶颈,再结合移远的高算力模组,成功将AI大模型‘装进’了物联网终端。当农机能‘看懂’土壤的干湿,当手表可以‘提醒’健康风险,AI就不再是飘在云里的概念,而是真真切切来到了田间地头、来到了你我的手腕上,让科技真正服务于每一处需要它的地方。”




RWKV联合创始人&COO罗璇表示:“我们希望让每一台设备都聪明起来,就像为它们植入了会思考的‘大脑’。随着RWKV架构在移远算力平台上实现规模化部署,让终端设备突破资源限制,构建‘云端能力+本地智能’的双引擎协同生态,为万物智联时代奠定技术基石。”



移远通信与RWKV的战略合作,不仅是一次技术与硬件的强强联合,更是推动智能计算走向普惠的关键里程碑,让“AI大模型”真正走出云端,融入万物。


7月26日-29日,诚邀莅临WAIC 2025移远展台(H1 D815),近距离体验端侧大模型解决方案的前沿科技魅力。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    41060

    浏览量

    302569
  • 移远通信
    +关注

    关注

    6

    文章

    852

    浏览量

    20969
  • 大模型
    +关注

    关注

    2

    文章

    3765

    浏览量

    5269
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    MWC 2026 | 告别手搓代码:AIDE一键部署,AI落地快人一步

    在“万物皆可AI”的浪潮下,越来越多的设备正被赋予“智能大脑”。然而,AI算法从实验室走向真实场景,常常面临“最后一公里”的落地难题:多类模型适配难、多硬件平台兼容困难、
    的头像 发表于 03-04 17:47 731次阅读
    MWC 2026 | 告别手搓代码:<b class='flag-5'>移</b><b class='flag-5'>远</b>AIDE一键部署,<b class='flag-5'>端</b><b class='flag-5'>侧</b><b class='flag-5'>AI</b>落地快人一步

    模型上车:从“语音助手”到“车内 AI 智能体”的跃迁革命

    生活空间”的可能性。当7B级大模型在车规级芯片上流畅运行,当多模态交互(语音+视觉+传感)成为标配,车载助手已从“被动响应”升级为“主动决策”,成为车内真正的“数字大脑”。这场由
    的头像 发表于 01-13 09:10 691次阅读

    如何让AIoT设备时刻“智商在线”?AI太懂了!

    。在10月31日举办的2026中国AIoT产业年会上,通信AI前沿技术中心总负责人王韬发表“
    的头像 发表于 10-31 19:07 674次阅读
    如何让AIoT设备时刻“智商在线”?<b class='flag-5'>移</b><b class='flag-5'>远</b><b class='flag-5'>AI</b>太懂了!

    × 高通:从开源生态到场景验证,共筑AI新生态

    8月26日,以“更开源更智能”为主题的2025高通&通信智能物联网技术开放日在深圳成功举办。这场技术盛会由高通公司与
    的头像 发表于 08-26 21:52 1162次阅读
    <b class='flag-5'>移</b><b class='flag-5'>远</b> × 高通:从开源生态到场景验证,共筑<b class='flag-5'>端</b><b class='flag-5'>侧</b><b class='flag-5'>AI</b>新生态

    通信飞鸢AIoT大模型应用算法成功通过备案

    AI领域的深厚技术积累与行业领先地位。 "飞鸢AIoT大模型应用算法"面向企业客户,聚焦对话生成场景,能够基于用户输入音频,生成相应的音频回复。目前,该算法已依托
    的头像 发表于 08-06 08:48 1037次阅读
    <b class='flag-5'>移</b><b class='flag-5'>远</b><b class='flag-5'>通信</b>飞鸢AIoT大<b class='flag-5'>模型</b>应用算法成功通过备案

    云+多模态”新范式:《通信AI模型技术方案白皮书》正式发布

    7月28日,通信联合智次方研究院正式发布《AI模型技术方案白皮书》(以下简称“白皮书”)。这份白皮书系统梳理了
    的头像 发表于 07-28 13:08 1398次阅读
    “<b class='flag-5'>端</b>云+多模态”新范式:《<b class='flag-5'>移</b><b class='flag-5'>远</b><b class='flag-5'>通信</b><b class='flag-5'>AI</b>大<b class='flag-5'>模型</b>技术方案白皮书》正式发布

    媒体报道 | 锚定“AI+机器人”,又有大动作!

    随着AI算力的指数级突破与大模型轻量化部署技术的快速成熟,“
    的头像 发表于 07-11 19:05 1108次阅读
    媒体报道 | 锚定“<b class='flag-5'>端</b><b class='flag-5'>侧</b><b class='flag-5'>AI</b>+机器人”,<b class='flag-5'>移</b><b class='flag-5'>远</b>又有大动作!

    AI到全链路解决方案:通信如何重塑AloT产业?

    的物联网整体解决方案供应商,通信受邀出席峰会并发表两场演讲,围绕AI、云端
    的头像 发表于 07-05 19:04 1893次阅读
    从<b class='flag-5'>端</b><b class='flag-5'>侧</b><b class='flag-5'>AI</b>到全链路解决方案:<b class='flag-5'>移</b><b class='flag-5'>远</b><b class='flag-5'>通信</b>如何重塑AloT产业?

    通信 × 奥飞娱乐,共同打造AI潮玩2.0时代

    上海——当童年记忆中的“喜羊羊”不再只是屏幕里的动画角色,而是化身能倾听心声、感知情绪的智能伙伴,一场由AI技术驱动的潮玩革命已悄然来临。   作为全球领先的物联网整体解决方案供应商,
    发表于 06-30 17:31 1596次阅读
    <b class='flag-5'>移</b><b class='flag-5'>远</b><b class='flag-5'>通信</b> × 奥飞娱乐,共同<b class='flag-5'>打造</b><b class='flag-5'>AI</b>潮玩2.0时代

    通信 × 奥飞娱乐,共同打造AI潮玩2.0时代

    当童年记忆中的“喜羊羊”不再只是屏幕里的动画角色,而是化身能倾听心声、感知情绪的智能伙伴,一场由AI技术驱动的潮玩革命已悄然来临。作为全球领先的物联网整体解决方案供应商,
    的头像 发表于 06-30 17:02 1169次阅读
    <b class='flag-5'>移</b><b class='flag-5'>远</b><b class='flag-5'>通信</b> × 奥飞娱乐,共同<b class='flag-5'>打造</b><b class='flag-5'>AI</b>潮玩2.0时代

    LLaVA、RWKV、Qwen3... 远端AI模型解决方案实现多维度跃迁

    AI以破竹之势席卷千行百业,大模型技术正以惊人的速度迭代演进,重塑着智能世界的底层逻辑。作为全球AIoT行业的引领者,通信通过持续迭代
    的头像 发表于 06-23 19:07 1047次阅读
    LLaVA、<b class='flag-5'>RWKV</b>、Qwen3... <b class='flag-5'>移</b>远端<b class='flag-5'>侧</b><b class='flag-5'>AI</b>大<b class='flag-5'>模型</b>解决方案实现多维度跃迁

    5G+AI双剑合璧!通信以“数智双擎”,破局FWA智能连接新赛道

    当5G的“极速狂飙”撞上AI的“最强大脑”,智能连接的世界会掀起怎样的风暴?6月16日,全球领先的物联网整体解决方案供应商通信宣布,正式
    的头像 发表于 06-16 19:14 1247次阅读
    5G+<b class='flag-5'>AI</b>双剑合璧!<b class='flag-5'>移</b><b class='flag-5'>远</b><b class='flag-5'>通信</b>以“数智双擎”,破局FWA智能连接新赛道

    智慧大脑 × 毫秒响应!通信携全新Wi-Fi AI玩具整体解决方案亮相火山引擎原力大会

    。硬核技术助力,重新定义AI玩具“智慧大脑通信Wi-Fi版本AI玩具整体解决方案,通过整合
    的头像 发表于 06-11 19:03 1365次阅读
    智慧<b class='flag-5'>大脑</b> × 毫秒响应!<b class='flag-5'>移</b><b class='flag-5'>远</b><b class='flag-5'>通信</b>携全新Wi-Fi <b class='flag-5'>AI</b>玩具整体解决方案亮相火山引擎原力大会

    从机械应答到深度交互,通信如何让机器人“灵魂觉醒”?

    通信率先推出了云混合大模型机器人大脑解决方案中,围绕
    发表于 05-21 13:46 1309次阅读
    从机械应答到深度交互,<b class='flag-5'>移</b><b class='flag-5'>远</b><b class='flag-5'>通信</b>如何让机器人“灵魂觉醒”?

    从机械应答到深度交互,通信如何让机器人“灵魂觉醒”?

    你是否还在因机器人的“答非所问”而无奈,为它们的“反应慢半拍”而抓狂?别慌!一场引领机器人实现“灵魂觉醒”的技术革命,正如同暗夜中悄然绽放的繁星,彻底颠覆人们对机器人的传统认知。5月20日,
    的头像 发表于 05-20 19:04 1064次阅读
    从机械应答到深度交互,<b class='flag-5'>移</b><b class='flag-5'>远</b><b class='flag-5'>通信</b>如何让机器人“灵魂觉醒”?