0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

端侧大模型迎来“轻”革命!移远通信 × RWKV 打造“轻量AI大脑”

移远通信 2025-07-27 19:02 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

7月27日,移远通信宣布与RWKV公司建立全面合作关系,双方将依托移远的算力平台,优化并支持RWKV最新模型架构,共同推动大模型在端侧设备的低资源占用部署。此次合作成果于2025世界人工智能大会(WAIC)首次亮相,标志着端侧大模型解决方案向更高性能、更广场景的应用迈出关键一步。


RWKV(Receptance Weighted Key Value)是全球领先的RNN大模型架构,它成功结合了递归神经网络(RNN)的恒定复杂度和高效串行推理,以及Transformer的并行处理优势,使其在文本生成、时间序列、图像和视频、语音和音乐等领域表现出色,推理成本和训练成本显著低于Transformer。


这项技术的核心突破在于引入RWKV算子替代Transformer的位置编码和多头注意力机制。这一革新有效解决了Transformer在处理长序列时的空间和时间复杂度问题,在确保模型性能不受影响的前提下,实现了内存占用恒定、token计算复杂度恒定,意味着运算过程更高效、更省力。这一特性让 RWKV 在端侧设备部署中展现出显著优势:处理长序列时速度更快、内存占用更低,相当于为终端设备配备了一个 “轻量化的AI大脑”。


在本次世界人工智能大会(WAIC)上,基于高通 QCS8550 平台的两大 RWKV 联合解决方案将重磅登场:


  • RWKV Chat:思考永续

RWKV Chat是一款离线AI聊天应用,无需联网即可实现推理、深度对话与文本续写,支持个性化会话配置,成为用户的“口袋级”生产力伙伴。例如其中的RWKV7-G1 2.9B模型在高通手机平台的速度可达30 token/s,且由于RWKV架构无需KV cache,在超长推理后仍然可以速度恒定,内存占用恒定。


RWKV Sudoku:超长CoT


RWKV 数独则展示了20M超小参数模型在超长链式推理(CoT)下的数学解题能力,凭借恒定内存与极少token消耗,轻松破解复杂数独,直观呈现RWKV架构在端侧的高效潜能。


在Transformer架构主导大模型领域的当下,移远通信以前瞻性的眼光,积极布局非Transformer的技术路线,致力于为客户提供更低算力、更少内存消耗的解决方案。
此次展出的RWKV7-G1 1.5B模型,经过移远通信的工程优化后,在SG885G模组上的实测数据表现亮眼,明显优于同等参数量的Transformer架构的模型,具体来说,
在Prefill阶段:

  • 平均耗时减少83%
  • 平均处理速度提升345%


在Decoding阶段:

  • 平均CPU使用减少23%
  • 平均内存使用减少36%
  • 平均功耗减少18%


303c3cf8-6ad9-11f0-a486-92fbcf53809c.jpg


移远通信的SG885G基于高通QCS8550平台开发,其AI综合算力高达48 TOPS,能够支撑7B左右参数级的多模态模型在本地化推理,从而实现实时视觉理解与多模态信息融合。在模型兼容性方面,移远构建了强大的端侧适配体系,率先实现对Llama、通义千问、DeepSeek等主流开源模型的全方位兼容,兼容的参数范围覆盖0.5B至8B,打造出了功能强大的端侧大模型超级平台。此外,在架构创新上,SG885G支持运行非Transformer路线的RWKV7架构,这一特征显著降低了对算力和内存的需求。



移远通信首席运营官张栋表示:“此次与RWKV的战略合作,是移远通信 ‘让终端拥有AI大心脏’技术理念的关键落地!RWKV的线性注意力架构,突破性地解决了端侧设备的长序列处理瓶颈,再结合移远的高算力模组,成功将AI大模型‘装进’了物联网终端。当农机能‘看懂’土壤的干湿,当手表可以‘提醒’健康风险,AI就不再是飘在云里的概念,而是真真切切来到了田间地头、来到了你我的手腕上,让科技真正服务于每一处需要它的地方。”




RWKV联合创始人&COO罗璇表示:“我们希望让每一台设备都聪明起来,就像为它们植入了会思考的‘大脑’。随着RWKV架构在移远算力平台上实现规模化部署,让终端设备突破资源限制,构建‘云端能力+本地智能’的双引擎协同生态,为万物智联时代奠定技术基石。”



移远通信与RWKV的战略合作,不仅是一次技术与硬件的强强联合,更是推动智能计算走向普惠的关键里程碑,让“AI大模型”真正走出云端,融入万物。


7月26日-29日,诚邀莅临WAIC 2025移远展台(H1 D815),近距离体验端侧大模型解决方案的前沿科技魅力。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    89

    文章

    38153

    浏览量

    296816
  • 移远通信
    +关注

    关注

    6

    文章

    805

    浏览量

    20530
  • 大模型
    +关注

    关注

    2

    文章

    3446

    浏览量

    4972
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    × 高通:从开源生态到场景验证,共筑AI新生态

    8月26日,以“更开源更智能”为主题的2025高通&通信智能物联网技术开放日在深圳成功举办。这场技术盛会由高通公司与
    的头像 发表于 08-26 21:52 751次阅读
    <b class='flag-5'>移</b><b class='flag-5'>远</b> × 高通:从开源生态到场景验证,共筑<b class='flag-5'>端</b><b class='flag-5'>侧</b><b class='flag-5'>AI</b>新生态

    通信飞鸢AIoT大模型应用算法成功通过备案

    AI领域的深厚技术积累与行业领先地位。 "飞鸢AIoT大模型应用算法"面向企业客户,聚焦对话生成场景,能够基于用户输入音频,生成相应的音频回复。目前,该算法已依托
    的头像 发表于 08-06 08:48 712次阅读
    <b class='flag-5'>移</b><b class='flag-5'>远</b><b class='flag-5'>通信</b>飞鸢AIoT大<b class='flag-5'>模型</b>应用算法成功通过备案

    云+多模态”新范式:《通信AI模型技术方案白皮书》正式发布

    7月28日,通信联合智次方研究院正式发布《AI模型技术方案白皮书》(以下简称“白皮书”)。这份白皮书系统梳理了
    的头像 发表于 07-28 13:08 941次阅读
    “<b class='flag-5'>端</b>云+多模态”新范式:《<b class='flag-5'>移</b><b class='flag-5'>远</b><b class='flag-5'>通信</b><b class='flag-5'>AI</b>大<b class='flag-5'>模型</b>技术方案白皮书》正式发布

    媒体报道 | 锚定“AI+机器人”,又有大动作!

    随着AI算力的指数级突破与大模型轻量化部署技术的快速成熟,“
    的头像 发表于 07-11 19:05 634次阅读
    媒体报道 | 锚定“<b class='flag-5'>端</b><b class='flag-5'>侧</b><b class='flag-5'>AI</b>+机器人”,<b class='flag-5'>移</b><b class='flag-5'>远</b>又有大动作!

    LLaVA、RWKV、Qwen3... 远端AI模型解决方案实现多维度跃迁

    AI以破竹之势席卷千行百业,大模型技术正以惊人的速度迭代演进,重塑着智能世界的底层逻辑。作为全球AIoT行业的引领者,通信通过持续迭代
    的头像 发表于 06-23 19:07 745次阅读
    LLaVA、<b class='flag-5'>RWKV</b>、Qwen3... <b class='flag-5'>移</b>远端<b class='flag-5'>侧</b><b class='flag-5'>AI</b>大<b class='flag-5'>模型</b>解决方案实现多维度跃迁

    通信携手高通举办“2025 高通边缘智能创新应用大赛”,助力开发者探索AI创新潜能

    覆盖高性能AI模组、AI模型和云端协同的一站式AI解决方案。为进一步推动边缘智能技术的创新
    的头像 发表于 04-20 08:07 964次阅读
    <b class='flag-5'>移</b><b class='flag-5'>远</b><b class='flag-5'>通信</b>携手高通举办“2025 高通边缘智能创新应用大赛”,助力开发者探索<b class='flag-5'>AI</b>创新潜能

    AI革命通信如何用大模型重构人机交互

    ,各类应用纷纷接入DeepSeek,包括搜索引擎、机器人、汽车、智能手机等。通信产品总监王韬在“绽放通信之美—预见
    的头像 发表于 04-03 19:06 1046次阅读
    <b class='flag-5'>端</b><b class='flag-5'>侧</b><b class='flag-5'>AI</b><b class='flag-5'>革命</b>:<b class='flag-5'>移</b><b class='flag-5'>远</b><b class='flag-5'>通信</b>如何用大<b class='flag-5'>模型</b>重构人机交互

    AI模型侧部署正当时:远端AI模型解决方案,激活场景智能新范式

    AI技术飞速发展的当下,AI模型的应用正从云端向加速渗透。 作为全球领先的物联网整体解决方案供应商,
    发表于 03-27 11:26 428次阅读
    <b class='flag-5'>AI</b>大<b class='flag-5'>模型</b><b class='flag-5'>端</b>侧部署正当时:<b class='flag-5'>移</b>远端<b class='flag-5'>侧</b><b class='flag-5'>AI</b>大<b class='flag-5'>模型</b>解决方案,激活场景智能新范式

    AI模型侧部署正当时:远端AI模型解决方案,激活场景智能新范式

    AI技术飞速发展的当下,AI模型的应用正从云端向加速渗透。作为全球领先的物联网整体解决方案供应商,
    的头像 发表于 03-26 19:05 996次阅读
    <b class='flag-5'>AI</b>大<b class='flag-5'>模型</b><b class='flag-5'>端</b>侧部署正当时:<b class='flag-5'>移</b>远端<b class='flag-5'>侧</b><b class='flag-5'>AI</b>大<b class='flag-5'>模型</b>解决方案,激活场景智能新范式

    通信联合德壹发布全球首款搭载模型AI具身理疗机器人

    各行业智能化发展版图。 3月11日,在第66届广州美博会上,德壹机器人在通信助力下,正式推出全能王AI具身机器人。作为德壹全球首款
    发表于 03-13 11:16 885次阅读
    <b class='flag-5'>移</b><b class='flag-5'>远</b><b class='flag-5'>通信</b>联合德壹发布全球首款搭载<b class='flag-5'>端</b><b class='flag-5'>侧</b>大<b class='flag-5'>模型</b>的<b class='flag-5'>AI</b>具身理疗机器人

    通信联合德壹发布全球首款搭载模型AI具身理疗机器人

    各行业智能化发展版图。3月11日,在第66届广州美博会上,德壹机器人在通信助力下,正式推出全能王AI具身机器人。作为德壹全球首款
    的头像 发表于 03-12 20:24 541次阅读
    <b class='flag-5'>移</b><b class='flag-5'>远</b><b class='flag-5'>通信</b>联合德壹发布全球首款搭载<b class='flag-5'>端</b><b class='flag-5'>侧</b>大<b class='flag-5'>模型</b>的<b class='flag-5'>AI</b>具身理疗机器人

    AI模组再进化!通信和美格智能在MWC如何放大招?

      电子发烧友原创 章鹰 3月3日到5日,世界移动通讯大会在西班牙巴塞罗那会议中心举办,今年,AI终端在DeepSeek大模型的加持下,产业正在经历从中心智能化向分布式智能的转变。
    的头像 发表于 03-09 04:33 2449次阅读
    <b class='flag-5'>端</b><b class='flag-5'>侧</b><b class='flag-5'>AI</b>模组再进化!<b class='flag-5'>移</b><b class='flag-5'>远</b><b class='flag-5'>通信</b>和美格智能在MWC如何放大招?

    通信边缘计算模组成功运行DeepSeek模型

    DeepSeek模型的稳定运行,并顺利完成了针对性的微调优化。 DeepSeek模型的这一成功运行,标志着通信
    的头像 发表于 02-17 09:56 1077次阅读

    通信边缘计算模组成功运行DeepSeek模型,以领先的工程能力加速AI落地

    。   目前,该模型正在多款智能终端上进行深入测试与优化。通信将凭借其卓越的工程化能力,加速
    发表于 02-13 11:32 445次阅读
    <b class='flag-5'>移</b><b class='flag-5'>远</b><b class='flag-5'>通信</b>边缘计算模组成功运行DeepSeek<b class='flag-5'>模型</b>,以领先的工程能力加速<b class='flag-5'>端</b><b class='flag-5'>侧</b><b class='flag-5'>AI</b>落地

    通信边缘计算模组成功运行DeepSeek模型,以领先的工程能力加速AI落地

    。目前,该模型正在多款智能终端上进行深入测试与优化。通信将凭借其卓越的工程化能力,加速
    的头像 发表于 02-12 19:03 763次阅读
    <b class='flag-5'>移</b><b class='flag-5'>远</b><b class='flag-5'>通信</b>边缘计算模组成功运行DeepSeek<b class='flag-5'>模型</b>,以领先的工程能力加速<b class='flag-5'>端</b><b class='flag-5'>侧</b><b class='flag-5'>AI</b>落地