0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

美格智能团队成功在高算力AI模组上运行大模型Stable Diffusion

美格智能 2023-07-21 13:50 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

我们在上一篇文章的导语中提到:”AI人工智能这个已经存在了数十年的概念,已然成为未来几十年人类社会发展的核心变量。面对变革,每个人、每个企业都需要思索,如何与时代的潮流,一同跃进“。近日,美格智能研发团队成功在自研高算力模组上运行文生图大模型Stable Diffusion,而这仅仅是我们将思索变为实际行动的第一步,AIGC的大时代,才刚刚开始!

▌不局限云端,边缘计算+终端侧AI的技术路径已经成熟

2022年以来,AIGC作为一项变革性的技术,正在逐步颠覆人类原有的工作、生活、创作及娱乐方式。以ChatGPT、Midjourney、Stable Diffusion、文心一言等为代表的各类生成式大模型,能在数秒之内完成包括搜索、绘画、创作、表格编辑、代码编写等各项任务,并且各项能力正在不断进化中。数据显示,目前至少已有上千个可用的生成式 AI 应用,这一切都表明,AIGC正迎来史无前例的爆发期。

拥有数十亿参数的众多生成式 AI 模型对计算架构及算力强度提出了极高的需求。之前的情况是,无论是优化参数的AI训练,还是执行模型的AI推理,都一直受限于大型复杂模型及端侧算力部署不足,而与云端绑定。

初步估计显示,生成式AI市场规模潜力巨大,将广泛覆盖生态链上的各个参与方。这一巨大市场机遇,势必驱动不同类型的计算架构及算力基础来源同时演进,从而满足大规模生成式 AI 日益增长的算力需求。

全球头部玩家的近期动作也表明,算力建设和算力竞争的趋势才刚刚开始,所有人都在起跑。高通于不久前宣布完成了全球首个运行在Android手机上的Stable Diffusion终端侧演示,这是首次由第二代骁龙8移动平台支持的大型语言生成式AI模型在端侧运行的实例,充分说明了随着端侧算力加强及模型优化技术结合,各类高算力终端支持大模型运行只是时间问题。

其后,高通官方关于转型边缘计算公司的表态,以及大力推动混合式AI的举措,都表明边缘计算+终端侧AI的技术和产品路径正在迅速变为现实。

▌高算力AI模组能力再进化,成功运行Stable Diffusion大模型

美格智能作为业界最早提出智能模组概念的企业,持续关注算力发展对模组产业带来的深刻变革,也最早提出:随着各行各业对于算力需求及应用的爆发式增长,高算力AI模组将成为智能模组发展的一个子集,“无算力不智能”正在成为模组3.0时代的重要发展趋势,并将高算力AI模组产品独立组建产品团队,聚集资源不断投入。

近日,美格智能高算力AI模组产品团队,充分发挥软硬件一体协同开发的能力,在基于高通骁龙800平台的自研算力模组上成功运行文生图大模型Stable Diffusion,或许是行业内首个在算力模组上运行推理大模型的实例。

Stable Diffusion是一个非常出色的从文本到图像的生成式AI大模型,能够基于任何文本输入,在数十秒内创作出逼真图像。Stable Diffusion的参数超过10亿,迄今为止主要限于在云端运行。

EVB(2).jpg

▲美格智能高算力AI模组SNM970 EVB开发板

美格高算力AI模组团队很早就前瞻性地开展了大模型在算力模组端侧运行的相关研究工作。运行Stable Diffusion大模型的高算力模组,在硬件上选用了高通骁龙800系列的高算力SoC处理器,在软件上使用了高通AI模型增效工具包(AIMET)实现模型转换,在无需重新训练的情况下,克服了模型参数从FP32压缩到INT8所产生的精度损失,从而让大模型在算力模组上始终保持高效运行。

美格智能研发团队在硬件和软件层面的进一步优化,保证大模型运行精度的同时,有效降低了内存带宽消耗,充分发挥了高算力模组AI硬件的最大效能,最终顺利在算力模组端侧跑通了Stable Diffusion大模型。

▌创领高算力AI模组发展,以产品力驱动生成式AI在端侧部署

美格智能持续深耕高算力AI模组产品线,至今已经历经三代产品演进。依靠强大的软硬件一体研发能力,美格智能持续推进高算力AI模组的AI硬件不断升级。美格研发团队在AI应用场景开发、AI性能优化和AI低功耗程序研发等领域的设计研发能力处于行业领先水平,相关算力产品在各类核心场景大规模应用。

云计算服务器领域,美格智能推出的高算力AI模组基于强算力、低功耗芯片及美格智能特有的定制化解决方案,完美应用于领先型的arm架构阵列服务器集群,在完成同等计算任务下,性耗提升2倍以上。

智能机器人领域,高算力AI模组能轻松匹配智能机器人及下一代具身智能机器人在算力方面的高要求,同时配备丰富的外围接口,以AI模组的形式将语音识别机器视觉、导航、定位、避障和多模态技术通过各种传感器植入到终端侧,真正实现机器人的AI觉醒。

工业视觉、AI零售等领域,美格智能推出的标准化AI套件,在AI加速方面,可支持变革性INT4 Al精度格式,在持续AI推理方面实现与前代相比60%的能效提升。同时可对多路摄像头进行视频结构化分析,快捷实现人、事、物等智能感知、数据分析、安全管理等性能,快速实现对众多传统产业的AI嵌入。

作为在行业内最早布局算力模组产品的企业,美格智能高算力AI模组产品实现了从1.2T到近48T产品全覆盖,充分满足不同行业算力需求。研发团队在大算力平台与不同行业算法对接、AI运行低功耗控制、5G+AI融合开发等领域有众多积累。

072108.jpg

随着AI大模型首次在自研算力模组产品上成功运行,极大拓展了算力模组的能力边界,积累了大模型在端侧部署和应用的前瞻经验,将真正驱动生成式AI在端侧和边缘侧的大规模部署,也让边缘计算+终端侧AI的技术图景越来越清晰!

物联网连接数量在过去的十年间呈指数级增长的发展态势,曾经写在书上的“万物互联”已然成为现实。无处不在的连接为人类社会的数字化和智能化已经筑下了坚实基础,而当连接与算力融合的时候,亿万个IoT节点的算力汇聚,将构建最为庞大的算力网络,与云端算力互联互通,共同构建AIGC等跨时代技术的算力底座。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    41988

    浏览量

    303082
  • 模组
    +关注

    关注

    6

    文章

    1812

    浏览量

    32409
  • AI算力
    +关注

    关注

    1

    文章

    187

    浏览量

    10056
  • AIGC
    +关注

    关注

    1

    文章

    394

    浏览量

    3288
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    物理AI加速落地|美格智能行业首家大规模量产交付 77TOPS AI 模组,并推动AI能力从端侧向云端拓展

    出48TOPS智能模组成功实现大规模部署后,
    的头像 发表于 05-19 15:29 231次阅读
    物理<b class='flag-5'>AI</b>加速落地|<b class='flag-5'>美格</b><b class='flag-5'>智能</b>行业首家大规模量产交付 77TOPS <b class='flag-5'>AI</b> <b class='flag-5'>模组</b>,并推动<b class='flag-5'>AI</b>能力从端侧向云端拓展

    2026北京车展|美格智能发布新一代中央计算架构5G舱联AI模组,推动座舱智能体加速上车

    4月24日,北京国际汽车展览会开幕首日,美格智能携手通公司于北京车展美格智能展台举办了QCM6650/QCM8538/QCM8838三大智
    的头像 发表于 04-24 13:59 512次阅读
    2026北京车展|<b class='flag-5'>美格</b><b class='flag-5'>智能</b>发布新一代中央计算架构5G舱联<b class='flag-5'>AI</b><b class='flag-5'>模组</b>,推动座舱<b class='flag-5'>智能</b>体加速上车

    5W功耗实现25TOPS,LM2-100-V0模组破解AI安防核心难题

    智慧安防边缘AI应用快速部署需求的背景下,设备制造商常面临终端设备不足、功耗超标、体积受限、部署太慢等困境。模型越复杂,终端越吃力;设
    的头像 发表于 04-03 11:34 553次阅读
    5W功耗实现25TOPS<b class='flag-5'>算</b><b class='flag-5'>力</b>,LM2-100-V0<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>模组</b>破解<b class='flag-5'>AI</b>安防核心难题

    美格智能港股上市,智能模组高达100 TOPS,支持主流AI模型端侧部署

    美格智能A股走势出现分化,10日受H股上市利好刺激,大涨5.9%,不过随后连续四个交易日回调,累计跌幅超8%,截至16日收盘,报收45.23元。   美格智能是全球领先的无线通信
    的头像 发表于 03-19 09:00 1.2w次阅读
    <b class='flag-5'>美格</b><b class='flag-5'>智能</b>港股上市,<b class='flag-5'>智能</b><b class='flag-5'>模组</b><b class='flag-5'>算</b><b class='flag-5'>力</b>高达100 TOPS,支持主流<b class='flag-5'>AI</b><b class='flag-5'>模型</b>端侧部署

    边缘AI临界点:深度解析176TOPS香橙派AI Station的产业价值

    ,开发者利用AI Station的176TOPS机器人平台上运行模仿学习策略,控制机械臂完成精细操作[](https://hwcom
    发表于 03-10 14:19

    MWC 2026|美格智能发布SNM979AI模组,重塑AI原生的高清视觉终端

    前言一块仅有掌心大小的模组,却能驱动4K视频会议系统流畅进行AI降噪、人物追踪,并实时生成会议纪要——美格智能全新SNM979系列
    的头像 发表于 03-02 12:22 661次阅读
    MWC 2026|<b class='flag-5'>美格</b><b class='flag-5'>智能</b>发布SNM979<b class='flag-5'>高</b><b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>AI</b><b class='flag-5'>模组</b>,重塑<b class='flag-5'>AI</b>原生的高清视觉终端

    美格智能AI模组+Qwen3.5,打造端侧最强AI智能

    ”提供强大的底座,成为解锁AI原生应用的关键。QWEN3.5开发者友好,适合本地部署近期,Qwen3.5系列模型的发布,为AI的本地化部
    的头像 发表于 02-27 08:33 710次阅读
    <b class='flag-5'>美格</b><b class='flag-5'>智能</b><b class='flag-5'>高</b><b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>AI</b><b class='flag-5'>模组</b>+Qwen3.5,打造端侧最强<b class='flag-5'>AI</b><b class='flag-5'>智能</b>体

    CES 2026 | 100 TOPSAI模组领衔,美格智能全栈AI解决方案定义智能未来

    要点:SNM983系列:100TOPSAI模组
    的头像 发表于 01-12 17:01 765次阅读
    CES 2026 | 100 TOPS<b class='flag-5'>高</b><b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>AI</b><b class='flag-5'>模组</b>领衔,<b class='flag-5'>美格</b><b class='flag-5'>智能</b>全栈<b class='flag-5'>AI</b>解决方案定义<b class='flag-5'>智能</b>未来

    CES 2026|美格智能发布100TOPS超高AI模组产品,面向“AI原生”时代的架构革命

    。▲直击CES2026最前沿——美格智能展位从CES2026现场的盛况不难看出,AI依旧是最重要的主题。然而与CES2025不同的是,随着端侧
    的头像 发表于 01-07 11:21 1089次阅读
    CES 2026|<b class='flag-5'>美格</b><b class='flag-5'>智能</b>发布100TOPS超高<b class='flag-5'>算</b><b class='flag-5'>力</b>的<b class='flag-5'>AI</b><b class='flag-5'>模组</b>产品,面向“<b class='flag-5'>AI</b>原生”时代的架构革命

    MWC Doha 2025|美格智能全新发布60 Tops AI、支持Linux系统的SNM982AI模组

    11月25日,MWCDoha展会期间,美格智能全新发布基于通QCS8650平台研发设计的SNM982
    的头像 发表于 11-25 16:34 2638次阅读
    MWC Doha 2025|<b class='flag-5'>美格</b><b class='flag-5'>智能</b>全新发布60 Tops <b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>、支持Linux系统的SNM982<b class='flag-5'>高</b><b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>AI</b><b class='flag-5'>模组</b>

    从CPU、GPU到NPU,美格智能持续优化异构计算效能

    的科技企业也近期表示,将通过软件层创新大幅提升资源利用率。作为
    的头像 发表于 11-21 16:05 1403次阅读
    从CPU、GPU到NPU,<b class='flag-5'>美格</b><b class='flag-5'>智能</b>持续优化异构<b class='flag-5'>算</b><b class='flag-5'>力</b>计算效能

    什么是AI模组

    未来,腾视科技将继续深耕AI模组领域,全力推动AI边缘计算行业的深度发展。随着AI技术的不断
    的头像 发表于 09-19 15:26 2246次阅读
    什么是<b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>模组</b>?

    什么是AI模组

    未来,腾视科技将继续深耕AI模组领域,全力推动AI边缘计算行业的深度发展。随着AI技术的不断
    的头像 发表于 09-19 15:25 1148次阅读
    什么是<b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>模组</b>?

    【Sipeed MaixCAM Pro开发板试用体验】基于MaixCAM-Pro的AI生成图像鉴别系统

    能够有效捕捉AI生成图像与真实手绘扫描图像在纹理、笔触、光影、全局一致性等方面的细微差异。 边缘端部署:将模型量化、编译,最终高效运行
    发表于 08-21 13:59

    行业最强音|美格智能重磅发布行业首款3nm工艺,拥有300K DMIPS CPU的5G-A智能座舱模组

    当前,全球智能汽车产业正经历驱动的深刻变革。随着舱驾融合加速以及生成式AI上车需求激增,车载芯片制程工艺与综合算成为竞争焦点。2025
    的头像 发表于 06-05 19:18 1675次阅读
    行业最强音|<b class='flag-5'>美格</b><b class='flag-5'>智能</b>重磅发布行业首款3nm工艺,拥有300K DMIPS CPU<b class='flag-5'>算</b><b class='flag-5'>力</b>的5G-A<b class='flag-5'>智能</b>座舱<b class='flag-5'>模组</b>