0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

安霸生成式AI芯片解决方案助力本地处理大型语言模型

Ambarella安霸半导体 来源:Ambarella安霸半导体 2024-06-26 11:32 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

具有高AI性能和效率的最新SoC系统助力本地处理大型语言模型

随着 AI 技术的不断进步,十年前还只能在书本和科幻电影中看到的功能,如今随处可见。然而,迄今为止,对性能有着高要求的最新生成式 AI 技术应用通常只能运行在云端。

直到最近,生成式 AI 的主要应用还是倚靠耗电量巨大的服务器,这些服务器的任务本是开发和训练大型语言模型(LLM)。LLM 的出现本身就是一项突破,它只是迈出了一系列重要变革中的第一步。

目前,人们非常关注并推动着端侧大模型技术的广泛发展,因为该技术将使生成式 AI 能够部署到更多应用中,获益良多。具体来说,这些用例将大大增加生成式 AI 在智能城市、工业自动化机器人和智能驾驶等市场的端侧设备中的广泛应用。

生成式 AI 要在前端领域取得成功,需要注意四要素:AI 的隐私、性能,能效和高生产率,这些因素决定了市场转化的速度。

前端集成也有能源效率、设备微调和可靠性方面的技术挑战。这些问题本身就很棘手,因此向开发人员提供的解决方案须兼顾性能和成本,才能克服这些障碍。

为了应对这些相互冲突的挑战,定制化的芯片成为首选解决方案。

生成式AI的高能效SoC

安霸观察到前端应用对高能效 AI 处理器的需求,因此推出了一系列 AI SoC,适用于各种前端的生成式 AI 应用。

在大多数用于前端应用的高性能多模式分析用例中,第一步通常是在所有照明条件下捕获高质量视频。为此,需要一个即使在低光照条件下也能提供出色图像质量的图像信号处理器(ISP)。同样,高对比度场景的捕捉也必须使用具有先进的高动态范围(HDR)能力的处理器,这样才能捕捉到非常清晰的细节,为安防视频分析、自主移动机器人(AMR)和智能驾驶感知算法提供高品质的图像输入,从而得到通用的解决方案。此外,通过高效的视频编码技术,安霸的 SoC 还能以极低的码率传输高分辨率的视频流。

安霸 SoC 中的专有 CVflow AI 引擎,除了支持 LLM 处理外,还支持同时运行多个神经网络(NN),在运行各类计算机视觉算法时维持低功耗。安霸的 Cooper 开发者平台包含一套功能丰富的工具,使得客户很方便地把在PC上开发的神经网络移植到安霸芯片平台。

安霸的生成式 AI 芯片解决方案在模型的参数上具备高扩展性,从支持多达 340 亿个参数的多模态 LLM 的 N1 系列,到支持多达 30 亿个参数的较小视觉语言模型 (VLM) 的 CV7 系列。

如果你的应用需要超强的前端处理能力,那么安霸的旗舰款 N1 系列 SoC 是最佳选择之一。N1 可以接收多个高分辨率摄像头数据流输入,同时运行多达 340 亿个参数的多模态 LLM,并且支持连接更多的外围设备。N1 芯片集成了神经向量处理器 (NVP)、高级图像信号处理器(ISP)、16 个 Arm Cortex-A78AE CPU, 以及用于 3D 用户界面的 GPU,单颗芯片可提供高性能神经网络计算。不仅性能卓越,N1 芯片的每次推理功耗仅为业界领先 GPU 解决方案的一小部分。

N1 芯片非常适合为多种应用提供生成式 AI,包括工业机器人、智慧城市、智能医疗成像和诊断、多摄像头 AI 处理中心、运行多模态 LLM 的终端 AI 服务器以及智驾车队远程信息处理等。设备端通过运行多模态 LLM 促进了 生成式 AI 功能的实现,例如对视频和图像输入进行智能上下文搜索;使用自然语言命令控制机器人;以及多才多艺的 AI 助手,比如代码、文本和图像的生成等。

虽然这些系统多种多样,但它们在很大程度上都依赖于摄像头和自然语言理解的结合。在这种情况下,设备端的生成式 AI 处理可提高运行速度和增强隐私保护,同时降低总成本。本地处理也是特定应用大语言模型处理的理想选择,这些大语言模型通常在前端针对每个用例进行微调,而不是采用服务器方法,即使用更大、功耗更高的大语言模型来覆盖所有用例。

N1 系列芯片基于安霸功能强大的第三代 CVFlow 架构设计,因此具有出色的网络推理性能,广泛兼容各类神经网络,包括多模态大模型。例如,N1 SoC 在单流模式下以低于 50 瓦的功耗运行 Llama2-13B,每秒可推理 25 个 token。结合预移植模型的易集成性,这一新型解决方案可帮助设备制造商快速将生成式 AI 部署到任何对功耗敏感的应用中,如 AI 智能盒子、送货机器人等产品。

第四要素-生产率

Cooper 是安霸自研的开发者平台,提供灵活的模块化开发环境,可与安霸任何 AI SoC(包括 CV2,CV5, CV7 系列和 N1 系列)配合使用。它因强调合作而得名,适用于各种应用,包括机器人、AIoT、汽车和消费类视频设备。

是围绕一个名为 Cooper Foundry 的软件平台构建的,该开发平台由以下四个软件模块组成:

Cooper Core 核心组件:包含基于 Linux操作系统、编译器和 SDK。

Cooper Foundation AI 应用组件:用于在前端构建和部署 ML 应用程序

Cooper Vision 视觉感知组件:包含多模态传感器处理和融合的构建模块

Cooper UX 应用交互组件:用于分析和开发

全面的 Cooper 开发平台加快了产品上市速度

该开发平台在 Cooper Metal 上运行。Cooper Metal 是一套硬件参考板,包括高能效 AI SoC、开发套件和模块,它还集成了常见的第三方开源软件工具。

为了展示这些功能,安霸利用其最新的 AI SoC 在 Cooper 上开发了一个演示系统。其中,安霸将业界领先的具有 AI 功能的 ISP 与多模态视觉语言模型相融合,后者还考虑到了视频帧中的图像数据。

作为向开发人员提供的单独演示的一部分,安霸使用 N1 SoC 建立了一个系统,支持处理多达 16 个视频流。它允许用户使用自然语言搜索任何异常或不寻常事件的上下文,甚至搜索特定的内容,如特定品牌或型号的汽车。

在 CV7 系列 SoC 的基础上,可以更低功耗构建具有 1-4 个视频流小型系统。这些系统可运行“CLIP”等视觉语言模型,整个系统的功耗低于 5W。

总结

生成式 AI 是一项变革性技术,由于其处理过程通常在 GPU 上,消耗大量电能,它曾一度被局限于成本高昂的服务器中。基于安霸高效的 AI SoC 搭建的端侧 LLM 推理设备,其每次AI推理所需的功耗极低,领先行业。安霸 N1 SoC 将生成式 AI 引入终端设备和可内部部署的硬件,应用范围更加广泛,例如安防视频分析、机器人技术和众多工业自动化需求。此外,与 GPU 及其他 AI 加速器相比,安霸提供了完整的 SoC 和系统解决方案,每生成一个 token 的能效比大幅提升,可达 3 倍,并可快捷、低成本地部署。

原文标题:生成式AI赋能前端,未来已来

文章出处:【微信公众号:Ambarella安霸半导体】欢迎添加关注!文章转载请注明出处。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • soc
    soc
    +关注

    关注

    40

    文章

    4624

    浏览量

    230172
  • AI
    AI
    +关注

    关注

    91

    文章

    41103

    浏览量

    302585
  • 安霸
    +关注

    关注

    3

    文章

    56

    浏览量

    13488

原文标题:生成式AI赋能前端,未来已来

文章出处:【微信号:AMBARELLA_AMBA,微信公众号:Ambarella安霸半导体】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    AI SoC放大招:深度适配OpenClaw,驱动机器人自主进化

    AI模型落地需要端侧算力的支持,时间的节点已经到来。现在的人形机器人需要自主决策的能力,可以用自然语言和人类交互,并且理解人类布置的任务,自主做决策。”
    的头像 发表于 03-17 16:07 8204次阅读
    <b class='flag-5'>安</b><b class='flag-5'>霸</b><b class='flag-5'>AI</b> SoC放大招:深度适配OpenClaw,驱动机器人自主进化

    技嘉与趋境科技联合部署AMaaS平台 推动本地模型应用加速落地

    生成AI加速走向实际应用的当下,大模型部署正从“可体验”迈向“可落地、可管理、可应用”。作为技嘉面向本地
    的头像 发表于 03-12 15:11 199次阅读
    技嘉与趋境科技联合部署AMaaS平台 推动<b class='flag-5'>本地</b>大<b class='flag-5'>模型</b>应用加速落地

    后摩智能M50芯片助力联想AI Workmate概念机发布

    在MWC2026上,联想推出AI Workmate概念机,主打“工作场景的智能搭档”,可通过端侧AI模型本地处理语音控制和手势操作。
    的头像 发表于 03-04 10:37 474次阅读

    推出开发者社区,拓展端侧AI生态版图

    开发者社区为合作伙伴提供优先体验通道,助力其在 AI SoC 及 Cooper 开发软件
    的头像 发表于 01-09 08:37 548次阅读
    <b class='flag-5'>安</b><b class='flag-5'>霸</b>推出开发者社区,拓展端侧<b class='flag-5'>AI</b>生态版图

    推出开发者社区以助力部署端侧AI应用

    开发者社区为合作伙伴提供优先体验通道,助力其在 AI SoC 及 Cooper 开发软件
    的头像 发表于 01-08 14:50 422次阅读

    从云端到边缘:联发科MT8371/MT8391平台实现7B大模型本地部署

    的第八代NPU提供高达7/9 TOPS算力,配备16GB大容量LPDDR5高速内存,支持Transformer/CNN硬件加速,支持本地部署7B大语言模型,显著提升生成
    发表于 12-15 16:32

    行业特定的生成 AI 能力如何形成:面向中国企业的场景化解决方案模型

    需要的不是一个“能对话”的模型,而是一套“能在行业场景中跑得通、落得下”的生成 AI 方案。 因此,“哪些
    的头像 发表于 12-02 09:33 559次阅读

    openDACS 2025 开源EDA与芯片赛项 赛题七:基于大模型生成原理图设计

    、分布数据库;(2)人工智能领域:AI加速芯片及人工智能软件框架规划;(3)CAD&CG领域:几何建模、网格生成、结构优化、计算图分割&分布
    发表于 11-13 11:49

    不只有AI协作编程(Vibe Coding):生成系统级芯片(GenSoC)将如何把生成设计推向硬件层面

    但是否能将这种生成的、目标驱动的方法从软件层向下延伸呢?这一理念是否可以直接应用于硬件本身呢?通过GenSoC,开发者可用自然语言或高级模型描述系统行为,XMOS的工具链将自动
    的头像 发表于 11-07 14:04 660次阅读

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI芯片到AGI芯片

    2)渗透AI的优势 5、大型多模态模型 多模态模型(LMM)可以被理解成大模型的更高级版本,
    发表于 09-18 15:31

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI的科学应用

    是一种快速反应能力,是直接的感知;灵感是一种通过思考和探索获得的创造性想法,是一种创意。 AI怎么模拟直觉与灵感呢?四、AI代替人类的假说 这可能吗? 用机器来生成假说: 1、直接生成
    发表于 09-17 11:45

    【书籍评测活动NO.64】AI芯片,从过去走向未来:《AI芯片:科技探索与AGI愿景》

    :科技探索与 AGI 愿景》。 这本新书针对大模型技术浪潮,详细讲解了AI芯片的主流技术、挑战与创新解决方案,并介绍了下一代芯片工艺和颠覆性
    发表于 07-28 13:54

    谷歌新一代生成AI媒体模型登陆Vertex AI平台

    我们在 Vertex AI 上推出新一代生成 AI 媒体模型: Imagen 4、Veo 3 和 Lyria 2。
    的头像 发表于 06-18 09:56 1308次阅读

    SAP与亚马逊云科技推出AI联合创新计划,打造生成AI解决方案助力客户应对市场波动与供应链复杂性

    北京 2025年5月26日 /美通社/ -- 在SAP蓝宝石大会上,亚马逊云科技与SAP宣布启动全新的AI联合创新计划,帮助合作伙伴构建生成AI应用和智能体,
    的头像 发表于 05-26 16:54 659次阅读

    SAP与亚马逊云科技推出AI联合创新计划,打造生成AI解决方案助力客户应对市场波动与供应链复杂性

    北京 ——2025 年 5 月 26 日 在SAP蓝宝石大会上,亚马逊云科技与SAP宣布启动全新的AI联合创新计划,帮助合作伙伴构建生成AI应用和智能体,
    发表于 05-26 11:44 1220次阅读