0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

安霸发布N1系列生成式AI芯片支持前端设备运行本地LLM应用

Ambarella安霸半导体 来源:Ambarella安霸半导体 2024-01-09 15:19 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

单颗 SoC 支持 1 至 340 亿参数的多模态大模型(Multi-Modal LLM)推理,实现前端低功耗生成式 AI

美国加利福尼亚州圣克拉拉市,2024年1月8日-

Ambarella (下称“安霸”,专注 AI 视觉感知的半导体公司,纳斯达克股票代码:AMBA)于当天宣布,在 2024 国际消费电子展(CES)期间,展出在其新款 N1 系列 SoC 上运行多模态大模型(Multi-Modal LLM),其每次推理的功耗显著低于当前市场的通用 GPU 解决方案。

生成式 AI 是为了处理大规模数据集而最早应用于服务器上的变革性技术,而安霸的目标是将生成式 AI 部署于终端设备和本地硬件上,从而将其广泛应用于视频安防分析、机器人以及众多工业领域。

安霸将在中高端 SoC 上提供已优化的生成式 AI 处理。这些 AI SoC 包含了功耗低于 5 瓦的 CV72 芯片,以及最新的可应用于服务器端,功耗低于 50 瓦的 N1 芯片。与 GPU 及其他 AI 加速器相比,安霸提供了完整的 SoC 解决方案,每生成一个 token 的能效比最高可提高 3 倍,并可快捷、低成本地部署在终端产品中。

生成式 AI 在我们的目标市场上实现了突破,之前无法想象的功能得以实现。使用我们的 N1 系列 SoC 来进行多模态大模型推理,将使所有的前端设备变得更智能,更低功耗,和更低成本。

市场研究公司 Omdia 高级计算首席分析师 Alexander Harrowell 表示:“在未来 18 个月内,几乎所有设备前端应用都将被生成式 AI 增强。把生成式 AI 的计算转移到设备前端的要点,就在于每瓦的 AI 性能,以及它与前端生态系统其余部分的集成,而不仅仅是原始数据的吞吐量。”

所有安霸的 AI SoC 均可搭配全新的 Cooper 开发平台。此外,为了缩短客户新产品上市的时间,安霸已预先移植和优化了 LIama-2 等流行的大语言模型。其在 N1 芯片上运行的大语言和视觉助手 LLava 模型,可对多达 32 个摄像头同时进行多模态视觉分析。这些经过预训练和调优的模型可从 Cooper Model Garden 下载。

在现实世界的众多应用里,除了语言,视觉输入也是一种关键模式。安霸 SoC 的特有架构非常适合以超低功耗同时运行视频处理和 AI 计算。安霸的 AI SoC 并不是单一的 AI 加速器,它不仅能够高效处理多模态大模型,还能同时执行各种系统功能。

生成式 AI 将成为计算机视觉处理中跨越式的新技术,它可将上下文学习和场景理解应用于各种设备,从而涵盖安防设施、自主机器人以及众多工业应用。基于安霸 AI 芯片的设备端通过运行大语言模型和多模态处理可实现以下功能:安防视频的上下文智能搜索、通过自然语言命令控制的机器人、以及多才多艺的AI助手,比如代码、文本和图像的生成等。

这些依赖摄像头和自然语言理解的系统,大部分将受益于设备前端的生成式 AI 处理,其处理速度得以提高,隐私保护得到加强,并且总成本也会降低。安霸解决方案支持的本地处理也非常适合垂直领域大语言模型,这些大语言模型通常需要针对每个具体应用场景进行调整;而传统的集中式服务器方案则是使用更大、功耗更高的大语言模型来满足不同用例的要求。

基于安霸最初为自动驾驶开发的 CV3-HD 架构,N1 系列 SoC 对总算力资源进行了针对性的优化,从而以超极低功耗运行多模态大模型。例如,N1 SoC 在单流模式下以低于 50 瓦的功耗运行 Llama2-13B,每秒可推理 25 个 token。N1 解决方案自带移植好的大模型,使系统整合更容易,因此它可快速帮助 OEM 厂商部署生成式 AI,特别是要求低功耗的各种应用,比如自带本地应用的 AI 智能盒子、送货机器人等,不一而足。







审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 加速器
    +关注

    关注

    2

    文章

    841

    浏览量

    40237
  • soc
    soc
    +关注

    关注

    40

    文章

    4623

    浏览量

    230163
  • 计算机视觉
    +关注

    关注

    9

    文章

    1715

    浏览量

    47713
  • AI芯片
    +关注

    关注

    17

    文章

    2164

    浏览量

    36865
  • LLM
    LLM
    +关注

    关注

    1

    文章

    350

    浏览量

    1394

原文标题:安霸发布 N1 系列生成式 AI 芯片,支持前端设备运行本地 LLM 应用

文章出处:【微信号:AMBARELLA_AMBA,微信公众号:Ambarella安霸半导体】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    克创新发布Thus™芯片:存算一体架构重塑AI音频新生态

    2026年4月22日,克创新在深圳举办技术沟通会,正式推出全球首款基于NOR Flash技术的神经网络存算一体(CIM)AI音频芯片Thus™。这款芯片通过颠覆性架构设计,将
    的头像 发表于 04-23 09:59 307次阅读

    富瀚微推动OpenClaw实现端侧本地运行验证

    随着生成人工智能持续突破,AI正从“内容生成工具”向具备自主执行能力的智能体形态加速演进。在这一背景下,AI Agent正逐步成为推动智能
    的头像 发表于 03-17 17:27 1061次阅读
    富瀚微推动OpenClaw实现端侧<b class='flag-5'>本地</b><b class='flag-5'>运行</b>验证

    AI SoC放大招:深度适配OpenClaw,驱动机器人自主进化

    AI 大模型落地需要端侧算力的支持,时间的节点已经到来。现在的人形机器人需要自主决策的能力,可以用自然语言和人类交互,并且理解人类布置的任务,自主做决策。”半导体研发总监钱豪表示
    的头像 发表于 03-17 16:07 8194次阅读
    <b class='flag-5'>安</b><b class='flag-5'>霸</b><b class='flag-5'>AI</b> SoC放大招:深度适配OpenClaw,驱动机器人自主进化

    Google正式发布LLM评测基准Android Bench

    LLM 在 Android 开发任务中的表现。现在,我们发布了 Android Bench 的首个版本,这是 Google 官方专门针对 Android 开发打造的 LLM 排行榜。
    的头像 发表于 03-14 16:00 1881次阅读
    Google正式<b class='flag-5'>发布</b><b class='flag-5'>LLM</b>评测基准Android Bench

    技嘉与趋境科技联合部署AMaaS平台 推动本地大模型应用加速落地

    生成AI加速走向实际应用的当下,大模型部署正从“可体验”迈向“可落地、可管理、可应用”。作为技嘉面向本地AI场景打造的重要产品,
    的头像 发表于 03-12 15:11 198次阅读
    技嘉与趋境科技联合部署AMaaS平台 推动<b class='flag-5'>本地</b>大模型应用加速落地

    半导体邀您相约Embedded World 2026

    美国加利福尼亚州圣克拉拉市,Ambarella(下称“”,纳斯达克股票代码:AMBA,AI 视觉感知芯片公司)于今日宣布,将参加 2026 年 3 月 10 日至 12 日在德国纽
    的头像 发表于 02-10 17:09 1431次阅读

    国民技术发布N32Cube芯片配置与初始化代码生成工具

    1月30日,国民技术(NSING)正式发布N32Cube——芯片配置与初始化代码生成工具,让时钟、引脚与外设的配置一目了然、轻松上手!
    的头像 发表于 02-02 15:26 874次阅读
    国民技术<b class='flag-5'>发布</b><b class='flag-5'>N</b>32Cube<b class='flag-5'>芯片</b>配置与初始化代码<b class='flag-5'>生成</b>工具

    推出开发者社区,拓展端侧AI生态版图

    开发者社区为合作伙伴提供优先体验通道,助力其在 AI SoC 及 Cooper 开发软件上评估、构建并大规模部署端侧
    的头像 发表于 01-09 08:37 547次阅读
    <b class='flag-5'>安</b><b class='flag-5'>霸</b>推出开发者社区,拓展端侧<b class='flag-5'>AI</b>生态版图

    推出开发者社区以助力部署端侧AI应用

    开发者社区为合作伙伴提供优先体验通道,助力其在 AI SoC 及 Cooper 开发软件上评估、构建并大规模部署端侧
    的头像 发表于 01-08 14:50 422次阅读

    发布高性能端侧AI 8K视觉感知芯片CV7

    美国加利福尼亚州圣克拉拉市,2026年1月5日——Ambarella(下称“”,纳斯达克股票代码:AMBA,AI 视觉感知芯片公司)在国
    的头像 发表于 01-08 14:46 1036次阅读

    亮相CPSE 2025博会

    为期四天的 “全球防第一展”——CPSE 2025 博会顺利落下帷幕。以“AI 驱动,智影领航”为主题,携几大核心技术矩阵亮相安博会
    的头像 发表于 11-04 16:07 499次阅读

    Alif Semiconductor的Ensemble MCU新增对ExecuTorch Runtime的支持,助力其推动边缘生成AI发展

    · Ensemble E4/E6/E8是业界首个为Transformer网络提供硬件加速的MCU系列,可在边缘设备及终端设备上实现本地生成
    的头像 发表于 11-04 11:44 1805次阅读
    Alif Semiconductor的Ensemble MCU新增对ExecuTorch Runtime的<b class='flag-5'>支持</b>,助力其推动边缘<b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>发展

    4nm制程+AI加速:高通W5与苹果N1掀起通信芯片新革命

    通则推出支持卫星通信的第二代骁龙W5系列平台。二者虽技术路径不同、战略重心各异,却共同指向一个目标,加速在通信底层技术的布局。   N1无线网络芯片
    的头像 发表于 09-15 07:04 7296次阅读
    4nm制程+<b class='flag-5'>AI</b>加速:高通W5与苹果<b class='flag-5'>N1</b>掀起通信<b class='flag-5'>芯片</b>新革命

    Qualys TotalAI 降低 Gen AILLM 工作负载的风险

    “在AI时代,最大的风险不是不去创新,而是在没有稳固基础的情况下创新。” 生成人工智能 (Gen AI) 和大语言模型 (LLM) 正在革
    的头像 发表于 06-25 14:18 622次阅读
    Qualys TotalAI 降低 Gen <b class='flag-5'>AI</b> 和 <b class='flag-5'>LLM</b> 工作负载的风险

    【米尔MYC-YM90X路飞龙DR1开发板】路科技 SALDRAGON开发板介绍

    。 高可靠性设计 针对工业和汽车电子需求,SALDRAGON系列支持宽温工作范围(-40℃至+125℃),并提供SEU(单粒子翻转)容错技术,确保在辐射或高干扰环境下稳定运行。 二、技术优势分析 灵活性
    发表于 04-28 17:57