0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

安霸发布N1系列生成式AI芯片支持前端设备运行本地LLM应用

Ambarella安霸半导体 来源:Ambarella安霸半导体 2024-01-09 15:19 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

单颗 SoC 支持 1 至 340 亿参数的多模态大模型(Multi-Modal LLM)推理,实现前端低功耗生成式 AI

美国加利福尼亚州圣克拉拉市,2024年1月8日-

Ambarella (下称“安霸”,专注 AI 视觉感知的半导体公司,纳斯达克股票代码:AMBA)于当天宣布,在 2024 国际消费电子展(CES)期间,展出在其新款 N1 系列 SoC 上运行多模态大模型(Multi-Modal LLM),其每次推理的功耗显著低于当前市场的通用 GPU 解决方案。

生成式 AI 是为了处理大规模数据集而最早应用于服务器上的变革性技术,而安霸的目标是将生成式 AI 部署于终端设备和本地硬件上,从而将其广泛应用于视频安防分析、机器人以及众多工业领域。

安霸将在中高端 SoC 上提供已优化的生成式 AI 处理。这些 AI SoC 包含了功耗低于 5 瓦的 CV72 芯片,以及最新的可应用于服务器端,功耗低于 50 瓦的 N1 芯片。与 GPU 及其他 AI 加速器相比,安霸提供了完整的 SoC 解决方案,每生成一个 token 的能效比最高可提高 3 倍,并可快捷、低成本地部署在终端产品中。

生成式 AI 在我们的目标市场上实现了突破,之前无法想象的功能得以实现。使用我们的 N1 系列 SoC 来进行多模态大模型推理,将使所有的前端设备变得更智能,更低功耗,和更低成本。

市场研究公司 Omdia 高级计算首席分析师 Alexander Harrowell 表示:“在未来 18 个月内,几乎所有设备前端应用都将被生成式 AI 增强。把生成式 AI 的计算转移到设备前端的要点,就在于每瓦的 AI 性能,以及它与前端生态系统其余部分的集成,而不仅仅是原始数据的吞吐量。”

所有安霸的 AI SoC 均可搭配全新的 Cooper 开发平台。此外,为了缩短客户新产品上市的时间,安霸已预先移植和优化了 LIama-2 等流行的大语言模型。其在 N1 芯片上运行的大语言和视觉助手 LLava 模型,可对多达 32 个摄像头同时进行多模态视觉分析。这些经过预训练和调优的模型可从 Cooper Model Garden 下载。

在现实世界的众多应用里,除了语言,视觉输入也是一种关键模式。安霸 SoC 的特有架构非常适合以超低功耗同时运行视频处理和 AI 计算。安霸的 AI SoC 并不是单一的 AI 加速器,它不仅能够高效处理多模态大模型,还能同时执行各种系统功能。

生成式 AI 将成为计算机视觉处理中跨越式的新技术,它可将上下文学习和场景理解应用于各种设备,从而涵盖安防设施、自主机器人以及众多工业应用。基于安霸 AI 芯片的设备端通过运行大语言模型和多模态处理可实现以下功能:安防视频的上下文智能搜索、通过自然语言命令控制的机器人、以及多才多艺的AI助手,比如代码、文本和图像的生成等。

这些依赖摄像头和自然语言理解的系统,大部分将受益于设备前端的生成式 AI 处理,其处理速度得以提高,隐私保护得到加强,并且总成本也会降低。安霸解决方案支持的本地处理也非常适合垂直领域大语言模型,这些大语言模型通常需要针对每个具体应用场景进行调整;而传统的集中式服务器方案则是使用更大、功耗更高的大语言模型来满足不同用例的要求。

基于安霸最初为自动驾驶开发的 CV3-HD 架构,N1 系列 SoC 对总算力资源进行了针对性的优化,从而以超极低功耗运行多模态大模型。例如,N1 SoC 在单流模式下以低于 50 瓦的功耗运行 Llama2-13B,每秒可推理 25 个 token。N1 解决方案自带移植好的大模型,使系统整合更容易,因此它可快速帮助 OEM 厂商部署生成式 AI,特别是要求低功耗的各种应用,比如自带本地应用的 AI 智能盒子、送货机器人等,不一而足。







审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 加速器
    +关注

    关注

    2

    文章

    836

    浏览量

    39711
  • soc
    soc
    +关注

    关注

    38

    文章

    4514

    浏览量

    227569
  • 计算机视觉
    +关注

    关注

    9

    文章

    1714

    浏览量

    47448
  • AI芯片
    +关注

    关注

    17

    文章

    2062

    浏览量

    36560
  • LLM
    LLM
    +关注

    关注

    1

    文章

    340

    浏览量

    1256

原文标题:安霸发布 N1 系列生成式 AI 芯片,支持前端设备运行本地 LLM 应用

文章出处:【微信号:AMBARELLA_AMBA,微信公众号:Ambarella安霸半导体】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    亮相CPSE 2025博会

    为期四天的 “全球防第一展”——CPSE 2025 博会顺利落下帷幕。以“AI 驱动,智影领航”为主题,携几大核心技术矩阵亮相安博会
    的头像 发表于 11-04 16:07 217次阅读

    Alif Semiconductor的Ensemble MCU新增对ExecuTorch Runtime的支持,助力其推动边缘生成AI发展

    · Ensemble E4/E6/E8是业界首个为Transformer网络提供硬件加速的MCU系列,可在边缘设备及终端设备上实现本地生成
    的头像 发表于 11-04 11:44 1183次阅读
    Alif Semiconductor的Ensemble MCU新增对ExecuTorch Runtime的<b class='flag-5'>支持</b>,助力其推动边缘<b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>发展

    4nm制程+AI加速:高通W5与苹果N1掀起通信芯片新革命

    通则推出支持卫星通信的第二代骁龙W5系列平台。二者虽技术路径不同、战略重心各异,却共同指向一个目标,加速在通信底层技术的布局。   N1无线网络芯片
    的头像 发表于 09-15 07:04 5858次阅读
    4nm制程+<b class='flag-5'>AI</b>加速:高通W5与苹果<b class='flag-5'>N1</b>掀起通信<b class='flag-5'>芯片</b>新革命

    在ISC West上推出下一代前端多模态AI技术

    近日,Ambarella (下称“”,纳斯达克股票代码:AMBA, AI 视觉感知芯片公司)在美国拉斯维加斯西部防展(ISC West
    的头像 发表于 04-03 09:57 718次阅读

    英伟达GROOT N1 全球首个开源人形机器人基础模型

    英伟达GROOT N1 全球首个开源人形机器人基础大模型
    的头像 发表于 03-20 11:05 1686次阅读

    Banana Pi 发布 BPI-AI2N &amp; BPI-AI2N Carrier,助力 AI 计算与嵌入开发

    RZ/V2N——近期在嵌入世界2025上新发布,为 AI 计算、嵌入系统及工自动化提供强大支持
    发表于 03-19 17:54

    Banana Pi 发布 BPI-AI2N &amp; BPI-AI2N Carrier,助力 AI 计算与嵌入开发

    ——近期在嵌入世界2025上新发布,为 AI 计算、嵌入系统及工自动化提供强大支持。这款全新的计算平台旨在满足开发者和企业用户对高性能、
    的头像 发表于 03-19 17:53 1438次阅读
    Banana Pi <b class='flag-5'>发布</b> BPI-<b class='flag-5'>AI2N</b> &amp; BPI-<b class='flag-5'>AI2N</b> Carrier,助力 <b class='flag-5'>AI</b> 计算与嵌入<b class='flag-5'>式</b>开发

    AI Agent 应用与项目实战》阅读心得3——RAG架构与部署本地知识库

    继续学习迪哥的AI Agent入门引导书籍。 LLM在落地应用中面临着专业领域表现不足、知识更新困难、容易产生\"幻觉\"等问题,这些挑战严重制约了AI技术在各行业的深入
    发表于 03-07 19:49

    大算力AI芯片接入DeepSeek R1

    (Ambarela)在人工智能领域持续发力,已成功在多款 AI 芯片,包括 N 系列大算力
    的头像 发表于 02-17 13:36 866次阅读

    正点原子ESP32S3系列开发板全面支持小智AI

    飞速发展的大语言模型应用到实际的硬件设备中。 小智AI功能如下: WiFi / ML307 Cat.1 4G BOOT键唤醒和打断,支持点击和长按两种触发方式 离线语音唤醒ESP-SR
    发表于 02-14 17:01

    聚云科技荣获亚马逊云科技生成AI能力认证 助力企业加速生成AI应用落地

    、数据处理、模型调优到应用集成与部署等方面,助力企业加速生成AI应用落地。此外,聚云科技还基于亚马逊云科技打造RAGPro企业知识库、AI-Space、DecisionAI和数字人等
    发表于 02-14 13:41 323次阅读

    Gauzy和的战略合作取得突破性进展

    Gauzy 的 AI Smart-Vision CMS 采用先进的 CVflow AI SoC 支持 ADAS 功能,提升道路安全,重塑
    的头像 发表于 02-07 11:20 1003次阅读

    发布N1-655前端生成AI芯片

    Ambarella(下称“”,纳斯达克股票代码:AMBA,AI 视觉感知芯片公司)在 CES 上发布
    的头像 发表于 01-09 10:29 1488次阅读

    基于Arm Neoverse平台的处理器革新生成AI体验

    Llama 是一个专为开发者、研究人员和企业打造的开源大语言模型 (LLM) 库,旨在推动生成 AI 的创新、实验及可靠地扩展。
    的头像 发表于 01-03 15:31 1151次阅读
    基于Arm Neoverse平台的处理器革新<b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>体验

    定制本地的ChatFile的AI问答系统

    会遇到这样的困扰?今天,我们将利用下面两个技术为自己定制一个本地的 ChatFile 的 AI 问答系统: 1. Google 最新开源的生成
    的头像 发表于 01-03 09:26 959次阅读
    定制<b class='flag-5'>本地</b>的ChatFile的<b class='flag-5'>AI</b>问答系统