0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Kinara发布Ara-2边缘AI处理器,实现高效、经济、节能的推理性能

微云疏影 来源:综合整理 作者:综合整理 2023-12-19 11:05 次阅读

Kinar于近期发布了Ara-2边缘AI处理器,这是一款专为边缘服务器及笔记本电脑打造的高性能、高效能且节能推理解决方案,尤其适用于视频分析、大规模语言模型(LLM)在内的各类AI应用。值得注意的是,Ara-2也能够良好适应传统AI模型和基于Transformer架构的尖端AI模型,其所具备的体验式增强功能集使得Ara-2的性能较初代的Ara-1处理器有显著提升,可达成超过5至8倍的增长,将实时响应能力与大吞吐量相结合,从而达致高度精炼的延迟优化设计和均衡性能。

生成式AI现已成为主流,然而大多数此类应用却在数据中心GPU上运行,由此引发的延迟、高成本以及隐私问题亟待解决。Ara-2顺应时代变化,贴心支持生成式AI模型所需引导的数十亿个参数,为跨境转移提供便利。同时,为了更顺畅地完成从GPU至各个AI模型的过度,其内建的计算引擎以及软件开发套件(SDK)均为此进行定制搭建。

“Ara-2的诞生使得我们有能力根据客户需求提供更高性能和成本选择。如Ara-1,其专为智能相机及具有2至8路视频流的边缘AI设备而生;而Ara-2则特别擅长处理针对16至32路甚至更多视频流的底层边缘服务器或笔记本电脑,且与高端相机完美兼容。” Kinara首席执行官Ravi Annavajjhala对此表示。“借助先进的计算引擎,Ara-2能够快速处理高清图像,有效提升精度,实现更高水平的对象检视、识别及追踪。例如,针对生成式AI模型,Stable Diffusion每10秒即可生成一幅图片,LLaMA-7B则可达到每秒几十个token的处理速率。”

据悉,Ampere将在10月份容忍Kinar加入其人工智能平台联盟,共同致力于降低系统复杂度,推动人工智能进一步提升协同工作能力和开放性,目标在于提供比GPU更优的总体性能,同时兼顾吞吐量、功率和成本效益。该团队的首席布道师Sean Varley认为:“ ARA-2展现的性能和功能集让我坚定朝这个方向发展,助力行业推出性能更优且与现有GPU技术相匹敌的AI替代方案。”

除此之外,Ara-2还秉持着安全启动、加密内存访问以及安全主控接口等特性,确保企业AI部署拥有更高的安全性。Kinar亦为之提供全套的SDK支持,囊括模型编译器、计算单元调度程序、灵活的量化选项(含内置的Kinar量化器)以及对PyTorch和TFLite预量化模型的支持、多芯片负荷均衡器系统与动态调节主控运行等诸多要素。

Ara-2提供独立设备、USB模块、M.2模块以及多个Ara-2组成的PCIe卡等丰富形式供消费者选择。 Kinara计划在CES上现场展示这款备受瞩目的Ara-2产品

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    28

    文章

    4658

    浏览量

    128522
  • 数据中心
    +关注

    关注

    16

    文章

    4608

    浏览量

    71855
  • 生成式AI
    +关注

    关注

    0

    文章

    476

    浏览量

    443
收藏 人收藏

    评论

    相关推荐

    英特尔®至强®可扩展处理器助力智慧医疗的数字化转型

    医疗机构实现数据的收集、分析和辅助决策,从而提升医疗服务质量与效率。   这一处理器内置的AI加速显著提升了AI
    发表于 09-29 11:13 6023次阅读
    英特尔®至强®可扩展<b class='flag-5'>处理器</b>助力智慧医疗的数字化转型

    开箱即用,AISBench测试展示英特尔至强处理器的卓越推理性能

    。 中国电子技术标准化研究院赛西实验室依据国家标准《人工智能服务系统性能测试规范》(征求意见稿)相关要求,使用AISBench 2.0测试工具,完成了第五代英特尔至强可扩展处理器AI
    的头像 发表于 09-06 15:33 237次阅读
    开箱即用,AISBench测试展示英特尔至强<b class='flag-5'>处理器</b>的卓越<b class='flag-5'>推理性能</b>

    基于瑞萨RZ/V2H AI处理器的解决方案:高性能视觉AI系统

    RZ/V2H嵌入式AI处理器,采用瑞萨最新的DRP-AI3技术,可提供高达8TOPS(Dense模型)/80TOPS(sparse模型)的AI
    发表于 07-02 18:36 401次阅读
    基于瑞萨RZ/V<b class='flag-5'>2</b>H <b class='flag-5'>AI</b>微<b class='flag-5'>处理器</b>的解决方案:高<b class='flag-5'>性能</b>视觉<b class='flag-5'>AI</b>系统

    宁畅B5000 G5多节点服务采用第五代英特尔至强可扩展处理器

    “基于第五代英特尔 至强 可扩展处理器的宁畅B5000 G5多节点服务,可以在满足大量AI推理场景在吞吐量、时延、容量、并发能力等方面的需求,而且与专用的GPU服务
    的头像 发表于 05-27 11:46 733次阅读
    宁畅B5000 G5多节点服务<b class='flag-5'>器</b>采用第五代英特尔至强可扩展<b class='flag-5'>处理器</b>

    台积电:AI服务处理器预计翻番,拉动收入增长 

    台积电将 AI 服务处理器严格限定为用于 AI 训练与推理的 GPU、CPU 及 AI 加速
    的头像 发表于 04-19 15:04 301次阅读

    自然语言处理应用LLM推理优化综述

    当前,业界在将传统优化技术引入 LLM 推理的同时,同时也在探索从大模型自回归解码特点出发,通过调整推理过程和引入新的模型结构来进一步提升推理性能
    发表于 04-10 11:48 530次阅读
    自然语言<b class='flag-5'>处理</b>应用LLM<b class='flag-5'>推理</b>优化综述

    UL Procyon AI 发布图像生成基准测试,基于Stable Diffusion

    UL去年发布的首个Windows版Procyon AI推理基准测试,以计算机视觉工作负载评估AI推理性能。新推出的图像生成测试将提供统一、精
    的头像 发表于 03-25 16:16 809次阅读

    AMD EPYC处理器AI推理能力究竟有多强?

    如今,AMD EPYC处理器已经成为最常被选择用于AI推理的服务平台,尤其是第四代Genoa EPYC 9004系列,执行AI
    发表于 03-15 09:47 398次阅读

    瑞萨电子宣布推出一款面向高性能机器人应用的新产品—RZ/V2H

    具有10TOPS/W能效的新一代AI加速无需冷却风扇即可提供高达80TOPS的AI推理性能
    的头像 发表于 03-01 10:41 751次阅读
    瑞萨电子宣布推出一款面向高<b class='flag-5'>性能</b>机器人应用的新产品—RZ/V<b class='flag-5'>2</b>H

    英特尔专家为您揭秘第五代英特尔® 至强® 可扩展处理器如何为AI加速

    % 1 ,AI 推理性能提升42% 2 。 这一系列性能提升的背后,存在着怎样的创新与突破?第五代英特尔 至强 可扩展处理器为什么要强调为
    的头像 发表于 12-23 12:20 684次阅读

    英特尔发布第五代至强可扩展处理器性能和能效大幅提升,AI 加速

    此外,至强可扩展处理器被誉为行业首屈一指的内置AI加速数据中心处理器,全新第五代产品更能优化参数量高达200亿的大型语言模型,使其推理性能
    的头像 发表于 12-15 11:02 774次阅读

    Kinara推出Ara-2边缘AI处理器,为边缘服务和笔记本电脑提供高性

    虽然生成式AI应用日趋盛行,但大部分应用仍依赖GPU在数据中心运行,存在着延迟高、成本大、隐私泄漏等诸多风险。为了解决此类问题,Ara-2处理器支持生成式AI模型所需要的大量参数,有效
    的头像 发表于 12-14 10:12 1051次阅读
    <b class='flag-5'>Kinara</b>推出<b class='flag-5'>Ara-2</b><b class='flag-5'>边缘</b><b class='flag-5'>AI</b><b class='flag-5'>处理器</b>,为<b class='flag-5'>边缘</b>服务<b class='flag-5'>器</b>和笔记本电脑提供高性

    英特尔新处理器,掀AI PC战火

    随着ai时代的到来,英特尔正在构想新的酷睿Ultra处理器(代号Meteor Lake),这是英特尔的第一个基于npu的处理器,旨在在pc上应用ai加速和
    的头像 发表于 12-11 11:26 890次阅读

    用上这个工具包,大模型推理性能加速达40倍

    作者: 英特尔公司 沈海豪、罗屿、孟恒宇、董波、林俊 编者按: 只需不到9行代码, 就能在CPU上实现出色的LLM推理性能。 英特尔  Extension for Transformer 创新
    的头像 发表于 12-01 20:40 1065次阅读
    用上这个工具包,大模型<b class='flag-5'>推理性能</b>加速达40倍

    利用 NVIDIA Jetson 实现生成式 AI

    交互速率运行的 Llama-2-70B 模型。 图 1. 领先的生成式 AI 模型在  Jetson AGX Orin 上的推理性能 如要在 Jetson 上快速测试最新的模型和应用,请使用 Jetson 生成式
    的头像 发表于 11-07 21:25 877次阅读
    利用 NVIDIA Jetson <b class='flag-5'>实现</b>生成式 <b class='flag-5'>AI</b>