0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

边缘AI推理应用设计的发展

星星科技指导员 来源:嵌入式计算设计 作者:Geoff Tate 2022-07-10 10:03 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

在过去的三四年里,人工智能推理市场发生了巨大变化。以前,甚至不存在边缘人工智能,大多数推理能力都发生在数据中心、超级计算机或政府应用程序中,这些应用程序通常也是大型计算项目。在所有这些情况下,性能都是至关重要的,并且始终是重中之重。快进到今天,边缘人工智能市场与此截然不同,尤其是当它进入更多商业应用时。对于这些用例,主要关注点更多的是低成本、功耗和小尺寸;而更少关于原始性能。

通过硬件-软件协同设计平衡更好的性能

在查看推理芯片时,很明显一种芯片与另一种不同。设计师总是在他们的设计中做出选择,而好的选择会考虑他们的最终应用以及他们在这些应用中的限制。例如,当 Flex Logix 设计其第一个推理芯片时,它最初的大小是现在的 4 倍。我们很快意识到,芯片需要更小才能在成本更低、功耗更低、外形尺寸更小的边缘 AI 市场中占据一席之地。

有趣的是,大多数人最初认为大多数推理总是在数据中心完成。这种观点最终发生了变化,因为行业意识到它有太多的数据需要移动,因此,这些数据开始向边缘移动。随着 5G 开始出现,更清楚的是,不可能始终将原始数据发送到云端进行处理。显然,边缘必须有一定的智能才能解决 99.9% 的场景,而数据中心实际上只需要用于极端情况。一个完美的例子是安全摄像头。边缘 AI 需要能够确定是否发生了任何可疑活动以及周围是否有人。然后,如果发现任何有趣的东西,这些部分可以发送到数据中心进行进一步处理。然而,发送到数据中心的数据实际上只是整体推理的一小部分。边缘推理 AI 通常意味着要满足很多约束,有时如果你想运行非常大的复杂模型,你实际上只需要在很小一部分数据上运行这些模型。

早期边缘 AI 推理设计的另一个误解是,一刀切的方法就足够了。这也被证明是错误的,因为出现了展示其优势和力量的专用芯片。关键是围绕算法构建芯片,因为如果它真的能在算法上磨练,你可以获得更好的性能。正确的平衡实际上是像专用硬件一样获得最有效的计算,但在编译时具有可编程性。

可编程性是关键

该行业确实处于人工智能发展的风口浪尖。在接下来的几十年里,我们将在这个领域看到的创新将是惊人的。就像任何长寿的市场一样,您可以期待变化。这就是为什么不为某些客户模型设计超级专业的芯片变得至关重要的原因。如果我们今天这样做,那么当芯片在两年后到达客户手中时,模型可能会发生重大变化——客户的要求也会发生变化。这就是我们不断听到有关公司最终获得他们的人工智能推理芯片的故事的主要原因——然后发现它们的表现并没有像他们需要的那样。如果将可编程性内置到芯片架构中,则可以轻松解决该问题。

如今,在任何边缘 AI 处理器中,AI 的灵活性和可编程性都至关重要。客户的算法会定期发生变化,系统设计也会发生变化。随着 Edge AI 功能在主流中的推广,越来越清楚的是,芯片设计人员需要能够适应和改变客户模型,而不是根据他们“认为”的模型来选择它。我们一次又一次地看到这一点,这就是编译器如此重要的原因。编译器中有很多对最终用户隐藏的技术,这些技术是围绕分配资源以确保一切都以最少的功率高效完成的。

另一个被密切关注的关键特性是吞吐量。现在正在构建好的推理芯片,以便它们可以非常快速地通过它们移动数据,这意味着它们必须非常快速地处理这些数据,并且非常快速地将其移入和移出内存。通常,芯片供应商会抛出各种各样的性能数据,例如 TOPS 或 ResNet-50,但研究这些数据的系统/芯片设计人员很快就会意识到这些数据通常毫无意义。真正重要的是推理引擎可以为模型、图像大小、批量大小和过程以及 PVT(过程/电压/温度)条件提供多少吞吐量。这是衡量其性能表现的第一个衡量标准,但令人惊讶的是,很少有供应商提供它。

边缘人工智能向前发展

今天的许多客户都渴望吞吐量,并正在寻找能够以与他们现在使用的相同功率/价格为他们提供更高吞吐量和更大图像尺寸的解决方案。当他们得到它时,他们的解决方案将比竞争解决方案更准确和可靠,然后他们的市场采用和扩展将加速。因此,尽管今天的应用程序有数千或数万个单位,但我们预计随着推理的可用性,这种情况会迅速增长,从而提供越来越多的吞吐量/美元和吞吐量/瓦特。

边缘人工智能市场正在迅速增长,芯片供应商也在这个市场上争夺一席之地。事实上,到 2020 年代中期,人工智能销售额迅速增长至数百亿美元,其中大部分增长来自边缘人工智能推理。没有人可以预测未来的模型,这就是为什么在设计时考虑到灵活性和可编程性更为重要

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    20380

    浏览量

    255624
  • 芯片
    +关注

    关注

    463

    文章

    54637

    浏览量

    470978
  • AI
    AI
    +关注

    关注

    91

    文章

    41986

    浏览量

    303080
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    华为破解HBM依赖!AI推理黑科技UCM上线,9月正式开源

    8月12日,在2025金融AI推理应用落地与发展论坛上,华为公司副总裁、数据存储产品线总裁周越峰宣布,华为此次和银联联合创新,推出AI推理
    的头像 发表于 08-13 08:58 1.1w次阅读
    华为破解HBM依赖!<b class='flag-5'>AI</b><b class='flag-5'>推理</b>黑科技UCM上线,9月正式开源

    论马斯克的预言:AI使人类边缘

    工作领域的边缘化。 局限性 AI能力限制方面:尽管AI发展迅速,但目前仍存在诸多局限性,如在常识推理、跨领域迁移学习等方面存在本质缺陷,在数
    发表于 03-14 05:27

    边缘AI算力临界点:深度解析176TOPS香橙派AI Station的产业价值

    AGX Orin 150 TOPS+ 本地大模型推理、具身智能控制、多模态实时交互 迷你AI服务器 176TOPS 意味着OrangePi AI Station正式迈入 高端边缘
    发表于 03-10 14:19

    如何在边缘AI应用场景中实现高性能、低功耗推理(上)

    RA生态工作室关注我们为什么选择边缘AIAI市场已经发生了根本性变革。过去,AI处理主要在云端完成。EndPoint设备从传感器收集数据并将其发送到云端进行
    的头像 发表于 03-03 14:18 6702次阅读
    如何在<b class='flag-5'>边缘</b><b class='flag-5'>AI</b>应用场景中实现高性能、低功耗<b class='flag-5'>推理</b>(上)

    如何在边缘AI应用场景中实现高性能、低功耗推理(上)

      为什么选择边缘AIAI市场已经发生了根本性变革。过去,AI处理主要在云端完成。End Point设备从传感器收集数据并将其发送到云端进行推理
    的头像 发表于 02-27 07:48 1w次阅读
    如何在<b class='flag-5'>边缘</b><b class='flag-5'>AI</b>应用场景中实现高性能、低功耗<b class='flag-5'>推理</b>(上)

    基于NVIDIA模组与软件套件推动边缘与机器人AI推理

    NVIDIA 正式推出 NVIDIA Jetson T4000,将高性能 AI 与实时推理能力带入更广泛的机器人和边缘 AI 应用。T4000 针对更严格的功耗和散热限制进行了优化,最
    的头像 发表于 01-14 09:46 918次阅读
    基于NVIDIA模组与软件套件推动<b class='flag-5'>边缘</b>与机器人<b class='flag-5'>AI</b><b class='flag-5'>推理</b>

    华为数据存储与「DaoCloud 道客」发布AI推理加速联合解决方案

    AI产业已从“追求模型能力极限”转向“追求推理体验最优化”,推理体验决定用户与AI的交互质感。当前推理应用快速
    的头像 发表于 11-28 10:03 530次阅读
    华为数据存储与「DaoCloud 道客」发布<b class='flag-5'>AI</b><b class='flag-5'>推理</b>加速联合解决方案

    工业视觉网关:RK3576赋能多路检测与边缘AI

    ~150ms6TOPS NPU 边缘AI推理易对接 MES / 追溯系统 一、产线痛点:从“人看”到“机判”的转变· 多工位/多角度同步:单机位覆盖不足,典型项目需 8~12 路并发,且画面时序一致性要求高
    发表于 10-16 17:56

    什么是AI算力模组?

    未来,腾视科技将继续深耕AI算力模组领域,全力推动AI边缘计算行业的深度发展。随着AI技术的不断演进和物联网应用的持续拓展,腾视科技的
    的头像 发表于 09-19 15:26 2246次阅读
    什么是<b class='flag-5'>AI</b>算力模组?

    什么是AI算力模组?

    未来,腾视科技将继续深耕AI算力模组领域,全力推动AI边缘计算行业的深度发展。随着AI技术的不断演进和物联网应用的持续拓展,腾视科技的
    的头像 发表于 09-19 15:25 1148次阅读
    什么是<b class='flag-5'>AI</b>算力模组?

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI芯片的需求和挑战

    边缘AI的不同特点: 边缘推理的优势:可以提供数据处理速度和响应速度,满足实时需求;可以缩短网络延迟,降低成本;可以提高安全性和隐私性,保护用户数据。 前面说的都是好处,那面临的
    发表于 09-12 16:07

    华为亮相2025金融AI推理应用落地与发展论坛

    近日,2025金融AI推理应用落地与发展论坛在上海举行。中国银联执行副总裁涂晓军、华为数字金融军团CEO曹冲出席本次论坛并发表致辞。论坛上,华为公司副总裁、数据存储产品线总裁周跃峰博士发布AI
    的头像 发表于 08-15 09:45 1471次阅读

    研华科技推出紧凑型边缘AI推理系统AIR-120

    研华科技隆重宣布,推出紧凑型边缘AI推理系统——AIR-120。该系统搭载英特尔凌动x7433RE(Amston Lake)处理器、酷睿i3-N305处理器、N97(Alder Lake)处理器以及
    的头像 发表于 07-17 17:16 1244次阅读

    信而泰×DeepSeek:AI推理引擎驱动网络智能诊断迈向 “自愈”时代

    DeepSeek-R1:强大的AI推理引擎底座DeepSeek是由杭州深度求索人工智能基础技术研究有限公司开发的新一代AI大模型。其核心优势在于强大的推理引擎能力,融合了自然语言处理(
    发表于 07-16 15:29

    边缘AI盒子技术解析:ASIC/FPGA/GPU芯片及边缘-云端协同与自适应推理

      电子发烧友网综合报道 边缘AI盒子是一种集成了高性能芯片、AI算法和数据处理能力的硬件设备,部署在数据源的边缘侧,如工厂、商场、交通路口等,能在本地进行数据采集、预处理、分析和决策
    的头像 发表于 07-13 08:25 5015次阅读