0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

人工智能推理的演变

星星科技指导员 来源:嵌入式计算设计 作者:Geoff Tate 2022-10-17 10:38 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

人工智能推理市场在过去三四年中发生了巨大变化。以前,边缘AI甚至不存在,大多数推理功能都发生在数据中心,超级计算机或政府应用程序中,这些应用程序通常也是大型计算项目。在所有这些情况下,性能都至关重要,并且始终是重中之重。快进到今天,边缘AI市场与此截然不同,特别是随着它进入更多的商业应用。对于这些用例,主要关注点更多的是低成本、功耗和小尺寸。而不是原始性能。

平衡更好的性能与软硬件协同设计

在查看推理芯片时,很明显一个芯片与另一个芯片不同。设计师总是在他们的设计中做出选择,好的设计师会考虑他们的最终应用以及他们在这些应用中的约束。例如,当 Flex Logix 设计其第一个推理芯片时,它最初的大小是现在的 4 倍。我们很快意识到,芯片需要小得多,才能成为低成本、低功耗、更小外形边缘AI市场的参与者。

有趣的是,大多数人最初认为大多数推理总是在数据中心完成的。这种观点最终发生了变化,因为业界意识到它有太多的数据需要移动,因此,这些数据开始向边缘移动。随着5G开始出现,更清楚的是,不可能始终将原始数据发送到云端进行处理。显然,边缘必须有一定数量的智能可以解决99.9%的场景,而数据中心实际上只需要用于极端情况。一个完美的例子是安全摄像头。边缘人工智能需要能够弄清楚是否有任何可疑活动正在发生,以及周围是否有人。然后,如果发现任何有趣的东西,这些部分可以发送到数据中心进行进一步处理。但是,发送到数据中心的数据实际上只是整体推理的一小部分。边缘推理AI通常意味着满足很多约束,有时如果你想运行非常大的复杂模型,你实际上只在非常小的数据部分上运行这些模型。

早期边缘AI推理设计中的另一个误解是,一种适合所有方法就足够了。这也被证明是错误的,因为出现了专门的芯片,展示了它们的优势和力量。关键是真正围绕算法构建芯片,因为如果它能够真正磨练算法,你可以获得更好的性能。正确的平衡实际上是获得最有效的计算,就像专业硬件一样,但在编译时具有可编程性。

可编程性是关键

该行业确实处于AI发展的风口浪尖。未来几十年,我们将在这个领域看到的创新将是惊人的。就像任何长寿的市场一样,你可以期待变化。这就是为什么不要设计针对某些客户型号的超级专用芯片变得至关重要的原因。如果我们今天这样做,到两年后芯片在客户手中时,模型可能会发生重大变化 - 客户的要求也会发生重大变化。这就是我们不断听到有关公司最终获得AI推理芯片的故事的主要原因 - 然后发现他们并没有真正按照他们需要的方式表现。如果将可编程性内置到芯片架构中,则可以轻松解决该问题。

如今,AI 的灵活性和可编程性在任何边缘 AI 处理器中都至关重要。客户的算法会定期更改,系统设计也会更改。随着边缘AI功能在主流中的推出,越来越清楚的是,芯片设计人员需要能够适应和改变客户的模型,而不是选择他们“认为”模型将要成为的样子。我们一次又一次地看到这一点,这就是为什么编译器如此重要。编译器中有很多技术对最终用户是隐藏的,这些技术都是关于分配资源以确保以最小的功率有效地完成所有事情。

另一个被密切关注的关键特征是吞吐量。现在正在构建良好的推理芯片,以便它们可以非常快速地通过它们移动数据,这意味着它们必须非常快速地处理该数据,并非常快速地将其移入和移出内存。通常,芯片供应商会抛出各种各样的性能数据,如TOPS或ResNet-50,但研究这些数字的系统/芯片设计人员很快就会意识到这些数字通常毫无意义。真正重要的是推理引擎可以为模型、图像大小、批量大小以及过程和 PVT(过程/电压/温度)条件提供什么吞吐量。这是衡量其性能的头号指标,但令人惊讶的是,很少有供应商提供它。

边缘 AI 向前发展

如今,许多客户都渴望吞吐量,并且正在寻找能够以与当今相同的功耗/价格为他们提供更高吞吐量和更大图像尺寸的解决方案。当他们得到它时,他们的解决方案将比竞争解决方案更准确,更可靠,然后他们的市场采用和扩张将加速。因此,尽管今天的应用程序有数千或数万个单位,但我们预计随着推理的可用性而迅速增长,推理提供了越来越多的吞吐量/$和吞吐量/瓦。

Edge AI市场正在快速增长,芯片供应商也在争夺该市场的地位。事实上,据预测,到20世纪20年代中期,人工智能销售额将迅速增长到数百亿美元,其中大部分增长将用于边缘人工智能推理。没有人能预测未来的模型,这就是为什么在设计时考虑灵活性和可编程性更为重要的原因。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    462

    文章

    53534

    浏览量

    458988
  • 人工智能
    +关注

    关注

    1813

    文章

    49734

    浏览量

    261469
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    利用超微型 Neuton ML 模型解锁 SoC 边缘人工智能

    的框架小 10 倍,速度也快 10 倍,甚至可以在最先进的边缘设备上进行人工智能处理。在这篇博文中,我们将介绍这对开发人员意味着什么,以及使用 Neuton 模型如何改进您的开发和终端
    发表于 08-31 20:54

    迅为iTOP-RK3568人工智能开发板mobilenet图像分类模型推理测试

    想快速验证MobileNet图像分类模型的实际运行效果?迅为iTOP-RK3568人工智能开发板,让模型推理测试高效又省心。
    的头像 发表于 08-28 15:53 1266次阅读
    迅为iTOP-RK3568<b class='flag-5'>人工智能</b>开发板mobilenet图像分类模型<b class='flag-5'>推理</b>测试

    人工智能+”,走老路难赚到新钱

    昨天的“人工智能+”刷屏了,这算是官方第一次对“人工智能+”这个名称定性吧?今年年初到现在,涌现出了一大批基于人工智能的创业者,这已经算是AI2.0时代的第三波创业潮了,第一波是基础大模型,第二波
    的头像 发表于 08-27 13:21 523次阅读
    “<b class='flag-5'>人工智能</b>+”,走老路难赚到新钱

    挖到宝了!人工智能综合实验箱,高校新工科的宝藏神器

    应用场景。从数据采集,到模型推理,都能完整且自如地参与,轻松解锁人工智能全流程实训,让你深度体验AI技术的魅力 。 四、九门课程全覆盖,满足多元学习需求 对于高校教学或者技术学习来说,课程覆盖的广度
    发表于 08-07 14:30

    挖到宝了!比邻星人工智能综合实验箱,高校新工科的宝藏神器!

    应用场景。从数据采集,到模型推理,都能完整且自如地参与,轻松解锁人工智能全流程实训,让你深度体验AI技术的魅力 。 四、九门课程全覆盖,满足多元学习需求 对于高校教学或者技术学习来说,课程覆盖的广度
    发表于 08-07 14:23

    信而泰×DeepSeek:AI推理引擎驱动网络智能诊断迈向 “自愈”时代

    DeepSeek-R1:强大的AI推理引擎底座DeepSeek是由杭州深度求索人工智能基础技术研究有限公司开发的新一代AI大模型。其核心优势在于强大的推理引擎能力,融合了自然语言处理(NLP)、深度
    发表于 07-16 15:29

    迅为RK3588开发板Linux安卓麒麟瑞芯微国产工业AI人工智能

    迅为RK3588开发板Linux安卓麒麟瑞芯微国产工业AI人工智能
    发表于 07-14 11:23

    最新人工智能硬件培训AI 基础入门学习课程参考2025版(大模型篇)

    人工智能大模型重塑教育与社会发展的当下,无论是探索未来职业方向,还是更新技术储备,掌握大模型知识都已成为新时代的必修课。从职场上辅助工作的智能助手,到课堂用于学术研究的智能工具,大模型正在工作生活
    发表于 07-04 11:10

    开售RK3576 高性能人工智能主板

    ,HDMI-4K 输出,支 持千兆以太网,WiFi,USB 扩展/重力感应/RS232/RS485/IO 扩展/I2C 扩展/MIPI 摄像头/红外遥控 器等功能,丰富的接口,一个全新八核拥有超强性能的人工智能
    发表于 04-23 10:55

    NXP技术白皮书:AIoT人工智能物联网 将人工智能与现实世界相连

      分析师将人工智能物联网 (AIoT) 大致定义为人工智能 (AI) 与物联网(IoT)的融合,利用AI让物联网设备变得更智能、更具自主性。但这是一个以设备为中心的“小数据”的定义。从战略层面
    的头像 发表于 03-28 11:53 1817次阅读
    NXP技术白皮书:AIoT<b class='flag-5'>人工智能</b>物联网 将<b class='flag-5'>人工智能</b>与现实世界相连

    支持实时物体识别的视觉人工智能微处理器RZ/V2MA数据手册

    DRP-AI 采用了一种由动态可重构处理器(DRP)和 AI-MAC组成的人工智能加速器,该加速器可加速人工智能推理,实现高速的人工智能推理
    的头像 发表于 03-18 18:12 741次阅读
    支持实时物体识别的视觉<b class='flag-5'>人工智能</b>微处理器RZ/V2MA数据手册

    人工智能大模型年度发展趋势报告

    2024年12月的中央经济工作会议明确把开展“人工智能+”行动作为2025年要抓好的重点任务。当前,以大模型为代表的人工智能正快速演进,激发全球科技之变、产业之变、时代之变,人工智能发展迎来新高潮。随着大模型
    的头像 发表于 02-13 10:57 1509次阅读
    <b class='flag-5'>人工智能</b>大模型年度发展趋势报告

    探究人工智能发展前沿:智能体的演进及其社会影响

    导语:2024年12月,世界经济论坛发布了《探索人工智能前沿:人工智能体的演变及其影响》白皮书,不仅探讨了人工智能体的发展轨迹,还分析了其在医疗、教育和金融等行业中提升效率的潜力。同时
    的头像 发表于 02-10 09:44 1329次阅读
    探究<b class='flag-5'>人工智能</b>发展前沿:<b class='flag-5'>智能</b>体的演进及其社会影响

    GPT架构及推理原理

    导读 本篇是作者从开发人员的视角,围绕着大模型正向推理过程,对大模型的原理的系统性总结,希望对初学者有所帮助。 引言 什么是人工智能? 清华大学出版社出版的《人工智能概论》中提出,人工智能
    的头像 发表于 01-20 13:41 2816次阅读
    GPT架构及<b class='flag-5'>推理</b>原理

    人工智能推理及神经处理的未来

    人工智能行业所围绕的是一个受技术进步、社会需求和监管政策影响的动态环境。机器学习、自然语言处理和计算机视觉方面的技术进步,加速了人工智能的发展和应用。包括医疗保健、金融和制造业在内的各个行业对自动化
    的头像 发表于 12-23 11:18 869次阅读
    <b class='flag-5'>人工智能</b><b class='flag-5'>推理</b>及神经处理的未来