0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

CPU推理:AI算力配置新范式

阿丘科技 2024-11-21 01:03 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

613ef124-a761-11ef-8084-92fbcf53809c.png

在当前的人工智能领域,尤其是涉及到深度学习的推理阶段,行业普遍认为GPU是唯一的选择。然而,GPU的成本相对较高,且对于某些特定的应用场景,其高昂的价格和较高的能耗成为了一大负担。

相比之下,CPU作为一种性价比极高的推理硬件,逐渐进入了人们的视野,尤其是在对结果准确度有较高要求且需要考虑成本效益的行业中,如制造业、图像处理与分析等。经过数年的内部研究,阿丘科技的工业AI视觉算法平台软件AIDI已经成功验证了CPU推理的可行性,为行业提供了新的解决方案。

具体应用场景01

旧产线改造

许多制造企业的生产线启动时间较早,初期采用的传统算法并不过多依赖于GPU资源。随着时间的发展,这些产线的主板可能无法支持新增的GPU、NPU、TPU等加速卡。

在这种情况下,如果企业希望在其生产线上添加AI检测功能,全面更换工控机会导致成本激增,并延长上线周期。通过使用AIDI提供的CPU推理模式,企业可以迅速实现AI检测功能的上线,同时避免了高昂的硬件升级费用。

相关词语解释:

CPU(中央处理器,Central Processing Unit)

CPU是计算机的主要处理单元,负责执行系统中的大部分基本指令集,包括算术逻辑运算、控制单元的功能以及数据的移动等。它通常设计为能够高效地处理广泛的任务,从运行操作系统到执行应用程序的各种任务。

GPU(图形处理器,Graphics Processing Unit)

GPU最初是为加速计算机图形渲染而设计的处理器,但现在其应用范围已经远远超出了图形处理领域。GPU拥有大量的核心,能够并行处理大量数据,这使得它们在图像和视频处理、深度学习、科学计算等领域非常有用。

NPU(神经网络处理器,Neural Network Processing Unit)

NPU是一种专门为处理机器学习算法而设计的微处理器,尤其是针对深度学习任务。NPU优化了对向量和矩阵运算的支持,这些运算是神经网络训练和推理过程中的基础。

TPU(张量处理单元,Tensor Processing Unit)

TPU是由谷歌开发的一种定制ASIC(专用集成电路),专门用于加速机器学习工作负载,特别是针对使用TensorFlow框架的应用程序。TPU能够高效地执行大规模的矩阵运算,这对于训练和推断阶段的深度学习模型至关重要。

02

轻量型项目

对于一些新的项目,尤其是那些算力需求较小的场景(如图像小于500万像素,仅需进行图像分类或单图推理,且可接受100毫秒的延迟),使用单个GPU卡往往无法达到满负荷运行的状态,从而造成资源浪费。

这类项目非常适合采用CPU进行推理,训练阶段则可以利用GPU工控机或云端资源。这种方法不仅能够显著降低硬件采购成本,还能确保项目的顺利推进。

03

旧产线改造的具体情形

如下图所示,通过传统算法进行项目的测量与检测,硬件配置主要为CPU+内存+主板。

61635b2c-a761-11ef-8084-92fbcf53809c.png

图:旧产线

目前,旧产线改造通常有以下两种情形。

情形一:硬件配置基本不变,即CPU+内存+主板,通过传统算法做测量,而利用AI算法做外观检测。

616ab3fe-a761-11ef-8084-92fbcf53809c.png

图:情形一

情形二:硬件配置基本不变,即CPU+内存+主板,通过传统算法做测量与外观检测,而利用AI算法做缺陷复判。

616e662a-a761-11ef-8084-92fbcf53809c.png

图:情形二AIDI-CPU推理的优势01

推理速度比肩GTX1060,500万图像像素级推理仅需50ms

AIDI的CPU推理在速度方面表现出色,其底层采用DefectNet网络+Aqinfer推理引擎的创新模式。

617a8f4a-a761-11ef-8084-92fbcf53809c.png

DefectNet网络专门针对工业数据的特性而设计,具备轻量且检测能力强的特点。Aqinfer自研推理引擎则针对工业场景中图像分辨率高、目标小的特点,在原本就较高的推理速度基础上,进一步优化计算速度。

02

节省硬件成本,降低耗能风险

CPU在市场上供应充足,价格相对更为亲民,相较于一些高性能GPU,CPU的获取成本更低。对于企业来说,尤其是预算有限的中小企业,选择CPU推理可以在不牺牲太多性能的前提下,大幅降低硬件采购成本。

以一家小型服装加工厂为例,在引入AI检测系统时,如果选择GPU方案,高昂的硬件成本可能使其望而却步;而采用CPU推理方案,仅需利用现有的工控机资源,就能实现基本的质量检测功能。

同时,GPU的高功耗不仅增加了企业的用电成本,还会导致设备硬件容易因过热等问题而损坏。相比之下,CPU的功耗较低,运行更加稳定,能够有效降低企业的能耗风险和设备维护成本。在长期运行过程中,这一优势将为企业节省大量的资金和人力投入。

03

快速验证,减少额外投资

利用CPU进行AI推理,企业可以充分挖掘既有平台的空闲算力,避免了为新的算力需求而进行大规模的额外投资。在项目的初期验证阶段,CPU推理能够快速搭建起一个低成本的测试环境,帮助企业快速验证AI算法的可行性和有效性。例如,视觉团队可以先在现有的服务器上利用CPU进行算法验证,根据验证结果再决定是否需要进一步投资更强大的GPU算力。

成功案例

在某胶体检测项目中,产品的检测项涵盖少胶、溢胶、断胶、漏胶等关键指标。老设备方案中,胶水识别采用的是传统算法,但在实际应用中,偶尔会出现定位不准的问题,这对产品质量产生了一定的影响。为了提高检测精度,降低过检率,企业决定引入AI检测方案。

61824dc0-a761-11ef-8084-92fbcf53809c.png

由于新增GPU需要对工控机配置进行复杂的修改,并且采购流程耗时较长,为了确保产线的正常运行,不耽误生产进度,项目团队最终选择了CPU推理方案。经过实际测试和验证,该方案能够直接上线,并且取得了令人满意的效果。

618cdeca-a761-11ef-8084-92fbcf53809c.png

在此次项目中,图像分辨率为1000W,客户要求的CT(Cycle Time,周期时间)为1000ms,而实际CT时间仅为500ms,单图推理时间更是缩短至100ms,完全满足了上线要求。这一案例充分证明了阿丘科技AIDI的CPU推理在实际工业场景中的可行性和有效性,为其他类似项目提供了宝贵的参考经验。

综上,CPU推理作为AI算力配置的新范式,在特定的应用场景中展现出了独特的优势。随着技术的不断发展和优化,相信阿丘科技AIDI的CPU推理将在更多领域得到广泛应用,为企业的智能化转型提供更加经济、高效的解决方案。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • cpu
    cpu
    +关注

    关注

    68

    文章

    11216

    浏览量

    222945
  • 人工智能
    +关注

    关注

    1813

    文章

    49734

    浏览量

    261523
  • AI算力
    +关注

    关注

    0

    文章

    122

    浏览量

    9739
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    湘军,让变成生产

    脑极体
    发布于 :2025年11月25日 22:56:58

    国产AI芯片真能扛住“内卷”?海思昇腾的这波操作藏了多少细节?

    反而压到了310W。更有意思的是它的异构架构:NPU+CPU+DVPP的组合,居然能同时扛住训练和推理场景,之前做自动驾驶算法时,用它跑模型时延直接降了20%。 但疑惑也有:这种
    发表于 10-27 13:12

    与电力的终极博弈,填上了AIDC的“电力黑洞”

    ),专注于提供人工智能训练与推理所需的服务、数据服务和算法服务。AIDC采用异构计算架构,结合GPU、FPGA、ASIC等多种AI加速芯片,形成高并发分布式系统,以满足大模型训练和
    的头像 发表于 09-22 02:43 7372次阅读

    什么是AI模组?

    未来,腾视科技将继续深耕AI模组领域,全力推动AI边缘计算行业的深度发展。随着AI技术的不断演进和物联网应用的持续拓展,腾视科技的
    的头像 发表于 09-19 15:26 1149次阅读
    什么是<b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>模组?

    什么是AI模组?

    未来,腾视科技将继续深耕AI模组领域,全力推动AI边缘计算行业的深度发展。随着AI技术的不断演进和物联网应用的持续拓展,腾视科技的
    的头像 发表于 09-19 15:25 429次阅读
    什么是<b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>模组?

    华为联合中国移动研究院发布“路由AI推理及视联网应用样板”

    2025年8月20日;在第九届未来网络发展大会期间,华为联合中国移动研究院发布“路由AI推理及视联网应用样板”,标志着
    的头像 发表于 08-25 19:23 1017次阅读

    科技上线赤兔推理引擎服务,创新解锁FP8大模型

    北京2025年7月30日 /美通社/ -- 近日,北京积科技有限公司(以下简称"积科技")宣布其服务平台上线赤兔推理引擎。积
    的头像 发表于 07-30 21:44 724次阅读

    借势 RISC-V与 AI 浪潮,元石智打造范式

    AI技术飞速发展的当下,需求呈指数级增长,成为推动行业前行的核心动力。与此同时,RISC-V架构凭借其开源、灵活、可定制等特性,正逐渐崭露头角,为AI
    的头像 发表于 07-25 14:51 442次阅读
    借势 RISC-V与 <b class='flag-5'>AI</b> 浪潮,元石智<b class='flag-5'>算</b>打造<b class='flag-5'>算</b><b class='flag-5'>力</b>新<b class='flag-5'>范式</b>

    一文看懂AI集群

    最近这几年,AI浪潮席卷全球,成为整个社会的关注焦点。大家在讨论AI的时候,经常会提到AI集群。AI
    的头像 发表于 07-23 12:18 973次阅读
    一文看懂<b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>集群

    革命:RoCE实测推理时延比InfiniBand低30%的底层逻辑

    AI 训练与推理中的网络效率瓶颈,助力数据中心在高带宽、低延迟、高可靠性的需求下实现资源的最优配置
    的头像 发表于 05-28 14:08 1738次阅读
    <b class='flag-5'>算</b><b class='flag-5'>力</b>革命:RoCE实测<b class='flag-5'>推理</b>时延比InfiniBand低30%的底层逻辑

    芯片的生态突围与革命

    据的爆发式增长,大芯片已成为科技竞争的核心领域之一。   大芯片的核心应用场景丰富多样。在人工智能训练与推理方面,大模型(如 GPT
    的头像 发表于 04-13 00:02 2610次阅读

    DeepSeek推动AI需求:800G光模块的关键作用

    随着人工智能技术的飞速发展,AI需求正以前所未有的速度增长。DeepSeek等大模型的训练与推理任务对
    发表于 03-25 12:00

    信而泰CCL仿真:解锁AI极限,智中心网络性能跃升之道

    引言 随着AI大模型训练和推理需求的爆发式增长,智中心网络的高效性与稳定性成为决定AI产业发展的核心要素。信而泰凭借自主研发的 CCL(集合通信库)评估工具 与 DarYu-X系列测
    的头像 发表于 02-24 17:34 985次阅读
    信而泰CCL仿真:解锁<b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>极限,智<b class='flag-5'>算</b>中心网络性能跃升之道

    中心的如何衡量?

    (ComputationalPower)是指智中心通过其内部的计算设备(如CPU、GPU、AI芯片等)对数据进行处理和计算的能力。它体现了智中心在单位时间内能够完成的计算任务量,
    的头像 发表于 01-16 14:03 4200次阅读
    <b class='flag-5'>算</b>智<b class='flag-5'>算</b>中心的<b class='flag-5'>算</b><b class='flag-5'>力</b>如何衡量?