0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

使用英特尔AI PC为YOLO模型训练加速

英特尔物联网 来源:英特尔物联网 2024-12-09 16:14 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

作者:

黄明明英特尔创新大使

李翊玮英特尔开发者技术推广经理

1背景

在以往的实践中,当我们针对 ultralytics 的 YOLO 模型开展训练工作时,可供选择的计算设备通常局限于 CPUmps 以及 cuda 这几种。然而,自 PyTorch2.5 版本发布之后,情况有了新的变化,PyTorch2.5正式开始支持英特尔显卡,也就是说,此后我们能够借助英特尔 锐炫 显卡来进行模型训练了。

具体而言,PyTorch2.5 版本能够在不同的操作系统及对应的英特尔显卡系列上提供支持。在 Linux 系统下,它支持 英特尔 数据中心 GPU Max 系列;在 Windows 系统下,则支持英特尔锐炫系列。倘若您想要尝试通过不同的方式来利用英特尔显卡进行相关操作,可以参考网址来安装 GPU 驱动。

接下来,本文将会选用基于英特尔酷睿 Ultra 7 185H 的AI PC在 Windows 平台展开具体的演示与应用,以便让大家更为直观地了解相关的操作流程与实际效果。

2安装驱动

Linux

如果你正在使用 Linux 操作系统,并且希望充分发挥英特尔独立显卡的性能优势,那么安装正确的 GPU 驱动程序至关重要。在这个过程中,你可以参考网址https://dgpu-docs.intel.com/driver/client/overview.html,该网站提供了详细且全面的指导,能够帮助你顺利完成 GPU 驱动的安装。

Windows

在使用英特尔显卡的过程中,若你购买的是正版系统并且使用的是默认的 Windows 系统,通常情况下,系统会默认安装英特尔 锐炫控制面板。这一控制面板为用户提供了便捷的图形设置和管理功能,使用户能够根据自身需求对显卡进行个性化的调整。

然而,若你发现系统中并未安装英特尔 锐炫控制面板,也无需担忧,你可以前往英特尔官方支持网站进行下载。英特尔为用户提供了丰富的支持资源,其中包括针对显卡相关问题的详细解决方案和各类实用工具的下载链接。你可以访问网址,在该页面中,你能够找到与英特尔图形产品支持相关的各类信息,涵盖了众多英特尔处理器系列、显卡产品以及相关技术和解决方案。通过浏览该页面,你可以获取到更为全面的产品支持信息,有助于你深入了解英特尔图形产品的特性和功能。

另外,对于如何在 Windows 10 和 Windows 11 系统中安装英特尔图形驱动程序,你可以参考网址https://www.intel.com/content/www/us/en/support/articles/000005629/graphics/processor-graphics.html。该页面详细介绍了两种安装方法,推荐的方法是使用英特尔 驱动程序与支持助手(Intel Driver & Support Assistant)自动检测并安装驱动程序。你只需下载该助手,它将为你智能识别系统所需的驱动程序并完成安装过程,更多信息可查看英特尔 驱动程序与支持助手常见问题解答(FAQ)。

PyTorch安装

安装Pytorch就比较简单了,首先建立一个虚拟的Python环境,然后:

$pip install --pre torch torchvision torchaudio --index-url 
https://download.pytorch.org/whl/nightly/xpu

注意:--index-url https://download.pytorch.org/whl/nightly/xpu请务必加上,如不加上可能安装的是非XPU版本。

验证:

import torch

若提示 “******xpu.dll 找不到”,先检查安装是否完整,回顾有无遗漏、报错或中断情况,确认依赖组件是否安装到位。同时排查网络是否被劫持,可换网络环境或用检测工具查看。

若存在问题,要重新下载安装。在此之前,删除 pip 的缓存,清理旧文件与错误记录,保障后续下载完整无误,顺利完成安装,恢复程序正常运行。

$pip uninstall torch 
$pip uninstall torchaudio
$pip uninstall torchvision 
$pip install --pre torch torchvision torchaudio --index-url https://download.pytorch.org/whl/nightly/xpu

确认XPU是否可以使用:

torch.xpu.is_available()
True

3使用XPU进行模型训练

之前在英特尔主机上展开模型训练,执行相应代码就能开启流程,可因未引入CUDA,仅靠 CPU 运算,训练耗时长得令人咋舌。就拿笔者实操来说,以往用 CPU 训练,满满六个小时才跑完一轮,效率极低。

好在如今情况大变样,同样的训练任务,用AI PC内置的英特尔锐炫 graphics耗时锐减,现在只需一个半小时即可完成,效率提升显著。

model = YOLO("yolo11s.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="yolo.yaml", epochs=100, imgsz=640)

依据官方文档指引,在利用相关工具开展训练工作时,倘若要启用除默认设备之外的其他设备,操作流程原本十分便捷,仅需在 train 方法里精准传入对应的 device 参数,便能轻松达成设备切换,适配多样化的硬件资源,实现训练效能的优化提升。

然而,就当前情况而言,ultralytics 官方框架尚未提供对 XPU 的原生支持,这无疑给我们借助 XPU 强大算力来加速训练进程设置了一道障碍。若执意要在训练流程中启用 XPU,那就不得不对源代码进行深度剖析与针对性修改,这一过程既考验技术功底,又伴随着代码稳定性、兼容性等诸多潜在风险。

但值得庆幸的是,即便受限于Ultralytics官方对 XPU 支持的暂缺现状,我们仍有变通之法。可以绕开复杂的源代码改动,转而在外层通过合理设置训练设备的方式,巧妙引导训练任务适配期望的硬件设备,以此确保训练工作能够在符合自身硬件条件与算力诉求的环境下高效、平稳开展。

if __name__ == '__main__':
  freeze_support()
  # Load a model
  model = YOLO("yolo11s.pt") # load a pretrained model (recommended for training) and transfer weights
  device_str = "xpu:0"
  device = torch.device(device_str)
  model = model.to(device)
  # Train the model
  results = model.train(data="switch.yaml", epochs=100, imgsz=640)
7208dfda-b3b7-11ef-93f3-92fbcf53809c.png

4总结

本文围绕深度学习模型训练效率提升与硬件资源优化利用这一核心主题,聚焦于英特尔AI PC系列平台,深入阐述了从传统 CPU 训练模式向 XPU 赋能训练模式的转型历程,尤其以 YOLO 模型训练作为典型范例展开剖析。

过往依赖 CPU 开展 YOLO模型训练时,受限于 CPU 单核处理能力与串行运算机制,训练周期冗长,硬件资源利用率也处于较低水平,极大制约了模型迭代优化的速度。而随着 英特尔AI PC系列平台搭载的 XPU 技术登场,局面得以彻底扭转。文中详述了如何借助这一先进平台,将训练算力基石从 CPU 平稳迁移至 XPU,充分释放 XPU 兼具的多元处理单元协同优势与高效并行计算效能。在这一转变过程中,训练时间得到了大幅度压缩,原本漫长的训练时长锐减,效率实现数倍乃至数十倍的跃升,让模型训练从耗时 “长跑” 变为高效 “冲刺”。

更为关键的是,这种基于 XPU 的训练革新绝非仅惠及 YOLO 模型。立足长远,凭借 XPU 卓越的架构设计与强劲算力支撑,后续众多依托 torch 框架构建的模型及前沿技术,均可无缝接入并深度运用其强大能力。无论是复杂的图像识别、语义分割,还是自然语言处理领域的深度神经网络模型,XPU 都将成为它们加速迭代、突破性能瓶颈的 “强效催化剂”,真正达成对深度学习技术全方位的加速赋能,推动整个领域朝着更高效、更智能的方向阔步迈进。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英特尔
    +关注

    关注

    61

    文章

    10275

    浏览量

    179303
  • Linux
    +关注

    关注

    88

    文章

    11628

    浏览量

    217972
  • WINDOWS
    +关注

    关注

    4

    文章

    3694

    浏览量

    93227
  • AI
    AI
    +关注

    关注

    89

    文章

    38091

    浏览量

    296598
  • 模型
    +关注

    关注

    1

    文章

    3648

    浏览量

    51712

原文标题:开发者实战|使用英特尔 AI PC 为 YOLO 模型训练加速

文章出处:【微信号:英特尔物联网,微信公众号:英特尔物联网】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    开启AI PC新纪元!英特尔酷睿Ultra重磅发布,胜任200亿参数大语言模型

    12月15日下午,以“AI无处不在 创芯无所不及”为主题的2023英特尔新品发布会在北京举办,英特尔正式推出了基于Intel4制程,采用3D封装技术的酷睿Ultra处理器,移动平台和
    的头像 发表于 12-16 15:14 3615次阅读
    开启<b class='flag-5'>AI</b> <b class='flag-5'>PC</b>新纪元!<b class='flag-5'>英特尔</b>酷睿Ultra重磅发布,胜任200亿参数大语言<b class='flag-5'>模型</b>

    英特尔Gaudi 2E AI加速DeepSeek-V3.1提供加速支持

    英特尔® Gaudi 2EAI加速器现已为DeepSeek-V3.1提供深度优化支持。凭借出色的性能和成本效益,英特尔Gaudi 2E以更低的投入、更高的效率,实现从模型
    的头像 发表于 08-26 19:18 2581次阅读
    <b class='flag-5'>英特尔</b>Gaudi 2E <b class='flag-5'>AI</b><b class='flag-5'>加速</b>器<b class='flag-5'>为</b>DeepSeek-V3.1提供<b class='flag-5'>加速</b>支持

    英特尔面向中国市场发布Gaudi2处理器,加速模型训练和推理

    推出的Gaudi2 AI加速器,将通过其合作伙伴浪潮提供给中国客户。   Gaudi2在训练和推理上的出色表现   英特尔此次推出的Gaudi2深度学习
    的头像 发表于 07-17 00:01 2558次阅读
    <b class='flag-5'>英特尔</b>面向中国市场发布Gaudi2处理器,<b class='flag-5'>加速</b>大<b class='flag-5'>模型</b><b class='flag-5'>训练</b>和推理

    英特尔媒体加速器参考软件Linux版用户指南

    英特尔媒体加速器参考软件是用于数字标志、交互式白板(IWBs)和亭位使用模型的参考媒体播放器应用软件,它利用固定功能硬件加速来提高媒体流速、改进工作量平衡和资源利用,以及定制的图形处理
    发表于 08-04 06:34

    英特尔通过AI参考套件加速AI发展

    人工智能(AI)。每个套件均包含面向AI优化的模型代码、训练数据、机器学习流水线、库以及oneAPI组件,让企业可以在采用不同架构的本地、云端和边缘环境下灵活应用。 “
    的头像 发表于 07-28 19:45 1175次阅读
    <b class='flag-5'>英特尔</b>通过<b class='flag-5'>AI</b>参考套件<b class='flag-5'>加速</b><b class='flag-5'>AI</b>发展

    英特尔携手PC产业伙伴,迈向规模化应用AI的未来

    以第12代、第13代英特尔酷睿处理器和英特尔锐炫A系列显卡代表的英特尔多款客户端芯片均能提供强劲性能,以满足生成式AI(AIGC)对于高算
    的头像 发表于 08-24 15:40 951次阅读
    <b class='flag-5'>英特尔</b>携手<b class='flag-5'>PC</b>产业伙伴,迈向规模化应用<b class='flag-5'>AI</b>的未来

    英特尔启动首个AI PC加速计划

    AI PC加速计划将为软件合作伙伴提供工程软件和资源,以在2025年前实现为超过1亿台PC实现人工智能特性。 新闻亮点 英特尔
    的头像 发表于 10-21 16:40 1281次阅读
    <b class='flag-5'>英特尔</b>启动首个<b class='flag-5'>AI</b> <b class='flag-5'>PC</b><b class='flag-5'>加速</b>计划

    英特尔新处理器,掀AI PC战火

    随着ai时代的到来,英特尔正在构想新的酷睿Ultra处理器(代号Meteor Lake),这是英特尔的第一个基于npu的处理器,旨在在pc上应用ai
    的头像 发表于 12-11 11:26 1459次阅读

    英特尔发布AI PC加速计划,确立AI PC新标准

    同时,英特尔也自定了更为简化的AI PC定义,即CPU、GPU和NPU均应具备专属AI加速能力,这恰恰反映了其最新力作Meteor Lake
    的头像 发表于 03-27 10:10 867次阅读

    英特尔宣布AI PC加速计划新增两项AI举措

    首先,“AI PC 开发者计划”面向软件研发人员和独立软件开发商,他们提供便捷的开发环境,助力加速大规模运用新型 AI技术。此计划包含一系
    的头像 发表于 03-27 16:03 835次阅读

    浪潮信息&quot;源2.0&quot;大模型YuanChat支持英特尔最新商用AI PC

    % 。企业可以在全新的英特尔商用客户端AI PC上,使用AI PC模型效率工具"YuanCha
    的头像 发表于 03-27 22:52 959次阅读
    浪潮信息&quot;源2.0&quot;大<b class='flag-5'>模型</b>YuanChat支持<b class='flag-5'>英特尔</b>最新商用<b class='flag-5'>AI</b> <b class='flag-5'>PC</b>

    英特尔升级AI PC加速计划

    近日,英特尔公司正式推出“AI PC加速计划”,旨在通过两大新举措进一步推动人工智能技术在个人电脑领域的应用与发展。
    的头像 发表于 03-28 11:46 1060次阅读

    英特尔助力京东云用CPU加速AI推理,以大模型构建数智化供应链

    英特尔助力京东云用CPU加速AI推理,以大模型构建数智化供应链
    的头像 发表于 05-27 11:50 1020次阅读
    <b class='flag-5'>英特尔</b>助力京东云用CPU<b class='flag-5'>加速</b><b class='flag-5'>AI</b>推理,以大<b class='flag-5'>模型</b>构建数智化供应链

    英特尔计划明年AI PC出货一亿台

    英特尔设定明年AI PC出货目标一亿台,较2024年原定计划激增150%   英特尔销售与营销部总监Jack Huang于10月28
    的头像 发表于 10-31 14:26 1246次阅读

    使用PyTorch在英特尔独立显卡上训练模型

    《PyTorch 2.5重磅更新:性能优化+新特性》中的一个新特性就是:正式支持在英特尔独立显卡上训练模型
    的头像 发表于 11-01 14:21 2838次阅读
    使用PyTorch在<b class='flag-5'>英特尔</b>独立显卡上<b class='flag-5'>训练</b><b class='flag-5'>模型</b>