0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

英特尔OpenVINO 2025.0正式发布

英特尔物联网 来源:OpenVINO 中文社区 2025-02-21 10:20 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

来源:OpenVINO 中文社区

作者:

武卓英特尔 OpenVINO 布道师

生成式AI(GenAI)在模型质量与应用范围上持续爆发式增长,DeepSeek 等顶尖模型已引发行业热议,这种势头预计将在 2025年延续。本次更新聚焦性能提升、更多生成式AI 模型的支持,并针对英特尔神经处理单元(NPU)推出关键优化。让我们来一探究竟吧!

新增图像生成场景与模型支持

OpenVINO 2025.0 版本正式支持FLUX.1 图像生成模型(含Dev与Schnell变体),可在英特尔 CPU/GPU 上通过 GenAI 流水线运行。开发者现可通过 Optimum-Intel 导出 Flux 模型,并结合 Text2ImagePipeline 生成图像。针对 Flux 模型对精度变化非常敏感的特点,我们进行了深度优化,确保图像生成性能与准确度兼得。

LoRA适配器:模型定制利器

自前期版本起,OpenVINO 已支持基于 Safetensor 文件的LoRA 低秩适配技术,无需重新编译即可动态切换 LoRA 适配器,从而快速方便的生成不同定制化风格的图像。本次更新进一步扩展至 Flux 模型家族,开发者可直接从 Hugging Face Hub 下载适配器,通过 GenAI 的 Text2ImagePipeline 快速实现风格定制。

示例:

LoRA 增强的 FLUX.1-Dev 图像生成效果


展示了 INT8 量化版 FLUX.1-dev 模型在应用 Yarn 风格 LoRA 前后的对比(提示词:"albert einstein, yarn art style",初始种子=420,迭代次数=20):

新场景支持:Image2Image 与 Inpainting

新增Image2ImageInpainting流水线(预览版),解锁更可控的创作方式:

Image2Image:以图像+文本为输入生成新图像,提升结果可控性;

Inpainting:通过掩码图像替换输入图像的指定区域,支持局部内容再生。

两种流水线均兼容 LoRA 适配器,满足定制化需求。

文本生成场景优化

本次新版本在 LLMPipeline API 中引入了对提示词查找解码的预览支持,这是对推测解码的简化,它在输入提示词本身中用直接查找机制取代了传统的草稿模型。这有助于在具有高相似性的请求的情况下显著减少生成延迟。例如,通过对一组文档的问答可以观察到性能优势,因为答案将根据作为提示词本身一部分的文档来生成。

如我们的示例所示,只需对 LLMPipeline 中的代码进行很小的修改,即可启用此功能。总结来说,您需要将提示查找作为流水线中的一个参数启用,并修改生成配置以添加两个重要参数:在提示词中查找多少 token 数以及匹配后取多少 token 数。

生成过程中的内存使用是运行应用的一个重要考虑因素,因为 LLM 权重非常占用内存。KV Cache 代表了额外的内存消耗,并且可能会增长得相当大。我们引入了 KV Cache 的压缩作为一种减少内存消耗的技术,在这个版本中,我们默认在 CPU 上启用它。为了确保压缩的准确性,我们引入了非对称 INT8 压缩,被证明是总体来说最准确的压缩方式。如果需要,INT4 压缩也可作为进一步减少内存消耗的选项。在未来的版本中,我们计划启用更多的压缩技术,请持续关注。

另外,我们一直在努力支持和验证最新的模型,包括 Mistral-7B-Instruct-v0.2、Qwen2.5,当然我们也支持基于 LLama 和 Qwen 架构的 DeepSeek 蒸馏模型。您可以探索我们的新的使用 DeepSeek-R1 蒸馏模型进行 LLM 推理的 Notebook 代码示例,并查看下面与英特尔 酷睿 Ultra 200V GPU 上的 DeepSeek-R1-Llama-8b 模型的对话:

https://github.com/openvinotoolkit/openvino_notebooks/tree/latest/notebooks/deepseek-r1

通过 torch.compile

支持英特尔 NPU

2025.0 版本首次实现 NPU 加速支持,开发者可通过 PyTorch 的 torch.compile 接口调用英特尔 NPU 算力。OpenVINO 作为 torch.compile 生态系统中的编译器已经面世一段时间了。它已经在 CPU 和 GPU 上得到支持,并且在性能方面非常接近原生 OpenVINO 推理。在 2025.0 版本中,我们将推出对 Intel NPU 作为推理设备的预览支持。这包括对 TorchVision、Timm 和 TorchBench 存储库中的300多个模型的支持。

启用方式非常简单,只需要增加如下两行代码:

b6c39f82-ef73-11ef-9310-92fbcf53809c.png

结果因模型而异,因此建议您尝试使用自己的模型以查看性能的提升情况。同时我们建议在英特尔 酷睿 Ultra Series 2 及更高版本的平台上使用此功能。

总结

随着我们迎来激动人心的新一年,生成式AI的潜力继续重塑我们的创造、工作和创新方式。

借助 OpenVINO 2025.0,我们提供了更多的模型覆盖、更快的推理性能和扩展的英特尔 NPU 支持。这只是一个开始——今年我们全年计划发布更多版本,请继续关注即将到来的更新!

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英特尔
    +关注

    关注

    61

    文章

    10340

    浏览量

    181328
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5321

    浏览量

    136211
  • 模型
    +关注

    关注

    1

    文章

    3873

    浏览量

    52341
  • OpenVINO
    +关注

    关注

    0

    文章

    118

    浏览量

    829

原文标题:开发者实战|OpenVINO™ 2025.0正式发布!DeepSeek支持、FLUX.1图像生成、英特尔® NPU加速全面升级

文章出处:【微信号:英特尔物联网,微信公众号:英特尔物联网】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    英特尔宣布新人事任命

    近日,英特尔宣布了一系列重要的领导层任命,涉及客户端计算业务和公司整体技术战略两大核心板块。这两项任命被视为英特尔在当前转型关键期的重要布局,释放出公司在客户端计算和前沿技术领域加速推进的明确信号。
    的头像 发表于 05-13 09:19 721次阅读

    AI工作站本地养龙虾!英特尔双芯混合算力,告别云端Token焦虑

    4月23日,英特尔公司在北京举办新一代AI工作站平台发布会,英特尔中国区技术部总经理高宇宣布,面向AI工作站,英特尔推出两大重磅产品:英特尔
    的头像 发表于 04-26 16:27 1.1w次阅读
    AI工作站本地养龙虾!<b class='flag-5'>英特尔</b>双芯混合算力,告别云端Token焦虑

    释放极致游戏性能!英特尔酷睿Ultra 200S Plus发布

    英特尔酷睿Ultra 200S Plus的内容创作性能至高可达同类产品的两倍,游戏性能平均提升 15%。其中,酷睿 Ultra 7 270K Plus 是英特尔迄今最快的台式机游戏处理器。 最新发布
    的头像 发表于 03-19 13:13 571次阅读

    吉方工控亮相2025英特尔技术创新与产业生态大会

    2025年11月19日至20日,由英特尔公司主办的年度重磅盛会——2025英特尔技术创新与产业生态大会(Intel Connection)暨英特尔行业解决方案大会(Edge Industry Summit)在重庆悦来国际会议中心
    的头像 发表于 11-24 16:57 832次阅读

    打造智算基石:英特尔携手本土生态发布全域液冷服务器

    2025年11月19日,重庆 ——在英特尔技术创新与产业生态大会上,英特尔携手本地生态伙伴——新华三、英维克、忆联及国内领先内存厂商,发布了基于英特尔 ® 至强 ®   6900系列性
    的头像 发表于 11-20 14:31 644次阅读
    打造智算基石:<b class='flag-5'>英特尔</b>携手本土生态<b class='flag-5'>发布</b>全域液冷服务器

    英特尔举办行业解决方案大会,共同打造机器人“芯”动脉

    11月19日,在2025英特尔行业解决方案大会上,英特尔展示了基于英特尔® 酷睿™ Ultra平台的最新边缘AI产品及解决方案,并预览了针对边缘侧的英特尔® 酷睿™ Ultra处理器(
    的头像 发表于 11-19 21:51 7248次阅读
    <b class='flag-5'>英特尔</b>举办行业解决方案大会,共同打造机器人“芯”动脉

    美国政府将入股英特尔

    据彭博社报道称,特朗普政府正在与芯片制造商英特尔进行谈判,希望美国政府入股这家陷入困境的公司,随后该公司股价周四上涨 7% 。 英特尔是唯一一家有能力在美国本土生产最快芯片的美国公司,尽管包括台湾
    的头像 发表于 08-17 09:52 1343次阅读

    硬件与应用同频共振,英特尔Day 0适配腾讯开源混元大模型

    今日,腾讯正式发布新一代混元开源大语言模型。英特尔凭借在人工智能领域的全栈技术布局,现已在英特尔® 酷睿™ Ultra 平台上完成针对该模型的第零日(Day 0)部署与性能优化。值得一提的是, 依托
    的头像 发表于 08-07 14:42 1630次阅读
    硬件与应用同频共振,<b class='flag-5'>英特尔</b>Day 0适配腾讯开源混元大模型

    主控CPU全能选手,英特尔至强6助力AI系统高效运转

    2025年3月,英伟达发布了DGX B300 AI加速计算平台。2025年5月,英特尔发布了三款全新英特尔至强6性能核处理器,其中一款6776P被用作是DGX B300的主控CPU,这
    的头像 发表于 06-27 11:44 1118次阅读
    主控CPU全能选手,<b class='flag-5'>英特尔</b>至强6助力AI系统高效运转

    使用英特尔® NPU 插件C++运行应用程序时出现错误:“std::Runtime_error at memory location”怎么解决?

    使用OpenVINO™工具套件版本 2024.4.0 构建C++应用程序 使用英特尔® NPU 插件运行了 C++ 应用程序 遇到的错误: Microsoft C++ exception: std::runtime_error at memory location
    发表于 06-25 08:01

    英特尔发布边缘AI控制器与边缘智算一体机,创造“AI新视界”

    在2025北京机器视觉展览会(VisionChina)以“AI 视界:英特尔推动智能制造革新浪潮”为主题的英特尔论坛中,英特尔与诺达佳联合发布了 基于
    发表于 06-24 17:50 1601次阅读
    <b class='flag-5'>英特尔</b><b class='flag-5'>发布</b>边缘AI控制器与边缘智算一体机,创造“AI新视界”

    无法将Openvino2025.0与onnx运行时Openvino™ 执行提供程序 1.16.2 结合使用,怎么处理?

    使用OpenVINO™与英特尔 i5-8500 CPU 和超核处理器 630 iGPU 一起部署模型。 使用了 Microsoft.ML.OnnxRuntime.OpenVino
    发表于 06-24 06:31

    为什么无法通过“pip install openvino-dev==2025.0.0”安装 2025.0 OpenVINO™?

    通过“pip install openvino-dev==2025.0.0OpenVINO2025.0 安装。 收到的错误: ERROR: No matching distribution found for
    发表于 06-23 08:13

    英特尔锐炫Pro B系列,边缘AI的“智能引擎”

    2025年6月19日,上海—— 在MWC 25上海期间,英特尔展示了一幅由英特尔锐炫™ Pro B系列GPU所驱动的“实时响应、安全高效、成本可控”的边缘AI图景。 英特尔客户端计算事业部边缘计算
    的头像 发表于 06-20 17:32 1130次阅读
    <b class='flag-5'>英特尔</b>锐炫Pro B系列,边缘AI的“智能引擎”

    英特尔先进封装,新突破

    在半导体行业的激烈竞争中,先进封装技术已成为各大厂商角逐的关键领域。英特尔作为行业的重要参与者,近日在电子元件技术大会(ECTC)上披露了多项芯片封装技术突破,再次吸引了业界的目光。这些创新不仅展现
    的头像 发表于 06-04 17:29 1596次阅读