0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

英特尔OpenVINO 2025.0正式发布

英特尔物联网 来源:OpenVINO 中文社区 2025-02-21 10:20 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

来源:OpenVINO 中文社区

作者:

武卓英特尔 OpenVINO 布道师

生成式AI(GenAI)在模型质量与应用范围上持续爆发式增长,DeepSeek 等顶尖模型已引发行业热议,这种势头预计将在 2025年延续。本次更新聚焦性能提升、更多生成式AI 模型的支持,并针对英特尔神经处理单元(NPU)推出关键优化。让我们来一探究竟吧!

新增图像生成场景与模型支持

OpenVINO 2025.0 版本正式支持FLUX.1 图像生成模型(含Dev与Schnell变体),可在英特尔 CPU/GPU 上通过 GenAI 流水线运行。开发者现可通过 Optimum-Intel 导出 Flux 模型,并结合 Text2ImagePipeline 生成图像。针对 Flux 模型对精度变化非常敏感的特点,我们进行了深度优化,确保图像生成性能与准确度兼得。

LoRA适配器:模型定制利器

自前期版本起,OpenVINO 已支持基于 Safetensor 文件的LoRA 低秩适配技术,无需重新编译即可动态切换 LoRA 适配器,从而快速方便的生成不同定制化风格的图像。本次更新进一步扩展至 Flux 模型家族,开发者可直接从 Hugging Face Hub 下载适配器,通过 GenAI 的 Text2ImagePipeline 快速实现风格定制。

示例:

LoRA 增强的 FLUX.1-Dev 图像生成效果


展示了 INT8 量化版 FLUX.1-dev 模型在应用 Yarn 风格 LoRA 前后的对比(提示词:"albert einstein, yarn art style",初始种子=420,迭代次数=20):

新场景支持:Image2Image 与 Inpainting

新增Image2ImageInpainting流水线(预览版),解锁更可控的创作方式:

Image2Image:以图像+文本为输入生成新图像,提升结果可控性;

Inpainting:通过掩码图像替换输入图像的指定区域,支持局部内容再生。

两种流水线均兼容 LoRA 适配器,满足定制化需求。

文本生成场景优化

本次新版本在 LLMPipeline API 中引入了对提示词查找解码的预览支持,这是对推测解码的简化,它在输入提示词本身中用直接查找机制取代了传统的草稿模型。这有助于在具有高相似性的请求的情况下显著减少生成延迟。例如,通过对一组文档的问答可以观察到性能优势,因为答案将根据作为提示词本身一部分的文档来生成。

如我们的示例所示,只需对 LLMPipeline 中的代码进行很小的修改,即可启用此功能。总结来说,您需要将提示查找作为流水线中的一个参数启用,并修改生成配置以添加两个重要参数:在提示词中查找多少 token 数以及匹配后取多少 token 数。

生成过程中的内存使用是运行应用的一个重要考虑因素,因为 LLM 权重非常占用内存。KV Cache 代表了额外的内存消耗,并且可能会增长得相当大。我们引入了 KV Cache 的压缩作为一种减少内存消耗的技术,在这个版本中,我们默认在 CPU 上启用它。为了确保压缩的准确性,我们引入了非对称 INT8 压缩,被证明是总体来说最准确的压缩方式。如果需要,INT4 压缩也可作为进一步减少内存消耗的选项。在未来的版本中,我们计划启用更多的压缩技术,请持续关注。

另外,我们一直在努力支持和验证最新的模型,包括 Mistral-7B-Instruct-v0.2、Qwen2.5,当然我们也支持基于 LLama 和 Qwen 架构的 DeepSeek 蒸馏模型。您可以探索我们的新的使用 DeepSeek-R1 蒸馏模型进行 LLM 推理的 Notebook 代码示例,并查看下面与英特尔 酷睿 Ultra 200V GPU 上的 DeepSeek-R1-Llama-8b 模型的对话:

https://github.com/openvinotoolkit/openvino_notebooks/tree/latest/notebooks/deepseek-r1

通过 torch.compile

支持英特尔 NPU

2025.0 版本首次实现 NPU 加速支持,开发者可通过 PyTorch 的 torch.compile 接口调用英特尔 NPU 算力。OpenVINO 作为 torch.compile 生态系统中的编译器已经面世一段时间了。它已经在 CPU 和 GPU 上得到支持,并且在性能方面非常接近原生 OpenVINO 推理。在 2025.0 版本中,我们将推出对 Intel NPU 作为推理设备的预览支持。这包括对 TorchVision、Timm 和 TorchBench 存储库中的300多个模型的支持。

启用方式非常简单,只需要增加如下两行代码:

b6c39f82-ef73-11ef-9310-92fbcf53809c.png

结果因模型而异,因此建议您尝试使用自己的模型以查看性能的提升情况。同时我们建议在英特尔 酷睿 Ultra Series 2 及更高版本的平台上使用此功能。

总结

随着我们迎来激动人心的新一年,生成式AI的潜力继续重塑我们的创造、工作和创新方式。

借助 OpenVINO 2025.0,我们提供了更多的模型覆盖、更快的推理性能和扩展的英特尔 NPU 支持。这只是一个开始——今年我们全年计划发布更多版本,请继续关注即将到来的更新!

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英特尔
    +关注

    关注

    61

    文章

    10275

    浏览量

    179317
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5099

    浏览量

    134465
  • 模型
    +关注

    关注

    1

    文章

    3649

    浏览量

    51715
  • OpenVINO
    +关注

    关注

    0

    文章

    117

    浏览量

    716

原文标题:开发者实战|OpenVINO™ 2025.0正式发布!DeepSeek支持、FLUX.1图像生成、英特尔® NPU加速全面升级

文章出处:【微信号:英特尔物联网,微信公众号:英特尔物联网】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    硬件与应用同频共振,英特尔Day 0适配腾讯开源混元大模型

    今日,腾讯正式发布新一代混元开源大语言模型。英特尔凭借在人工智能领域的全栈技术布局,现已在英特尔® 酷睿™ Ultra 平台上完成针对该模型的第零日(Day 0)部署与性能优化。值得一提的是, 依托
    的头像 发表于 08-07 14:42 1123次阅读
    硬件与应用同频共振,<b class='flag-5'>英特尔</b>Day 0适配腾讯开源混元大模型

    使用英特尔® NPU 插件C++运行应用程序时出现错误:“std::Runtime_error at memory location”怎么解决?

    使用OpenVINO™工具套件版本 2024.4.0 构建C++应用程序 使用英特尔® NPU 插件运行了 C++ 应用程序 遇到的错误: Microsoft C++ exception: std::runtime_error at memory location
    发表于 06-25 08:01

    无法将Openvino2025.0与onnx运行时Openvino™ 执行提供程序 1.16.2 结合使用,怎么处理?

    使用OpenVINO™与英特尔 i5-8500 CPU 和超核处理器 630 iGPU 一起部署模型。 使用了 Microsoft.ML.OnnxRuntime.OpenVino
    发表于 06-24 06:31

    为什么无法通过“pip install openvino-dev==2025.0.0”安装 2025.0 OpenVINO™?

    通过“pip install openvino-dev==2025.0.0OpenVINO2025.0 安装。 收到的错误: ERROR: No matching distribution found for
    发表于 06-23 08:13

    直击Computex2025:英特尔重磅发布新一代GPU,图形和AI性能跃升3.4倍

    5月19日,在Computex 2025上,英特尔发布了最新全新图形处理器(GPU)和AI加速器产品系列。包括全新英特尔锐炫™ Pro B系列GPU——英特尔锐炫Pro B60和
    的头像 发表于 05-20 12:27 5162次阅读
    直击Computex2025:<b class='flag-5'>英特尔</b>重磅<b class='flag-5'>发布</b>新一代GPU,图形和AI性能跃升3.4倍

    英特尔发布全新GPU,AI和工作站迎来新选择

    英特尔推出面向准专业用户和AI开发者的英特尔锐炫Pro GPU系列,发布英特尔® Gaudi 3 AI加速器机架级和PCIe部署方案   2025 年 5 月 19 日,北京 ——今日
    发表于 05-20 11:03 1668次阅读

    在Windows中安装OpenVINO™后,无法找到OpenCL编译器二进制文件是怎么回事?

    已在 Windows* 和开源OpenVINO工具套件 Windows* 中安装 OpenVINO英特尔 Distribution。 如 如何为 VPU 实施自定义层 (英特尔®
    发表于 03-05 08:57

    为什么无法检测到OpenVINO™工具套件中的英特尔®集成图形处理单元?

    在 Ubuntu* Desktop 22.04 上安装了 英特尔® Graphics Driver 版本并OpenVINO™ 2023.1。 运行 python 代码: python -c
    发表于 03-05 08:36

    请问OpenVINO™工具套件英特尔®Distribution是否与Windows® 10物联网企业版兼容?

    无法在基于 Windows® 10 物联网企业版的目标系统上使用 英特尔® Distribution OpenVINO™ 2021* 版本推断模型。
    发表于 03-05 08:32

    安装OpenVINO™适用于Raspberry Pi64位操作系统的工具套件2022.3.1,配置英特尔®NCS2时出错怎么解决?

    安装OpenVINO™适用于 Raspberry Pi* 64 位操作系统的工具套件 2022.3.1。 配置英特尔® NCS2时出错: CMake Error at CMakeLists.txt
    发表于 03-05 07:27

    英特尔®独立显卡与OpenVINO™工具套件结合使用时,无法运行推理怎么解决?

    使用英特尔®独立显卡与OpenVINO™工具套件时无法运行推理
    发表于 03-05 06:56

    为什么Caffe模型可以直接与OpenVINO™工具套件推断引擎API一起使用,而无法转换为中间表示 (IR)?

    推断 Caffe 模型直接基于 英特尔® 神经电脑棒 2 (英特尔® NCS2)。 无法确定为什么 Caffe 模型可以直接与OpenVINO™工具套件推断引擎 API 一起使用,而无法转换为中间表示 (IR)。
    发表于 03-05 06:31

    英特尔OpenVINO 2025.0性能全面升级

    最近,DeepSeek 的重大更新再次震撼全球 AI 领域。作为生成式 AI 领域的佼佼者,DeepSeek 近期发布的新模型展现了惊人的推理速度与卓越的语言理解能力,使其成为大模型竞争中的新焦点
    的头像 发表于 02-21 10:22 1061次阅读

    英特尔的开发板评测

    作者: 隋晓金 收到英特尔的开发板-小挪吒,正好手中也有oak相机,反正都是 OpenVINO 一套玩意,进行评测一下,竟然默认是个Windows系统,刷机成Linux系统比较方便。 我们先刷个刷成
    的头像 发表于 01-24 09:37 1627次阅读
    <b class='flag-5'>英特尔</b>的开发板评测

    英特尔带您解锁云上智算新引擎

    在近日举办的2024火山引擎FORCE原动力大会上,英特尔与火山引擎联合发布基于英特尔 至强 6 性能核处理器的第四代服务器实例,以打造弹性算力底座的产品化实践。同时,英特尔也携手扣子
    的头像 发表于 12-23 14:05 1235次阅读