0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

解锁LLM新高度—OpenVINO™ 2024.1赋能生成式AI高效运行

英特尔物联网 来源:OpenVINO 中文社区 2024-05-10 10:36 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

大语言模型推理的改进

LLM 的发展仍保持着惊人的速度。尽管现有的 LLM 已经具备强大的功能,但通过 OpenVINO 的优化和推理加速,可以对这些复杂模型的执行进行精炼,实现更快、更高效的处理,减少计算开销并最大限度发挥硬件潜力,这将直接导致 LLM 实现更高的吞吐量和更低的延迟。

通过采用压缩嵌入实现额外优化,有效地缩减了 LLM 的编译耗时与内存占用。与此同时,基于英特尔锐炫GPU,以及英特尔高级矩阵扩展(Intel AMX)的第4代和第5代英特尔至强平台之上,LLM 的第一个 token 处理性能得到了显著提升。

通过 oneDNN 可实现更好的 LLM 压缩与性能提升。如今,经过量化或压缩后的 INT4 和 INT8 精度的 LLM 可在英特尔锐炫GPU 上得到支持。在搭载集成 GPU 的英特尔酷睿Ultra 处理器上,针对部分小型 GenAI 模型显著减少了内存消耗。

此外,现在可以在 PyTorch 模型进行训练后量化之后,对其进行微调,以提高模型精度并简化从训练后量化过渡到训练感知量化的过程。

已添加演示示例:https://github.com/openvinotoolkit/nncf/blob/develop/examples/quantization_aware_training/torch/resnet18/README.md

更多生成式 AI 覆盖范围和框架集成

进一步深入了解搭载 OpenVINO 的生成式 AI,该新版本拓宽了生成式AI的边界,使其能够覆盖更广泛的神经网络架构与应用场景。

针对最新发布的最先进的 Llama 3 和 Phi3 模型, OpenVINO 对其实现了支持和优化。

具备混合专家(MoE)架构的 LLM 模型 Mixtral 以及 URLNet 模型,均针对英特尔至强处理器进行了性能提升优化。

文生图模型 Stable Diffusion 1.5以及 LLMs 模型 ChatGLM3-6b和Qwen-7B,则专为搭载了集成 GPU 的英特尔酷睿Ultra 处理器进行了推理速度的改进和优化。

现在,OpenVINO 已支持 Falcon-7B-Instruct,这是一款即用型、具备优秀性能指标的生成式AI大语言模型,适用于聊天与指令场景。

新版本支持的其他模型包括:

Yolo V9、Yolo V8 Oriented Bounding Box Detection (OOB)、Stable Diffusion in Keras、MoblieCLIP、RMBG-v1.4 Background Removal、Magika、TripoSR、AnimateAnyone、LLaVA-Next 以及带有 OpenVINO 和 LangChain 的 RAG 系统。

我们还在 OpenVINO Notebooks 存储库中提供了 Jupyter Notebook 示例。

新平台的更改和现有平台的增强

除了 PyPI 上的主 OpenVINO 软件包外,英特尔酷睿Ultra 处理器的预览 NPU 插件现在在 OpenVINO 开源 GitHub 存储库中可用。

现在,可以通过 npm 存储库更轻松地访问 JavaScript API,使 JavaScript 开发人员能够无缝访问 OpenVINO API。我们扩展了文档,可帮助开发人员将他们的 JavaScript 应用程序与 OpenVINO 集成。

现在,默认情况下已在 ARM 处理器上为卷积神经网络(CNN)启用 FP16 推理。在多种 ARM 设备上,已显著提升了众多模型的性能。已实现与 CPU 架构无关的构建,旨在为不同 ARM 设备提供统一的二进制分发。

新增和更新的 Notebook

OpenVINO Notebooks 仍然是非常有价值的资源,用于展示如何利用 OpenVINO 在人工智能领域实现重要进展。最近,我们对 OpenVINO notebooks 存储库做了一些改动,包括将默认分支从 'main' 更改为 'latest',以及对 "notebooks" 文件夹内 notebook 的命名结构进行了改进



审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • GPU芯片
    +关注

    关注

    1

    文章

    306

    浏览量

    6402
  • 生成式AI
    +关注

    关注

    0

    文章

    537

    浏览量

    1021
  • OpenVINO
    +关注

    关注

    0

    文章

    117

    浏览量

    717

原文标题:解锁 LLM 新高度,拓宽模型新边界 —— OpenVINO™ 2024.1 赋能生成式 AI 高效运行 | 开发者实战

文章出处:【微信号:英特尔物联网,微信公众号:英特尔物联网】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    生成AI虚拟调试——fe.screen-sim的架构价值

    生成AI虚拟调试——fe.screen-sim的架构价值
    的头像 发表于 12-04 14:59 538次阅读
    <b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b><b class='flag-5'>赋</b><b class='flag-5'>能</b>虚拟调试——fe.screen-sim的架构价值

    搭载新洁NCE1216,解锁高效应用新可能

    在电子技术蓬勃发展的当下,功率半导体器件已成为推动电子系统高效运行的关键力量。搭载新洁NCE1216,以其卓越的性能和广泛的应用场景,解锁高效
    的头像 发表于 10-25 16:05 438次阅读
    搭载新洁<b class='flag-5'>能</b>NCE1216,<b class='flag-5'>解锁</b><b class='flag-5'>高效</b>应用新可能

    使用 llm-agent-rag-llamaindex 笔记本时收到的 NPU 错误怎么解决?

    使用 conda create -n ov-nb-demos python=3.11 创建运行 llm-agent-rag-llamaindex notebook 的环境。 执行“创建
    发表于 06-23 06:26

    vivo Pad5 Pro搭载MediaTek天玑9400处理器

    vivo Pad5 Pro 搭载天玑 9400 旗舰芯,实现效、AI 全面进阶,解锁平板体验新高度
    的头像 发表于 06-05 14:15 1065次阅读

    2.5MW全球首发,绿慧充引领行业新高度

    ,它以双兆瓦级系统架构与全场景兼容能力,革新大功率充电技术标准,引领行业新高度。01智能投切全场景功率适配产品单机功率达2.5MW,通过智能投切技术动态分配功率,
    的头像 发表于 04-25 12:18 972次阅读
    2.5MW全球首发,绿<b class='flag-5'>能</b>慧充引领行业<b class='flag-5'>新高度</b>!

    陶瓷围坝:解锁电子封装领域防护新高度的关键

    电子封装技术作为电子产业发展的基石,其防护性能直接关乎电子设备的可靠性与稳定性。陶瓷围坝凭借其独特的材料特性和结构优势,在电子封装防护领域崭露头角,成为解锁防护新高度的关键要素。本文深入剖析陶瓷围坝在电子封装中的作用、优势及发展趋势,旨在揭示其对电子封装领域的重要意义……
    的头像 发表于 03-24 17:10 519次阅读

    利用OpenVINO GenAI解锁LLM极速推理

    随着 DeepSeek、 GPT 和 Llama 等大语言模型(LLMs)不断推动人工智能的边界,它们在高效部署方面也带来了重大挑战。这些模型在生成类似人类的文本方面具有革命性,但每生成一个
    的头像 发表于 03-18 14:09 916次阅读
    利用<b class='flag-5'>OpenVINO</b> GenAI<b class='flag-5'>解锁</b><b class='flag-5'>LLM</b>极速推理

    富士通如何解锁生成AI红利 从人才进化到业务

    生成AI技术正以每周迭代一次的速度重塑商业世界。利用生成AI,营销部门10分钟就可以产出百张
    的头像 发表于 02-25 17:32 1082次阅读

    HarmonyOS 应用开发套件:鸿蒙原生应用开发的 “神助攻”

    知识问答,助力问题快速闭环   在整个应用开发过程中,开发者可能会遇到各种问题。套件提供了高效AI智能问答系统,确保开发者在遇到挑战时能够及时获得帮助,提升开发效率。   其中,
    发表于 02-17 16:37

    C#集成OpenVINO™:简化AI模型部署

    在开源测控、机器视觉、数采与分析三大领域中,如何快速将AI模型集成到应用程序中, 实现AI和应用增值? 最容易的方式是:在C#中,使用 Open
    的头像 发表于 02-17 10:03 2530次阅读
    C#集成<b class='flag-5'>OpenVINO</b>™:简化<b class='flag-5'>AI</b>模型部署

    古河云接入DeepSeek!AI,智能化应用场景再升级

    AI能力接入,古河云将其领先的智能算法与数据分析能力融入“开河”平台,进一步提升平台的技术深度与应用价值,致力于为企业提供更精准、更高效的 智能化管理服务 。 应用场景升级 AI
    的头像 发表于 02-14 17:21 756次阅读
    古河云接入DeepSeek!<b class='flag-5'>AI</b><b class='flag-5'>赋</b><b class='flag-5'>能</b>,智能化应用场景再升级

    C#中使用OpenVINO™:轻松集成AI模型!

    与分析三大领域中,如何快速将AI模型集成到应用程序中,实现AI和应用增值?最容易的方式是:在C#中,使用OpenVINO™工具套件集成
    的头像 发表于 02-07 14:05 1668次阅读
    C#中使用<b class='flag-5'>OpenVINO</b>™:轻松集成<b class='flag-5'>AI</b>模型!

    基于Arm Neoverse平台的处理器革新生成AI体验

    Llama 是一个专为开发者、研究人员和企业打造的开源大语言模型 (LLM) 库,旨在推动生成 AI 的创新、实验及可靠地扩展。
    的头像 发表于 01-03 15:31 1161次阅读
    基于Arm Neoverse平台的处理器革新<b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>体验

    解锁光伏发电新高度:探秘 400V 转 660V 升压变压器核心力量

    解锁光伏发电新高度:探秘 400V 转 660V 升压变压器核心力量 在追求绿色能源变革的征程中,光伏发电已然成为耀眼的明星,而 400V 转 660V 升压变压器则是隐藏在幕后、默默发力的关键
    的头像 发表于 12-27 10:27 821次阅读
    <b class='flag-5'>解锁</b>光伏发电<b class='flag-5'>新高度</b>:探秘 400V 转 660V 升压变压器核心力量

    解锁光伏发电新高度:探秘400V转660V升压变压器核心力量

    解锁光伏发电新高度:探秘400V转660V升压变压器核心力量 光伏发电作为绿色能源的重要组成部分,在全球能源结构中扮演着越来越重要的角色。400V转660V升压变压器,作为光伏发电系统中的关键设备
    的头像 发表于 12-13 13:51 932次阅读
    <b class='flag-5'>解锁</b>光伏发电<b class='flag-5'>新高度</b>:探秘400V转660V升压变压器核心力量