0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

解锁LLM新高度—OpenVINO™ 2024.1赋能生成式AI高效运行

英特尔物联网 来源:OpenVINO 中文社区 2024-05-10 10:36 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

大语言模型推理的改进

LLM 的发展仍保持着惊人的速度。尽管现有的 LLM 已经具备强大的功能,但通过 OpenVINO 的优化和推理加速,可以对这些复杂模型的执行进行精炼,实现更快、更高效的处理,减少计算开销并最大限度发挥硬件潜力,这将直接导致 LLM 实现更高的吞吐量和更低的延迟。

通过采用压缩嵌入实现额外优化,有效地缩减了 LLM 的编译耗时与内存占用。与此同时,基于英特尔锐炫GPU,以及英特尔高级矩阵扩展(Intel AMX)的第4代和第5代英特尔至强平台之上,LLM 的第一个 token 处理性能得到了显著提升。

通过 oneDNN 可实现更好的 LLM 压缩与性能提升。如今,经过量化或压缩后的 INT4 和 INT8 精度的 LLM 可在英特尔锐炫GPU 上得到支持。在搭载集成 GPU 的英特尔酷睿Ultra 处理器上,针对部分小型 GenAI 模型显著减少了内存消耗。

此外,现在可以在 PyTorch 模型进行训练后量化之后,对其进行微调,以提高模型精度并简化从训练后量化过渡到训练感知量化的过程。

已添加演示示例:https://github.com/openvinotoolkit/nncf/blob/develop/examples/quantization_aware_training/torch/resnet18/README.md

更多生成式 AI 覆盖范围和框架集成

进一步深入了解搭载 OpenVINO 的生成式 AI,该新版本拓宽了生成式AI的边界,使其能够覆盖更广泛的神经网络架构与应用场景。

针对最新发布的最先进的 Llama 3 和 Phi3 模型, OpenVINO 对其实现了支持和优化。

具备混合专家(MoE)架构的 LLM 模型 Mixtral 以及 URLNet 模型,均针对英特尔至强处理器进行了性能提升优化。

文生图模型 Stable Diffusion 1.5以及 LLMs 模型 ChatGLM3-6b和Qwen-7B,则专为搭载了集成 GPU 的英特尔酷睿Ultra 处理器进行了推理速度的改进和优化。

现在,OpenVINO 已支持 Falcon-7B-Instruct,这是一款即用型、具备优秀性能指标的生成式AI大语言模型,适用于聊天与指令场景。

新版本支持的其他模型包括:

Yolo V9、Yolo V8 Oriented Bounding Box Detection (OOB)、Stable Diffusion in Keras、MoblieCLIP、RMBG-v1.4 Background Removal、Magika、TripoSR、AnimateAnyone、LLaVA-Next 以及带有 OpenVINO 和 LangChain 的 RAG 系统。

我们还在 OpenVINO Notebooks 存储库中提供了 Jupyter Notebook 示例。

新平台的更改和现有平台的增强

除了 PyPI 上的主 OpenVINO 软件包外,英特尔酷睿Ultra 处理器的预览 NPU 插件现在在 OpenVINO 开源 GitHub 存储库中可用。

现在,可以通过 npm 存储库更轻松地访问 JavaScript API,使 JavaScript 开发人员能够无缝访问 OpenVINO API。我们扩展了文档,可帮助开发人员将他们的 JavaScript 应用程序与 OpenVINO 集成。

现在,默认情况下已在 ARM 处理器上为卷积神经网络(CNN)启用 FP16 推理。在多种 ARM 设备上,已显著提升了众多模型的性能。已实现与 CPU 架构无关的构建,旨在为不同 ARM 设备提供统一的二进制分发。

新增和更新的 Notebook

OpenVINO Notebooks 仍然是非常有价值的资源,用于展示如何利用 OpenVINO 在人工智能领域实现重要进展。最近,我们对 OpenVINO notebooks 存储库做了一些改动,包括将默认分支从 'main' 更改为 'latest',以及对 "notebooks" 文件夹内 notebook 的命名结构进行了改进



审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • GPU芯片
    +关注

    关注

    1

    文章

    307

    浏览量

    6553
  • 生成式AI
    +关注

    关注

    0

    文章

    538

    浏览量

    1128
  • OpenVINO
    +关注

    关注

    0

    文章

    118

    浏览量

    816

原文标题:解锁 LLM 新高度,拓宽模型新边界 —— OpenVINO™ 2024.1 赋能生成式 AI 高效运行 | 开发者实战

文章出处:【微信号:英特尔物联网,微信公众号:英特尔物联网】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    信息:软硬协同AI解锁智能制造质检/排程新高度

    在智能制造加速升级的当下,AI 正成为驱动产业变革的核心引擎。以 AI检测系统、XR智能眼镜等智能软硬件为抓手,企业可实现生产环节的精准感知、智能判别与高效协同,大幅提升质检精度、作业效率与安全管
    的头像 发表于 04-16 09:24 4534次阅读

    赋予AI设备灵动双眸 | 匠芯创亮相“AI+教育硬件”沙龙 解锁流畅交互新高度

    -高帧芯动力解锁流畅新高度》的主题演讲。直面行业痛点匠芯创给出“芯”答案当前,AI陪伴设备在儿童教育、智能玩具、家庭陪伴等场景中快速普及。然而,传统AI硬件在显示效
    的头像 发表于 04-02 18:51 320次阅读
    赋予<b class='flag-5'>AI</b>设备灵动双眸 | 匠芯创亮相“<b class='flag-5'>AI</b>+教育硬件”沙龙 <b class='flag-5'>解锁</b>流畅交互<b class='flag-5'>新高度</b>

    思必驰携手雅迪冠系列推动两轮智能出行迈向新高度

    近日,思必驰与雅迪深度携手,为冠星舰Ⅱ、冠白鲨Ⅱ高配版两款重磅车型量身打造7寸智能语音仪表,将全链路语音技术、AI大模型能力与两轮车骑行场景融合,为用户带来更安全、更便捷、更丰富的骑行体验,推动两轮智能出行迈向
    的头像 发表于 04-02 09:13 818次阅读

    还在手动拼接 AI 代码?你的 IDE 早就该升级了

    嵌入专用 AI 智能助手直接内嵌到 IDE 工作流中,实现了代码编辑、AI 生成、调试优化、编译运行、 项目部署一站
    发表于 03-11 10:25

    AI定义座舱新高度|搭载天玑座舱S1 Ultra的奇瑞风云T9L

    」推向「AI 定义座舱」的新高度。 旗舰算力 构建车载 AI 的基础   风云 T9L 搭载的 MediaTek 天玑座舱 S1 Ultra 采用先进的 3nm 制程工艺,这是其能够平稳运行
    的头像 发表于 02-12 16:19 2720次阅读
    <b class='flag-5'>AI</b>定义座舱<b class='flag-5'>新高度</b>|搭载天玑座舱S1 Ultra的奇瑞风云T9L

    探索ISO724x系列高速四通道数字隔离器,解锁电子设计新高度

    探索ISO724x系列高速四通道数字隔离器,解锁电子设计新高度 在电子工程师的日常设计工作中,数字隔离器是不可或缺的关键组件,它能够有效阻断高电压、隔离接地,防止噪声电流干扰或损坏敏感电路。今天
    的头像 发表于 01-25 09:50 521次阅读

    生成AI虚拟调试——fe.screen-sim的架构价值

    生成AI虚拟调试——fe.screen-sim的架构价值
    的头像 发表于 12-04 14:59 1167次阅读
    <b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b><b class='flag-5'>赋</b><b class='flag-5'>能</b>虚拟调试——fe.screen-sim的架构价值

    搭载新洁NCE1216,解锁高效应用新可能

    在电子技术蓬勃发展的当下,功率半导体器件已成为推动电子系统高效运行的关键力量。搭载新洁NCE1216,以其卓越的性能和广泛的应用场景,解锁高效
    的头像 发表于 10-25 16:05 800次阅读
    搭载新洁<b class='flag-5'>能</b>NCE1216,<b class='flag-5'>解锁</b><b class='flag-5'>高效</b>应用新可能

    AI6G与卫星通信:开启智能天网新时代

    需求?传统网络会因流量激增而拥堵,而AI的6G网络则能提前预测流量模式,动态调整资源分配。 AI算法能够实时分析海量数据,包括用户位置、网络负载、历史流量模式等。在2025年上海世
    发表于 10-11 16:01

    燃料电池负载均衡测试:解锁高效密码

    整理、绘图,直观呈现燃料电池在不同负载下的特性曲线。通过对比不同阶段的数据,精准定位潜在问题所在,为后续改进提供依据。 通过这套严谨的负载均衡测试方案,能够全方位评估燃料电池的性能表现,及时发现并解决隐患,助力燃料电池技术迈向新高度,在清洁能源应用中发挥更大效能。
    发表于 09-18 13:51

    AI生成的测试用例真的靠谱吗?

    的身影无处不在。尤其在测试用例生成这一传统上高度依赖人工经验的环节,AI展现出令人惊艳的能力——快速、高效、“看起来很专业”。于是,很多测试团队纷纷尝试用
    的头像 发表于 08-01 10:02 1893次阅读
    <b class='flag-5'>AI</b><b class='flag-5'>生成</b>的测试用例真的靠谱吗?

    使用 llm-agent-rag-llamaindex 笔记本时收到的 NPU 错误怎么解决?

    使用 conda create -n ov-nb-demos python=3.11 创建运行 llm-agent-rag-llamaindex notebook 的环境。 执行“创建
    发表于 06-23 06:26

    vivo Pad5 Pro搭载MediaTek天玑9400处理器

    vivo Pad5 Pro 搭载天玑 9400 旗舰芯,实现效、AI 全面进阶,解锁平板体验新高度
    的头像 发表于 06-05 14:15 1509次阅读

    利用NVIDIA 3D引导生成AI Blueprint控制图像生成

    AI 的图像生成技术突飞猛进,从早期模型会生成手指过多的人类图像,到现在创造出令人惊叹的逼
    的头像 发表于 06-05 09:24 996次阅读

    2.5MW全球首发,绿慧充引领行业新高度

    ,它以双兆瓦级系统架构与全场景兼容能力,革新大功率充电技术标准,引领行业新高度。01智能投切全场景功率适配产品单机功率达2.5MW,通过智能投切技术动态分配功率,
    的头像 发表于 04-25 12:18 1386次阅读
    2.5MW全球首发,绿<b class='flag-5'>能</b>慧充引领行业<b class='flag-5'>新高度</b>!