0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

英特尔集成显卡+ChatGLM3大语言模型的企业本地AI知识库部署

英特尔物联网 来源:英特尔物联网 2024-03-29 11:07 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

前言

在当今的企业环境中,信息的快速获取和处理对于企业的成功至关重要。为了满足这一需求,我们可以将RAG技术与企业本地知识库相结合,以提供实时的、自动生成的信息处理和决策支持。这将有助于企业更好地应对快速变化的市场环境,提高企业的竞争力和创新能力。

企业本地知识库是一个集中存储和管理企业内部知识的系统。它包含了企业的历史数据、经验教训、最佳实践、流程文档、产品信息等。企业本地知识库是企业智慧的结晶,对于企业的运营和发展具有重要意义。

将RAG技术与企业本地知识库相结合,可以为企业带来以下几个方面的优势:

1

实时性

RAG技术可以实时地从企业本地知识库中提取相关信息,并生成用户所需的内容。这意味着用户可以快速地获取到最新的知识和信息,而不需要花费大量时间去查找和整理。

2

自动化

RAG技术可以自动地处理和生成内容,减少了人工干预的需求。这不仅可以提高企业的效率,还可以减少人为错误的发生。

3

个性化和定制化

RAG技术可以根据用户的需求和偏好,生成个性化的内容。通过与企业本地知识库的结合,可以提供更加精准和有针对性的信息,满足不同用户的需求。

4

知识共享和传承

企业本地知识库是一个集中存储和共享知识的平台。通过与RAG技术的结合,可以将这些知识快速地传递给需要的用户,促进知识的共享和传承。

1

RAG简介

RAG - Retrieval-Augmented Generation(检索增强生成)是一种先进的自然语言处理(NLP)技术,它结合了信息检索(Retrieval)和神经网络生成(Generation)两种方法,以提升模型在生成文本时的准确性和相关性。在传统的生成模型中,模型依据自身学习到的知识库生成文本。然而,这种方法受限于模型训练时所接触到的数据范围,特别是在处理未见的、需要实时查找新信息的场景时,可能无法生成最新或最准确的内容。

RAG模型通过引入一个检索组件,在接收到输入问题或任务后,首先从大规模预定义的知识库(如网页、文档集合或其他结构化/非结构化数据源)中检索与任务相关的信息片段。然后,检索到的信息作为额外的上下文输入,与原始输入一起传递给生成模型。生成模型在此基础上,利用检索到的信息以及自身的语言模型能力,生成更为精确、详尽且与现实世界信息保持同步的回答或文本内容。

简单来说,RAG模型就是在传统生成模型的基础上增加了一个动态获取外部知识的能力,这样既保留了大模型生成连贯文本的优点,又解决了由于模型记忆限制导致的知识更新和准确性不足的问题,尤其适用于问答系统、对话系统及需要实时更新信息的自然语言处理任务。

504d318a-ece7-11ee-a297-92fbcf53809c.png

2

OpenVINO Notebook简介

OpenVINO Notebooks是一套以Jupyter Notebook为载体的开源交互式编程教程和示例代码合集,由英特尔公司开发和维护。这套资源专为使用 OpenVINO 工具套件的开发者设计,旨在帮助他们更快地理解和掌握如何利用 OpenVINO 进行深度学习模型的优化与推理及实际部署AI在各式业务应用场景里面。

50752faa-ece7-11ee-a297-92fbcf53809c.png

3

部署平台简介

算力魔方是一款可以DIY的迷你主机,采用了抽屉式设计,后续组装、升级、维护只需要拔插模块。通过选择计算模块的版本,再搭配不同额 IO 模块可以组成丰富的配置,适应不同场景。性能不够时,可以升级计算模块提升算力, 如需要显卡可加上显卡, IO 接口不匹配时,可以更换 IO 模块调整功能,而无需重构整个系统。本文在带有英特尔12代酷睿i7-1265U芯片组里的锐炬 Xe集成显卡+RAM 32GB的算力魔方上完成验证。

4

在集成显卡上部署RAG

4.1

搭建OpenVINO Notebooks开发环境

第一步:请使用下面的命令克隆存储库创建并激活名为“openvino_env”的虚拟环境

git clone https://github.com/openvinotoolkit/openvino_notebooks.git
cd openvino_notebooks
conda create -n openvino_env python=3.9

50b015a2-ece7-11ee-a297-92fbcf53809c.png

第二步:请使用下面的命令激活虚拟环境并安装依赖包,并启动Jupyter Notebooks

conda activate openvino_env
pip install -r requirements.txt

511c6d4c-ece7-11ee-a297-92fbcf53809c.png

jupyter lab notebooks

5143f5f6-ece7-11ee-a297-92fbcf53809c.png

4.2

下载模型到本地

请使用命令将ChatGLM3 6B和text2vec模型下载到本地

git clone https://www.modelscope.cn/ZhipuAI/chatglm3-6b.git

51638e98-ece7-11ee-a297-92fbcf53809c.png

git clone https://www.modelscope.cn/Jerry0/text2vec-large-chinese.git

5179773a-ece7-11ee-a297-92fbcf53809c.png

4.3

运行254-rag-chatbot程序

请运行Notebooks里面的代码模块, 注意!! 国内用户请勿运行模块1,从模块2开始一步步运行代码到NNCF模块,模型压缩选择int4并按照下图一及二图修改notebooks 254里的代码引导程序指定对应的模型路径完成ChatGLM3-6b模型int 4量化及部署

519b22c2-ece7-11ee-a297-92fbcf53809c.png

图一

51b0f96c-ece7-11ee-a297-92fbcf53809c.png

图二

text2vec-large-chinese 模型部署

51d88414-ece7-11ee-a297-92fbcf53809c.png

运行结果,如下所示:本地知识库已成功加入ChatGLM 6B模型里并精确回答问题

51f27da6-ece7-11ee-a297-92fbcf53809c.png

运行视频.avi

5

总结

将RAG技术与企业本地知识库相结合,可以为企业提供实时、自动化、个性化和定制化的信息处理和决策支持。这将有助于企业更好地应对快速变化的市场环境,提高企业的竞争力和创新能力。

利用OpenVINO 工具套件简单易用,仅需三步即可在算力魔方完成开发环境搭建及模型的INT4量化且在英特尔集成显卡上的部署实现RAG企业本地知识库部署。




审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英特尔
    +关注

    关注

    61

    文章

    10321

    浏览量

    181073
  • 深度学习
    +关注

    关注

    73

    文章

    5607

    浏览量

    124620
  • 大模型
    +关注

    关注

    2

    文章

    3770

    浏览量

    5269
  • OpenVINO
    +关注

    关注

    0

    文章

    118

    浏览量

    818

原文标题:英特尔集成显卡+ChatGLM3大语言模型的企业本地AI知识库部署 | 开发者实战

文章出处:【微信号:英特尔物联网,微信公众号:英特尔物联网】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    AI模型微调企业项目实战课

    作画上表现优异,但一旦面对企业内部特定的专业术语、复杂的业务流程或私有的行业知识库,往往会表现出令人失望的“幻觉”与外行。 更致命的是数据安全边界。将涉及财务、法务、客户隐私的敏感数据直接上传给第三方
    发表于 04-16 18:48

    开发知识库测试添加知识库

    文档类型的知识要等待数据校验完成后才能上架 可以点击知识名称查看知识详情 等待后端处理完成可以点击知识列表的上架 在智能体中知识库的位置点
    发表于 03-06 15:07

    鸿蒙智能体开发知识库---创建知识库

    在小艺智能体平台页面,通过【工作空间】-【知识库】-【新建知识库】,进入新建知识库流程。 若勾选【授权知识库用于知识问答,授权后该
    发表于 03-06 10:18

    AI基础设施中部署语言模型的三大举措

    文:Gartner研究副总裁周玲中国企业机构已逐步在生产环境中运行或者计划运行大语言模型,但在AI基础设施的生产部署与高效运营方面仍面临诸多
    的头像 发表于 02-09 16:28 548次阅读
    在<b class='flag-5'>AI</b>基础设施中<b class='flag-5'>部署</b>大<b class='flag-5'>语言</b><b class='flag-5'>模型</b>的三大举措

    英特尔开发者年度盛会智潮涌动,推动AI创新走向产业纵深

    2026年1月16日,上海 ——2025英特尔AI开发者优秀项目路演暨英特尔平台企业AI解决方案创新实践赛颁奖大会成功举办,Bluedot团
    的头像 发表于 01-19 16:14 490次阅读

    英特尔创新引领AI NAS:软硬结合引领本地数据智慧管理与多场景创新应用

    展示面向中小企业、消费者和专业用户,赋能新场景、加速产品落地的最新技术方案。会上,绿联、极空间、铁威马、畅网、飞牛等AI NAS 厂商,发布和展示了一系列基于英特尔® 酷睿™ Ultra处理器和
    的头像 发表于 12-12 15:45 715次阅读
    <b class='flag-5'>英特尔</b>创新引领<b class='flag-5'>AI</b> NAS:软硬结合引领<b class='flag-5'>本地</b>数据智慧管理与多场景创新应用

    发力图形工作站和AI推理市场,英特尔大显存GPU亮相湾芯展

    英特尔发布了面向专业的锐炫Pro B50和B60。这两款显卡比较RTX2000和5660Ti,有哪些性能上的优势?在支持AI推理工作站和大模型部署
    的头像 发表于 10-22 13:40 1.2w次阅读
    发力图形工作站和<b class='flag-5'>AI</b>推理市场,<b class='flag-5'>英特尔</b>大显存GPU亮相湾芯展

    本地部署openWebUI + ollama+DeepSeek 打造智能知识库并实现远程访问

    。 DeepSeek 作为一个开源的大语言模型,我们可以通过 ZeroNews + openWebUI + ollama的方式,轻松的在本地私有化部署 DeepSeek,不受网络攻击影
    的头像 发表于 09-10 16:41 5518次阅读
    <b class='flag-5'>本地</b><b class='flag-5'>部署</b>openWebUI + ollama+DeepSeek 打造智能<b class='flag-5'>知识库</b>并实现远程访问

    英特尔可变显存技术让32GB内存笔记本流畅运行Qwen 30B大模型

    英特尔® 酷睿™ Ultra 200H处理器和32GB内存的AI PC上,英特尔可变显存技术(Intel Variable VRAM Technology)可以将VRAM分配比例从57%提升到87%1
    的头像 发表于 08-14 15:39 1975次阅读

    硬件与应用同频共振,英特尔Day 0适配腾讯开源混元大模型

    今日,腾讯正式发布新一代混元开源大语言模型英特尔凭借在人工智能领域的全栈技术布局,现已在英特尔® 酷睿™ Ultra 平台上完成针对该模型
    的头像 发表于 08-07 14:42 1533次阅读
    硬件与应用同频共振,<b class='flag-5'>英特尔</b>Day 0适配腾讯开源混元大<b class='flag-5'>模型</b>

    主控CPU全能选手,英特尔至强6助力AI系统高效运转

    2025年3月,英伟达发布了DGX B300 AI加速计算平台。2025年5月,英特尔发布了三款全新英特尔至强6性能核处理器,其中一款6776P被用作是DGX B300的主控CPU,这
    的头像 发表于 06-27 11:44 1028次阅读
    主控CPU全能选手,<b class='flag-5'>英特尔</b>至强6助力<b class='flag-5'>AI</b>系统高效运转

    英特尔发布边缘AI控制器与边缘智算一体机,创造“AI新视界”

    处理器的边缘 AI 控制器 和 基于英特尔锐炫 ™ 显卡的边缘智算一体机 ,为工业AI的规模化落地注入强劲动力。 英特尔与诺达佳联合发布边缘
    发表于 06-24 17:50 1567次阅读
    <b class='flag-5'>英特尔</b>发布边缘<b class='flag-5'>AI</b>控制器与边缘智算一体机,创造“<b class='flag-5'>AI</b>新视界”

    直击Computex 2025:英特尔重磅发布新一代GPU,图形和AI性能跃升3.4倍

    B60和英特尔锐炫Pro B50 GPU,AI加速器产品—英特尔Gaudi 3 AI加速器。 英特尔
    的头像 发表于 05-21 00:57 7744次阅读
    直击Computex 2025:<b class='flag-5'>英特尔</b>重磅发布新一代GPU,图形和<b class='flag-5'>AI</b>性能跃升3.4倍

    直击Computex2025:英特尔重磅发布新一代GPU,图形和AI性能跃升3.4倍

    5月19日,在Computex 2025上,英特尔发布了最新全新图形处理器(GPU)和AI加速器产品系列。包括全新英特尔锐炫™ Pro B系列GPU——英特尔锐炫Pro B60和
    的头像 发表于 05-20 12:27 5651次阅读
    直击Computex2025:<b class='flag-5'>英特尔</b>重磅发布新一代GPU,图形和<b class='flag-5'>AI</b>性能跃升3.4倍

    英特尔发布全新GPU,AI和工作站迎来新选择

    英特尔推出面向准专业用户和AI开发者的英特尔锐炫Pro GPU系列,发布英特尔® Gaudi 3 AI
    发表于 05-20 11:03 1912次阅读