0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

英特尔集成显卡+ChatGLM3大语言模型的企业本地AI知识库部署

英特尔物联网 来源:英特尔物联网 2024-03-29 11:07 次阅读

前言

在当今的企业环境中,信息的快速获取和处理对于企业的成功至关重要。为了满足这一需求,我们可以将RAG技术与企业本地知识库相结合,以提供实时的、自动生成的信息处理和决策支持。这将有助于企业更好地应对快速变化的市场环境,提高企业的竞争力和创新能力。

企业本地知识库是一个集中存储和管理企业内部知识的系统。它包含了企业的历史数据、经验教训、最佳实践、流程文档、产品信息等。企业本地知识库是企业智慧的结晶,对于企业的运营和发展具有重要意义。

将RAG技术与企业本地知识库相结合,可以为企业带来以下几个方面的优势:

1

实时性

RAG技术可以实时地从企业本地知识库中提取相关信息,并生成用户所需的内容。这意味着用户可以快速地获取到最新的知识和信息,而不需要花费大量时间去查找和整理。

2

自动化

RAG技术可以自动地处理和生成内容,减少了人工干预的需求。这不仅可以提高企业的效率,还可以减少人为错误的发生。

3

个性化和定制化

RAG技术可以根据用户的需求和偏好,生成个性化的内容。通过与企业本地知识库的结合,可以提供更加精准和有针对性的信息,满足不同用户的需求。

4

知识共享和传承

企业本地知识库是一个集中存储和共享知识的平台。通过与RAG技术的结合,可以将这些知识快速地传递给需要的用户,促进知识的共享和传承。

1

RAG简介

RAG - Retrieval-Augmented Generation(检索增强生成)是一种先进的自然语言处理(NLP)技术,它结合了信息检索(Retrieval)和神经网络生成(Generation)两种方法,以提升模型在生成文本时的准确性和相关性。在传统的生成模型中,模型依据自身学习到的知识库生成文本。然而,这种方法受限于模型训练时所接触到的数据范围,特别是在处理未见的、需要实时查找新信息的场景时,可能无法生成最新或最准确的内容。

RAG模型通过引入一个检索组件,在接收到输入问题或任务后,首先从大规模预定义的知识库(如网页、文档集合或其他结构化/非结构化数据源)中检索与任务相关的信息片段。然后,检索到的信息作为额外的上下文输入,与原始输入一起传递给生成模型。生成模型在此基础上,利用检索到的信息以及自身的语言模型能力,生成更为精确、详尽且与现实世界信息保持同步的回答或文本内容。

简单来说,RAG模型就是在传统生成模型的基础上增加了一个动态获取外部知识的能力,这样既保留了大模型生成连贯文本的优点,又解决了由于模型记忆限制导致的知识更新和准确性不足的问题,尤其适用于问答系统、对话系统及需要实时更新信息的自然语言处理任务。

504d318a-ece7-11ee-a297-92fbcf53809c.png

2

OpenVINO Notebook简介

OpenVINO Notebooks是一套以Jupyter Notebook为载体的开源交互式编程教程和示例代码合集,由英特尔公司开发和维护。这套资源专为使用 OpenVINO 工具套件的开发者设计,旨在帮助他们更快地理解和掌握如何利用 OpenVINO 进行深度学习模型的优化与推理及实际部署AI在各式业务应用场景里面。

50752faa-ece7-11ee-a297-92fbcf53809c.png

3

部署平台简介

算力魔方是一款可以DIY的迷你主机,采用了抽屉式设计,后续组装、升级、维护只需要拔插模块。通过选择计算模块的版本,再搭配不同额 IO 模块可以组成丰富的配置,适应不同场景。性能不够时,可以升级计算模块提升算力, 如需要显卡可加上显卡, IO 接口不匹配时,可以更换 IO 模块调整功能,而无需重构整个系统。本文在带有英特尔12代酷睿i7-1265U芯片组里的锐炬 Xe集成显卡+RAM 32GB的算力魔方上完成验证。

4

在集成显卡上部署RAG

4.1

搭建OpenVINO Notebooks开发环境

第一步:请使用下面的命令克隆存储库创建并激活名为“openvino_env”的虚拟环境

git clone https://github.com/openvinotoolkit/openvino_notebooks.git
cd openvino_notebooks
conda create -n openvino_env python=3.9

50b015a2-ece7-11ee-a297-92fbcf53809c.png

第二步:请使用下面的命令激活虚拟环境并安装依赖包,并启动Jupyter Notebooks

conda activate openvino_env
pip install -r requirements.txt

511c6d4c-ece7-11ee-a297-92fbcf53809c.png

jupyter lab notebooks

5143f5f6-ece7-11ee-a297-92fbcf53809c.png

4.2

下载模型到本地

请使用命令将ChatGLM3 6B和text2vec模型下载到本地

git clone https://www.modelscope.cn/ZhipuAI/chatglm3-6b.git

51638e98-ece7-11ee-a297-92fbcf53809c.png

git clone https://www.modelscope.cn/Jerry0/text2vec-large-chinese.git

5179773a-ece7-11ee-a297-92fbcf53809c.png

4.3

运行254-rag-chatbot程序

请运行Notebooks里面的代码模块, 注意!! 国内用户请勿运行模块1,从模块2开始一步步运行代码到NNCF模块,模型压缩选择int4并按照下图一及二图修改notebooks 254里的代码引导程序指定对应的模型路径完成ChatGLM3-6b模型int 4量化及部署

519b22c2-ece7-11ee-a297-92fbcf53809c.png

图一

51b0f96c-ece7-11ee-a297-92fbcf53809c.png

图二

text2vec-large-chinese 模型部署

51d88414-ece7-11ee-a297-92fbcf53809c.png

运行结果,如下所示:本地知识库已成功加入ChatGLM 6B模型里并精确回答问题

51f27da6-ece7-11ee-a297-92fbcf53809c.png

运行视频.avi

5

总结

将RAG技术与企业本地知识库相结合,可以为企业提供实时、自动化、个性化和定制化的信息处理和决策支持。这将有助于企业更好地应对快速变化的市场环境,提高企业的竞争力和创新能力。

利用OpenVINO 工具套件简单易用,仅需三步即可在算力魔方完成开发环境搭建及模型的INT4量化且在英特尔集成显卡上的部署实现RAG企业本地知识库部署。




审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英特尔
    +关注

    关注

    60

    文章

    9421

    浏览量

    168826
  • 深度学习
    +关注

    关注

    73

    文章

    5237

    浏览量

    119910
  • 大模型
    +关注

    关注

    2

    文章

    1516

    浏览量

    1104
  • OpenVINO
    +关注

    关注

    0

    文章

    59

    浏览量

    91

原文标题:英特尔集成显卡+ChatGLM3大语言模型的企业本地AI知识库部署 | 开发者实战

文章出处:【微信号:英特尔物联网,微信公众号:英特尔物联网】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    简单三步使用OpenVINO™搞定ChatGLM3本地部署

    英特尔 OpenVINO™ 工具套件是一款开源 AI 推理优化部署的工具套件,可帮助开发人员和企业加速生成式人工智能 (AIGC)、大语言
    的头像 发表于 04-03 18:18 1110次阅读
    简单三步使用OpenVINO™搞定<b class='flag-5'>ChatGLM3</b>的<b class='flag-5'>本地</b><b class='flag-5'>部署</b>

    三步完成在英特尔独立显卡上量化和部署ChatGLM3-6B模型

    ChatGLM3 是智谱 AI 和清华大学 KEG 实验室联合发布的新一代对话预训练模型ChatGLM3-6B 是 ChatGLM3 系列
    的头像 发表于 01-11 18:04 993次阅读
    三步完成在<b class='flag-5'>英特尔</b>独立<b class='flag-5'>显卡</b>上量化和<b class='flag-5'>部署</b><b class='flag-5'>ChatGLM</b>3-6B<b class='flag-5'>模型</b>

    集成在主板上的独立显卡是属于集成显卡还是独立显卡的范围?

    集成在主板上的独立显卡是属于集成显卡还是独立显卡的范围? 集成在主板上的独立显卡可说是介于
    的头像 发表于 01-09 14:20 248次阅读

    ChatGLM3-6B在CPU上的INT4量化和部署

    ChatGLM3 是智谱 AI 和清华大学 KEG 实验室联合发布的新一代对话预训练模型ChatGLM3-6B 是 ChatGLM3 系列
    的头像 发表于 01-05 09:36 556次阅读
    <b class='flag-5'>ChatGLM</b>3-6B在CPU上的INT4量化和<b class='flag-5'>部署</b>

    【爱芯派 Pro 开发板试用体验】在爱芯派部署ChatGLM3(一)

    ChatGLM3是由智谱AI和清华大学KEG实验室联合发布的第三代大型语言模型,是基于GLM-130B的对话微调版本,国内首个全线对标OpenAI产品线,官网:https://
    发表于 12-17 22:54

    集成显卡和独立显卡有什么区别?

    集成显卡和独立显卡有什么区别? 集成显卡和独立显卡是两种不同的图形处理单元,它们在计算机图形处理方面具有一些显著的区别。本文将详尽、详实、细致地介绍这两种
    的头像 发表于 12-11 15:31 763次阅读

    #高通 #英特尔 #Elite 高通X Elite芯片或终结苹果、英特尔的芯片王朝

    高通英特尔苹果
    深圳市浮思特科技有限公司
    发布于 :2023年10月27日 16:46:07

    如何本地部署模型

    近期,openEuler A-Tune SIG在openEuler 23.09版本引入llama.cpp&chatglm-cpp两款应用,以支持用户在本地部署和使用免费的开源大语言
    的头像 发表于 10-18 11:48 1675次阅读
    如何<b class='flag-5'>本地</b><b class='flag-5'>部署</b>大<b class='flag-5'>模型</b>

    酷睿轻薄本也能运行大语言模型英特尔推动 PC 生成式 AI 落地

    展示了他们在 AIGC 上的技术方向,并进行了多个应用的演示。 首先,英特尔介绍了他们在大语言模型方面的优化和支持。在我们传统的认知里,运行类似 ChatGPT 这种大语言
    的头像 发表于 08-25 09:26 751次阅读
    酷睿轻薄本也能运行大<b class='flag-5'>语言</b><b class='flag-5'>模型</b>,<b class='flag-5'>英特尔</b>推动 PC 生成式 <b class='flag-5'>AI</b> 落地

    一个简单模型就让ChatGLM性能大幅提升 | 最“in”大模型

    引言 自大语言模型 (LLM) 成为热点话题以来,涌现了一大批中文大语言模型并在优化平台中得到了积极部署
    的头像 发表于 08-19 11:15 494次阅读
    一个简单<b class='flag-5'>模型</b>就让<b class='flag-5'>ChatGLM</b>性能大幅提升 | 最“in”大<b class='flag-5'>模型</b>

    Ai 部署的临界考虑电子指南

    虽然GPU解决方案对训练,AI部署需要更多。 预计到2020年代中期,人工智能行业将增长到200亿美元,其中大部分增长是人工智能推理。英特尔Xeon可扩展处理器约占运行AI推理的处理器
    发表于 08-04 07:25

    英特尔媒体加速器参考软件Linux版用户指南

    英特尔媒体加速器参考软件是用于数字标志、交互式白板(IWBs)和亭位使用模型的参考媒体播放器应用软件,它利用固定功能硬件加速来提高媒体流速、改进工作量平衡和资源利用,以及定制的图形处理股(GPU)管道解决方案。该用户指南将介绍和解释如何为Linux* 使用
    发表于 08-04 06:34

    使用英特尔开发者套件搭建RTMP流媒体服务器

    推流的基础上,我们可以部署AI模型实现对视频流的 AI 处理。并且,我们将充分利用CPU所携带的集成显卡(iGPU)进行视频的编解码加速和
    的头像 发表于 07-18 15:58 412次阅读
    使用<b class='flag-5'>英特尔</b>开发者套件搭建RTMP流媒体服务器

    ChatGLM-6B的局限和不足

    基于ChatGLM-6B 部署本地私有化ChatGPT 一、开源模型 1、ChatGLM-6B介绍 清华大学
    的头像 发表于 06-25 11:50 4766次阅读
    <b class='flag-5'>ChatGLM</b>-6B的局限和不足

    显卡独立显卡集成显卡的区别

    显卡独立显卡集成显卡的区别 独立显卡集成显卡之间最大的区别在于其显存是独立的还是共享的。独立显卡
    的头像 发表于 06-01 10:38 1633次阅读