0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

LangChain:为你定制一个专属的GPT

阿尔法工场研究院 来源:阿尔法工场研究院 2023-04-24 11:27 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

导语:用户可以利用LangChain的模块来改善大语言模型的使用,通过输入自己的知识库来“定制化”自己的大语言模型。

LLM(大语言模型) 是一项变革性的技术,它将人类的各类知识和逻辑能力打包进入了一个体积庞大的模型当中。

但是通常来说,包括当前公认效果最好的LLM GPT-4都会有一个问题——事实问题错误,也常被称之为幻觉。幻觉(Hallucination),或者说人工智能幻觉是人工智能的自信反应。

当模型输出欺骗性数据的倾向时,其使用的的训练数据并不能证明输出的合理性。人工智能幻觉的危险之处之一是模型的输出看起来是正确的,其实它本质上是错误的。

基于这种前提条件下,若是直接将LLM利用于生产环境中(例如客服答疑,新形式文档等)时,那么事实幻觉就可能会造成极其严重的影响。

但是通过LangChain,我们可以通过将其它计算资源和自有的知识库结合。依托于当前的各类产品,在整合了当前的语料资源库后,各类LLM都会进入到一个新的实用化发展阶段。

LangChain介绍

LangChain是一个用于开发基于语言模型的应用程序开发框架。总的来说,LangChain是一个链接面向用户程序和LLM之间的一个中间层。

它在 2023 年 3 月获得了 Benchmark Capital 的 1000 万美元种子轮融资,在近期又拿到了红杉2000-2500万美金的融资,估值已经提升到了2亿美金左右。

LangChain 可以轻松管理与语言模型的交互,将多个组件链接在一起,并集成额外的资源,例如 API 和数据库。其组件包括了模型(各类LLM),提示模板(Prompts),索引,代理(Agent),记忆等等。

当前GitHub上的热门项目Auto-GPT和Babyagi所使用的链式思考能力都是由LangChain启发而来。

0bb89c10-df25-11ed-bfe3-dac502259ad0.png

LangChain项目主页图

LangChain工作流程

本次重点介绍LangChain搭配自有的知识库让LLM发挥更大功能的流程。

在缺少了上下文的情况下,即使是目前公认最顶级的LLM GPT-4也无法回答部分需要特定领域的知识。

而要是想仅用自有知识库来训练出LLMs又是不可能的,这个时候最好的方法就是利用LangChain的模块来改善LLM的使用,通过输入自己的知识库来“定制化”自己的LLM。

Question Answering over specific documents是一个写在LangChain主页的主推功能。翻译过来就是 基于特定文档的问答

1.准备自定义数据

准备好需要LLM学习的内容,它可以是一个纯文本文件或者其他类型的文本(不同类型的文本需要不同的文档加载器)。

2.拆分文档

一般来讲,每个文档都是由复杂长短句、多种语法结合写作而成的。在进行输入之前,就必须对这些文字进行解构处理。

对于英文LangChain一般会使用RecursiveCharacterTextSplitter处理。由于中文的复杂性,会使用到jieba等处理工具预处理中文语句。

3.文本嵌入(Embeddings)

处理完文本之后,就可以对文本进行嵌入(Embeddings)了。通过调用OpenAI的Embeddings API将文本向量化。在这步处理之后,文本就已经不再是文字,而是以向量化存储的信息。

再使用一个开源的Embeddings数据库ChromaDB保存Embeddings数据,就可以达到使用数据长期存储和快速调用。

0be7ed76-df25-11ed-bfe3-dac502259ad0.jpg

图:将原文本嵌入

4.使用链(Chain)对矢量数据库进行问答

在拥有了嵌入数据之后,我们就可以利用LangChain的强大链功能来执行我们的问答。这时就可以通过自然语言对于文档内容进行提问了。

0bfcdeb6-df25-11ed-bfe3-dac502259ad0.jpg

通过LangChain回答问题/完成任务

LangChain可能的应用场景

当前的AI热潮吸引了很多人,而除了ChatGPT这类问答还有New Bing这种搜索服务外,并没有什么可以将LLM商业化的案例。甚至可以说只有New Bing才是目前唯一一个成功的商业化案例。

LangChain为所有人提供了一个新的商业化方案。此前有将LLM导入客服软件中应用的方案,但是由于LLM容易出现事实幻觉而无法实施。

同时,将所需内容通过Prompt导入LLM的想法也由于LLM的对话(Context)输入限制而不可能实施。LangChain则通过将数据向量化避免了使用输入限制,从而将所需内容导入LLM进行问答。

当下的人工成本逐渐提升,例如淘宝客服等人工密集型产业的成本逐步提升。当前的智能问答距离可用仍有较远的距离。

通过已经预训练好的LLM是一个快速降本增效的方案。基于每个产品的数据,可以将数据引入LLM中,让LLM接替客服工作,准确、快速的回答客户的定制化问题,同时语气贴合自然口吻,避免了情绪化工作。

基于文档的工作还可以在各类公司培训和智能化文档方面提供作用。很多产品文档随着时间的积累变得越来越复杂,多层跳转也会让人学习起来效率低下且不适。

此时基于LangChain就可以将文档重新梳理,输出为大纲类,在使用的时候可以随时通过问答的形式将内容输出。类似于新员工培训和产品说明书等等场景都可以有所应用。这就极大的拓宽了文字类LLM的使用场景。

0c24a89c-df25-11ed-bfe3-dac502259ad0.png

基于LangChain的问答

除了直接与人交互的方面外,还可以导入特定领域的知识库,实时更新LLM的内容,让LLM的知识时刻处于最新的状态。依赖于此,LangChain除了可以完成自然语言文档搜索外,还可以基于及时的资源进行快速开发。

0c482632-df25-11ed-bfe3-dac502259ad0.jpg

导入资源后LangChain开发出的网页

当前LangChain的局限性

目前,由于整个AI生态还处于一种快速发展期,各类工具和平台还没有完全成熟,因此LangChain的各类链和模块的定制性和功能都还不够强大。对于有高性能场景需求和定制化任务的可能需要自己重新修改。

事实合法性也是未来需要解决的一个痛点。LLM的各类越狱层出不穷。虽然在引入了嵌入之后LLM只会对文档内容进行问答,但是仍然需要有一套额外的监督系统防止出现任何非法的回答。

同时当前LangChain还有使用难度较高等问题。目前的各类AI工具都面临着普通用户无法轻松驾驭等等的问题,而LangChain的问题更盛。

普通产品或者开发者的上手学习成本较高,使用起来难度很大。这一切都需要社区和商业资本的共同投入才有可能解决。

结语

LangChain是当前众多的AGI实验性工具的基石项目。基于链(Chain)的LLM调用思维势必会贯穿未来LLM的发展生态。

提前关注AI发展动向,关注LangChain的开发进度,会对未来的AI应用落地有极大的帮助。

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    41060

    浏览量

    302571
  • 数据库
    +关注

    关注

    7

    文章

    4082

    浏览量

    68538
  • GPT
    GPT
    +关注

    关注

    0

    文章

    371

    浏览量

    16959

原文标题:LangChain:为你定制一个专属的GPT

文章出处:【微信号:alpworks,微信公众号:阿尔法工场研究院】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    GPT-5震撼发布:AI领域的重大飞跃

    电子发烧友网报道(文/李弯弯)2025年8月8日凌晨1点,OpenAI以场长达1小时的线上发布会正式推出GPT-5。这场被业界称为“AI进化分水岭”的发布,终结了长达两年的技术猜测,更以多维度性能
    的头像 发表于 08-09 07:44 1w次阅读
    <b class='flag-5'>GPT</b>-5震撼发布:AI领域的重大飞跃

    请教RTD GPT 配置问题

    ) RTD版本如下图: 我在我的项目中包含 GPT。我希望它从 0 到 5000 计数并重新开始。我面临的问题是似乎没有办法配置这个上限。这是
    发表于 04-15 08:32

    FastAPI+LangChain打造智能招聘系统

     未来招聘不再人工:FastAPI+LangChain 的经济价值与影响 AI 自动化招聘的技术背景 随着人工智能技术的迅速发展,企业招聘流程正在经历深刻变革。传统的招聘模式依赖人力资源部门通过简历
    的头像 发表于 04-14 14:26 101次阅读

    专属“数字员工”已到岗!迅RK3588系列开发板适配OpenClaw

    专属“数字员工”已到岗!迅RK3588系列开发板适配OpenClaw
    的头像 发表于 03-11 11:02 740次阅读
    <b class='flag-5'>你</b>的<b class='flag-5'>专属</b>“数字员工”已到岗!迅<b class='flag-5'>为</b>RK3588系列开发板适配OpenClaw

    专属“数字员工”已到岗!迅RK3588系列适配OpenClaw

    专属“数字员工”已到岗!迅RK3588系列适配OpenClaw
    的头像 发表于 02-27 15:33 797次阅读
    <b class='flag-5'>你</b>的<b class='flag-5'>专属</b>“数字员工”已到岗!迅<b class='flag-5'>为</b>RK3588系列适配OpenClaw

    [工具讨论] 如果有款国产图形化配置工具STM32Cube,支持所有内核和厂商MCU,会用吗?

    涉及多家厂商芯片时,要在多个工具间切换 如果有款这样的工具 我们想和大家讨论假设性问题: 如果有款国产的图形化配置工具,具备以下特性,
    发表于 01-26 10:30

    定制灌封胶_特殊场景灌封胶定制化服务流程与案例

    什么是灌封胶定制化? 灌封胶定制化是指根据客户具体的应用场景、工作环境、性能要求(如耐温、耐腐蚀、耐老化、导热、阻燃等)以及产品结构,量身研发和生产专属配方的灌封胶产品。不同于通用型产品,定制
    的头像 发表于 11-25 01:21 428次阅读
    <b class='flag-5'>定制</b>灌封胶_特殊场景灌封胶<b class='flag-5'>定制</b>化服务流程与案例

    IoT设备账号归属操作秘籍:专属固件全攻略来啦!

    。   、创建项目 首先,需要登录,并进入IoT管理页面。 点击【新建项目】,创建项目,以便后续将设备归属到此项目中来管控。 二、归属设备 接下来开始进行归属操作,首先点击【专属
    的头像 发表于 11-14 16:45 1125次阅读
    IoT设备账号归属操作秘籍:<b class='flag-5'>专属</b>固件全攻略来啦!

    专属固件助力IoT设备账号归属变更:详细操作说明!

    顺利完成操作。   、创建项目 首先,需要登录,并进入IoT管理页面。 点击【新建项目】,创建项目,以便后续将设备归属到此项目中来管控。 二、归属设备 接下来开始进行归属操作,首先点击【
    的头像 发表于 11-14 16:41 480次阅读
    <b class='flag-5'>专属</b>固件助力IoT设备账号归属变更:详细操作说明!

    GPT-5.1发布 OpenAI开始拼情商

    问题。 Sam Altman 发文称GPT-5.1是次不错的模型升级。 GPT-5.1 Instant:ChatGPT 最常用的模型,更温暖、更智能,也更善于遵循指令的模型。 GPT
    的头像 发表于 11-13 15:49 814次阅读

    【RA4M2-SENSOR】3、使用GPT定时器-PWM输出

    的信息 */ R_GPT_InfoGet(&g_timer2_ctrl, &info); /* 获得计时器周期需要的计数次数 */ uint32_t
    发表于 09-01 15:20

    杰和N150处理器体机主板,企业定制专属出口方案

    行业背景:“不出海,就出局”,对于投身体机电脑海外业务的企业而言,精准把握市场特性,提供契合需求的产品解决方案,是抢占市场份额的关键所在。杰和科技依托深厚的技术积淀与丰富的行业经验,合作伙伴定制
    的头像 发表于 07-31 13:44 1928次阅读
    杰和N150处理器<b class='flag-5'>一</b>体机主板,<b class='flag-5'>为</b>企业<b class='flag-5'>定制</b><b class='flag-5'>专属</b>出口方案

    【重磅】企业版华秋DFM&amp;华秋CAM正式发布!离线审查+定制开发+专属护航

    深度工艺审查规则 ,且更多工艺审查规则和企业版专属高阶功能持续新增中 3、企业级专属服务 ◆ 轻量 定制开发 (最快3天交付企业专用规则库) ◆ 代建元件库服务:元件库600万+,支持代建服务
    发表于 06-11 16:02

    F1®与亚马逊云科技联合推出全新在线体验 车迷可亲手打造专属赛道

    北京 ——2025 年 5 月 22 日 世界级方程式锦标赛®(以下简称:F1®)在其成立75周年之际,与亚马逊云科技联合推出了全新数字互动体验,使其车迷可自主创建、定制并分享其专属F1赛道
    发表于 05-22 11:40 1555次阅读

    使用CYUSB3065制作了定制电路板,并且想要配置我的定制传感器,遇到的几个疑问求解

    我已经使用 CYUSB3065 制作了定制电路板,并且想要配置我的定制传感器,但有几个问题。 1.I2C 时钟 如果我想用 2 通道设置配置 AR0144 传感器,这种情况下串行时
    发表于 05-15 08:14