电子发烧友App

硬声App

0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

电子发烧友网>人工智能>探索LangChain:构建专属LLM应用的基石

探索LangChain:构建专属LLM应用的基石

收藏

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

评论

查看更多

相关推荐

【比特熊充电栈】实战演练构建LLM对话引擎

Guardrails 与 Azure OpenAI 结合使用,构建更加安全可靠的 LLM 对话引擎? 本期 【比特熊充电栈】 NVIDIA 企业
2023-09-19 13:40:04717

突破边界:高性能计算引领LLM驶向通用人工智能AGI的创新纪元

ChatGPT的成功带动整个AIGC产业的发展,尤其是LLM(大型语言模型,大语言模型)、NLP、高性能计算和深度学习等领域。LLM的发展将为全球和中国AI芯片、AI服务器市场的增长提供强劲动力,据估算,LLM将为全球和中国AI服务器带来约891.2亿美元和338.2亿美元的市场空间。
2023-06-25 14:31:15575

对比解码在LLM上的应用

为了改进LLM的推理能力,University of California联合Meta AI实验室提出将Contrastive Decoding应用于多种任务的LLM方法。实验表明,所提方法能有效改进LLM的推理能力。让我们走进论文一探究竟吧!
2023-09-21 11:37:55327

TensorRT-LLM初探(一)运行llama

TensorRT-LLM正式出来有半个月了,一直没有时间玩,周末趁着有时间跑一下。
2023-11-16 17:39:34772

基于ICL范式的LLM的最高置信度预测方案

本文假设不同的ICL为LLM提供了关于任务的不同知识,导致对相同数据的不同理解和预测。因此,一个直接的研究问题出现了:llm能否用多个ICL提示输入来增强,以提供最可信的预测?为解决这个问题,本文提出上下文采样(ICS)。ICS遵循三步流程:采样、增强和验证,如图1所示。
2023-11-24 11:20:46863

低比特量化技术如何帮助LLM提升性能

针对大语言模型 (LLM) 在部署过程中的性能需求,低比特量化技术一直是优化效果最佳的方案之一,本文将探讨低比特量化技术如何帮助 LLM 提升性能,以及新版 OpenVINO 对于低比特量化技术的支持。
2023-12-08 15:26:45554

基于OpenVINO和LangChain构建RAG问答系统

随着生成式 AI 的兴起,和大语言模型对话聊天的应用变得非常热门,但这类应用往往只能简单地和你“聊聊家常”,并不能针对某些特定的行业,给出非常专业和精准的答案。这也是由于大语言模型(以下简称 LLM
2023-12-25 11:10:42505

使用基于Transformers的API在CPU上实现LLM高效推理

英特尔 Extension for Transformers是英特尔推出的一个创新工具包,可基于英特尔 架构平台,尤其是第四代英特尔 至强 可扩展处理器(代号 SapphireRapids,SPR)显著加速基于Transformers的大语言模型( LargeLanguageModel,LLM)。
2024-01-22 11:11:061823

LLM3225

LLM3225 - Wire Wound Chip Inductors - TOKO, Inc
2022-11-04 17:22:44

LLM3225-R15H

LLM3225-R15H - Wire Wound Chip Inductors - TOKO, Inc
2022-11-04 17:22:44

LLM3225-R18H

LLM3225-R18H - Wire Wound Chip Inductors - TOKO, Inc
2022-11-04 17:22:44

LLM3225-R33H

LLM3225-R33H - Wire Wound Chip Inductors - TOKO, Inc
2022-11-04 17:22:44

LLM3225-R56H

LLM3225-R56H - Wire Wound Chip Inductors - TOKO, Inc
2022-11-04 17:22:44

LLM3225-R68H

LLM3225-R68H - Wire Wound Chip Inductors - TOKO, Inc
2022-11-04 17:22:44

探索者STM32F407

探索者STM32F407 DEVB_121X160MM 6~24V
2023-03-28 13:06:24

ArkUI开发趣味体验,快来抽取限量HarmonyOS专属头像!

本次ArkUI开发趣味体验活动,将手把手教大家如何在IDE里实操一个ArkUI程序,通过补充缺失代码,成功运行程序开启抽奖功能,抽取个人专属头像,做HarmonyOS第一批数字藏品家!同时本期提供
2022-12-08 17:20:47

DIY一款自己专属的手柄

玩游戏的小伙伴都知道,有的游戏需要使用游戏手柄体验才会更好,今天就我们来DIY一款自己专属的手柄!1.设计思路电脑游戏手柄和鼠标键盘一样属于USBHID设备,Window系统和Linux系统和各种
2021-07-21 09:32:48

HarmonyOS 探索之路——电子书上线啦!

的你还不知道如何上手吗?快来看看这本电子书下载地址:http://t.elecfans.com/ebook/118.html目录HarmonyOS 探索之路(1):开箱体验HarmonyOS 探索之路
2021-01-28 15:03:07

HarmonyOS初步探索系列文章汇总

文章! 鸿蒙初步探索系列:HarmonyOS初步探索01:下载安装DevEco StudioHarmonyOS初步探索02:开发第一个HarmonyOS应用HarmonyOS初步探索03:DevEco
2020-12-15 14:56:20

IEC61850协议通信的“基石”是什么?

这里给大家介绍一下IEC61850协议通信的“基石”— ASN.1编码。
2021-05-14 07:15:20

OPPO在5G标准、研发和应用探索方面有哪些布局?

11月15日,在重庆召开的《2018第二届国际手机产业领袖峰会——5G新世界·AI云生态》论坛上,OPPO全球副总裁刘畅表示,5G可以催生出更多前所未有的应用场景,OPPO正积极构建自身的5G技术能力,并在标准、研发和应用探索全方面的布局。OPPO全球副总裁刘畅
2019-09-11 11:51:52

【下载】《构建嵌入式LINUX系统(第二版)》

Linux内核的*新版本做过*新,并且加入之前未介绍 过的程序以便协助你: ·建立你自己的GNU development toolchain(开发工具链) ·为你的目标系统选用、设定、构建以及安装专属的内核
2018-04-10 18:00:43

便携设备电源管理设计技巧与难点探索

和通信电源的应用工程师于相旭,带我们走进电源管理技术的核心,一起探索便携电源管理技术现在,未来。欲了解便携设备电源管理技术,请点击本期话题讨论 话题讨论:构建低功耗不可或缺的电源管理技术嘉宾:Intersil 工业电源和通信电源的应用工程师 于相旭{:4_99:}
2014-10-14 16:08:22

利用卷积调制构建一种新的ConvNet架构Conv2Former

1、利用卷积探索一种更高效的编码空域特征的方式  本文旨在通过充分利用卷积探索一种更高效的编码空域特征的方式:通过组合ConvNet与ViT的设计理念,本文利用卷积调制操作对自注意力进行了简化,进而
2022-12-19 17:37:34

如何使用Arm Compiler 5工具链构建一个简单的C程序

使用Arm编译器构建hello世界教程向您展示了如何使用Arm Compiler 5工具链构建一个简单的C程序。 本教程超越了基础知识,探索Arm编译器5工具链的一些更高级的功能。 本教程假设您已经
2023-08-02 06:57:53

如何量身定做自己的专属Beacon?

如何量身定做自己的专属Beacon?
2021-05-20 06:39:17

打造专属电源方案

错开の折腾经历:ESP8266 NodeMCU文章目录前言一、准备1.材料清单2.设计思路二、焊接三、总结前言继续之前的项目,现在任务就是将实现的空调控制器集成于一块pcb板子上,并打造专属电源方案
2021-11-11 06:39:48

数据探索与数据预处理

目录1数据探索与数据预处理21.1 赛题回顾21.2 数据探索性分析与异常值处理21.3 相关性分析52特征工程82.1 光伏发电领域特征82.2 高阶环境特征112.3 特征选择113模型构建
2021-07-12 08:37:20

机器学习基石笔记

3)机器学习基石笔记 Lecture3:Types of Learning
2020-05-26 14:53:14

机器学习基石笔记分享

机器学习基石笔记01
2020-06-03 08:14:10

林轩田机器学习基石课程个人笔记

林轩田机器学习基石课程个人笔记-第二讲
2020-05-22 07:35:12

正点原子STM32系列——探索者V3开发板评测报告聚合帖

】+I2C驱动OLED jinglixix 【正点原子STM32探索者V3开发板体验】初识STM32F407开发板 【正点原子STM32探索者V3开发板体验】 开发环境的构建与GPIO口的使用 【正点
2023-05-10 15:52:16

物联网的基石-MQTT协议初识

1、物联网的基石-mqtt协议初识随着 5G 时代的来临,万物互联的伟大构想正在成为现实。联网的 物联网设备 在 2018 年已经达到了 70 亿,在未来两年,仅智能水电气表就将超过10亿。海量
2022-09-08 16:03:12

精通信号处理设计小Tips(3):必须掌握的三大基石

,以及对应的硬件设计实现能力;具备通信物理层开发设计各个方面的实战经 验...  精通信号处理设计小Tips(3):必须掌握的三大基石  信号与信息处理涵盖的内容相当广泛,并和自动控制,计算机等其他
2013-12-09 22:25:24

选择蓝牙开发板 启动你的专属Beacon!

选择蓝牙开发板启动你的专属Beacon!
2021-05-21 06:45:22

彩虹AA电池 宾得彩色单反专属

  彩虹AA电池 宾得彩色单反专属 2009年11月16日17:59:24
2009-11-16 17:59:34762

专属iPhone的两款时尚充电器

著名的苹果配件生产商Bracketron公布了最新专属iPhone 4和IPhone 4S打造的MetalDock充电设备。
2012-05-09 09:05:36405

e络盟推出专属网站平台,帮助用户构建并推广面向TI MCU LaunchPad的全新BoosterPack扩展板

2013年10月21日,e络盟日前宣布推出全新专属网站平台‘构建你的BoosterPack’,为设计师创造自己独有的BoosterPack提供资源支持。BoosterPack是一款针对TI微控制器
2013-10-22 12:00:58869

这么萌还不买?红米Note4X初音专属配色图赏

红米Note 4X 多彩金属,超长续航,这是我们对国民手机的全新定义。这一次也特地邀请到初音未来,带来她的专属配色款。极具特色的初音未来专属配色,不仅使手机有了一个独特的外观,还代表着对未来的无限期待。
2017-03-28 14:34:202997

构建专属于你的CAN-bus应用层协议

随着CAN-bus相关芯片价格的下降,内置CAN控制器MCU的增多,CAN-bus当前已经进入了众多早期由于成本问题无法使用的领域,成为极具生命力的现场总线,今天我们就来探讨如何构建专属自己的CAN-bus应用层协议。
2017-05-02 15:31:379

如何构建专属自己的CAN-bus应用层协议

随着CAN-bus相关芯片价格的下降,内置CAN控制器MCU的增多,CAN-bus当前已经进入了众多早期由于成本问题无法使用的领域,成为极具生命力的现场总线,今天我们就来探讨如何构建专属自己的CAN-bus应用层协议。
2017-05-04 15:39:05954

存储 IC——现代信息技术的基石

存储器可以说是大数据时代的基石
2019-06-06 11:23:327592

5G手机需专属应用场景

本文主要讲述了:若无专属应用场景,5G手机或成为无米之炊
2019-08-15 10:50:375639

如何定义一个Blocklet基石程序

Blocklet(基石程序) 是供开发者和社区用户在ArcBlock平台上创建事物的可重用构建模块。简单来说,Blocklet 可以是任何现成的组件、模块、库、前端视图或其他简化构建 dApp(去中心化应用)过程的工具。
2019-09-30 10:26:43273

特斯拉Roadster车主的专属服务

日前据外媒报道,特斯拉向Roadster车主发送了邮件,声称将为车主提供包括专属的服务顾问在内的“专属渠道”,以改善多年来特斯拉对Roadster车主的服务。并邀请Roadster车主用他们的旧车抵价购买新款特斯拉电动汽车,或者用于购买最新的Roadster跑车。
2019-12-05 16:35:512249

属于使用Keil朋友的专属文章

一篇属于使用Keil朋友的专属文章
2020-03-14 14:38:551326

英特尔构建智慧云基石,推动企业在数字经济时代前进

“后新冠时代”,在线(云)上,人与人的交流变得更加容易。4月底,“英特尔构建智慧云基石”线上沙龙如约举行,英特尔及合作伙伴的专家们,围绕着“快捷上云、高效用云、轻松管云”三个核心点,又延展
2020-05-09 14:46:163205

高通安蒙:构建无线技术的未来,探索5G未来之路

“What’s Next in 5G”系列视频迎来了最后一集,将由高通公司总裁兼候任CEO安蒙为大家解析高通将如何构建无线技术的未来,探索5G未来之路。 以下为安蒙演讲全文: 5G未来
2021-03-02 11:29:571512

浪潮存储助力九寨沟构建智慧产业升级的数据基石

为游客营造信息对称、安全、舒适、有序、交通顺畅的旅游环境,九寨沟借助数字科技技术构建了智慧旅游大数据综合管理平台,在坚持以景区生态环境承载量为第一前提的“保护型发展”原则,打造兼顾人与自然
2021-12-30 11:31:22999

汽车网络安全左移实践——基于信任构建汽车安全的探索

汽车网络安全左移实践——基于信任构建汽车安全的探索
2023-02-06 15:06:56611

LangChain:为你定制一个专属的GPT

LangChain 可以轻松管理与语言模型的交互,将多个组件链接在一起,并集成额外的资源,例如 API 和数据库。其组件包括了模型(各类LLM),提示模板(Prompts),索引,代理(Agent),记忆等等。
2023-04-24 11:27:23980

如何利用LLM做多模态任务?

大型语言模型LLM(Large Language Model)具有很强的通用知识理解以及较强的逻辑推理能力,但其只能处理文本数据。虽然已经发布的GPT4具备图片理解能力,但目前还未开放多模态输入接口并且不会透露任何模型上技术细节。因此,现阶段,如何利用LLM做一些多模态任务还是有一定的研究价值的。
2023-05-11 17:09:16648

如何利用LLM做一些多模态任务

本文整理了近两年来基于LLM做vision-lanuage任务的一些工作,并将其划分为4个类别:
2023-05-17 15:02:35575

LangChain简介

对 ChatGPT 等应用着迷?想试验他们背后的模型吗?甚至开源/免费模型?不要再观望……LangChain 是必经之路……
2023-05-22 09:14:567793

邱锡鹏团队提出具有内生跨模态能力的SpeechGPT,为多模态LLM指明方向

大型语言模型(LLM)在各种自然语言处理任务上表现出惊人的能力。与此同时,多模态大型语言模型,如 GPT-4、PALM-E 和 LLaVA,已经探索LLM 理解多模态信息的能力。然而,当前
2023-05-22 14:38:06417

LLM性能的主要因素

现在是2023年5月,截止目前,网络上已经开源了众多的LLM,如何用较低的成本,判断LLM的基础性能,选到适合自己任务的LLM,成为一个关键。 本文会涉及以下几个问题: 影响LLM性能的主要因素
2023-05-22 15:26:201148

如何利用LLM做多模态任务?

大型语言模型LLM(Large Language Model)具有很强的通用知识理解以及较强的逻辑推理能力,但其只能处理文本数据。虽然已经发布的GPT4具备图片理解能力,但目前还未开放多模态输入接口
2023-05-22 15:57:33466

如何最好地使用所有可用的 LLM 工具

鉴于价格和质量的广泛差异,从业者可能很难决定如何最好地使用所有可用的 LLM 工具。此外,如果服务中断,则依赖单个 API 提供者是不可靠的,这可能发生在意外高需求的情况下。
2023-05-23 17:22:30525

LLM在各种情感分析任务中的表现如何

  最近几年,GPT-3、PaLM和GPT-4等LLM刷爆了各种NLP任务,特别是在zero-shot和few-shot方面表现出它们强大的性能。因此,情感分析(SA)领域也必然少不了LLM的影子
2023-05-29 17:24:411379

微软将向美国政府客户提供OpenAI的GPT模型

微软增加了对大型语言模型(llm)的支持。openai推出chatgpt后,llm的使用大幅增加,微软持有openai的股份,许多类型的公司争相在llm构建功能。
2023-06-08 10:35:43759

大型语言模型(LLM)的自定义训练:包含代码示例的详细指南

近年来,像 GPT-4 这样的大型语言模型 (LLM) 因其在自然语言理解和生成方面的惊人能力而受到广泛关注。但是,要根据特定任务或领域定制LLM,定制培训是必要的。本文提供了有关自定义训练 LLM 的详细分步指南,其中包含代码示例和示例。
2023-06-12 09:35:431783

Macaw-LLM:具有图像、音频、视频和文本集成的多模态语言建模

尽管指令调整的大型语言模型 (LLM) 在各种 NLP 任务中表现出卓越的能力,但它们在文本以外的其他数据模式上的有效性尚未得到充分研究。在这项工作中,我们提出了 Macaw-LLM,一种新颖的多模式 LLM,它无缝集成了视觉、音频和文本信息。
2023-06-19 10:35:33876

基于Transformer的大型语言模型(LLM)的内部机制

本文旨在更好地理解基于 Transformer 的大型语言模型(LLM)的内部机制,以提高它们的可靠性和可解释性。 随着大型语言模型(LLM)在使用和部署方面的不断增加,打开黑箱并了解它们的内部
2023-06-25 15:08:49991

基于一个完整的 LLM 训练流程

    在这篇文章中,我们将尽可能详细地梳理一个完整的 LLM 训练流程。包括模型预训练(Pretrain)、Tokenizer 训练、指令微调(Instruction Tuning)等环节。 文末
2023-06-29 10:08:591202

LangChain跑起来的3个方法

使用 LangChain 开发 LLM 应用时,需要机器进行 GLM 部署,好多同学第一步就被劝退了,
2023-07-05 09:59:06797

最新综述!当大型语言模型(LLM)遇上知识图谱:两大技术优势互补

LLM 是黑箱模型,缺乏可解释性,因此备受批评。LLM 通过参数隐含地表示知识。因此,我们难以解释和验证 LLM 获得的知识。此外,LLM 是通过概率模型执行推理,而这是一个非决断性的过程。对于 LLM 用以得出预测结果和决策的具体模式和功能,人类难以直接获得详情和解释。
2023-07-10 11:35:001354

什么是LangChain?深入地了解一下LangChain

在日常生活中,我们通常致力于构建端到端的应用程序。有许多自动机器学习平台和持续集成/持续交付(CI/CD)流水线可用于自动化我们的机器学习流程。我们还有像 Roboflow 和 Andrew N.G. 的 Landing AI 这样的工具,可以自动化或创建端到端的计算机视觉应用程序。
2023-07-14 09:50:5715274

适用于各种NLP任务的开源LLM的finetune教程~

ChatGLM2-6b是清华开源的小尺寸LLM,只需要一块普通的显卡(32G较稳妥)即可推理和微调,是目前社区非常活跃的一个开源LLM
2023-07-24 09:04:221311

LLM对程序员的冲击和影响

LLM 对软件研发的单点提效,我之前录制过一段视频,大家可以直接观看,里面有详细的演示,我在这里就不再赘述了。
2023-07-24 15:39:06766

LLM的长度外推浅谈

苏神最早提出的扩展LLM的context方法,基于bayes启发得到的公式
2023-07-28 17:37:431484

MLC-LLM的编译部署流程

MLC-LLM部署在各种硬件平台的需求,然后我就开始了解MLC-LLM的编译部署流程和RWKV World模型相比于MLC-LLM已经支持的Raven系列模型的特殊之处。 MLC-LLM的编译部署流程
2023-09-04 09:22:461569

检索增强LLM的方案全面的介绍

分分享了 ChatGPT 这类模型是如何一步一步训练的,后半部分主要分享了 LLM 模型的一些应用方向,其中就对检索增强 LLM 这个应用方向做了简单介绍。
2023-09-08 16:39:55799

mlc-llm对大模型推理的流程及优化方案

在 MLC-LLM 部署RWKV World系列模型实战(3B模型Mac M2解码可达26tokens/s) 中提到要使用mlc-llm部署模型首先需要一个编译过程,将原始的基于Realx搭建的模型
2023-09-26 12:25:55383

新型威胁:探索LLM攻击对网络安全的冲击

最令人担忧的也许是,目前尚不清楚 LLM 提供商是否能够完全修复此类行为。在过去的 10 年里,在计算机视觉领域,类似的对抗性攻击已经被证明是一个非常棘手的问题。有可能深度学习模型根本就无法避免这种威胁。因此,我们认为,在增加对此类人工智能模型的使用和依赖时,应该考虑到这些因素。
2023-10-11 16:28:37482

Continuous Batching:解锁LLM潜力!让LLM推断速度飙升23倍,降低延迟!

本文介绍一篇 LLM 推理加速技术 相关的文章,值得读一读。 LLMs 在现实应用中的计算成本主要由服务成本所主导,但是传统的批处理策略存在低效性。在这篇文章中,我们将告诉
2023-10-15 20:25:02292

在线研讨会 | 基于 Jetson 边缘计算平台构建 Azure OpenAI LLM 安全护栏

,并通过自定义方式响应用户特定的请求,按照预定义的对话路径进行操作,以及使用特定的语言风格进行回答等。它的核心价值在于通过 Colang 语言来编写安全护栏,来指导、定义和控制 LLM 驱动的对话机器人在特定主题上的行为,从而构建可靠、安全的 LLM 对话系统。 如何在
2023-10-21 16:35:03215

Hugging Face LLM部署大语言模型到亚马逊云科技Amazon SageMaker推理示例

 本篇文章主要介绍如何使用新的Hugging Face LLM推理容器将开源LLMs,比如BLOOM大型语言模型部署到亚马逊云科技Amazon SageMaker进行推理的示例。我们将部署12B
2023-11-01 17:48:42422

LLM的Transformer是否可以直接处理视觉Token?

多种LLM Transformer都可以提升Visual Encoding。例如用LLaMA和OPT的不同Transformer层都会有提升,而且不同层之间也会体现不同的规律。
2023-11-03 14:10:15181

NVIDIA AI Foundation Models:使用生产就绪型 LLM 构建自定义企业聊天机器人和智能副驾

  系列基础模型是一套功能强大的全新工具,可用于为企业构建生产就绪生成式 AI 应用,从而推动从客服 AI 聊天机器人到尖端 AI 产品的各种创新。 这些新的基础模型现已加入  NVIDIA NeMo 。这个端到端框架用于构建、自定义和部署专为企业定制的 LLM。企业现在可以使用这些工具快速
2023-11-17 21:35:01469

LLM的幻觉问题最新综述

幻觉被描述为无意义或不忠实于所提供源内容的生成内容。根据与源内容的矛盾,这些幻觉又进一步分为内在幻觉和外在幻觉。在LLMs中,幻觉的范围包含了一个更广泛、更全面的概念,主要集中在事实错误上。本文重新定义了幻觉的分类,为LLM应用程序提供了一个更定制的框架。
2023-11-22 17:40:41467

基于单一LLM的情感分析方法的局限性

LLM的发展为情感分析任务带来的新的解决方案。有研究人员使用LLM,在上下文学习(in-context learning, ICL)的范式下,仅使用少量的训练示例就能够实现与监督学习策略旗鼓相当的性能表现。
2023-11-23 11:14:27322

基于Redis Enterprise,LangChain,OpenAI 构建一个电子商务聊天机器人

鉴于最近人工智能支持的API和网络开发工具的激增,许多科技公司都在将聊天机器人集成到他们的应用程序中。LangChain是一种备受欢迎的新框架,近期引起了广泛关注。该框架旨在简化开发人员与语言模型
2023-11-25 08:04:13178

专栏发布 | LLM圈走马换将?微软广告“黑五”来袭 !

过 去一年并不平凡 。 从去年11月至今,LLM大型语言模型持续破圈、始终盘踞热点话题之列。 根据Adobe Analytics的最新在线购物预测,感恩节本土市场假日季的在线收入,或将有
2023-11-27 08:15:02215

Long-Context下LLM模型架构全面介绍

随着ChatGPT的快速发展,基于Transformer的大型语言模型(LLM)为人工通用智能(AGI)铺平了一条革命性的道路,并已应用于知识库、人机界面和动态代理等不同领域。然而,存在一个普遍
2023-11-27 17:37:36440

Ambarella展示了在其CV3-AD芯片上运行LLM的能力

Ambarella前不久展示了在其CV3-AD芯片上运行LLM的能力。这款芯片是CV3系列中最强大的,专为自动驾驶设计。
2023-11-28 09:05:311192

怎样使用Accelerate库在多GPU上进行LLM推理呢?

大型语言模型(llm)已经彻底改变了自然语言处理领域。随着这些模型在规模和复杂性上的增长,推理的计算需求也显著增加。
2023-12-01 10:24:52396

如何利用OpenVINO加速LangChainLLM任务

LangChain 是一个高层级的开源的框架,从字面意义理解,LangChain 可以被用来构建 “语言处理任务的链条”,它可以让AI开发人员把大型语言模型(LLM)的能力和外部数据结合起来,从而
2023-12-05 09:58:14325

全面解析大语言模型(LLM

internal feedback:使用LLM去预测生成的plan取得成功的概率、Tree of Thought去对比不同的plan(有点类似AlphaGo的蒙特卡诺搜索的意思)、对中间结果进行评估并作为长期记忆存储
2023-12-05 14:49:47857

一文详解LLM模型基本架构

LLM 中非常重要的一个概念是 Token,我们输入给 LLM 和它输出的都是 Token。Token 在这里可以看做语言的基本单位,中文一般是词或字(其实字也是词)。比如:”我们喜欢 Rust
2023-12-25 10:38:38657

优于10倍参数模型!微软发布Orca 2 LLM

微软发布 Orca 2 LLM,这是 Llama 2 的一个调优版本,性能与包含 10 倍参数的模型相当,甚至更好。
2023-12-26 14:23:16247

LangChain 0.1版本正式发布

LangChain 由 Harrison Chase 于 2022 年 10 月推出,是一个开源编排框架,用于使用 LLM 开发应用程序,推出后迅速脱颖而出,截至 2023 年 6 月,它是 GitHub 上增长最快的开源项目。
2024-01-10 10:28:28391

用Redis为LangChain定制AI代理——OpenGPTs

OpenAI最近推出了OpenAIGPTs——一个构建定制化AI代理的无代码“应用商店”,随后LangChain开发了类似的开源工具OpenGPTs。OpenGPTs是一款低代码的开源框架,专用
2024-01-13 08:03:59521

虹科分享 | 用Redis为LangChain定制AI代理——OpenGPTs

OpenAI最近推出了OpenAI GPTs——一个构建定制化AI代理的无代码“应用商店”,随后LangChain开发了类似的开源工具OpenGPTs。OpenGPTs是一款低代码的开源框架,专用于构建定制化的人工智能代理。
2024-01-18 10:39:08121

2023年LLM大模型研究进展

作为做LLM应用的副产品,我们提出了RLCD[11],通过同时使用正例和负例prompt,自动生成带标签的生成样本不需人工标注,然后可以接大模型微调,或者用于训练reward models
2024-01-19 13:55:33178

LLM推理加速新范式!推测解码(Speculative Decoding)最新综述

这个问题随着LLM规模的增大愈发严重。并且,如下左图所示,目前LLM常用的自回归解码(autoregressive decoding)在每个解码步只能生成一个token。这导致GPU计算资源利用率
2024-01-29 15:54:24261

100%在树莓派上执行的LLM项目

ChatGPT的人性口语化回复相信许多人已体验过,也因此掀起一波大型语言模型(Large Language Model, LLM)热潮,LLM即ChatGPT背后的主运作技术,但LLM运作需要庞大运算力,因此目前多是在云端(Cloud)上执行。
2024-02-29 16:29:59476

基于NVIDIA Megatron Core的MOE LLM实现和训练优化

本文将分享阿里云人工智能平台 PAI 团队与 NVIDIA Megatron-Core 团队在 MoE (Mixture of Experts) 大语言模型(LLM)实现与训练优化上的创新工作。
2024-03-22 09:50:3758

已全部加载完成