如何训练自己的ChatGPT-电子发烧友网

LLM 这两周不断带给我们震撼与惊喜。GPT-4 的发布让大家对 LLM 的想象空间进一步扩大，而这些想象在本周眼花缭乱的 LLM 应用发布中逐渐成为现实，下面分享一位朋友训练ChatGPT的完整方案，供大家参考~

LLM 相关的开源社区这两周涌现了很多优秀的工作，吸引了很多人的关注。其中，我比较关注的是 Stanford 基于 LLaMA 的 Alpaca 和随后出现的 LoRA 版本 Alpaca-LoRA。原因很简单，便宜。

Alpaca 宣称只需要 600$ 不到的成本（包括创建数据集），便可以让 LLaMA 7B 达到近似 text-davinci-003 的效果。而 Alpaca-LoRA 则在此基础上，让我们能够以一块消费级显卡，在几小时内完成 7B 模型的 fine-turning。

下面是开源社区成员分享的可以跑通的硬件规格及所需时间：

根据大家分享的信息，fine-tune 7B 模型仅需要 8-10 GB vram。因此我们很有可能可以在 Google Colab 上完成你所需要的 fine-tune！

那么，说干就干！

为什么要训练自己的 ChatGPT ？

我想到了以下的方面：

对我个人而言，这非常非常 cooooool !
让模型能够讲我熟悉的语言
让模型替我写注释和测试代码
让模型学习产品文档，帮我回答用户提出的小白问题
...

计划

那么，为了训练自己的 Chat我们需要做那些事儿呢? 理论上需要如下步骤：

第一步：准备数据集

fine-tune 的目标通常有两种：

像 Alpaca 一样，收集 input/output 生成 prompt 用于训练，让模型完成特定任务
语言填充，收集文本用于训练，让模型补全 prompt。

以第一种目标为例，假设我们的目标是让模型讲中文，那么，我们可以通过其他 LLM （如 text-davinci-003）把一个现有数据集（如 Alpaca）翻译为中文来做 fine-tune。实际上这个想法已经在开源社区已经有人实现了。

第二步：训练并 apply LoRA

在第一步准备的数据集上进行 fine-tune。

第三步：合并模型（可选）

合并 LoRA 与 base 可以加速推理，并帮助我们后续 Quantization 模型。

第四步：quantization（可选）

最后，Quantization 可以帮助我们加速模型推理，并减少推理所需内存。这方面也有开源的工具可以直接使用。

https://github.com/megvii-research/Sparsebit/blob/main/large_language_models/llama/quantization/README.md

基于 Spring Boot + MyBatis Plus + Vue & Element 实现的后台管理系统 + 用户小程序，支持 RBAC 动态权限、多租户、数据权限、工作流、三方登录、支付、短信、商城等功能

项目地址：https://github.com/YunaiV/ruoyi-vue-pro

视频教程：https://doc.iocoder.cn/video/

实践

柿子挑软的捏，我们从简单的目标开始：让模型讲中文。

为了达成这个目标，我使用的数据集是 Luotuo 作者翻译的 Alpaca 数据集，训练代码主要来自 Alpaca-LoRA。

准备

由于我打算直接使用 Alpaca-LoRA 的代码，我们先 clone Alpaca-LoRA：

gitclonegit@github.com:tloen/alpaca-lora.git

下载数据集：

wgethttps://github.com/LC1332/Chinese-alpaca-lora/blob/main/data/trans_chinese_alpaca_data.json

创建虚拟环境并安装依赖（需要根据不同环境的 cuda 版本调整）：

condacreate-nalpacapython=3.9
condaactivatealpaca
cdalpaca-lora
pipinstall-rrequirements.txt

训练

单卡选手很简单，可以直接执行：

pythonfinetune.py
--base_model'decapoda-research/llama-7b-hf'
--data_path'/path/to/trans_chinese_alpaca_data.json'
--output_dir'./lora-alpaca-zh'

双卡选手相对比较麻烦，需要执行：

WORLD_SIZE=2CUDA_VISIBLE_DEVICES=0,1torchrun
--nproc_per_node=2
--master_port=1234
finetune.py
--base_model'decapoda-research/llama-7b-hf'
--data_path'/path/to/trans_chinese_alpaca_data.json'
--output_dir'./lora-alpaca-zh'

在我的环境下（2 * RTX 3090 Ti 24GB），需要额外配置 micro_batch_size 避免 OOM。

--micro_batch_size2

推荐的其他额外参数：

--num_epochs2

训练的过程比较稳定，我在训练过程中一直在用 nvitop 查看显存和显卡的用量：

下面是我训练时模型收敛的情况，可以看到差不多 2 epochs 模型就收敛的差不多了：

推理

单卡选手可以直接执行：

pythongenerate.py--base_model"decapoda-research/llama-7b-hf"
--lora_weights'./lora-alpaca-zh'
--load_8bit

双卡选手还是会麻烦点，由于现在还不支持双卡推理，我手动修改了 generate.py，添加了第 47 行：

而后，执行上面的命令即可。

如果你的推理运行在服务器上，想要通过其他终端访问，可以给 launch 方法添加参数：

server_name="0.0.0.0"

此时打开浏览器，享受你的工作成果吧 :D

加速推理

Alpaca-LoRA 提供了一些脚本，如 export_hf_checkpoint.py 来合并模型。合并后的模型可以通过 llamap.cpp 等项目达到更好的推理性能。

测试

最后，让我们对比下原生 Alpaca 与自己 fine-tune 的 Alpaca，看看 fine-tune 到底有没有让模型学会讲中文吧！

Good Examples

Bad Examples

可以看出模型确实在讲中文，也能依据中文的指令和输入完成一些工作。但是由于 LLaMA 本身训练数据大部分为英文以及 Alpaca 数据集翻译后的质量不足，我们的模型有些时候效果不如原生 Alpaca。此时不得不感叹高质量数据对 LLM 的重要性 。

基于 Spring Cloud Alibaba + Gateway + Nacos + RocketMQ + Vue & Element 实现的后台管理系统 + 用户小程序，支持 RBAC 动态权限、多租户、数据权限、工作流、三方登录、支付、短信、商城等功能

项目地址：https://github.com/YunaiV/yudao-cloud

视频教程：https://doc.iocoder.cn/video/

总结

作为一个分布式系统方向的工程师，fine-tune 一个 LLM 的过程遇到了不少问题，也有很多乐趣。虽然 LLaMA 7B 展现出的能力还比较有限，我还是很期待后面开源社区进一步的工作。

后续我也打算尝试 fine-tune 特定目的的 LLM，比如让 LLM 教我做饭，感兴趣的朋友可以保持关注！

审核编辑：李倩

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

模型

模型

+关注

关注
1

文章
2797

浏览量
47976
数据集

数据集

+关注

关注
4

文章
1182

浏览量
24461
ChatGPT

ChatGPT

+关注

关注
28

文章
1485

浏览量
5663

原文标题：如何训练自己的ChatGPT

文章出处：【微信号：芋道源码，微信公众号：芋道源码】欢迎添加关注！文章转载请注明出处。

类ChatGPT训练需高性能芯片大规模并联，高速接口IP迎红利时代

发布类ChatGPT应用。众所周知，类ChatGPT应用是一个吞金兽，微软公司为了训练ChatGPT使用了1万张英伟达的高端GPU。“从训练

发表于 03-06 09:18 •1673次阅读

在FPGA设计中是否可以应用ChatGPT生成想要的程序呢

当下AI人工智能崛起，很多开发领域都可看到ChatGPT的身影，FPGA设计中，是否也可以用ChatGPT辅助设计呢？

发表于 03-28 23:41

科技大厂竞逐AIGC，中国的ChatGPT在哪？

迅速走红。进入2023年，微软推新，谷歌入局，“ChatGPT”热潮迅速升温，国内的科技巨头也陆续涌入潮中。ChatGPT发布后，包括百度、科大讯飞、京东等在内的多家企业纷纷公布自己在AI领域的布局

发表于 03-03 14:28

chatGPT一种生产力的变革

角色对话、修改错误代码等。此外，ChatGPT还表现出一些人类特质，例如承认自己的错误，按照设定的道德准则拒绝不怀好意的请求等。ChatGPT一上线，就引发网民争相体验，但也有不少人对此表示担忧，担心

发表于 04-25 16:04

ChatGPT系统开发AI人功智能方案

随着人工智能技术的不断发展，本文由小编：Congge420整理发布。社交聊天系统在人们生活中扮演着越来越重要的角色。尤其是当人们想要与他人交流时，这个工具可以帮助他们更好地表达自己的想法和感受

发表于 05-18 10:16

ChatGPT自动化操作

邮件助手等。　　ChatGPT通过对大量的自然语言文本进行预训练，然后使用这些预训练权重来解决具

发表于 02-10 11:58 •2次下载

ChatGPT入门指南

是基于聊天的生成预训练transformer模型的缩写，是一个强大的工具，可以以各种方式使用，以提高您在许多领域的生产力。 ChatGPT是一种人工智能（AI）技术，被称为自然语言处理（NLP）模型　　由人工智能研发公司OpenAI创建。它使用机器学习算法来分析和

发表于 02-10 11:19 •7次下载

chatgpt怎么用

chatgpt怎么用 chatgpt怎么用？chatgpt 简介 ChatGPT是一种语言模型，它被训练来对对话进行建模。它能够通过学习和理

发表于 02-10 14:22 •5.7w次阅读

ChatGPT使用初探

　　最近一直听到ChatGPT，如雷贯耳，目前只能在国外用。近期找了个时间专门研究了怎么使用ChatGPT. 　　ChatGPT是一种大型语言模型，由 OpenAI 训练。它可

发表于 02-13 10:11 •1次下载

如何训练ChatGPT？中国版ChatGPT下月面世

中国百度公司2月7日表示，将在今年3月完成类似ChatGPT的项目“文心一言”（ERNIE Bot）的内部测试，加入这场全球竞赛。

发表于 02-13 15:10 •2828次阅读

ChatGPT介绍和代码智能

一. ChatGPT 1. ChatGPT的自我介绍 2. ChatGPT的前世 2.1GPT-3是啥？General Pre-Training(GPT)，即通用预训练语言模型，是一种

发表于 02-14 09:33 •2次下载

如何打造我们自己的ChatGPT

　　火爆全网的ChatGPT究竟是什么？为什么这么强？ChatGPT会取代搜素引擎吗？ChatGPT凸显的能力会是metaverse的有力支撑吗？ChatGPT的火爆背后， AI发展路

发表于 02-14 09:14 •3次下载

ChatGPT是什么？普通人应该如何去使用ChatGPT

ChatGPT的最强输出能力便是他的文字输出能力，而文字输出变现的软件有很多例如知乎百家号等，ChatGPT的语言生成模型，它能够通过训练集自动生成文本。这使得利用ChatGPT进行文

发表于 03-17 10:28 •3403次阅读

ChatGPT是什么？ChatGPT写代码的原理你知道吗

ChatGPT是什么 ChatGPT是一种人工智能聊天机器人，可以与用户进行自然语言对话，回答问题，提供建议和娱乐等服务。它的名字"GPT"代表着"生成预训练模型

发表于 06-04 17:01 •2746次阅读

ChatGPT原理 ChatGPT模型训练 chatgpt注册流程相关简介

ChatGPT注册没有外国手机号验证怎么办？ ChatGPT作为近期火爆网络的AI项目，受到了前所未有的关注。我们可以与AI机器人实时聊天，获得问题的答案。但受ChatGPT服务器及相关政策

发表于 12-06 16:28 •507次阅读

搜索历史

如何训练自己的ChatGPT

为什么要训练自己的 ChatGPT ？

计划

第一步：准备数据集

第二步：训练并 apply LoRA

第三步：合并模型（可选）

第四步：quantization（可选）

实践

准备

训练

推理

加速推理

测试

总结

评论

类ChatGPT训练需高性能芯片大规模并联，高速接口IP迎红利时代

在FPGA设计中是否可以应用ChatGPT生成想要的程序呢

科技大厂竞逐AIGC，中国的ChatGPT在哪？

chatGPT一种生产力的变革

ChatGPT系统开发AI人功智能方案

ChatGPT自动化操作

ChatGPT入门指南

chatgpt怎么用

ChatGPT使用初探

如何训练ChatGPT？中国版ChatGPT下月面世

ChatGPT介绍和代码智能

如何打造我们自己的ChatGPT

ChatGPT是什么？普通人应该如何去使用ChatGPT

ChatGPT是什么？ChatGPT写代码的原理你知道吗

ChatGPT原理 ChatGPT模型训练 chatgpt注册流程相关简介