iPhone都能微调大模型了嘛-电子发烧友网

自动测试分数达到ChatGPT的99.3%，人类难以分辨两者的回答……

这是开源大模型最新成果，来自羊驼家族的又一重磅成员——华盛顿大学原驼（Guanaco）。

更关键的是，与原驼一起提出的新方法QLoRA把微调大模型的显存需求从>780GB降低到<48GB。

开源社区直接开始狂欢，相关论文成为24小时内关注度最高的AI论文。

以Meta的美洲驼LLaMA为基础，得到原驼650亿参数版只需要48GB显存单卡微调24小时，330亿参数版只需要24GB显存单卡微调12小时。

24GB显存，也就是一块消费级RTX3090或RTX4090显卡足以。

不少网友在测试后也表示，更喜欢它而不是ChatGPT。

英伟达科学家Jim Fan博士对此评价为：大模型小型化的又一里程碑。

先扩大规模再缩小，将成为开源AI社区的节奏。

而新的高效微调方法QLoRA迅速被开源社区接受，HuggingFace也在第一时间整合上线了相关代码。

GPT-4做裁判，原驼得分达到ChatGPT的99.3%

论文中，团队对原驼总共做了三项测试，自动评估、随机匹配和人类评估。

测试数据来自小羊驼Vicuna和Open Assistant。

自动评估由大模型天花板GPT-4当裁判，对不同模型的回答进行打分，以ChatGPT（GPT3.5）的成绩作为100%。

最终原驼650亿版得分达到ChatGPT的99.3%，而GPT-4自己的得分是114.5%，谷歌Bard是94.8%。

随机匹配，采用棋类专业比赛和电子竞技同款的Elo记分机制，由GPT-4和人类共同做裁判。

原驼650亿和330亿版最终得分超过ChatGPT（GPT3.5）。

人类评估，则是把原驼650亿版的回答和ChatGPT的回答匿名乱序放在一起，人类来盲选哪个最好。

论文共同一作表示，研究团队里的人都很难分辨出来，并把测试做成了一个小游戏放在Colab上，开放给大家挑战。

这里节选其中一个问题（附中文翻译），你能分辨出哪个是ChatGPT回答的吗？

问题：How can I improve my time management skills?（如何提高时间管理技能？）

总的来说，原驼的优势在于不容易被问题中的错误信息误导，比如能指出地球从来没有被科学界认为是平的。

以及擅长心智理论（Theory of Mind），也就是能推测理解他人的心理状态。

但原驼也并非没有弱点，团队发发现它不太擅长数学，以及容易用提示注入攻击把要求保密的信息从它嘴里套出来。

也有网友表示，虽然一个模型能在某个数据集上无限接近ChatGPT，但像ChatGPT那样通用还是很难的。

全新方法QLoRA，iPhone都能微调大模型了

原驼论文的核心贡献是提出新的微调方法QLoRA。

其中Q代表量化（Quantization），用低精度数据类型去逼近神经网络中的高精度浮点数，以提高运算效率。

LoRA是微软团队在2021年提出的低秩适应（Low-Rank Adaptation）高效微调方法，LoRA后来被移植到AI绘画领域更被大众熟知，但最早其实就是用于大语言模型的。

通常来说，LoRA微调与全量微调相比效果会更差，但团队将LoRA添加到所有的线性层解决了这个问题。

具体来说，QLoRA结合了4-bit量化和LoRA，以及团队新创的三个技巧：新数据类型4-bit NormalFloat、分页优化器（Paged Optimizers）和双重量化（Double Quantization）。

最终QLoRA让4-bit的原驼在所有场景和规模的测试中匹配16-bit的性能。

QLoRA的高效率，让团队在华盛顿大学的小型GPU集群上每天可以微调LLaMA 100多次……

最终使用Open Assistant数据集微调的版本性能胜出，成为原驼大模型。

Open Assistant数据集来自非盈利研究组织LAION（训练Stable Diffusion的数据集也来自这里），虽然只有9000个样本但质量很高，经过开源社区的人工仔细验证。

这9000条样本用于微调大模型，比100万条指令微调（Instruction Finetune）样本的谷歌FLAN v2效果还好。

研究团队也据此提出两个关键结论：

指令微调有利于推理，但不利于聊天

最后，QLoRA的高效率，还意味着可以用在手机上，论文共同一作Tim Dettmers估计以iPhone 12 Plus的算力每个晚上能微调300万个单词的数据量。

这意味着，很快手机上的每个App都能用上专用大模型。
责任编辑：彭菁

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

iPhone

iPhone

+关注

关注
28

文章
13177

浏览量
200187
显存

显存

+关注

关注
0

文章
103

浏览量
13552
模型

模型

+关注

关注
1

文章
2709

浏览量
47712

原文标题：开源「原驼」爆火，iPhone都能微调大模型了，得分逼近ChatGPT！

文章出处：【微信号：zenRRan，微信公众号：深度学习自然语言处理】欢迎添加关注！文章转载请注明出处。

阻微调电路都有哪些组合？

发表于 03-12 16:00

多圈微调线绕电位器

多圈微调线绕电位器 1. WXW1B 型方形多图微调线绕电位器WXW1B 型方形多圈微调线绕电位器的外形如图3-78 所示，其主要参数见表3-53 。

发表于 08-21 18:50 •1307次阅读

黑色版iPhone 7 Plus模型机曝光：黑色很亮眼！

黑色版iPhone 7 Plus模型机曝光：黑色很亮眼！

发表于 08-15 08:48 •920次阅读

iphone8什么时候上市？别等了，直接入手iphone se如何？回归经典！

iphone8今年九月上市，其实也没多久了，但是小编不建议等啊，为什么，第一，很贵；第二，性能过剩，你一普通群众你要那么好的性能干嘛！你一个iphone se完全够了嘛

发表于 01-19 16:45 •9725次阅读

iPhone X Plus和iPhone 9的最新消息模型机和保护壳的体验

国外有网友带来了最新的 iPhone X Plus 和 iPhone 9 模型机和保护壳上手体验。传言称 iPhone X Plus 搭载 6.5 寸显示屏，而

发表于 07-07 10:43 •4288次阅读

苹果新款iPhone X Plus和LCD iPhone的机器模型泄露

手机圈内比较知名的爆料者，爆料了两款据称是苹果 2018 年新一代 iPhone 的机器模型，包括 6.5 英寸 iPhone X Plus 和 6.1 英寸LCD iPhone。

发表于 07-31 00:04 •777次阅读

使用NVIDIA TAO工具包和Appen实现AI模型微调

NVIDIA TAO 工具包与 Appen 的数据平台相结合，使您能够训练、微调和优化预训练模型，以更快地启动人工智能解决方案。在不牺牲质量的情况下，将开发时间缩短十倍。在NVIDIA 和 Appen 的综合专业知识和工具的帮助下，您将满怀信心地推出人工智能。

发表于 04-13 15:29 •1073次阅读

使用NVIDIA TAO工具包和Appen实现AI<b class='flag-5'>模型</b><b class='flag-5'>微调</b>

有哪些省内存的大语言模型训练/微调/推理方法？

首先，我们需要了解如何根据参数量估计模型大致所需的 RAM，这在实践中有很重要的参考意义。我们需要通过估算设置 batch_size，设置模型精度，选择微调方法和参数分布方法等。

发表于 04-10 11:41 •997次阅读

蒸馏也能Step-by-Step：新方法让小模型也能媲美2000倍体量大模型

为了解决大型模型的这个问题，部署者往往采用小一些的特定模型来替代。这些小一点的模型用常见范式 —— 微调或是蒸馏来进行训练。微调使用下游的人

发表于 05-15 09:35 •421次阅读

蒸馏也能Step-by-Step：新方法让小<b class='flag-5'>模型</b>也能媲美2000倍体量大<b class='flag-5'>模型</b>

中软国际参加首期百度智能云文心千帆大模型SFT微调能力实训营

2023年7月15日，中软国际受邀在百度大厦参加了首期百度智能云文心千帆大模型SFT微调能力实训营。此次培训旨在提高合作伙伴对大模型的理解和落地能力，更好地帮助客户落地大模型和相关应用

发表于 07-17 18:15 •624次阅读

中软国际参加首期百度智能云文心千帆大<b class='flag-5'>模型</b>SFT<b class='flag-5'>微调</b>能力实训营

OpenAI开放大模型微调功能　GPT-3.5可以打造专属ChatGPT

OpenAI开放大模型微调功能 GPT-3.5可以打造专属ChatGPT OpenAI开放大模型微调功能，这意味着GPT-3.5 Turbo支持自定义

发表于 08-23 19:34 •773次阅读

OpenAI开放大模型微调功能！

除了提高性能之外，还能缩短提示时间，确保类似性能。另外，微调目前仅支持处理4000 tokens，这也是此前微调型号的两倍。16k tokens微调将于今年秋季推出。

发表于 08-24 16:39 •391次阅读

OpenAI开放大<b class='flag-5'>模型</b><b class='flag-5'>微调</b>功能！

一种新颖的大型语言模型知识更新微调范式

我们使用LLAMA2-7B作为实验的基础模型。我们主要评估将旧知识更新为新知识的能力，因此模型将首先在旧知识上进行为期3个时期的微调。表1中F-Learning中设置的超参数λ分别取值为0.3、0.7、0.1和1.5。

发表于 12-01 15:10 •173次阅读

一种新颖的大型语言<b class='flag-5'>模型</b>知识更新<b class='flag-5'>微调</b>范式

四种微调大模型的方法介绍

全微调（Full Fine-tuning）：全微调是指对整个预训练模型进行微调，包括所有的模型参数。在这种方法中，预训练

发表于 01-03 10:57 •5977次阅读

四种<b class='flag-5'>微调</b>大<b class='flag-5'>模型</b>的方法介绍

基于双级优化（BLO）的消除过拟合的微调方法

这篇论文试图解决的问题是大型预训练模型在下游任务中进行微调时出现的过拟合问题。尽管低秩适应（LoRA）及其变体通过学习低秩增量矩阵有效地减少了与完全微调方法相比的可训练参数数量。

发表于 04-02 16:46 •179次阅读

搜索历史

iPhone都能微调大模型了嘛

评论