Meta AI重磅推出LIMA！媲美GPT-4、无需RLHF就能对齐！-电子发烧友网

昨天Meta AI+CMU这篇文章一出，twitter都炸了！

LIMA，只使用1000个精心挑选的样本微调一个 65B LLaMa，无需RLHF，性能媲美甚至优于GPT-4！

论文：LIMA: Less Is More for Alignment
地址：https://arxiv.org/pdf/2305.11206.pdf

天下人苦“对齐”久矣！要让预训练语言模型的响应和特定任务和用户偏好对齐，动辄需要百万示例数据集上的instruction tuning、以及最近从人类反馈中进行的强化学习，才能实现ChatGPT级别的性能。

这篇文章旨在用简单的方法解决复杂的对齐问题，作者提出表面对齐假说(Superficial Alignment Hypothesis)，将对齐视为一个简单的过程：学习与用户交互的样式或格式，来展示预训练期间就已经获得的知识和能力！

结果发现，少量高质量样例上的简单微调就足以与当今最先进的技术竞争！这也证明预训练过程的强大威力和重要性，远胜于大规模instruction tuning和强化学习！

实验设置

数据集来源：这1000个近似真实用户提示和高质量响应的示例中，有750个来自Stack Exchange和wikiHow这样的社区论坛，其余250个则是手动编写。

微调的超参数：使用AdamW进行微调，其中，权重衰减为0.1。没有热身步骤，初始学习率设置为，并线性地降至训练结束时的。批量大小设为32个示例（更小的模型为64个），长度大于2048 token的文本将被裁剪。与以往的显著不同是在残差连接上应用dropout，从底层的开始，线性升高到最后一层的（更小的模型为）。

基准模型

实验将 LIMA 与五个基准模型进行比较：

(1)Alpaca 65B：将 LLaMa 65B 在 Alpaca 训练集中的 52,000 个样例上进行微调；(2) OpenAI 的DaVinci003，经过 RLHF 训练的大语言模型；(3) 基于 PaLM 的谷歌Bard；(4) Anthropic 的Claude， 52B 参数，经过从 AI 反馈进行强化学习 (Constitutional AI) 训练；(5) OpenAI 的GPT-4，经过 RLHF 训练，目前认为最先进的大语言模型。

结果

根据人类偏好的实验结果，LIMA 的表现比 Alpaca 65B 和 DaVinci003 都要更好！尽管Alpaca 65B 的训练数据量比 LIMA 高52倍，而DaVinci003 采用了 RLHF，一种被认为是更优秀的对齐方法。

Bard 情况要好，在 42% 的时间产生了比 LIMA 更好的响应；然而，这也意味着至少58%的时间， LIMA 的表现和 Bard 相当。

最后，虽然 Claude 和 GPT-4 通常比 LIMA 的表现更加出色，但很多情况下，LIMA 确实能产生更好的响应。有些讽刺的是，即使是 GPT-4 也有19% 的时间会认为 LIMA 的输出更好。