0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

与ChatGPT性能最相匹配的开源模型

深度学习自然语言处理 来源:深度学习自然语言处理 2023-04-06 10:16 次阅读

前言

最近由UC Berkeley、CMU、Stanford, 和 UC San Diego的研究人员创建的 Vicuna-13B,通过在 ShareGPT 收集的用户共享对话数据中微调 LLaMA获得。其中使用 GPT-4 进行评估,发现Vicuna-13B 的性能达到了ChatGPT 和 Bard 的 90% 以上,同时在 90% 情况下都优于 LLaMA 和 Alpaca 等其他模型。训练 Vicuna-13B 的费用约为 300 美元。训练和代码[1]以及在线演示[2]已公开。

Vicuna到底怎么样?

Vicuna在官网中通过和Alpaca、LLaMA、ChatGPT和Bard对比,然后通过GPT4当裁判来打出分数,具体如下。

13c714ec-d401-11ed-bfe3-dac502259ad0.png

问题

13de1fde-d401-11ed-bfe3-dac502259ad0.png

Alpaca-13b vs Vicuna

140b2c9a-d401-11ed-bfe3-dac502259ad0.png

LLaMA-13b vs Vicuna

1430ff2e-d401-11ed-bfe3-dac502259ad0.png

ChatGPT vs Vicuna

1454ff3c-d401-11ed-bfe3-dac502259ad0.png

Bard vs Vicuna

可以看出,Vicuna的回答还是非常棒的,让GPT4来打分,Vicuna和ChatGPT是十分接近的,远远高于Alpaca和LLaMA。

如果大家想试试别的问题,可以自己去尝试[3]哈。

1476f48e-d401-11ed-bfe3-dac502259ad0.png

可换不同类型的不同问题

然而,官方认为评估聊天机器人绝非易事,听过GPT4进行评估是一件十分不严格的事情,但是目前还是无法解决评估的问题,需要后续学者进行进一步探索。

148f1b54-d401-11ed-bfe3-dac502259ad0.png

图1 GPT-4 评估

在线demo

14a82ec8-d401-11ed-bfe3-dac502259ad0.png

概述

14cef7ec-d401-11ed-bfe3-dac502259ad0.png

图2 工作流

图 2 介绍了整体工作流程。训练是在一天时间在 8 个 A100 上使用 PyTorch FSDP 完成的。 LLaMA、Alpaca、ChatGPT 和 Vicuna 的详细比较如表 1 所示。

14f36212-d401-11ed-bfe3-dac502259ad0.png

表1 一些模型的对比

训练

Vicuna 是通过使用从 ShareGPT.com 使用公共 API 收集的大约 7万 用户共享对话微调 LLaMA 基础模型创建的。为了确保数据质量,将 HTML 转换回 markdown 并过滤掉一些不合适或低质量的样本。此外,将冗长的对话分成更小的部分,以适应模型的最大上下文长度。

训练方法建立在斯坦福alpaca的基础上,并进行了以下改进。

内存优化:为了使 Vicuna 能够理解长上下文,将最大上下文长度从alpaca 中的 512 扩展到 2048。还通过gradient checkpointingflash attentio来解决内存压力。

多轮对话调整训练损失考虑多轮对话,并仅根据聊天机器人的输出进行微调。

通过 Spot 实例降低成本:使用 SkyPilot 托管点来降低成本。该解决方案将 7B 模型的训练成本从 500 美元削减至 140 美元左右,将 13B 模型的训练成本从 1000 美元左右削减至 300 美元。

150d9588-d401-11ed-bfe3-dac502259ad0.png

图3 通过GPT4来评估打分

153299aa-d401-11ed-bfe3-dac502259ad0.png

通过GPT4评估得出的总分






审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    206

    文章

    27053

    浏览量

    201441
  • CMU
    CMU
    +关注

    关注

    0

    文章

    19

    浏览量

    15129
  • GPT
    GPT
    +关注

    关注

    0

    文章

    302

    浏览量

    14872
  • ChatGPT
    +关注

    关注

    27

    文章

    1411

    浏览量

    4780

原文标题:Vicuna:与ChatGPT 性能最相匹配的开源模型

文章出处:【微信号:zenRRan,微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    在FPGA设计中是否可以应用ChatGPT生成想要的程序呢

    当下AI人工智能崛起,很多开发领域都可看到ChatGPT的身影,FPGA设计中,是否也可以用ChatGPT辅助设计呢?
    发表于 03-28 23:41

    谷歌发布轻量级开源人工智能模型Gemma

    谷歌近日宣布推出开源人工智能(AI)模型系列Gemma,旨在为开发人员和研究人员提供一个负责任的AI构建平台。这一举措标志着自2022年OpenAI的ChatGPT引领AI聊天机器人热潮后,谷歌首次发布重要的
    的头像 发表于 02-23 11:38 419次阅读

    【国产FPGA+OMAPL138开发板体验】(原创)6.FPGA连接ChatGPT 4

    方面。而且,由于ChatGPT 4是一个大型的语言模型。通常,FPGA会用于处理一些底层的数据流或执行特定的硬件加速任务,而ChatGPT 4这样的模型则会在云端或高
    发表于 02-14 21:58

    ChatGPT原理 ChatGPT模型训练 chatgpt注册流程相关简介

    的影响,其注册相对繁琐。那么国内如何注册ChatGPT账号?本文跟大家详细分享GPT账户注册教程,手把手教你成功注册ChatGPTChatGPT是一种自然语言处理模型
    的头像 发表于 12-06 16:28 390次阅读
    <b class='flag-5'>ChatGPT</b>原理 <b class='flag-5'>ChatGPT</b><b class='flag-5'>模型</b>训练 <b class='flag-5'>chatgpt</b>注册流程相关简介

    不到1分钟开发一个GPT应用!各路大神疯狂整活,网友:ChatGPT就是新iPhone

    这个说法并不准确。尽管ChatGPT等语言模型已经在一定程度上改变了我们获取信息、学习知识的方式,但它们并不能替代人类进行创造性思考和创造性活动。 虽然一些人可能会利用ChatGPT等语言模型
    发表于 11-19 12:06

    盘古大模型ChatGPT4

    盘古大模型ChatGPT4 盘古大模型ChatGPT4:人工智能领域重要的两大进展 随着人工智能技术的不断发展,越来越多的模型和算法被开
    的头像 发表于 08-31 10:15 3865次阅读

    盘古大模型ChatGPT4的区别

    盘古大模型ChatGPT4的区别 对于大家尤其是人工智能领域的从业者而言,盘古大模型(PanGu-α)和ChatGPT-4是两个大家的比较关注的
    的头像 发表于 08-30 18:27 4240次阅读

    chatgpt是什么意思 ChatGPT背后的技术原理

      今天我们为大家带来的文章,深入浅出地阐释了ChatGPT背后的技术原理,没有NLP或算法经验的小伙伴,也可以轻松理解ChatGPT是如何工作的。  ChatGPT是一种机器学习自然语言处理
    发表于 07-18 17:12 0次下载

    沐曦付轩:蹄急而步稳,GPU助力ChatGPT快、准、稳全面发展

    付轩在“ChatGPT风向下的集成电路新趋势”论坛中发表主题为《蹄急而步稳:ChatGPT与高性能GPU战略概览》的主题演讲,分析了ChatGPT的应用特点及软硬件需求,指出以
    的头像 发表于 06-20 10:57 844次阅读

    如何将ChatGPT的能力蒸馏到另一个大模型

    如何将ChatGPT的能力蒸馏到另一个大模型,是当前许多大模型研发的研发范式。当前许多模型都是采用chatgpt来生成微调数据,如self
    的头像 发表于 06-12 15:06 573次阅读
    如何将<b class='flag-5'>ChatGPT</b>的能力蒸馏到另一个大<b class='flag-5'>模型</b>

    ChatGPT浪潮下,看中国大语言模型产业发展

    ChatGPT的横空出世拉开了大语言模型产业和生成式AI产业蓬勃发展的序幕。本报告将着重分析“OpenAI ChatGPT的成功之路”、“中国类ChatGPT产业发展趋势”、“
    的头像 发表于 06-01 16:49 808次阅读
    <b class='flag-5'>ChatGPT</b>浪潮下,看中国大语言<b class='flag-5'>模型</b>产业发展

    ChatGPT背后的大模型技术

    由于ChatGPT可以适用于非常多的任务,很多人认为 AI 已经迎来拐点。李开复将此前的 AI 定义为 AI 1.0,此后的AI定义为AI 2.0。AI 1.0 中模型适用于单领域,AI 2.0
    的头像 发表于 05-29 11:16 930次阅读
    <b class='flag-5'>ChatGPT</b>背后的大<b class='flag-5'>模型</b>技术

    支持 ChatGPT 的机器学习模型的概况

    本文介绍了支持 ChatGPT 的机器学习模型的概况,文章将从大型语言模型的介绍开始,深入探讨用来训练 GPT-3 的革命性自我注意机制,然后深入研究由人类反馈的强化学习机制这项让 ChatG
    的头像 发表于 05-26 11:44 581次阅读
    支持 <b class='flag-5'>ChatGPT</b> 的机器学习<b class='flag-5'>模型</b>的概况

    ChatGPT系统开发AI人功智能方案

    ChatGPT是一个由OpenAI开发的人工智能语言模型,可以实现自然语言处理、对话生成等功能。要开发一个类似ChatGPT的人工智能系统软件,可以遵循以下步骤:确定应用场景:确定人工智能系统软件要
    发表于 05-18 10:16

    在线研讨会 | 让 ChatGPT 和大语言模型的使用合法合规 —— 30 分钟快速入门 NeMo - Guardrails

    研讨会安排 主题:让 ChatGPT 和大语言模型的使用合法合规 —— 30 分钟快速入门 NeMo - Guardrails 时间:2023 年 5 月 18 日(周四)19:30 - 20:00
    的头像 发表于 05-17 05:55 470次阅读
    在线研讨会 | 让 <b class='flag-5'>ChatGPT</b> 和大语言<b class='flag-5'>模型</b>的使用合法合规 —— 30 分钟快速入门 NeMo - Guardrails