0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Dolly 2.0发布,首个真正开放、可商用的指令调优LLM

OSC开源社区 来源:OSC开源社区 2023-04-14 09:33 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

Databricks 发布了 Dolly 2.0,这是该公司于两周前发布的一种训练成本不到 30 美元,类似 ChatGPT 的大型语言模型 (LLM) Dolly 的改进版本。公告称,Dolly 2.0 是第一个开源的指令跟随型语言模型,它在人类生成的指令数据集上进行了微调,可用于研究和商业用途。

根据介绍,Dolly 1.0 使用了斯坦福大学 Alpaca 团队使用 OpenAI API 创建的数据集进行训练;该数据集包含 ChatGPT 的输出,而其服务条款试图阻止任何人创建与 OpenAI 竞争的模型。因此,Dolly 1.0 并不能用于商业用途。且据已知信息,目前所有现有的知名指令跟随模型 (Alpaca, Koala, GPT4All, Vicuna) 都受到此限制,禁止商业使用。为了解决这个难题,Databricks 于是决定创建一个没有商业用途限制的新数据集。

977c4384-d9e7-11ed-bfe3-dac502259ad0.png

Dolly 2.0 是一个基于 EleutherAI pythia 模型系列的 12B 参数语言模型,并在透明且免费提供的数据集上进行了微调;该数据集称为 databricks-dolly-15k,也已开源发布。Databricks 表示,他们正在开源整个 Dolly 2.0,包括训练代码、数据集和模型权重,所有这些都适合商业使用。这意味着任何组织都可以创建、拥有和定制强大的 LLM,这些 LLM 可以与人们交谈,而无需支付 API 访问费用或与第三方共享数据。

databricks-dolly-15k 包含来自数千名 Databricks 员工的 15,000 个高质量的人工生成的提示 / 响应对,专为指令调优大型语言模型而设计。且 databricks-dolly-15k 根据(Creative Commons Attribution-ShareAlike 3.0 Unported License)的许可条款,任何人都可以出于任何目的使用、修改或扩展此数据集,包括商业应用程序。

Databricks 称这是 “第一个开源的、人工生成的指令语料库,专门设计用于让大型语言能够展示 ChatGPT 的神奇交互性”。并补充到,虽然 databricks-dolly-15k 比训练 Dolly 1.0 的数据集 Alpaca 小得多,但基于 EleutherAI 的 pythia-12b 生成的 Dolly 2.0 模型表现出高质量的指令遵循行为。另一方面, databricks-dolly-15k 是由专业人士生成的、质量很高,并且包含对大多数任务的长篇答案。

Databricks 表示,他们并没有期望 Dolly 在有效性方面达到最先进水平。但确实希望 Dolly 和开源数据集将成为大量后续工作的种子,“这可能有助于引导出更强大的语言模型”。

“我们还认为,偏见、问责制和人工智能安全等重要问题应该由不同利益相关者组成的广泛社区来解决,而不仅仅是少数大公司。开源数据集和模型鼓励评论、研究和创新,这将有助于确保每个人都能从人工智能技术的进步中受益。”

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1821

    文章

    50552

    浏览量

    268013
  • 语言模型
    +关注

    关注

    0

    文章

    575

    浏览量

    11384
  • 数据集
    +关注

    关注

    4

    文章

    1242

    浏览量

    26317
  • LLM
    LLM
    +关注

    关注

    1

    文章

    352

    浏览量

    1427

原文标题:Dolly 2.0发布,首个真正开放、可商用的指令调优LLM

文章出处:【微信号:OSC开源社区,微信公众号:OSC开源社区】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    中汽中心牵头完成的商用车整车领域首个ISO国际标准正式发布

    近日,商用车整车领域首个中国牵头完成的ISO国际标准《商用车辆 牵引车与挂车之间的电气和气动连接位置》(ISO 4009:2026)正式发布,该国际标准由中汽中心牵头完成。
    的头像 发表于 04-29 14:03 371次阅读

    Nginx高并发连接实战手册

    Nginx 的高性能源自其事件驱动架构。与 Apache 的"每连接一线程"模型不同,Nginx 使用单线程事件循环处理数千个并发连接。理解这套架构是的前提。
    的头像 发表于 03-16 15:28 621次阅读

    Google正式发布LLM评测基准Android Bench

    LLM 在 Android 开发任务中的表现。现在,我们发布了 Android Bench 的首个版本,这是 Google 官方专门针对 Android 开发打造的 LLM 排行榜。
    的头像 发表于 03-14 16:00 1998次阅读
    Google正式<b class='flag-5'>发布</b><b class='flag-5'>LLM</b>评测基准Android Bench

    小艺开放平台平台功能

    三种开发模式支撑智能体灵活构建 LLM模式 LLM 模式是一种基于大模型的智能体编排方式。开发者按需选择大模型,根据业务逻辑编写提示词,以LLM为理解中枢,结合意图识别、工具调用、对话上下文,动态
    发表于 01-30 15:24

    解锁Zephyr实时操作系统深度能力

    可以说,代码编写只是项目开发的起点,而随之而来的资源分析与性能才是确保系统稳定可靠的关键环节。
    的头像 发表于 01-30 09:16 6429次阅读

    Linux系统内核参数实战指南

    Linux 内核参数是系统性能优化的核心环节。随着云原生架构的普及和硬件性能的飞速提升,默认的内核参数配置往往无法充分发挥系统潜力。在高并发 Web 服务、大数据处理、容器化部署等场景下,合理的内核参数调整带来 30%-2
    的头像 发表于 01-28 14:27 895次阅读

    NVIDIA在CES 2026发布全新开放模型、数据和工具

    为扩展开放模型生态,NVIDIA 发布全新开放模型、数据和工具,推动各行业 AI 技术的发展。
    的头像 发表于 01-09 10:42 866次阅读

    重磅更新 | 先楫半导体HPM_APPS v1.10.1发布

    重磅更新 | 先楫半导体HPM_APPS v1.10.1发布
    的头像 发表于 12-26 08:33 1534次阅读
    重磅更新 | 先楫半导体HPM_APPS v1.10.1<b class='flag-5'>发布</b>

    华为面向欧洲发布星河AI Fabric 2.0方案

    华为数据通信创新峰会2025期间,在“星河AI Fabric 2.0,算力满载、业务永续”为主题的论坛上,华为面向欧洲发布星河AI Fabric 2.0方案。本次发布是继2018年
    的头像 发表于 10-13 09:43 1225次阅读

    HarmonyOSAI编程智慧

    DevEco Studio提供智慧能力,支持通过自然语言交互,分析并解释当前实例或项目中存在的性能问题,帮助开发者快速定位影响性能的具体原因。该功能从DevEco Studio 6.0.0
    发表于 09-01 15:15

    HarmonyOS AI辅助编程工具(CodeGenie)智慧

    DevEco Studio提供智慧能力,支持通过自然语言交互,分析并解释当前实例或项目中存在的性能问题,帮助开发者快速定位影响性能的具体原因。该功能从DevEco Studio 6.0.0
    发表于 08-14 11:12

    Linux内核参数方案

    在高并发微服务环境中,网络性能往往成为K8s集群的瓶颈。本文将深入探讨如何通过精细化的Linux内核参数,让你的K8s节点网络性能提升30%以上。
    的头像 发表于 08-06 17:50 1260次阅读

    Linux系统性能方案

    关键要点预览:本文将深入解析Linux系统性能瓶颈的根本原因,提供可直接落地的方案,让你的系统性能提升30-50%!
    的头像 发表于 08-06 17:49 1175次阅读

    MySQL配置技巧

    上个月,我们公司的核心业务系统突然出现大面积超时,用户投诉电话不断。经过紧急排查,发现是MySQL服务器CPU飙升到99%,大量慢查询堆积。通过一系列配置和SQL优化,最终在30分钟内恢复了服务。
    的头像 发表于 07-31 10:27 896次阅读

    Nginx在企业环境中的策略

    Nginx作为现代互联网架构中最重要的Web服务器和反向代理服务器,其性能对企业级应用的稳定性和效率至关重要。本指南将从运维实践角度出发,详细介绍Nginx在企业环境中的各种
    的头像 发表于 07-14 11:13 899次阅读