0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

ServiceNow、Hugging Face和NVIDIA发布StarCoder2助力生成式AI构建企业应用

NVIDIA英伟达 来源:NVIDIA英伟达 2024-03-01 10:28 次阅读

与 BigCode 社区共同创建的 StarCoder2 是在 600 多种编程语言上训练而成,它将推进代码生成、透明度、治理和创新。

ServiceNow、Hugging Face 和 NVIDIA 于今日发布 StarCoder2,其为一系列用于代码生成的开放获取大语言模型(LLM),将为性能、透明度和成本效益树立新标准。

StarCoder2 的联合开发者 BigCode 社区是由 ServiceNow 和 Hugging Face 共同管理。前者是一家领先的数字工作流公司,致力于为每个人创造更好的工作环境;后者则是最常用的开源平台,机器学习社区在该平台上就模型、数据集和应用程序开展合作。

在 619 种编程语言上训练而成的 StarCoder2,可接受进一步的训练并嵌入到企业应用中,以执行应用源代码生成、工作流生成、文本摘要等特定任务。开发者可以使用它的代码补全、高级代码摘要、代码片段检索等功能,加快创新速度及提高工作效率。

StarCoder2 提供三种规模的模型:由 ServiceNow 训练的 30 亿参数模型、由 Hugging Face 训练的 70 亿参数模型,以及由 NVIDIA 使用 NVIDIA NeMo 构建并在 NVIDIA 加速基础设施上训练的 150 亿参数模型。规模较小的模型由于参数较少,在推理过程中所需的计算量较少,可在提供强大性能的同时节省计算成本。实际上,新的 30 亿参数模型在性能上与原有的 StarCoder 150 亿参数模型不相上下。

ServiceNow 的 StarCoder2 开发团队负责人兼 BigCode 联合负责人 Harm de Vries 表示:“StarCoder2 证明了将开放式科学协作和负责任的 AI 实践与道德数据供应链相结合所产生的力量。这一极其先进的开放获取模型将提高已有生成式 AI 的性能和开发者的生产力,为开发者提供平等的机会,获得代码生成式 AI 的优势。这使任何规模的企业都能更加轻松地激发其全部业务潜力。”

Hugging Face 机器学习工程师兼 BigCode 联合负责人 Leandro von Werra 表示:“在 Hugging Face、ServiceNow 和 NVIDIA 的共同努力下,这套功能强大的基础模型终于问世。在数据和训练完全透明的情况下,社区能够更加高效地构建各种应用。StarCoder2 证明了开源和开放式科学的潜力,我们正在努力实现负责任 AI 的全民化。”

NVIDIA 应用研究副总裁 Jonathan Cohen 表示:“由于每个软件生态系统都有专门的编程语言,代码 LLM 可以推动各行业效率和创新方面的突破。NVIDIA 与 ServiceNow 和 Hugging Face 的合作带来了安全且负责任的模型,让更多人能够用上负责任的生成式 AI,我们相信这将使全球社区受益。”

StarCoder2 模型

为自定义应用开发增添强大助力

StarCoder2 模型均使用来自 BigCode 的先进架构和精心挑选的数据源。为了实现负责任的大规模创新,数据源的透明度和开放治理被放在第一位。

StarCoder2 提升了未来由 AI 驱动的编码应用的潜力,包括各种文本-代码和文本-工作流转换功能。通过更加广泛、深入的编程训练,它可以提供资源库上下文,从而实现准确的上下文感知预测。无论是经验丰富的软件工程师还是业余开发者等,都能利用这些进步提升业务价值和推动数字化转型。

StarCoder2 的基础是一个名为 Stack v2 的新代码数据集,该数据集规模比 Stack v1 大 7 倍多。除了先进的数据集之外,新的训练技术也有助于模型理解低资源编程语言(如 COBOL 等)、数学和程序源代码讨论。

使用特定业务数据对先进功能进行微调

用户可以使用 NVIDIA、NeMo 或 Hugging Face TRL 等开源工具,利用特定行业或组织的数据,对开放获取的 StarCoder2 模型进行微调。可以创建高级聊天机器人来处理更复杂的摘要或分类任务、开发能够快速且轻松地完成编程任务的个性化编码助手、检索相关代码片段,并实现文本-工作流转换功能。

为创建适合自身业务的特定任务功能,各企业已经开始对 StarCoder 基础模型进行微调。

ServiceNow 的文本-代码 Now LLM 就是在 150 亿参数 StarCoder LLM 的专用版本上构建而成的,并针对其工作流模式、用例和流程进行了微调和训练。Hugging Face 也使用该模型创建了自己的 StarChat 助手。

BigCode 促进 AI 领域的开放式科学协作

BigCode 是一个由 Hugging Face 和 ServiceNow 领导的开放式科学协作社区,致力于负责任的代码 LLM 开发。

BigCode 社区以工作组和特别任务组的形式积极参与 StarCoder2 项目的技术工作,分别使用 ServiceNow 的 Fast LLM 框架来训练 30 亿参数模型、使用 Hugging Face 的 nanotron 框架来训练 70 亿参数模型,以及 NVIDIA NeMo 云原生框架和 NVIDIA TensorRT-LLM 软件来训练和优化 150 亿参数模型。

BigCode 的核心宗旨是促进负责任的创新,其开放的治理、透明的供应链、开源软件的使用,以及让开发者选择数据不用于训练等做法都体现了这一点。StarCoder2 是在获得 Inria 托管的 Software Heritage 数字共享许可下,使用负责任的数据构建而成的。

Software Heritage 总监 Roberto Di Cosmo 表示:“StarCoder2 是首个使用 Software Heritage 源代码存档开发的代码生成式 AI 模型,其构建方式符合我们负责任地开发代码模型的政策。ServiceNow、Hugging Face 和 NVIDIA 的这一合作体现了对道德 AI 开发的共同承诺,引领技术朝着更崇高的利益发展。”

StarCoder2 与其前代一样,将在 BigCode Open RAIL-M 许可下免费提供访问和使用。为进一步促进透明度和协作,该模型的支持代码将继续保留在 BigCode 项目的 GitHub 页面上。

所有 StarCoder2 模型还可以在 Hugging Face 上下载。StarCoder2 150 亿参数模型通过 NVIDIA AI Foundation 模型提供,开发者可以直接在浏览器上或通过 API 端点进行试用。



审核编辑:刘清
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    4595

    浏览量

    101724
  • 机器学习
    +关注

    关注

    66

    文章

    8126

    浏览量

    130571
  • 大模型
    +关注

    关注

    2

    文章

    1532

    浏览量

    1126
  • 生成式AI
    +关注

    关注

    0

    文章

    353

    浏览量

    217

原文标题:ServiceNow、Hugging Face和NVIDIA发布全新开放获取LLM,助力开发者运用生成式AI构建企业应用

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    ServiceNowHugging FaceNVIDIA 发布全新开放获取 LLM,助力开发者运用生成AI 构建企业应用

    2024 年 2 月 28 日 - ServiceNow(NYSE:NOW)、Hugging FaceNVIDIA 于今日发布
    发表于 02-29 11:12 153次阅读
    <b class='flag-5'>ServiceNow</b>、<b class='flag-5'>Hugging</b> <b class='flag-5'>Face</b> 和 <b class='flag-5'>NVIDIA</b> <b class='flag-5'>发布</b>全新开放获取 LLM,<b class='flag-5'>助力</b>开发者运用<b class='flag-5'>生成</b>式 <b class='flag-5'>AI</b> <b class='flag-5'>构建</b><b class='flag-5'>企业</b>应用

    NVIDIA 通过企业生成AI 微服务为聊天机器人、AI 助手和摘要工具带来商业智能

    微服务,支持企业将自定义大语言模型与企业数据相连接,使其 AI 应用能够提供高度准确的响应。 NVIDIA NeMo Retriever 是 NV
    的头像 发表于 11-29 21:05 381次阅读

    NVIDIA 通过企业生成AI 微服务 为聊天机器人、AI 助手和摘要工具带来商业智能

    。   NVIDIA NeMo™ Retriever 是 NVIDIA NeMo(一个用于构建、自定义和部署生成AI 模型的框架和工具系
    发表于 11-29 14:37 131次阅读
    <b class='flag-5'>NVIDIA</b> 通过<b class='flag-5'>企业</b>级<b class='flag-5'>生成</b>式 <b class='flag-5'>AI</b> 微服务 为聊天机器人、<b class='flag-5'>AI</b> 助手和摘要工具带来商业智能

    NVIDIA 在 Microsoft Azure 上推出面向全球企业和初创公司的生成AI Foundry 服务

    AI Enterprise 软件进行部署 NVIDIA 于今日推出一项 AI foundry 服务,助力企业和初创公司在 Microsof
    的头像 发表于 11-16 21:15 297次阅读

    NVIDIA 在 Microsoft Azure 上推出面向全球企业和初创公司的 生成AI Foundry 服务

    AI Enterprise 软件进行部署       Microsoft Ignite — 2023 年 11 月 15 日 — NVIDIA 于今日推出一项 AI foundry 服务,
    发表于 11-16 14:13 142次阅读
    <b class='flag-5'>NVIDIA</b> 在 Microsoft Azure 上推出面向全球<b class='flag-5'>企业</b>和初创公司的 <b class='flag-5'>生成</b>式 <b class='flag-5'>AI</b> Foundry 服务

    Hugging Face被限制访问

    目前尚不清楚 Hugging Face 何时出现访问限制问题。雅虎的报道称,早在今年 5 月起,就已经有用户在 HF 的论坛上抱怨连接问题。另外有报道称,至少从 9 月 12 日起,Hugging
    的头像 发表于 10-22 15:51 1179次阅读
    <b class='flag-5'>Hugging</b> <b class='flag-5'>Face</b>被限制访问

    NVIDIA AI Enterprise 4.0 推出,助力企业构建生产就绪的生成AI 为业务赋能

    时。NVIDIA 正在将专业知识投入到解决方案的开发过程中,助力企业实现这样的飞跃。 推出 NVIDIA AI Enterprise 4.0
    的头像 发表于 09-19 20:20 392次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>AI</b> Enterprise 4.0 推出,<b class='flag-5'>助力</b><b class='flag-5'>企业</b><b class='flag-5'>构建</b>生产就绪的<b class='flag-5'>生成</b>式 <b class='flag-5'>AI</b> 为业务赋能

    NVIDIAHugging Face 将连接数百万开发者与生成AI 超级计算

    年 8 月 8 日 — NVIDIAHugging Face 宣布建立合作伙伴关系,为数百万开发者提供生成AI 超级计算服务,帮
    发表于 08-09 11:41 108次阅读
    <b class='flag-5'>NVIDIA</b> 与 <b class='flag-5'>Hugging</b> <b class='flag-5'>Face</b> 将连接数百万开发者与<b class='flag-5'>生成</b>式 <b class='flag-5'>AI</b> 超级计算

    NVIDIAHugging Face 将连接数百万开发者与生成AI 超级计算

    NVIDIA DGX Cloud 集成到 Hugging Face 平台将加速大语言模型(LLM)的训练和调优,简化了几乎每个行业的模型定制
    的头像 发表于 08-09 11:38 703次阅读
    <b class='flag-5'>NVIDIA</b> 与 <b class='flag-5'>Hugging</b> <b class='flag-5'>Face</b> 将连接数百万开发者与<b class='flag-5'>生成</b>式 <b class='flag-5'>AI</b> 超级计算

    NASA 携手 IBM 发布 Hugging Face 平台最大开源地理空间 AI 基础模型

    Hugging Face发布。它将成为 Hugging Face 上至今最大的地理空间基础模型,也是首个与 NASA 合作
    的头像 发表于 08-08 18:15 432次阅读
    NASA 携手 IBM <b class='flag-5'>发布</b> <b class='flag-5'>Hugging</b> <b class='flag-5'>Face</b> 平台最大开源地理空间 <b class='flag-5'>AI</b> 基础模型

    ServiceNowNVIDIA 和埃森哲携手合作,助力企业加快采用生成AI

    业界首创的 AI 灯塔计划助力合作伙伴与客户合作,共同制定基于生成AI 的计划,转变业务运营方式 ServiceNow(NYSE: NO
    的头像 发表于 07-31 20:40 473次阅读
    <b class='flag-5'>ServiceNow</b>、<b class='flag-5'>NVIDIA</b> 和埃森哲携手合作,<b class='flag-5'>助力</b><b class='flag-5'>企业</b>加快采用<b class='flag-5'>生成</b>式 <b class='flag-5'>AI</b>

    Snowflake 携手 NVIDIA 助力企业在数据云端利用数据实现生成AI

    日 —数据云公司 Snowflake(NYSE: SNOW)和 NVIDIA 今日在 2023 年 Snowflake 峰会上宣布,双方将携手助力各规模企业加速利用自身专有数据创建定制化的
    的头像 发表于 06-27 21:10 269次阅读
    Snowflake 携手 <b class='flag-5'>NVIDIA</b> <b class='flag-5'>助力</b><b class='flag-5'>企业</b>在数据云端利用数据实现<b class='flag-5'>生成</b>式 <b class='flag-5'>AI</b>

    NVIDIA 与微软合作加速企业就绪的生成AI

    NVIDIA AI Enterprise 与 Azure 机器学习集成,提供端到端云平台,供开发者构建、部署和管理大型语言模型的 AI 应用 微软 Build 大会——太平洋时间 20
    的头像 发表于 05-25 09:15 378次阅读
    <b class='flag-5'>NVIDIA</b> 与微软合作加速<b class='flag-5'>企业</b>就绪的<b class='flag-5'>生成</b>式 <b class='flag-5'>AI</b>

    ServiceNowNVIDIA宣布联合打造面向企业IT的生成AI

    2023年5月17日 - ServiceNowNVIDIA今日宣布达成合作伙伴关系,将共同开发强大的企业生成AI功能,通过实现更快、更
    的头像 发表于 05-19 18:06 1783次阅读
    <b class='flag-5'>ServiceNow</b>与<b class='flag-5'>NVIDIA</b>宣布联合打造面向<b class='flag-5'>企业</b>IT的<b class='flag-5'>生成</b>式<b class='flag-5'>AI</b>

    ServiceNowNVIDIA 宣布联合打造面向企业 IT 的生成AI

    基于 ServiceNow 平台并采用 NVIDIA AI 软件和 DGX 基础设施构建的自定义大型语言模型将为企业带来更智能的工作流自动化
    的头像 发表于 05-19 00:50 367次阅读
    <b class='flag-5'>ServiceNow</b> 与 <b class='flag-5'>NVIDIA</b> 宣布联合打造面向<b class='flag-5'>企业</b> IT 的<b class='flag-5'>生成</b>式 <b class='flag-5'>AI</b>