0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

ChatGPT背后的开源AI框架Ray,现在值10亿美元

人工智能与大数据技术 来源:机器之心 2023-04-14 11:03 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

最近一段时间,文本生成的人工智能在互联网上掀起了一阵风暴:ChatGPT 因为可以对人们能想到的几乎任何问题提供非常详细、近乎逼真的回答而受到追捧。大模型应用的出现让人们对于 AI 技术突破充满了信心,不过很少有人知道在其背后,一个分布式机器学习框架正为这场生成式 AI 革命提供动力。

分布式计算框架 Ray 来自 A16z 支持的初创公司 Anyscale,它是使 OpenAI 能够强化其训练 ChatGPT 等模型的关键。在 OpenAI 最近的所有大型语言模型背后都有 Ray 的身影 —— 它可能也会是 OpenAI 备受期待的 GPT-4 背后的框架。随着大模型技术的不断落地,业内人士认为通过生成接近人类的内容,一个价值数十亿美元的产业正在形成。

在这一领域,Ray 是影响力最大的框架。在它出现之前,OpenAI 使用自定义工具集合来开发大模型。但 OpenAI 总裁 Greg Brockman 在今年早些时候的 Ray 峰会上就表示,随着面临的挑战增多,该公司已转而使用 Ray。

5c74616c-da65-11ed-bfe3-dac502259ad0.png

软件公司 Weights & Biases 的 CEO Lukas Biewald 认为,Ray 已是 AI 世界中炙手可热的后起之秀。「因为新工具出现,你可以在笔记本电脑和大型分布式服务器上运行相同代码。这是巨大的改变,随着模型变得更大,它的重要性也会随之增加,」Biewald 表示。

十亿美元的赌注

随着技术的成熟,Ray 引来了资本市场的关注。Anyscale 的股权成为了一种稀缺的商品,据 Business Insider 报道,有知情人士称,其最近一轮融资是 C 轮融资的延伸,估值超过 10 亿美元,几天内就结束了。

一些投资者将 Anyscale 描述为 Horowitz 充满希望的「下一个 Databricks」—— 这个描述看来不无道理,因为这家初创公司的创始人之一 Ion Stoica 是市值 310 亿美元的数据巨头 Databricks 的联合创始人。

「人工智能的发展速度令人难以置信,人们一直在尝试新方法,」Anyscale 首席执行官 Robert Nishihara 表示。「ChatGPT 结合了此前大语言模型上的大量工作。在此基础上,你需要拥有能够实现灵活性、快速创新,并扩展不同算法和方法的基础设施。」

由于像 ChatGPT 这样热门的新工具背后是越来越大的模型,科技公司不得不重新考虑从头开始开发 AI 的方式。Ray 应运而生,使训练这些庞大的模型变得更加容易,并且可以包含数千亿个数据点,让每个响应都具有准栩栩如生的感觉。

Ray 如何成为机器学习的首选工具

Ray 是一个基于内存共享的分布式计算框架,适用于细粒度的并行计算和异构计算,其提供了一个底层基础架构,用于管理分配机器学习模型训练工作的复杂任务。

在 2017 年,UC Berkeley 的研究人员首次提交了 Ray 的论文《 Ray: A Distributed Framework for Emerging AI Applications 》:

5c8c45ca-da65-11ed-bfe3-dac502259ad0.jpg

论文链接:https://arxiv.org/abs/1712.05889

GitHub:https://github.com/ray-project/ray

在该工作中,研究人员预测了下一代 AI 应用程序的形态:与环境存在连续的交互,并从交互动作中进行学习。这些应用必然越来越多地在动态环境中来完成任务,根据环境的变化作出反应,并执行一系列的动作来达到长期目标。这些特性对于运行环境性能和灵活性等方面提出了全新且苛刻的系统要求,因此研究者提出了基于分布式的 Ray 框架。

Ray 实现了统一接口,可以表达任务并行和基于参与者的计算,由单个动态执行引擎支持。为了满足性能要求,Ray 采用分布式调度程序和分布式容错存储来管理系统的控制状态。它是首个将训练、仿真和服务统一起来的分布式计算框架,基于动态任务执行引擎统一了角色并行(actor)和任务并行(task)的计算,并保障了框架的高可扩展性和高容错性。

5ca30b8e-da65-11ed-bfe3-dac502259ad0.jpg

Ray 的架构。

基于该工作,2019 年 12 月,UC Berkeley 的 Robert Nishihara、Philipp Moritz 和 Ion Stoica 以及伯克利教授 Michael I. Jordan 创立了 Anyscale,迄今为止该公司已融资 2.6 亿美元。

机器学习从业者通常可以在自己的笔记本电脑上运行使用有限数据集的小型模型,例如预测用户购买产品的简单模型。然而,像 ChatGPT 这样的超大型模型,笔记本电脑是行不通的,这些模型需要大量服务器来训练。

使用大量设备训练一个模型要面对一个重要挑战 —— 在不同硬件上协调训练。而 Ray 恰好解决了这个难题,它为从业者提供了一种将不同硬件作为一个单元来管理的机制,用于确定什么数据去哪里,处理故障等等,硬件种类横跨谷歌云、AWS 和其他处理相同问题的产品组合。此外,Ray 还将其他语言中的一个关键编程概念「actor」扩展到 Python,众所周知 Python 是机器学习程序的首选语言。

5cc3a9b6-da65-11ed-bfe3-dac502259ad0.gif

作为一个分布式计算框架,Ray 有两个关键优势,分别是位置感知(Locality-aware)和任务分配(task placement)。如下图所示,Ray 能够横向扩展系统,以支持高吞吐量的细粒度任务,同时保持容错和低延迟任务调度。

5cda964e-da65-11ed-bfe3-dac502259ad0.png

Ray 为 OpenAI 训练大模型消除了巨大的复杂性,为该公司腾出更多时间和精力专注于模型的关键能力。

新一代 AI 需要新的开发工具,Ray 只是一系列迅速兴起的下一代机器学习工具中的一个,这些工具正在迅速颠覆 AI 的开发方式。例如,Google 的 JAX 框架也获得了巨大关注,JAX 有望成为谷歌核心机器学习工具的支柱,已经在 DeepMind 和 Google Brain 被广泛采用。

类似地,由 FirstMark Capital 和 Bessemer Venture Partners 支持的初创公司 Coiled 开发了一个名为 Dask 的并行计算框架。

近来大型语言模型正在释放更多潜力,这些新型机器学习工具将为业内科技巨头和初创公司构建更强大的语言模型。

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1813

    文章

    49746

    浏览量

    261603
  • 机器学习
    +关注

    关注

    66

    文章

    8541

    浏览量

    136236
  • OpenAI
    +关注

    关注

    9

    文章

    1238

    浏览量

    9816

原文标题:ChatGPT背后的开源AI框架Ray,现在值10亿美元

文章出处:【微信号:TheBigData1024,微信公众号:人工智能与大数据技术】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    NVIDIA新闻:英伟达10亿美元入股诺基亚 英伟达推出全新量子设备

    给大家分享一些NVIDIA新闻: 英伟达10亿美元入股诺基亚 在当地时间10月28日,英伟达正式宣布将以10
    的头像 发表于 10-29 17:12 1309次阅读

    开源鸿蒙MNN AI应用开发与MNN移植经验

    本期内容由AI Model SIG提供,介绍了在开源鸿蒙中,利用MNN开源框架开发AI应用以及基于MNN源码编译与Har包封装的方法。
    的头像 发表于 09-04 11:31 3654次阅读
    <b class='flag-5'>开源</b>鸿蒙MNN <b class='flag-5'>AI</b>应用开发与MNN移植经验

    美国商务部推进收购英特尔10%股份 估约达105亿美元

    约达105亿美元。 据悉,美国商务部长卢特尼克在19日接受美国消费者新闻与商业频道采访时透露,英特尔必须提供股权以换取联邦补贴。
    的头像 发表于 08-20 12:25 612次阅读

    下一波轻量化AI+AR眼镜热潮将至

    近期,Meta发布了今年第二季度的财报,2025 年第二季度,Meta Reality Labs共实现了 3.7 亿美元的收入,比 2024 年第二季度的 3.53 亿美元增长 5%。
    的头像 发表于 08-07 17:27 1748次阅读

    4450亿美元!Edge AI市场大爆发,英特尔布局哪些AI SoC芯片?

    AI是边缘计算和IoT增长的最大驱动力,预计到2030年,AI将成为全球边缘市场的重要驱动力,市场规模有望达到4450亿美元。英特尔在边缘AI
    的头像 发表于 08-04 08:46 6734次阅读
    4450<b class='flag-5'>亿</b><b class='flag-5'>美元</b>!Edge <b class='flag-5'>AI</b>市场大爆发,英特尔布局哪些<b class='flag-5'>AI</b> SoC芯片?

    大家都在用什么AI软件?有没有好用的免费的AI软件推荐一下?

    大家都在用什么AI软件?有没有好用的免费的AI软件推荐一下?直接发个安装包,谢谢。比如deepseek、Chatgpt、豆包、阿里AI、百度AI
    发表于 07-09 18:30

    星闪AI玩具,或将引爆600亿美元大市场?

    2025第一个“风口”来了?根据相关数据,AI玩具将迎来600亿美元大市场。一个售价9.9元的日常玩具,加上AI功能后,升价暴涨至100+,暴涨的
    的头像 发表于 04-30 18:21 644次阅读
    星闪<b class='flag-5'>AI</b>玩具,或将引爆600<b class='flag-5'>亿</b><b class='flag-5'>美元</b>大市场?

    Groq获沙特15亿美元投资,加速AI芯片全球布局

    近日,美国AI芯片初创公司Groq宣布了一项重大融资进展。2月10日,该公司透露已从沙特阿拉伯获得高达15亿美元的投资承诺,旨在扩大其先进的AI
    的头像 发表于 02-13 16:20 840次阅读

    谷歌再投10亿美元于Anthropic,加强AI领域布局

    近日,Alphabet Inc.旗下的谷歌公司宣布,将向人工智能(AI)开发商Anthropic进一步投资10亿美元。这一举动表明,谷歌正在加大对这家颇具潜力的
    的头像 发表于 01-23 15:20 803次阅读

    谷歌拟向Anthropic投资10亿美元

    近日,据外媒最新报道,谷歌正计划向人工智能(AI)领域的初创公司Anthropic进行新一轮投资,投资金额预计超过10亿美元。此举将使谷歌成为Anthropic的重要股东,并加强双方在
    的头像 发表于 01-23 14:38 817次阅读

    特朗普力推AI投资 5000亿美元!特朗普宣布重磅AI项目

    基础设施。 特朗普称这是“史上最大”的AI基础设施投资项目。有望创造10万个就业岗位。 据悉,三家公司联手打造的项目名为“星际之门”,计划初始投资1000亿美元,并在未来4年内扩展至5
    的头像 发表于 01-22 15:21 1051次阅读

    AI Server市场持续扩张,2025年产值有望逼近3000亿美元

     在2024年,全球Server市场的总产值预计将达到约3060亿美元。其中,AI Server的增长动力显著超越了一般型Server,其产值约为2050亿
    的头像 发表于 01-07 17:18 1980次阅读

    AI开发框架集成介绍

    随着AI应用的广泛深入,单一框架往往难以满足多样化的需求,因此,AI开发框架的集成成为了提升开发效率、促进技术创新的关键路径。以下,是对AI
    的头像 发表于 01-07 15:58 940次阅读

    Luma AI Ray 2视频模型即将发布

    能够在短短10秒内,根据用户提供的文本和图像提示,生成高质量的视频内容。 Luma AI Ray 2视频模型是Luma AI为视频创作者量身打造的“视觉思维合作伙伴”。与前代模型相比,
    的头像 发表于 12-20 11:37 983次阅读

    Luma AI全新视频模型Ray 2即将面向消费者、专业人士和开发者开放

    ,Luma AI宣布其最新版Luma AI Ray 2视频模型即将发布,该模型仅需10秒即可根据文本和图像提示生成视频。Luma AI
    的头像 发表于 12-18 09:49 1057次阅读