0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

ChatGPT背后的开源AI框架Ray,现在值10亿美元

人工智能与大数据技术 来源:机器之心 2023-04-14 11:03 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

最近一段时间,文本生成的人工智能在互联网上掀起了一阵风暴:ChatGPT 因为可以对人们能想到的几乎任何问题提供非常详细、近乎逼真的回答而受到追捧。大模型应用的出现让人们对于 AI 技术突破充满了信心,不过很少有人知道在其背后,一个分布式机器学习框架正为这场生成式 AI 革命提供动力。

分布式计算框架 Ray 来自 A16z 支持的初创公司 Anyscale,它是使 OpenAI 能够强化其训练 ChatGPT 等模型的关键。在 OpenAI 最近的所有大型语言模型背后都有 Ray 的身影 —— 它可能也会是 OpenAI 备受期待的 GPT-4 背后的框架。随着大模型技术的不断落地,业内人士认为通过生成接近人类的内容,一个价值数十亿美元的产业正在形成。

在这一领域,Ray 是影响力最大的框架。在它出现之前,OpenAI 使用自定义工具集合来开发大模型。但 OpenAI 总裁 Greg Brockman 在今年早些时候的 Ray 峰会上就表示,随着面临的挑战增多,该公司已转而使用 Ray。

5c74616c-da65-11ed-bfe3-dac502259ad0.png

软件公司 Weights & Biases 的 CEO Lukas Biewald 认为,Ray 已是 AI 世界中炙手可热的后起之秀。「因为新工具出现,你可以在笔记本电脑和大型分布式服务器上运行相同代码。这是巨大的改变,随着模型变得更大,它的重要性也会随之增加,」Biewald 表示。

十亿美元的赌注

随着技术的成熟,Ray 引来了资本市场的关注。Anyscale 的股权成为了一种稀缺的商品,据 Business Insider 报道,有知情人士称,其最近一轮融资是 C 轮融资的延伸,估值超过 10 亿美元,几天内就结束了。

一些投资者将 Anyscale 描述为 Horowitz 充满希望的「下一个 Databricks」—— 这个描述看来不无道理,因为这家初创公司的创始人之一 Ion Stoica 是市值 310 亿美元的数据巨头 Databricks 的联合创始人。

「人工智能的发展速度令人难以置信,人们一直在尝试新方法,」Anyscale 首席执行官 Robert Nishihara 表示。「ChatGPT 结合了此前大语言模型上的大量工作。在此基础上,你需要拥有能够实现灵活性、快速创新,并扩展不同算法和方法的基础设施。」

由于像 ChatGPT 这样热门的新工具背后是越来越大的模型,科技公司不得不重新考虑从头开始开发 AI 的方式。Ray 应运而生,使训练这些庞大的模型变得更加容易,并且可以包含数千亿个数据点,让每个响应都具有准栩栩如生的感觉。

Ray 如何成为机器学习的首选工具

Ray 是一个基于内存共享的分布式计算框架,适用于细粒度的并行计算和异构计算,其提供了一个底层基础架构,用于管理分配机器学习模型训练工作的复杂任务。

在 2017 年,UC Berkeley 的研究人员首次提交了 Ray 的论文《 Ray: A Distributed Framework for Emerging AI Applications 》:

5c8c45ca-da65-11ed-bfe3-dac502259ad0.jpg

论文链接:https://arxiv.org/abs/1712.05889

GitHub:https://github.com/ray-project/ray

在该工作中,研究人员预测了下一代 AI 应用程序的形态:与环境存在连续的交互,并从交互动作中进行学习。这些应用必然越来越多地在动态环境中来完成任务,根据环境的变化作出反应,并执行一系列的动作来达到长期目标。这些特性对于运行环境性能和灵活性等方面提出了全新且苛刻的系统要求,因此研究者提出了基于分布式的 Ray 框架。

Ray 实现了统一接口,可以表达任务并行和基于参与者的计算,由单个动态执行引擎支持。为了满足性能要求,Ray 采用分布式调度程序和分布式容错存储来管理系统的控制状态。它是首个将训练、仿真和服务统一起来的分布式计算框架,基于动态任务执行引擎统一了角色并行(actor)和任务并行(task)的计算,并保障了框架的高可扩展性和高容错性。

5ca30b8e-da65-11ed-bfe3-dac502259ad0.jpg

Ray 的架构。

基于该工作,2019 年 12 月,UC Berkeley 的 Robert Nishihara、Philipp Moritz 和 Ion Stoica 以及伯克利教授 Michael I. Jordan 创立了 Anyscale,迄今为止该公司已融资 2.6 亿美元。

机器学习从业者通常可以在自己的笔记本电脑上运行使用有限数据集的小型模型,例如预测用户购买产品的简单模型。然而,像 ChatGPT 这样的超大型模型,笔记本电脑是行不通的,这些模型需要大量服务器来训练。

使用大量设备训练一个模型要面对一个重要挑战 —— 在不同硬件上协调训练。而 Ray 恰好解决了这个难题,它为从业者提供了一种将不同硬件作为一个单元来管理的机制,用于确定什么数据去哪里,处理故障等等,硬件种类横跨谷歌云、AWS 和其他处理相同问题的产品组合。此外,Ray 还将其他语言中的一个关键编程概念「actor」扩展到 Python,众所周知 Python 是机器学习程序的首选语言。

5cc3a9b6-da65-11ed-bfe3-dac502259ad0.gif

作为一个分布式计算框架,Ray 有两个关键优势,分别是位置感知(Locality-aware)和任务分配(task placement)。如下图所示,Ray 能够横向扩展系统,以支持高吞吐量的细粒度任务,同时保持容错和低延迟任务调度。

5cda964e-da65-11ed-bfe3-dac502259ad0.png

Ray 为 OpenAI 训练大模型消除了巨大的复杂性,为该公司腾出更多时间和精力专注于模型的关键能力。

新一代 AI 需要新的开发工具,Ray 只是一系列迅速兴起的下一代机器学习工具中的一个,这些工具正在迅速颠覆 AI 的开发方式。例如,Google 的 JAX 框架也获得了巨大关注,JAX 有望成为谷歌核心机器学习工具的支柱,已经在 DeepMind 和 Google Brain 被广泛采用。

类似地,由 FirstMark Capital 和 Bessemer Venture Partners 支持的初创公司 Coiled 开发了一个名为 Dask 的并行计算框架。

近来大型语言模型正在释放更多潜力,这些新型机器学习工具将为业内科技巨头和初创公司构建更强大的语言模型。

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1820

    文章

    50330

    浏览量

    266967
  • 机器学习
    +关注

    关注

    67

    文章

    8565

    浏览量

    137226
  • OpenAI
    +关注

    关注

    9

    文章

    1249

    浏览量

    10281

原文标题:ChatGPT背后的开源AI框架Ray,现在值10亿美元

文章出处:【微信号:TheBigData1024,微信公众号:人工智能与大数据技术】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    腾讯阿里联手投资DeepSeek:估飙升背后AI资本博弈

    2026年4月23日,科技圈掀起资本巨浪——腾讯控股与阿里巴巴集团正就投资AI初创公司DeepSeek展开深度洽谈,若交易达成,这家成立仅三年的企业估将突破200亿美元,较五日前市场
    的头像 发表于 04-24 09:11 705次阅读

    跃昉科技产品全面适配OpenClaw开源AI智能体框架

    近期,开源AI智能体框架OpenClaw在开发者社区迅速走红。它让AI从“对话”走向“执行”——用户只需设定目标,OpenClaw就能自主拆解任务、调用工具、持续运行直至完成。这一范式
    的头像 发表于 03-18 17:17 980次阅读
    跃昉科技产品全面适配OpenClaw<b class='flag-5'>开源</b><b class='flag-5'>AI</b>智能体<b class='flag-5'>框架</b>

    瀚博半导体GPU云底座与一体机方案支持OpenClaw开源AI智能体框架

    瀚博半导体,以创新的GPU云底座与一体机方案,支持OpenClaw开源AI智能体框架,全天候运行AI智能体,在大幅提升数字生产力的同时保证数据安全与隐私安全,让智能体真正落地千行百业。
    的头像 发表于 03-11 13:39 604次阅读
    瀚博半导体GPU云底座与一体机方案支持OpenClaw<b class='flag-5'>开源</b><b class='flag-5'>AI</b>智能体<b class='flag-5'>框架</b>

    涨3倍,估破110亿美元!英伟达投资,AI初创公司剑指IPO

    2月4日,人工智能初创公司ElevenLabs 周三宣布,已完成5亿美元D轮资金,估达 110 亿美元,该公司正考虑进行潜在的IPO。此轮
    的头像 发表于 02-06 10:51 1.9w次阅读
    涨3倍,估<b class='flag-5'>值</b>破110<b class='flag-5'>亿</b><b class='flag-5'>美元</b>!英伟达投资,<b class='flag-5'>AI</b>初创公司剑指IPO

    巨头竞逐AI医疗健康:OpenAI推出ChatGPT Health,蚂蚁阿福国内领跑

    健康已成为AI技术的高频应用场景。OpenAI在其一篇博客文章中透露,通过分析匿名化的ChatGPT对话数据,发现全球每周有超过2.3亿人在ChatGPT上咨询健康相关问题,医疗健康的
    的头像 发表于 01-10 11:17 2556次阅读

    马斯克杀疯了!xAI官宣200亿美元融资,AI赛道再掀狂澜

    的单轮融资纪录,更将xAI推向全球AI竞争的核心舞台。   自2023年7月成立以来,xAI的融资步伐堪称“疯狂”。2024年,公司先后完成两轮60亿美元融资,估从180
    的头像 发表于 01-07 17:50 7089次阅读

    NVIDIA新闻:英伟达10亿美元入股诺基亚 英伟达推出全新量子设备

    给大家分享一些NVIDIA新闻: 英伟达10亿美元入股诺基亚 在当地时间10月28日,英伟达正式宣布将以10
    的头像 发表于 10-29 17:12 2413次阅读

    全球电子元件市场报告:AI 与新能源汽车增长机遇

    市场概述:稳健增长背后的强劲动力全球电子元件市场正在迎来前所未有的增长周期,宝宫Boarden根据StraitsResearch的最新报告显示,2024年市场估已达2111.1亿美元
    的头像 发表于 10-17 16:36 1462次阅读
    全球电子元件市场报告:<b class='flag-5'>AI</b> 与新能源汽车增长机遇

    AI看点:OpenAI启动员工百亿美元售股 上海人工智能实验室开源新模型 济南大数据局与华为签署合作协议

    给大家带来一些AI资讯: OpenAI启动员工百亿美元售股  据外媒爆料称,OpenAI正将其二次股票出售规模扩大逾40亿美元,向符合资格的现任及离职员工提供出售约103
    的头像 发表于 09-04 17:29 1641次阅读

    开源鸿蒙MNN AI应用开发与MNN移植经验

    本期内容由AI Model SIG提供,介绍了在开源鸿蒙中,利用MNN开源框架开发AI应用以及基于MNN源码编译与Har包封装的方法。
    的头像 发表于 09-04 11:31 4986次阅读
    <b class='flag-5'>开源</b>鸿蒙MNN <b class='flag-5'>AI</b>应用开发与MNN移植经验

    美国商务部推进收购英特尔10%股份 估约达105亿美元

    约达105亿美元。 据悉,美国商务部长卢特尼克在19日接受美国消费者新闻与商业频道采访时透露,英特尔必须提供股权以换取联邦补贴。
    的头像 发表于 08-20 12:25 888次阅读

    下一波轻量化AI+AR眼镜热潮将至

    近期,Meta发布了今年第二季度的财报,2025 年第二季度,Meta Reality Labs共实现了 3.7 亿美元的收入,比 2024 年第二季度的 3.53 亿美元增长 5%。
    的头像 发表于 08-07 17:27 2275次阅读

    4450亿美元!Edge AI市场大爆发,英特尔布局哪些AI SoC芯片?

    AI是边缘计算和IoT增长的最大驱动力,预计到2030年,AI将成为全球边缘市场的重要驱动力,市场规模有望达到4450亿美元。英特尔在边缘AI
    的头像 发表于 08-04 08:46 7398次阅读
    4450<b class='flag-5'>亿</b><b class='flag-5'>美元</b>!Edge <b class='flag-5'>AI</b>市场大爆发,英特尔布局哪些<b class='flag-5'>AI</b> SoC芯片?

    大家都在用什么AI软件?有没有好用的免费的AI软件推荐一下?

    大家都在用什么AI软件?有没有好用的免费的AI软件推荐一下?直接发个安装包,谢谢。比如deepseek、Chatgpt、豆包、阿里AI、百度AI
    发表于 07-09 18:30

    星闪AI玩具,或将引爆600亿美元大市场?

    2025第一个“风口”来了?根据相关数据,AI玩具将迎来600亿美元大市场。一个售价9.9元的日常玩具,加上AI功能后,升价暴涨至100+,暴涨的
    的头像 发表于 04-30 18:21 864次阅读
    星闪<b class='flag-5'>AI</b>玩具,或将引爆600<b class='flag-5'>亿</b><b class='flag-5'>美元</b>大市场?