0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

OpenAI用强化学习训练机械手,新的OpenAI长什么样子?

KIyT_gh_211d74f 来源:lp 2019-03-14 09:59 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

OpenAI 是一个非盈利性的 AI 组织,他们雇佣了许多一流的研究和开发人员,在机器学习理论和深度学习应用方面多有诸多成果,我们曾经报道过的许多强化学习连续控制成果、5v5 DOTA AI「OpenAI Five」、自动生成人类水准文本的 GPT-2就都来自他们。

OpenAI 用强化学习训练机械

在近几年的科研中,OpenAI 明显尝到了大规模计算能力的甜头。OpenAI Five 和 GPT-2 的优异表现背后,算法设计方面的创新并不多,更重要的是大规模计算能力。而 OpenAI 也决定在这个方向上走得更快、更远一些,OpenAI 打算未来几年在大规模云计算方面投入数十亿美元、吸引并留住更多优秀的 AI 人材,甚至建造 AI 超级计算机。

目标相当宏伟,可这些钱要去哪里找呢?他们的答案是,重组 OpenAI,吸引更多投资。

新的 OpenAI 长什么样子?

OpenAI 在创立之初就确定了自己的科研使命是确保通用人工智能(AGI)能够造福全人类,主要方式是尝试建造安全的通用人工智能,并和全世界分享它带来的好处。抱着这样的愿景成立的非盈利组织 OpenAI 自然能自由地追寻自己的使命,但同时它吸引投资、获得利润的能力自然是先天不足的。

OpenAI 在声明博客中写道「我们希望增加我们获得投资的能力,但同时还要保持我们的使命不受干扰。然而据我们了解,目前并没有什么合法的公司结构可以达到我们想要的平衡。我们想到的办法是创建一个新公司 OpenAI LP(有限公司),它将是盈利性和非盈利性的混合。我们把它称为『有上限的盈利公司』。」

OpenAI 未来将包含两部分,盈利性部分(「OpenAI 有限公司」)和非盈利性部分(「OpenAI 非盈利」)。在他们的设计中,投资人和绝大多数员工都将属于盈利性的部分,并正常进行科研工作;当 OpenAI沿着原有使命取得阶段性科研成果、带来利润回报的时候(如果获得利润回报的话),员工和投资人可以像正常的初创企业一样分享这些回报。可以预期一些回报,便于 OpenAI 获得投资、吸引高水平人材。但同时,他们会为科研成果带来的利润回报设定一个上限,超过这个上限的部分将不参与盈利性部分的分配,而转交给原本的 OpenAI 非营利性部分(首轮投资人的回报上限设定为投资额的一百倍,未来可能会降低一些)。

「OpenAI 有限公司」的实际控制权将属于「OpenAI 非盈利」的董事会。以及,只有一小部分的董事会成员可以持有未来的 OpenAI 的股份,而且,当 OpenAI 有限公司的投资人和员工的利益和 OpenAI 非盈利的使命发生冲突需要投票的时候,只有不持有股份的董事会成员可以参与投票。

在所有的员工和投资人合同第一页都会有这样一个紫色的警示框,内容大意是:OpenAI 有限公司的目标是推进 OpenAI 开发安全的通用人工智能并造福全人类的使命。OpenAI 非盈利的职责以及 OpenAI 纲领中提出的条款优先于获得利润。OpenAI 有限公司有可能永远无法获得利润,OpenAI 非盈利也没有义务让它产生利润。OpenAI 非盈利重新投资公司实体以及OpenAI有限公司的现金流在科研和开发活动中不受任何限制,也对投资人没有任何义务。

可以看出来,以上的种种设计都是为了确保 OpenAI 仍然对「不受盈利困扰的科研活动」这条主线有足够的控制,并确保它得以执行。未来的 OpenAI 对投资人的吸引力自然比以前要强一些,不过「盈利」看起来仍然只是锦上添花。这看起来也像是一场大胆的实验,即便 OpenAI 是 AI 领域的明星企业,但在这种种设计、种种限制,以及重资金的未来规划之下,是否真的会成为投资人眼中的香饽饽呢?

架构变了,科研路线不变

OpenAI CTO Greg Brockman 和 OpenAI 联合创始人、科研总监Ilya Sutskever 在博客中写道:我们的每日科研工作并不会因此发生变化,也继续相信只需要考虑如何开发新的 AI 技术就可以为全人类创造更多的价值(而不是通过制造商业化的产品);新的公司架构也为获得技术的长期回报留下了许多灵活的空间。

OpenAI 有限公司目前有大约 100 名员工,分别属于三个主要层面:能力(增大 AI 系统的能力范围)、安全(确保这些系统和人类的价值观相符)以及政策(确保对这些系统有正确的管理方式)。OpenAI 有限公司受 OpenAI 非盈利管理,访问学者、实习生、教育计划以及政策发声等活动也会继续在 OpenAI 非盈利的组织下进行。

除此之外,OpenAI 原有的开放科研、开放合作等理念也会延续下去(并不会因为有投资人参与就变得不再开放)。获得利润仍然不是 OpenAI 的首要目标,所以并不用担心 OpenAI 作为学术研究机构大变天。

根据 OpenAI 博客介绍,目前已经有 Reid Hoffman 慈善基金会、Khosla 风投等机构成为了他们的投资人。AI 科技评论也祝愿有更多的资金可以参与到 OpenAI 的科研中来,既加速了人工智能领域的发展,也展现了对技术纯粹的追求以及对全人类的美好期望。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1819

    文章

    50290

    浏览量

    266826
  • 机械手
    +关注

    关注

    7

    文章

    362

    浏览量

    31587
  • 深度学习
    +关注

    关注

    73

    文章

    5603

    浏览量

    124609

原文标题:要更有钱、更烧钱,OpenAI 重组,加速融资之路

文章出处:【微信号:gh_211d74f707ff,微信公众号:重庆人工智能】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    自动驾驶中常提的离线强化学习是什么?

    ,图片源自:网络 但强化学习本身是需要不断试错的,如果采用这种学习方式在真实道路中不断尝试,一定会导致不可控的事故。于是就有人提出一种猜测,能不能利用已经存在的大量行驶日志、仿真记录和人类驾驶数据,在训练过程中完全
    的头像 发表于 02-07 09:21 335次阅读
    自动驾驶中常提的离线<b class='flag-5'>强化学习</b>是什么?

    适配FOUP载具的晶圆搬运机械手,哪些型号维护更便捷?

    FOUP载具(Front-Opening Unified Pod)作为半导体晶圆的密封传输容器,能有效避免晶圆在搬运过程中被污染,因此在先进制程中应用广泛。但适配FOUP载具的晶圆搬运机械手,维护
    的头像 发表于 02-03 13:55 215次阅读

    强化学习会让自动驾驶模型学习更快吗?

    [首发于智驾最前沿微信公众号]在谈及自动驾驶大模型训练时,有的技术方案会采用模仿学习,而有些会采用强化学习。同样作为大模型的训练方式,强化学习
    的头像 发表于 01-31 09:34 815次阅读
    <b class='flag-5'>强化学习</b>会让自动驾驶模型<b class='flag-5'>学习</b>更快吗?

    多智能体强化学习(MARL)核心概念与算法概览

    训练单个RL智能体的过程非常简单,那么我们现在换一个场景,同时训练五个智能体,而且每个都有自己的目标、只能看到部分信息,还能互相帮忙。这就是多智能体强化学习
    的头像 发表于 01-21 16:21 321次阅读
    多智能体<b class='flag-5'>强化学习</b>(MARL)核心概念与算法概览

    今日看点:智元推出真机强化学习;美国软件公司SAS退出中国市场

    智元推出真机强化学习,机器人训练周期从“数周”减至“数十分钟”   近日,智元机器人宣布其研发的真机强化学习技术,已在与龙旗科技合作的验证产线中成功落地。据介绍,此次落地的真机强化学习
    发表于 11-05 09:44 1152次阅读

    自动驾驶中常提的“强化学习”是个啥?

    [首发于智驾最前沿微信公众号]在谈及自动驾驶时,有些方案中会提到“强化学习(Reinforcement Learning,简称RL)”,强化学习是一类让机器通过试错来学会做决策的技术。简单理解
    的头像 发表于 10-23 09:00 869次阅读
    自动驾驶中常提的“<b class='flag-5'>强化学习</b>”是个啥?

    柔性机械手视觉供料解决方案,提升无序分拣效率!

    正运动柔性机械手供料解决方案
    的头像 发表于 10-09 14:58 700次阅读
    柔性<b class='flag-5'>机械手</b>视觉供料解决方案,提升无序分拣效率!

    NVIDIA携手OpenAI构建AI基础设施

    NVIDIA 首席执行官黄仁勋、OpenAI 首席执行官 Sam Altman 和 OpenAI 总裁 Greg Brockman 宣布了一项新的合作伙伴关系,旨在推动 OpenAI 的发展,并支持几乎所有行业和用户大规模使用
    的头像 发表于 09-23 14:38 1073次阅读

    OpenAI或在周五凌晨发布GPT-5 OpenAI以低价向美国政府提供ChatGPT

    外界一直在期待的OpenAI新一代大语言模型GPT-5或将发布。据外媒的报道,GPT-5很可能在周五凌晨发布。这是OpenAI在2023年的3月份推出自然语言处理模型GPT-4之后,两年多时候后最受
    的头像 发表于 08-07 14:13 1.4w次阅读

    OpenAI发布2款开源模型

    OpenAI开源了两款高性能权重语言模型gpt-oss-120b和gpt-oss-20b,OpenAI CEO Sam Altman表示:「gpt-oss 发布了!我们做了一个开放模型,性能达到
    的头像 发表于 08-06 14:25 1124次阅读

    NVIDIA Isaac Lab可用环境与强化学习脚本使用指南

    Lab 是一个适用于机器人学习的开源模块化框架,其模块化高保真仿真适用于各种训练环境,Isaac Lab 同时支持模仿学习(模仿人类)和强化学习(在尝试和错误中进行
    的头像 发表于 07-14 15:29 2601次阅读
    NVIDIA Isaac Lab可用环境与<b class='flag-5'>强化学习</b>脚本使用指南

    DELTA机械手多物料视觉分拣的应用

    正运动DELTA机械手多物料视觉分拣解决方案
    的头像 发表于 06-24 11:16 1145次阅读
    DELTA<b class='flag-5'>机械手</b>多物料视觉分拣的应用

    运动控制模块:Delta机械手柔性上下料开发零门槛!

    正运动运动控制模块结合第三方视觉实现Delta机械手柔性上下料应用开发
    的头像 发表于 05-23 10:29 884次阅读
    运动控制模块:Delta<b class='flag-5'>机械手</b>柔性上下料开发零门槛!

    如何获取 OpenAI API Key?API 获取与代码调用示例 (详解教程)

    OpenAI API Key 获取与使用详解:从入门到精通 OpenAI 正以其 GPT 和 DALL-E 等先进模型引领全球人工智能创新。其 API 为开发者和企业提供了强大的 AI 能力集成途径
    的头像 发表于 05-04 11:42 1.8w次阅读
    如何获取 <b class='flag-5'>OpenAI</b> API Key?API 获取与代码调用示例 (详解教程)