0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

ai真的到了吗,这些业界的人都看不懂的问题,你怎么看

mK5P_AItists 来源:未知 作者:龚婷 2018-03-19 10:08 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

今天,OpenAI在官方博客上丢出了7个研究过程中发现的未解决问题。

OpenAI希望这些问题能够成为新手入坑AI的一种有趣而有意义的方式,也帮助从业者提升技能。

OpenAI版AI界七大未解之谜,现在正式揭晓——

丨1. Slitherin

难度指数:☆☆

实现并解决贪吃蛇的多玩家版克隆作为Gym环境。

环境:场地很大,里面有多条蛇,蛇通过吃随机出现的水果生长,一条蛇在与另一条蛇、自己或墙壁相撞时即死亡,当所有的蛇都死了,游戏结束。

智能体:使用自己选择的自我对弈的RL算法解决环境问题。你需要尝试各种方法克服自我对弈的不稳定性。

检查学习行为:智能体是否学会了适时捕捉食物并避开其他蛇类?是否学会了攻击、陷害、或者联合起来对付竞争对手?

丨2. 分布式强化学习中的参数平均

难度指数:☆☆☆

这指的是探究参数平均方案对RL算法中样本复杂度和通信量影响。一种简单的解决方法是平均每个更新的每个worker的梯度,但也可以通过独立地更新worker、减少平均参数节省通信带宽。

这样做还有一个好处:在任何给定的时间内,我们都有不同参数的智能体,可能出现更好的探测行为。另一种可能是使用EASGD这样的算法,它可以在每次更新时将参数部分结合在一起。

丨3. 通过生成模型完成的不同游戏中的迁移学习

难度指数:☆☆☆

这个流程如下:

训练11个Atari游戏的策略。从每个游戏的策略中,生成1万个轨迹,每个轨迹包含1000步行动。

将一个生成模型(如论文Attention Is All You Need提出的Transformer)与10个游戏产生的轨迹相匹配。

然后,在第11场比赛中微调上述模型。

你的目标是量化10场比赛预训练时的好处。这个模型需要什么程度的训练才能发挥作用?当第11个游戏的数据量减少10x时,效果的大小如何变化?如果缩小100x呢?

丨4. 线性注意Transformer

难度指数:☆☆☆

Transformer模型使用的是softmax中的软注意力(soft attention)。如果可以使用线性注意力(linear attention),我们就能将得到的模型用于强化学习。

具体来说,在复杂环境下使用Transformer部署RL不切实际,但运行一个具有快速权重(fast weight)的RNN可行。

你的目标是接受任何语言建模任务,训练Transformer,然后找到一种在不增加参数总数情况下,用具有不同超参数的线性注意Transformer获取每个字符/字的相同位元的方法。

先给你泼盆冷水:这可能是无法实现的。再给你一个潜在的有用提示,与使用softmax注意力相比,线性注意转化器很可能需要更高的维度key/value向量,这能在不显著增加参数数量的情况下完成。

丨5. 已学习数据的扩充

难度指数:☆☆☆

可以用学习过的数据VAE执行“已学习数据的扩充”。

我们首先可能需要在输入数据上训练一个VAE,然后将每个训练点编码到一个潜在的空间,之后在其中应用一个简单(如高斯)扰动,最后解码回到观察的空间。用这种方法是否能得到更好的泛化,目前还是一个谜题。

这种数据扩充的一个潜在优势是,它可能包含视角变换、场景光纤变化等很多非线性

转换。

丨6. 强化学习中的正则化

难度指数:☆☆☆☆

这指的是实验性研究和定性解释不同正则化方法对RL算法的影响。

在监督学习中,正则化对于优化模型和防止过拟合具有极其重要的意义,其中包含一些效果很赞的方法,如dropout、批标准化和L2正则化等。

然而,在策略梯度和Q-learning等强化学习算法上,研究人员还没有找到合适的正则化方法。顺便说一下,人们在RL中使用的模型要比在监督学习中使用的模型小得多,因为大模型表现更差。

丨7. Olympiad Inequality问题的自动解决方案

难度指数:☆☆☆☆☆

Olympiad Inequality问题很容易表达,但解决这个问题往往需要巧妙的手法。

建立一个关于Olympiad Inequality问题的数据集,编写一个可以解决大部分问题的程序。目前还不清楚机器学习在这里是否有用,但你可以用一个学习的策略减少分支因素。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    40927

    浏览量

    302512
  • 人工智能
    +关注

    关注

    1819

    文章

    50288

    浏览量

    266826

原文标题:AI界的七大未解之谜:OpenAI丢出一组AI研究课题

文章出处:【微信号:AItists,微信公众号:人工智能学家】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    PCB别人包地包地,但别人的隔离度比你好10dB不止

    就着看吧。 关键是这篇文章的题目就给得怪吓人的啊,难道那么多年的老设计工程师真的不懂包地?这样吧,Chris今儿给大家展示一个例子,看看大家的想法吧…… 最近Chris做了块测试板来模拟表层射频信号包
    发表于 04-13 11:21

    刚入行看不懂电路图怎么办?

    刚入行看不懂电路图怎么办?很多电子新手刚入行时,面对密密麻麻的电路图总会犯怵:“这么多元件和线路,到底从哪看起?”别慌!今天就带大家拆解电路图的核心逻辑,只要掌握这5大模块,看懂电路图真的没那么难
    的头像 发表于 04-02 09:01 217次阅读
    刚入行<b class='flag-5'>看不懂</b>电路图怎么办?

    VirtualLab Fusion光源的这些设置方法,掌握了吗?

    VirtualLab Fusion中光源设置的四种方式,欢迎关注黉论网校观看本期案例视频,获取相应代码。 好了,今天的分享就到这里,学会了吗
    发表于 04-02 08:19

    华芯微电子红外智能开发软件的核心亮点

    还在为红外遥控器方案开发头疼?不懂单片机编程、看不懂复杂代码,却想快速落地项目?今天给大家推荐一款“开发神器”—— 华芯微红外智能开发软件,让普通红外发射方案开发变得简单高效,新手也能轻松拿捏!
    的头像 发表于 01-20 16:05 992次阅读
    华芯微电子红外智能开发软件的核心亮点

    第5章 定时器与数码管基础(5.1 5.2)

          随着学习内容越来越多,个别细节可能会感觉略有吃力。但是不要担心,这个跟小孩学走路一样,刚开始走得不太稳,没关系,多走几步多练练。教材的时候要注意专心,一遍看不懂,思考一下,再回头第二
    的头像 发表于 11-20 17:43 653次阅读
    第5章 定时器与数码管基础(5.1 5.2)

    华为云Flexus AI智能体,让每家企业拥有开箱即用的AI超能力

    2024年,不谈AI的企业已被时代抛下。但真正试过的人知道:大模型很强,落地很难。招不到AI工程师、搞不懂复杂参数、担心数据泄露、算力成本
    的头像 发表于 11-17 17:07 993次阅读
    华为云Flexus <b class='flag-5'>AI</b>智能体,让每家企业<b class='flag-5'>都</b>拥有开箱即用的<b class='flag-5'>AI</b>超能力

    AD421环路输出,没有电流

    本人小白,看不懂原理图,搞的AD421模块测不出来4-20mA电流,有偿服务。
    发表于 11-17 14:21

    激光位移传感器参数看不懂?一篇讲透关键指标

    今天用通俗语言拆解3个必看参数,结合光子精密激光位移传感器的实测数据,帮你直观搞懂参数的实际价值。
    的头像 发表于 09-27 15:46 1839次阅读
    激光位移传感器参数<b class='flag-5'>看不懂</b>?一篇讲透关键指标

    AI 芯片浪潮下,职场晋升新契机?

    职场、渴望在专业领域更进一步的人来说,AI 芯片与职称评审之间,实则有着千丝万缕的联系,为职业晋升开辟了新的路径。 AI 芯片领域细分与职称对应 目前,AI 芯片从技术架构上主要分为
    发表于 08-19 08:58

    KF2EDGK-5.05P这个封装的数据手册怎么看

    *附件:KF2EDGK5.0-5P.pdf 看不懂,没有孔径,没有从孔中心到边界的距离,这种PCB封装怎么画?
    发表于 07-17 19:40

    所以做出来了吗

    所以做出来了吗,求
    发表于 06-16 01:43

    失去工作不是因为AI,而是因为使用AI的人

    当算法能精准预测消费者需求时,当AI生成的文案比人类更懂传播心理学时,当自动化系统开始取代基础决策岗位时,真正的危机已悄然降临—— 不是AI在抢夺的工作,而是那些比你更早掌握AI、更
    的头像 发表于 05-13 12:05 977次阅读
    <b class='flag-5'>你</b>失去工作不是因为<b class='flag-5'>AI</b>,而是因为使用<b class='flag-5'>AI</b><b class='flag-5'>的人</b>

    求大师傅分享

    有没有关于机械类别学习资料啊,刚入行,现在连螺母螺牙看不懂
    发表于 04-26 10:17

    帮帮孩子吧,看不懂

    这个图怎么接入电路中,要电路的图片求求了
    发表于 04-25 21:25