根据《自然》最新发表的一项研究,一类增强学习算法在雅达利经典游戏中的得分超过了人类玩家和已有的人工智能系统。这类算法被统称为Go-Explore,它改善了对复杂环境的探索方式,或有望朝着实现真正智能学习体迈出重要一步。
增强学习可以让人工智能系统通过探索和理解复杂环境来进行决策,并学习如何以最优的方式获得奖励。然而,当遇到很少给予反馈的复杂环境时,目前的加强学习算法似乎很容易碰壁。
但Go-Explore突破了这些障碍。它可以对环境进行全面探索,同时构建一个档案库来记住它去过的地方,确保自己不会忘记通往有望成功的中期阶段或是最终胜利(奖励)的路线。
利用这类算法,论文作者解决了之前未能解决的2600个雅达利游戏,验证了这类算法的潜力。作者指出,记住并回到有望成功的探索区域的简单原则,是一种强大、通用的探索方法。他们认为论文所报道的算法有望应用于机器人、语言理解和药物设计。
责任编辑:YYX
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。
举报投诉
-
人工智能
+关注
关注
1821文章
50376浏览量
267091 -
学习算法
+关注
关注
0文章
16浏览量
7632
发布评论请先 登录
相关推荐
热点推荐
嵌入式人工智能课程(华清远见)
嵌入式 AI 编译器优化:华清远见课程,解锁极致端侧性能
随着人工智能从云端全面向边缘侧和终端侧下沉,“万物智联”的时代已经悄然到来。然而,在这股浪潮背后,隐藏着一个巨大的技术鸿沟:在算力受限
发表于 04-16 18:47
人工智能多模态与视觉大模型开发实战 - 2026必会
视觉大模型特训:从原理到部署一站式学会
在科技飞速发展的当下,视觉大模型已成为人工智能领域的一颗璀璨明星,广泛应用于安防监控、自动驾驶、医疗影像分析等众多领域,深刻改变着我们的生活与工作方式。如今
发表于 04-15 16:06
九天菜菜大模型agent智能体开发实战2026一月班
的正式开启。在这个充满无限可能的时代,让我们抓住机遇,积极投身于大模型 Agent 的开发浪潮中,共同探索人工智能的未来边界,创造更加美好的智能世界。
发表于 04-15 16:04
人工智能与机器学习在这些行业的深度应用
自人工智能和机器学习问世以来,多个在线领域的数字化格局迎来了翻天覆地的变化。这些技术从诞生之初就为企业赋予了竞争优势,而在线行业正是受其影响最为显著的领域。人工智能(AI)与机器学习(
【「AI芯片:科技探索与AGI愿景」阅读体验】+具身智能芯片
为计算机可以处理的数字信息。
认知层:
认知层是具身智能的第二层,
负责对数据进行处理和分析,以便更好地理解和利用这些数据。
包括各种算法和模型,如DNN、神经形态计算、决策树等。
作
发表于 09-18 11:45
利用超微型 Neuton ML 模型解锁 SoC 边缘人工智能
的框架小 10 倍,速度也快 10 倍,甚至可以在最先进的边缘设备上进行人工智能处理。在这篇博文中,我们将介绍这对开发人员意味着什么,以及使用 Neuton 模型如何改进您的开发和终端
发表于 08-31 20:54
挖到宝了!人工智能综合实验箱,高校新工科的宝藏神器
和生态体系带到使用者身边 ,让我们在技术学习和使用上不再受制于人。
三、多模态实验,解锁AI全流程
它嵌入了2D视觉、深度视觉、机械手臂、语音识别、嵌入式传感器等多种类AI模块,涵盖人工智能领域主要
发表于 08-07 14:30
挖到宝了!比邻星人工智能综合实验箱,高校新工科的宝藏神器!
和生态体系带到使用者身边 ,让我们在技术学习和使用上不再受制于人。
三、多模态实验,解锁AI全流程
它嵌入了2D视觉、深度视觉、机械手臂、语音识别、嵌入式传感器等多种类AI模块,涵盖人工智能领域主要
发表于 08-07 14:23
兆芯携手合作伙伴在WAIC 2025展示人工智能计算与决策解决方案
2025世界人工智能大会近日在上海盛大开幕。大会期间,兆芯携手上交智算院、科算云共同呈现了基于自研CPU的人工智能计算与决策解决方案,展现了自主CPU技术与AI应用的融合创新,激发新质生产力的强大活力。
超小型Neuton机器学习模型, 在任何系统级芯片(SoC)上解锁边缘人工智能应用.
Neuton 是一家边缘AI 公司,致力于让机器 学习模型更易于使用。它创建的模型比竞争对手的框架小10 倍,速度也快10 倍,甚至可以在最先进的边缘设备上进行人工智能处理。在这篇博文中,我们将介绍
发表于 07-31 11:38
最新人工智能硬件培训AI 基础入门学习课程参考2025版(大模型篇)
在人工智能大模型重塑教育与社会发展的当下,无论是探索未来职业方向,还是更新技术储备,掌握大模型知识都已成为新时代的必修课。从职场上辅助工作的智能助手,到课堂用于学术研究的智能工具,大模
发表于 07-04 11:10
TDK收购SoftEye,打造智能眼镜系统实现通过眼球运动与人工智能进行交互
·TDK收购了人工智能/智能眼镜应用领域的领先技术推动者SoftEye,lnc ·通过此次收购,TDK将能够以更快的速度交付完整的智能眼镜系统,并打造全新的人机界面,实现
维智科技为什么提出时空人工智能
在AI技术突飞猛进的今天,语言、图像和语音的智能能力不断突破,但一个更本质的问题逐渐显现:人工智能真的理解我们所处的空间世界吗?从智能城市到商业选址,从应急调度到人机交互,AI正走向“
增强学习可让人工智能通过探索和理解来进行决策
评论