0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

腾讯宣布其人工智能球队获首届谷歌足球Kaggle竞赛冠军

lhl545545 来源:21世纪经济报道 作者:21世纪经济报道 2020-12-30 15:58 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

12月30日,腾讯宣布其人工智能球队摘得了首届谷歌足球Kaggle竞赛冠军。这是一场由Google Research与英超曼城俱乐部在Kaggle平台上联合举办的足球AI比赛,经过多轮角逐,腾讯AI Lab研发的绝悟WeKick版本以1785.8的总分成为冠军球队。

创立于2010年的Kaggle是全球最大的数据科学社区和数据科学竞赛平台,今年,也是Kaggle首次针对足球AI领域发布赛题。

比赛使用Google Research Football强化Learning环境,基于开源足球游戏Gameplay Football开发,采取11vs11的赛制,参赛团队需要控制其中1个智能体与10个内置智能体组成球队。

WeKick的比赛场景该赛事发布后,吸引了来自世界顶级院校和研究机构的1100多支队伍参加,而腾讯此次派出的队伍其实是11月底刚刚升级为完全体的“绝悟”,当时,腾讯“绝悟”首次精通了王者荣耀所有英雄的所有技能,此次参加足球赛,就是在其基础上进行了一些针对足球的调整。

AI如何踢足球?

Google Football(on Kaggle)以流行的足球游戏为模型,就像是一款由AI操作的FIFA游戏,智能体控制足球队中的一个或所有足球运动员,学习如何在他们之间传球,并设法克服对手的防守以进球。其竞赛规则与普通足球比赛类似,比如目标都是将球踢入对方球门以及越位、黄牌和红牌规则。

不同于常见足球视频游戏的统一调控式NPC球队,在本次Kaggle竞赛中,每个球员都各由一个单独的智能体控制,而参赛的AI模型则根据比赛情况控制其中一个智能体,与其他10个内置智能体配合。这要求每个球员不仅需要观察对手的行为,还需要留意己方队员的情况,背后需要非常复杂的团队协作和竞争策略作为支撑。

比如,当对方球员控球时,己方智能体不仅要根据球场上双方球员的分布位置预测控球球员的下一步动作,还需要与己方其他球员协同如何合规地夺取足球的控制权。且由于球场动态瞬息万变,因此高速的实时决策能力也是必需的。

此外,从零开始完全采用强化学习方法来训练完整的足球AI实际上也相当困难。与MOBA游戏中不断有经济、血量、经验等实时学习信号不同,足球的游戏激励非常稀疏,基本只能依靠进球,而稀疏激励一直是目前强化Learning一大难题。

“绝悟”的冠军之路

据腾讯方面介绍,绝悟WeKick版本首先采用了强化学习和自博弈(Self-Play)来从零开始训练模型,并部署了一种异步的分布式强化学习框架。虽然该异步架构牺牲了训练阶段的部分实时性能,但灵活性却得到显著提升,而且还支持在训练过程中按需调整计算资源,使其能适应 11 智能体足球游戏训练环境。

由于MOBA游戏和足球游戏任务目标的差异,绝悟WeKick版本还采用了生成对抗模拟学习(GAIL)与人工设计的奖励结合,在特征与奖励设计上进行了扩展和创新。

该方案利用了生成对抗训练机制来拟合专家行为的状态和动作分布,使得绝悟WeKick版本可以从其它球队学习。然后,再将 GAIL 训练的模型作为固定对手进行进一步自博弈训练,进一步提升策略的稳健性。

但这种通过自博弈强化学习得到的模型有一个天然的缺点:很容易收敛到单一风格。在实际比赛的时候单一风格的模型很容易发生由于没见过某种打法而表现失常,最终导致成绩不佳的情况。因此,为了提升策略的多样性和稳健性,绝悟还采用了针对多智能体学习任务的League(若干策略池)多风格强化学习训练方案。

这种League多风格强化学习训练方案的主要流程可简单总结为先专精后综合。

首先训练一个具备一定程度竞技能力的基础模型,比如运球过人、传球配合、射门得分;

接着基于基础模型训练出多个风格化模型,每个模型专注一种风格打法,在风格化模型训练的过程中会定期加入主模型作为对手,避免过度坚持风格,丢失基本能力;

最后基于多个基础模型训练一个主模型,主模型除了以自己的历史模型为对手以外,还会定期加入所有风格化对手的最新模型作为对手,确保主模型能够适应风格完全不同的对手。

最终,基于绝悟完全体的架构迁移,定制化的框架改进,加上关键性的生成对抗模拟学习(GAIL)方案和 League (若干策略池)多风格强化学习训练方案,使得绝悟实现了优于其它竞争AI球队的优势,成就了冠军之路。
责任编辑:pj

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    6271

    浏览量

    112179
  • 人工智能
    +关注

    关注

    1821

    文章

    50511

    浏览量

    267725
  • 腾讯
    +关注

    关注

    7

    文章

    1689

    浏览量

    51043
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    中美互动新周期,余杭论道:首届人工智能高质量发展大会进入倒计时

    人工智能高质量发展大会"已正式进入倒计时。 近日,大会组委会宣布,本次大会将于2026年6月6日在浙江省杭州市余杭区举行。大会由中国电子商会人工智能专业委员会主办,财新数据科技有限公司协办,浙江省乡村发展基金会支持,浙江省新时代
    的头像 发表于 05-19 17:08 488次阅读
    中美互动新周期,余杭论道:<b class='flag-5'>首届</b><b class='flag-5'>人工智能</b>高质量发展大会进入倒计时

    声智科技荣获全国口译大赛人工智能赛道冠军

    近日,第十四届全国口译大赛(英语)暨第十八届多语种全国口译大赛人工智能赛道总决赛在京圆满落幕。声智科技凭借自主构建的声学人工智能模型,从近千家参赛单位中脱颖而出,斩获人工智能赛道同声传译第一名。
    的头像 发表于 04-13 09:27 702次阅读

    浅谈人工智能(2)

    接前文《浅谈人工智能(1)》。 (5)什么是弱人工智能、强人工智能以及超人工智能? 弱人工智能(Weak AI),也称限制领域
    的头像 发表于 02-22 08:24 437次阅读
    浅谈<b class='flag-5'>人工智能</b>(2)

    澎峰科技携最新AI应用AIDF亮相首届光合组织人工智能创新大会

    12月17-19日,首届光合组织人工智能创新大会(HAIC2025)在昆山国际会展中心隆重举办。大会以“智算无界,光合共生”为主题,汇聚全产业链超2500家企业代表、专家学者及行业领袖,通过200余场高密度分享与5000余平方米实景展区,全景呈现中国AI计算开放架构的创新
    的头像 发表于 12-28 10:25 658次阅读

    荣誉再+1!阿普奇评“人工智能+”融合应用企业

    人工智能+”战略推进中取得的年度成果,展望智能时代新未来。 阿普奇作为人工智能领域的创新企业代表受邀参会,并凭借在产业融合方面的突出实践与创新成果,成功评  AI苏州“
    的头像 发表于 12-25 18:07 1131次阅读
    荣誉再+1!阿普奇<b class='flag-5'>获</b>评“<b class='flag-5'>人工智能</b>+”融合应用企业

    研华科技受邀参加首届光合组织人工智能创新大会

    作为海光核心生态伙伴及边缘计算领域的深耕者,研华科技受邀参加首届光合组织人工智能创新大会,并凭借其深度的技术协同与产品化能力,荣获大会颁发的“生态共擎奖”。
    的头像 发表于 12-25 09:52 607次阅读
    研华科技受邀参加<b class='flag-5'>首届</b>光合组织<b class='flag-5'>人工智能</b>创新大会

    智芯公司首届人工智能+”创新创意大赛圆满落幕

    10月20日,智芯公司首届人工智能+”创新创意大赛决赛圆满落幕。来自公司各部门及分子公司的10支队伍同台角逐,智芯公司领导班子出席决赛现场,全程参与打分并为获奖队伍颁奖,以实际行动传递“以创新驱动发展”的战略导向。
    的头像 发表于 10-24 15:31 1046次阅读

    是德科技如何提升AI数据中心集群的可扩展性

    全球范围内,一场高投入的竞赛正在展开:各国与各类企业不断扩建数据中心,以支撑其人工智能(AI)的发展。
    的头像 发表于 09-25 17:09 1272次阅读

    墨芯人工智能亮相2025外滩大会

    9月10日至13日,墨芯人工智能在2025外滩大会盛大亮相,成为"数据与计算展区"备受瞩目的焦点之一。作为深耕稀疏计算的AI芯片企业,墨芯在此次展会上全方位展示了其人工智能芯片、高性能计算卡及行业解决方案,吸引了大量专业观众驻足交流。
    的头像 发表于 09-11 14:04 1023次阅读

    Lambda采用Supermicro NVIDIA Blackwell GPU服务器集群构建人工智能工厂

    人工智能/机器学习、HPC、云、存储和 5G/边缘的整体 IT 解决方案提供商 Super Micro Computer, Inc. (SMCI)今天宣布,超级智能云提供商 Lambda 已部署
    的头像 发表于 08-30 16:55 994次阅读

    挖到宝了!人工智能综合实验箱,高校新工科的宝藏神器

    家人们,最近在研究人工智能相关设备,挖到了一款超厉害的宝藏——比邻星人工智能综合实验箱,必须来给大伙分享分享!可☎(壹捌伍 柒零零玖 壹壹捌陆) 一、开箱即学,便捷拉满 这个实验箱真的是为使用者
    发表于 08-07 14:30

    挖到宝了!比邻星人工智能综合实验箱,高校新工科的宝藏神器!

    家人们,最近在研究人工智能相关设备,挖到了一款超厉害的宝藏——比邻星人工智能综合实验箱,必须来给大伙分享分享!可☎(壹捌伍 柒零零玖 壹壹捌陆) 一、开箱即学,便捷拉满 这个实验箱真的是为使用者
    发表于 08-07 14:23

    2025人工智能十大趋势

    在2025世界人工智能大会·腾讯论坛上,腾讯研究院联合腾讯优图实验室、腾讯智能
    的头像 发表于 08-05 11:42 6178次阅读
    2025<b class='flag-5'>人工智能</b>十大趋势

    迅为RK3588开发板Linux安卓麒麟瑞芯微国产工业AI人工智能

    迅为RK3588开发板Linux安卓麒麟瑞芯微国产工业AI人工智能
    发表于 07-14 11:23

    最新人工智能硬件培训AI 基础入门学习课程参考2025版(大模型篇)

    人工智能大模型重塑教育与社会发展的当下,无论是探索未来职业方向,还是更新技术储备,掌握大模型知识都已成为新时代的必修课。从职场上辅助工作的智能助手,到课堂用于学术研究的智能工具,大模型正在工作生活
    发表于 07-04 11:10