DeepMind 在强化学习领域具有很高的学术声誉。从 AlphaGo 到 AlphaStar,每一项研究都取得了举世瞩目的成就,但就在最近,DeepMind 的一篇有关多智能体强化学习的论文被华为英国研究中心「打脸」。华为论文指出,DeepMind 的这项研究存在多个问题。
研究者认为,如果要复现近日 DeepMind 登上《Nature》子刊的论文,需要动用高达一万亿美元的算力,这是全球所有算力加起来都不可能实现的。
那么,DeepMind 的这份研究是什么,按照华为论文的说法,存在的问题是什么呢?

被怼的 DeepMind 论文
作为 DeepMind「阿尔法」家族的一名新成员,α-Rank 于今年 7 月登上了自然子刊《Nature Scientific Reports》。研究人员称,α-Rank 是一种全新的动态博弈论解决方法,这种方法已在 AlphaGo、AlphaZero、MuJoCo Soccer 和 Poker 等场景上进行了验证,并获得了很好的结果。
华为论文计算的花销成本(以美元计)如下图 2 所示,其中考虑到了英伟达 Tesla K80 GPU 能够以每秒 0.9 美元、最高 5.6 GFlop/s 的单精度下运行。

图 2:计算α-Rank 时构造转换矩阵 T 的花销成本。
这里请注意,当前全球计算机的总算力约为 1 万亿美元(红色平面)。投影轮廓线表明,由于α-Rank「输入」的算力需求呈指数级增长,用 10 个以上的智能体进行多智能体评估是根本不可能的。
最后,在论文中,华为研究人员提出了一个对α-Rank 的解决方法,名为:α^α-Rank。该方法使用了随机优化策略,能够大大降低计算复杂度。
α-Rank 原理
α-Rank 是 DeepMind 提出的一项强化学习研究,主要针对的是多智能体强化学习的场景。强化学习是一种利用智能体在搜索空间进行探索,并根据其选择的策略给予恰当奖励,使其逐渐收敛到最佳策略上的方法。和一般的强化学习不同,多智能体强化学习中有多个智能体,多个智能体和环境进行交互时就会带来比单个智能体复杂得多的情况。
在多智能体系统中,每个智能体都会通过与所在环境的交互来获取奖励值(reward),进而学习改善自己的策略,并获得该环境下行动的最优策略。在单智能体强化学习中,智能体所在的环境是稳定不变的。但是,在多智能体强化学习中,环境是复杂、动态的,因此不可避免地会给学习过程带来诸多困难。
MARL 最简单的形式是独立强化学习(independent RL,InRL),每个学习器不理会其他智能体,将所有互动作为自己(「局部」)环境的一部分。此外,还有许多智能体和环境以及彼此之间进行交互的研究,智能体彼此之间需要协作,形成联合策略(joint strategy)。要评估智能体选择的策略,就需要对联合策略进行评价。
因此,在可扩展的多智能体强化学习策略评估和学习中存在两个主要的困难。首先,联合策略空间(即所有智能体的策略总和)会随着智能体数量的增加而快速增长。其次,这种多智能体的游戏很可能会演变成一种「石头剪刀布」的循环行为,使得评价策略的好坏变得很困难。为了解决第二个问题,很多多智能体强化学习研究只能将智能体研究转换为博弈论的方法,按照最终博弈结果所得到的的固定分数进行评价。
最近,在解决多智能强化学习这一任务上,DeepMind 又提出了一个名为α-Rank 的方法。这是一个基于图和博弈论的多智能体协作评估解决方案。α-Rank 采用了马尔科夫-康利链(Markov Conley Chains),用于表示游戏动态过程,并尝试计算一个固定的分布。对联合策略的排名按照分布产生。
具体而言,DeepMind 的这篇论文将评估多智能体的问题转换为一个马尔科夫链的固定分布。假设有 N 个智能体,每个智能体有 k 个策略,则该马尔科夫链可被定义为一个联合策略图,有着
的转移矩阵。而要被计算的固定概率分布 ν∈R^k^N,用于解 Tν=ν。v 的质量函数就是联合策略的排名分数。这一方法的亮点在于将多智能体的联合策略作为一个固定分布,以便进行排名和评估。

图 1:有 3 个智能体。a)每个智能体有 3 个策略(用颜色区分)和 5 个副本。每个智能体集群有一个 Pi 值,用于衡量其选择的策略;b)当一个突变策略(红色星星)发生的时候;c)每个群体选择维持原有策略,或者选择突变策略。
在 α-Rank 中,N 个智能体的策略会通过突变和选择进行评价。开始时,智能体集群会构建多个学习器的副本,并假设每个集群中的所有智能体都会执行同一个固定策略。这样一来,α-Rank 会通过随机采样每个集群中的学习器,用于模拟多智能体的博弈环境。在游戏结束时,每个参与的智能体的可以获得一个收益,这个收益可以用于策略突变和选择。在这里,智能体面临一个概率选择——换成突变策略、维持原有策略,或者随机选择一个和前两个不一样的新策略。这一过程持续,目标是决定一个主要的进化方法,并在所有集群的智能体中传播。
反驳理由
华为论文的反驳理由主要是根据α*-*Rank 的计算复杂度进行批判的。α-Rank 声称能够根据智能体的数量在多项式时间内解出问题,但华为论文认为实际的复杂度会随着智能体数量呈几何级别的增长,实际上是一个 NP 困难问题。
α-Rank 的计算复杂度太高
原始的α-Rank 研究声称其算法可解,因为随着联合策略的数量增加,其算法可在多项式时间内完成。根据这一定义,如果α-Rank 有多项式的复杂度,则计算时间应当和公式:O (N × k)^d,(d 和 N(智能体数量)、K(策略数量)独立)相称。而如果算法要求计算一个固定概率分布,有着一个 k^N 行和列的转移矩阵,则时间复杂度应该是 O(k^N)。很显然,这个结果是几何级的,因此不可解。华为论文的研究者认为,α -Rank 中计算最高的联合策略过程是一个 NP 困难问题。
从以上的计算复杂度研究可以得出一个结论,如果按照α-Rank 的方法计算一个固定概率分布,有着ε个固定策略,且精确度参数ε大于 0,可以有多种算法进行计算,计算复杂度如下表 1 所示。而任何一种现有的计算这个固定概率分布的方法都会因智能体的数量增长呈现几何级的复杂度增长。

表 1:以 N(智能体数量)×K(策略数量)表作为输入时的时间和空间复杂度比较。
α-Rank 的输入定义不清
除了计算复杂度问题,华为论文对α-Rank 的输入进行了讨论。DeepMind 的论文给出了这些智能体的复杂度计算结果,并声明了它们的可解性。但是,华为论文想要阐明的一点是,在没有正式定义输入的情况下,此类定义并不能反映真正的底层时间复杂度,因此很难声称这些智能体的可解性。
为此,华为论文举了解决旅行推销员问题的例子,这位旅行推销员需要造访一系列城市,同时又要按照最短的路线返回最初的城市。尽管大家都知道旅行推销员问题属于一种 NP 困难问题,但按照α-Rank 的思路,这一问题可以简化为「元城市」规模的多项式时间(线性,如可解决)问题,这并不是一种有效的声明。
华为论文指出,即使可以说排列数量确定的情况下可以在多项式复杂度中解决旅行推销员问题,这并不能说明任何类似的算法都是可解的。即使算法可以在多项式时间内解决问题,但其空间是几何级规模的,这并不能说明它是可解决的。因此,要说解决了复杂度的问题,就需要对输入进行调整。
一万亿算力都打不住
在以上问题都没有清楚解决的情况下,华为论文只能按照推测,将α-Rank 的输入考虑作为指数级的收益矩阵。接着,他们进行了一项实验,对仅执行算法 1 中第 3 行的扩展性评估花销进行了计算,同时也考虑到了 DeepMind 另一篇论文《α-Rank: Multi-Agent Evaluation by Evolution》中的任务。

华为论文计算了α-Rank 算法 1 中第 3 行的扩展性评估的花销成本。
此外,构建公式 2 中 T 所需的浮点运算总量为

。

公式 2
而就构建上述公式 2 中的 T 而言,华为论文计算的花销成本(以美元计)如下图 2 所示,其中考虑到了英伟达 Tesla K80 GPU 能够以每秒 0.9 美元、最高 5.6 GFlop/s 的单精度下运行。

图 2:计算α-Rank 时构造转换矩阵 T 的花销成本。
这里请注意,当前全球计算机的总算力约为 1 万亿美元(红色平面)。投影轮廓线表明,由于α-Rank「输入」的算力需求呈指数级增长,用十个以上的智能体进行多智能体评估是根本不可能的。
同样值得注意的是,华为论文的分析没有考虑存储 T 或计算平稳分布的花销,因而他们的分析是乐观的。
此外,如果将α-Rank 的输入加入收益矩阵并按照 DeepMind 论文的实验跑 AlphaZero,即使用上全球所有算力,也得花上超过 5200 年。

其他的算法也都不可行——在华为研究人员估算下,即使将收益矩阵加入α-Rank 跑 DeepMind 几个著名算法需要用到的资金花费和时间都是天文数字。注意:在这里预设使用全球所有的算力。
华为提出改进方法α^α-Rank
华为在其论文中采用了一种随机优化方法,该方法通过对收益矩阵的随机采样而获得解决方案,同时无需存储指数大小的输入。与上表 1 中的内存需求相反,这一方法的复杂度为 O(Nk),每次迭代的复杂度为线性。值得注意的是,在启动任何数字指令之前,大多数其他方法需要存储指数大小的矩阵。尽管在理论上没有导致时间复杂度的减弱,但华为论文利用 double-oracle 启发式来扩展其算法,进而实现了联合策略下的空间减小。事实上,华为论文中的实验表明,α^α-Rank 可以在大型策略空间的数百次迭代下收敛至正确的顶级策略。

华为提出的改进方法。
华为论文表明其α^α-Rank 具有可扩展性,能够成功地在无人驾驶汽车模拟和伊辛模型(Ising model,一种具有数千万可能策略的设置)获得最优策略。他们注意到,当前 SOTA 方法的性能远远无法满足此等规模的需求。α-Rank 认为 4 个智能体最多可以采用 4 种策略。华为论文中的所有实验仅仅是在 64GB 内存和 10 核心英特尔 i9 CPU 的单机上运行的。

图 5:大规模多智能体评估。(a)无人驾驶模拟中最优联合策略组合的收敛性;(b)伊辛模型的平衡状态。
相关推荐
这个名为 Sparrow 的新聊天机器人是去年在一篇研究论文中作为概念验证引入的。DeepMind 首席执行官 Demis Hassabis 表示,Sparrow 可能会在 2023 年发布 “私人测试版”。
发表于 01-30 11:25
•295次阅读
。今天,智驾最前沿就带大家一起,来体验极狐阿尔法S 全新HI版NCA高阶智驾功能,测试路段全部为城市道路,点击下方视频,看极狐阿尔法S 全新HI版实际表现情况到底如何吧! 极狐阿尔法S 全新HI版是极狐携手华为联合打造的第一款产品,
发表于 12-21 09:17
•537次阅读
来源:新智元导读人工智能会消灭人类吗?最近,牛津大学和谷歌DeepMind的研究员发现,真的有可能。人工智能是否会消灭人类?这是许多科幻电影和小说中讨论过的话题。在《终结者》中,未来的世界已经
发表于 10-09 09:42
•0次阅读
音圈模组激光雷达在极狐阿尔法S华为HI版的应用。近日,极狐阿尔法S华为HI版正式起售,作为搭载华为HI解决方案的车型,极狐阿尔法S 华为 HI版车型同时也是首款搭载华为激光雷达方案的智能电动车。 据
发表于 05-28 14:12
•1120次阅读
中科阿尔法霍尔开关传感器的简单选型,由佰誉达销售工程师撰写。
发表于 05-17 17:58
•835次阅读
要说2021年的大事件,蔚蓝科技自主设计研发的阿尔法机器狗成功打破世界纪录。此前预售的阿尔法机器狗C系列已经陆续发货,不少用户开始“秀狗”。有的带他们出去散散步,有的留在家里陪孩子,有的甚至让机器狗
发表于 03-23 16:50
•658次阅读
要说2021年的大事件,由蔚蓝科技自主设计研发的阿尔法机器狗成功破世界纪录必须有姓名!此前进行预售的阿尔法机器狗C系列已经陆续交付,不少用户纷纷开始“晒狗”,有带出去遛弯的,有在家陪娃的,甚至还有让
发表于 02-28 10:47
•890次阅读
刷脸设备回收企业 全国上门回收 蜻蜓F4A 原封 拆封 蜻蜓F4 原封 拆封 蜻蜓F4H 原封 拆封 商米蜻蜓2 原封 拆封 蚂里奥T1A 原封 拆封 蚂里奥T1A折.,各种库存刷脸设备回收,长期
发表于 02-18 14:56
6月11日动静,蔚蓝科技推出的第六代c系列阿尔法机器狗打开预售,价钱为16900元起,此刻不妨在蔚蓝科技官方店铺微信小步调付出2000元定金介入预购。 蔚蓝科技第六代c系列阿尔法机器狗的目的是代替
发表于 02-14 09:53
•2086次阅读
大家好,我是老王~前段时间的北汽极狐阿尔法 S 华为 HI 量产版,不知道有没有朋友购买了呢?据说体验感很不错。之前我也特地说过一次关于极狐搭载鸿蒙的事情:全球首款华为鸿蒙汽车诞生!它的原理到底是什么?昨天我还在自己朋友圈刷到这款汽车的广告,今天鸿蒙生态就又加入了新的汽车伙伴加入鸿蒙生态
发表于 12-06 09:46
要说起华为“天才少年”,那话题度可以说是直接拉满。但在百万级年薪背后,“天才少年”们日常从事怎样的工作,却始终保持神秘。现在,下文终于来了——华为首次主动公开“天才少年”最新动向:2019年入职
发表于 12-01 10:01
什么是华为NFC功能?华为NFC有哪些常用的用法?
发表于 11-03 06:01
华为G9和华为p8区别在哪?华为G9和华为p8的硬件配置有何区别?
发表于 10-20 06:15
回收刷脸支付设备,如蜻蜓F4,商米,青蛙,大屏自助机扫码盒,等等,合作热线13480712056刷脸设备回收企业 全国上门回收 蜻蜓F4A 原封 拆封 蜻蜓F4 原封 拆封 蜻蜓F4H 原封 拆封
发表于 09-29 13:12
在无线充电领域,我们平常可以看到各种不同尺寸、不同材质、不同形状的线圈被广泛应用于发射端与接收端产品上,alpha线圈,俗称阿尔法线圈,因为它的两个引出线均在线圈外侧,形似α而得名。阿尔法线圈是单线
发表于 09-15 06:43
也将获得巨大机遇,许多无线充电线圈绕线厂家订单呈上升趋势,并且正在扩大产能。阿尔法线圈由于其绕线方式形似字母α而得名,一般为双层线圈,第一层由外向圆心绕线,绕好第一层之后再由圆...
发表于 09-14 07:39
回收刷脸支付设备,如蜻蜓F4,商米,青蛙,大屏自助机扫码盒,等等,合作热线13480712056刷脸设备回收企业 全国上门回收 蜻蜓F4A 原封 拆封 蜻蜓F4 原封 拆封 蜻蜓F4H 原封 拆封
发表于 09-05 17:21
回收刷脸支付设备,如蜻蜓F4,商米,青蛙,大屏自助机扫码盒,等等,合作热线13480712056刷脸设备回收企业 全国上门回收 蜻蜓F4A 原封 拆封 蜻蜓F4 原封 拆封 蜻蜓F4H 原封 拆封
发表于 09-04 13:02
回收刷脸支付设备,如蜻蜓F4,商米,青蛙,大屏自助机扫码盒,等等,合作热线13480712056刷脸设备回收企业 全国上门回收 蜻蜓F4A 原封 拆封 蜻蜓F4 原封 拆封 蜻蜓F4H 原封 拆封
发表于 09-03 14:14
回收刷脸支付设备,如蜻蜓F4,商米,青蛙,大屏自助机扫码盒,等等,合作热线13480712056刷脸设备回收企业 全国上门回收 蜻蜓F4A 原封 拆封 蜻蜓F4 原封 拆封 蜻蜓F4H 原封 拆封
发表于 09-01 09:22
谁说燃油车不能更智能?日前,北京汽车发布了全新SUV的预告图,图中文字显示,这款车将会是一款搭载华为Harmony OS系统的燃油车型,主要的宣传点也是“万物互联,智启新生”。Harmony OS
发表于 08-10 12:00
近日,华为数据中心能源多项产品荣获国际设计大奖:华为UPS解决方案UPS2000系列荣获2021德国红点奖、智能模块化数据中心AI巡检机器人荣获2021德国iF设计奖,这既是对产品工业设计的认可
发表于 08-06 15:41
•1764次阅读
2021年7月29日,华为智选与阿尔法蛋联合推出的智能词典笔S正式发布。阿尔法蛋智能词典笔S定位面向中小学生,在产品设计上奉行“孩子双语学习好帮手”的理念,做孩子喜爱的词典笔。 这款产品收录中英文
发表于 07-29 22:08
•656次阅读
小米产业投资部高管潘九堂表示这都是谣言。中国电信广州研究院终端研发中心副总经理程贵锋援引媒体报道称高通、联发科趁华为海思芯片被打压的机会涨价。报道称,有行业认为高通在疫情以来业务不振,所以并没有
发表于 07-29 08:23
4月17日晚,北汽新能源汽车高端品牌极狐宣布,旗下第二款量产车型阿尔法S正式上市,新车定位中大型车。首款Huaweiinside智能豪华纯电轿车北汽阿尔法S(华为HI版)采用华为快充技术...
发表于 07-27 08:13
2021上海车展进行中。本届车展,新能源,智能驾驶堪称最热话题,从特斯拉“刹车失灵”到华为首款inside智能汽车——ARCFOX极狐阿尔法S,智能驾驶热度持续攀升。玺哥今天不聊特斯拉,我们来聊聊
发表于 07-27 07:10
“一石激起千层浪”,自从华为宣布正式加入“造车局”后,围绕华为汽车业务的新闻不断涌现。4月15日,华为发布了搭载华为自动驾驶技术的北汽新能源极狐阿尔法S HI版车型在上海进行的公开试乘,这也是华为
发表于 07-27 06:47
千呼万唤,华为第一辆车正式亮相了。4月17日,北汽新能源旗下高端品牌极狐联合华为发布了极狐阿尔法S华为HI版。这是华为的第一辆车——不仅搭载了华为HI解决方案,同时也是首款搭载华为激光雷达方案的智能
发表于 07-27 06:40
手绘图如图片,8脚电源芯片被打磨型号,请问哪位高手认识是什么型号?谢谢!
发表于 07-17 10:28
谷歌 DeepMind 博客昨日更新一篇关于机器学习如何赋能风力发电的文章,详细介绍了谷歌全球可再生能源项目中针对风电场的机器学习实验结果,雷锋网(公众号:雷锋网) AI 科技评论将之编译如下
发表于 07-12 07:41
随着智慧化汽车时代的快速发展,越来越多车企加速自动驾驶技术,就连华为这类科技巨头公司也选择入局汽车行业。虽然华为多次重申不造车,但得益于与华为的技术,让极狐新车阿尔法 S 成为一大亮点。 近日,有
发表于 04-20 10:28
•3613次阅读
4月17日上海车展前夕,北汽极狐举办品牌之夜,亮相旗下最新车型阿尔法S,为了打开C端市场,阿尔法S相较之前车型各方面配置都有升级,其续航里程达到708km,搭载L2.5级的自动驾驶技术和20.3英寸超宽感4K交互屏。该款车补贴后最低售价25.19万,华为HI版最高售价达42.99万。
发表于 04-19 10:11
•1941次阅读
车型极狐阿尔法 S 将于本周发布,并在今年四季度开始推出一系列深度合作的车型。 同时,华为设计了专门的 HUAWEI INSIDE(HI)的子品牌,该 LOGO 未来将 出现在运用了包含华为自动驾驶
发表于 04-13 17:11
ICLR 2021杰出论文奖出炉今年共有2997篇投稿,接收860篇,最后共有8篇获得杰出论文奖。 这8篇论文中,谷歌成最大赢家,共有4篇论文获奖(包括DeepMind、谷歌大脑在内)。 除此之外
发表于 04-13 16:57
•2766次阅读
从官方公布的海报来看,阿尔法S将搭载华为HI智能汽车解决方案,该解决方案包括计算与通讯架构,智能座舱、智能驾驶、智能网联、智能电动、智能车云服务,以及激光雷达、AR HUD在内的30个以上的智能化部件。
发表于 04-12 11:08
•1820次阅读
这一次“灵犀芯片“的曝光还不能完全说明华为手机业务所面临的”无芯可用“的局面被打破。
发表于 01-19 09:40
•1028次阅读
此前印度方面禁止中国智能手机一些APP应用,并在当地引发了大量抵制中国品牌的活动,还抵制中国国产手机,现在闹笑话了,中国手机在印度销量不降反升,印度被打脸啪啪响。 小编之前还听说,印度的运动员羽毛球
发表于 12-30 12:25
•3369次阅读
给供应商股东们创造更高的利润空间。天音通信指出,IoT等相关设备毛利将会达到20%左右,比荣耀中低端手机高得多。这无疑也是供应商们愿意参与的重要原因之一。凭什么打倒华为携诸多优质资源从华为独立出来
发表于 12-03 09:59
购物时“刷脸”支付,乘火车时“刷脸”进站,使用智能终端时“刷脸”解锁……如今,人脸识别的应用场景日益丰富。与此同时,有部分用户认为人脸识别技术有信息泄露、滥用趋势。“刷脸”如何规避安全风险?相关话题频频引发热议。
发表于 12-01 11:32
•3615次阅读
高价暴利耳机被打脸!Xisem西圣ares双十一揭露市场黑幕! 2020年1月8日,西圣战神Ares蓝牙耳机在各大电商平台同步开启双十一促销活动! 西圣这款战神Ares蓝牙耳机自上市以来就稳居全店
发表于 11-05 17:22
•1414次阅读
并不认为华为在被打压的情况下会失去所有这些合同。华为有三种途径可以继续向海外发货电信网络设备,包括美国对于华为非5G网络设备的例外许可(解除对华为的出口限制)、华为使用非美国制造的组件和技术进行产品
发表于 10-21 14:31
•1196次阅读
华为方面选择在9月11日发布鸿蒙系统2.0。鸿蒙系统2.0是在美国再次升级打压措施之后,华为推出的又一项关键成果,也是系统国产化必不可少的一环。2019年华为第一次被打压的时候推出了自主研发的鸿蒙
发表于 09-23 10:03
学习从非结构化数据中学习来编写分析报告或执行无人监督的任务。所有这些发展都为不同的公司发挥作用并证明他们的价值奠定了基础。因此,很多像DeepMind这样的公司成立了,来继续发展这一领域。你对其有
发表于 08-26 12:04
本帖最后由 sumzia 于 2020-2-27 10:46 编辑
霍尔元件在蒸脸机中起开关作用蒸脸器的原理是通过科技手段,把水转化成纳米级较高温度的雾状粒子,使毛孔打开,疏通毛孔,能够帮助
发表于 02-27 10:43
的交易规模已突破40万亿。 2019年,随着刷脸支付的到来,移动支付市场即将迎来新一轮大洗牌——一个百万亿级别的潜在市场,一个巨大的风口。那么,如何加入到刷脸支付的战役之中?如何在这场战役中胜出?本文
发表于 12-10 18:18
颜值当道,看脸为先。在一个看脸的时代,一款产品首先必须以高颜值俘获眼球,才有可能让用户进一步去了解其创新内涵。华为深谙这一点,因此推出的每一款产品,都努力做到颜值和性能的平衡,为人们打造内外兼修的好
发表于 12-05 08:12
•529次阅读
``阿尔法.罗密欧stelivo电动踏板 stelivo智能伸缩踏板阿尔法.罗密欧stelivo电动踏板多少钱``
发表于 10-25 16:09
在华为5G终端及全场景新品发布会上获悉,截至10月22日,华为2019年手机销量已突破2亿台,这一销售业绩比2018年提前64天。 “10月22日,华为手机的销量达到了2亿部,这个数字比2018年
发表于 10-25 10:11
近日,一则“小学生轻松破解丰巢刷脸取件”的新闻冲上了热搜。据报道,浙江一小学的“科学小队”发现,用一张人像的打印照片即可轻松“破解”丰巢智能柜的“刷脸取件”,取出父母的快件。多家媒体纷纷进行测试
发表于 10-23 10:05
在ucosii中,如果在最高优先级的任务中使用delay_us进行延迟,并且delay_us中没有上锁,那么延迟会被打断么?
发表于 08-29 22:56
华为AI觉醒,与谷歌、脸书“三分天下”?
发表于 08-23 10:09
•2460次阅读
近期,因为Deepmind的人工智能在星际争霸2上打败了人类选手,DeepMind又一次进入了人们的视野。AlphaGo作为DeepMind的核心创造物之一,绝不仅是挑战围棋和游戏而生。事实上
发表于 07-29 18:21
•1513次阅读
谷歌人工智能DeepMind,高中数学考了个不及格,研究人员使用数学问题给DeepMind测试了两个LSTM(长短期记忆)模型。据报道,这些题目基于英国国立学校数学课程(面向16岁及以下),涵盖代数
发表于 07-05 11:56
•215次阅读
该算法从感观效果上来看比生成对抗神经网络(GAN)的来得更加真实,堪称AI换脸界的大杀器。
发表于 06-19 09:57
•6922次阅读
近日,DeepMind的研究人员在本周的《科学》杂志上发表了一篇论文,描述描述了一个完全无监督的自学程序,不仅能够学习如何玩“ Quake III Arena ”(雷神之锤III竞技场,一款第一人称射击游戏),还能设计出胜过人类团队的新颖战略。
发表于 06-04 14:53
•2089次阅读
通过对比 2018 年和 2019 年的论文接收情况可以发现,谷歌依旧强势领跑,如果将 DeepMind 的接收论文也统计在内,今年,一作以 Google 发表的论文数量达到了 60 篇,署名 Google 的论文总数高达104篇,科研实力可见一斑。
发表于 05-25 11:11
•3668次阅读
Google AI 与 DeepMind 合作推出深度规划网络 (PlaNet),这是一个纯粹基于模型的智能体,能从图像输入中学习世界模型,完成多项规划任务,数据效率平均提升50倍,强化学习又一突破。
发表于 02-17 09:30
•2738次阅读
DeepMind 发表的好几篇论文也是仅依靠论文本身完全无法复现。这让我意识到发表在 arXiv 或企业网站上的「论文」并不是真正的发表,其主要目标是表明该企业已经具备了某种能力。我并不是说所有大企业在线发表的论文都这样,但其中一些确实如此。
发表于 01-18 14:05
•1765次阅读
`在华为(Huawei)财务长孟晚舟在加拿大被捕后,该公司轮值董事长胡厚崑(Ken Hu)首度打破沉默痛斥美国在制造恐慌,散布华为产品不安全的谣言。胡厚崑进一步指出,各国在没有凭据的情况下封杀华为
发表于 12-19 15:15
报告指出,华为的设备存在技术和供应料的问题,恐让英国通讯网路暴露在新的安全威胁之下,其中的技术问题包括,安全研究人员检查华为产品编码的能力受到限制。路透(Reuters)引述知情人士消息指出,华为
发表于 12-10 14:22
宾夕法尼亚大学生物工程副教授Arjun Raj早在2012年就指出,平均一篇生物医学研究论文背后的科学成本约为30万美元至50万美元。而柳叶刀报道称,美国研究人员在当年发表了近152000篇论文。
发表于 11-12 10:19
•4238次阅读
在自助柜台机上输入手机号码,对准摄像头,“刷脸”验证成功后,可办理挂号、住院、缴费、查询等多项服务。
发表于 09-21 10:35
•2441次阅读
而罗永浩本人回应打脸:【腾讯投资部如果是想打麻将,我道歉】在遭遇腾讯投资部否认投资子弹短信后,罗永浩表示,“如果这是一场误会,如果腾讯投资部通过各种渠道找我们的子弹团队不是想谈投资合作,而是想一起打打麻将,吃个鸡,学个猫叫,看个电影什么的,那我向腾讯投资部道歉。”
发表于 09-13 15:38
•4326次阅读
,用stm32做手势识别,当手和脸同时被摄像头拍到时,无法将脸去掉,只留下手,所以下一步手势识别就无从谈起,请高人指点
发表于 08-30 09:59
很多人都知道“阿尔法狗”,不过你听说过“阿尔法蛋”吗?这款2016年上市的陪伴型人工智能机器人,有六大能力:听得清,听得懂,能理解,有知识,有情感,自成长;是唯一入选“CCTV中国亲子计划品牌”的智能机器人。
发表于 08-18 08:47
•1.7w次阅读
本帖最后由 一只耳朵怪 于 2018-5-21 11:23 编辑
想用labview进行如图所示的公式计算,我找到了多项式插件,但是没研究明白怎么实现上面是常数下面是多项式这种形式的多项式的运算,不知道能否请各位大佬指点一二,最好能给出相应的程序,图中除了x之外都是变量。
发表于 05-21 11:03
谷歌收购的deepmind可谓是性价比超高了,AlphaGo就是deepmind的杰作,不过这都是过去式了。今日凌晨deepmind公布新突破,训练出人脑模式的AI,学会像哺乳动物那样抄近路。
发表于 05-10 10:10
•997次阅读
`最近小弟对此类产品很有兴趣,但是苦于芯片型号被打磨,没法深入了解,求大神用最高效率和最少成本帮我解决,多谢了!卫*星cocoahawk `
发表于 05-07 13:30
Deepmind旗下的“阿尔法狗”大胜人类围棋选手,名声大噪,由此,也让Deepmind逐渐为人所熟知,最近其在医疗领域的一连串大动作,不得不让我们遐想纷纷,难不成这是要出医疗版“阿法狗”的节奏?
发表于 04-08 11:27
•5291次阅读
人们对DeepMind的认知多来自于Alpha Go,因为化名Master,战胜李世石、柯洁、聂卫平、朴廷桓、古力等世界顶级高手而闻名。最初人们提到这个围棋竞技AI都说是谷歌的Alpha Go
发表于 03-16 07:16
•1238次阅读
DeepMind成立DeepMind Health致力于开发有助于解决社会棘手难题的技术,而其最新研究计划主题为乳腺癌,DeepMind将会通过机器学习应用于筛检乳腺癌。
发表于 12-12 09:20
•618次阅读
阿尔法围棋(AlphaGo)是第一个击败人类职业围棋选手、第一个战胜围棋世界冠军的人工智能程序,由谷歌(Google)旗下DeepMind公司戴密斯哈萨比斯领衔的团队开发。 那么阿尔法狗的工作原理
发表于 11-28 11:10
•12.1w次阅读
DeepMind 最有名的成就莫过于在围棋上战胜人类世界冠军。但围棋和星际争霸等游戏 AI 并不是 DeepMind 唯一的研究方向,他们一直都在尝试把从游戏 AI 身上学到的技术应用于医疗领域。今天,DeepMind 就又宣布了一项新的合作研究项目,试图使用 AI 来对抗乳腺癌。
发表于 11-27 17:07
•441次阅读
继今年5月,机器人阿尔法狗(AlphaGo)在世界级三番棋人机大战中战胜了世界排名第一的中国棋手柯洁,近日,阿尔法狗的下一代阿尔法元(AlphaZero)的出现再次引起了世人的关注。在此次对弈过程中,阿尔法元以100比0的战绩轻松击败阿尔法狗。阿尔法元的成功让人工智能进入了一
发表于 11-03 14:12
•2685次阅读
对标的就是三星Note 8和iPhone X。从曝光的真机图片来看,正脸的全面屏超级吸眼,屏占比似乎高过三星Note 8,正面和背面都没有看到指纹解锁模块,目前网上猜测华为Mate10将会采用虹膜识别
发表于 10-23 10:41
他强调华为有在手机设计上略做修改,因此内建eMMC的手机效能,与内建UFS的手机基本上没有差别。 余承东指出,UFS和eMMC的单价只相差约0.5美元,因此华为认为把UFS换成eMMC并无
发表于 06-14 09:52
阿尔法狗这几天又火了,在击败了韩国选手李世石之后,又击败了我们国家围棋九段的柯洁,赛前一直在微博上说阿尔法狗不行现在也被打
发表于 05-27 14:12
•1905次阅读
`我们是谁?阿尔法通讯是谁?18126198676是谁?`
发表于 05-25 17:21
阿尔法血压、心电等等整体解决方案,有兴趣可联系:18126198676,谢谢!
发表于 05-19 14:36
之前一直不知道这款超声波被打磨的芯片是什么,后来看到一张图上面是stc11,但是找stc单片机看一直找不到,对它的了解仅仅是这是一个单片机,里面固化了一程序,程序是将超声波Trig发来信号以后单片机会向发射口一个40K频率的信号,完成超声波的发射。唉不说那么多,这款单片机是义隆的EM78P153
发表于 05-03 20:44
苹果要封杀扩容iPhone的新闻,狠狠被打脸了。虽然苹果不封这个漏洞,一直以苹果为对手的华为却忍不住了。华为通过其官方微博正式对之前在网上被热议的P10闪存颗粒的事件。华为官方表述的内容和昨天给媒体的回复基本一致。
发表于 04-20 10:37
•3066次阅读
我们都知道目前在手机处理器方面,能够排得上的名次的就是高通,联发科,三星,华为这4个了,其他的要么是市场份额占有量不足,要么就是性能和技术差太多。
发表于 01-11 08:57
•1526次阅读
那些被夸张的华为石墨烯电池已经商用是误导吃瓜群众的,希望大家理性对待。
发表于 12-30 14:24
•9873次阅读
仅仅发不一个月的时间,小米最引以为傲的双曲面屏就被打脸,被频频爆出质量问题.
发表于 12-24 09:49
•1.1w次阅读
12月6日消息,据彭博社报道,Alphabet旗下人工智能部门Google DeepMind将会向其他研究人员和大众开放它用于诸多试验的迷宫式游戏平台。 DeepMind周一表示,它将把其训练环境
发表于 12-07 01:25
•413次阅读
华为iLab研究VR黑科技 传统社交应用或被打破 华为iLab对社交VR开展了深入的研究,对当前和未来的社交VR应用形态的核心元素、关键技术、应用体验、网络要求、网络流量和影响等进行了系统性的分析,并表示社交VR将改变未来通信。
发表于 11-28 11:40
•535次阅读
网络收集整理 都是单片机论文设计 仅供参考!一共2000多项 有时间再上传其它余项
发表于 11-23 11:52
•21次下载
补充称,12%“并不太糟”,他指出,中国多数智能手机厂商的利润率为10%或以下。华为首席财务官孟晚舟(Sabrina Meng)预测,今年年内销售额将继续强劲增长:“我们有信心维持当前的势头,在公司业务持续健康运营的支撑下,在全年结束时实现积极财务状况”。
发表于 07-27 22:20
AlphaGo-develop阿尔法狗源代码,python语言
发表于 05-05 14:56
•16次下载
关于智能车的优秀论文(43篇论文)关于智能车的优秀论文(43篇论文)关于智能车的优秀论文(43篇论文)关于智能车的优秀论文(43篇论文)
发表于 11-13 15:56
•18次下载
新人报道!混脸熟!
发表于 08-26 10:25
RT 新人报道混个脸熟
发表于 01-07 17:14
LabVIEW论文LabVIEW论文LabVIEW论文
发表于 05-13 21:44
教育医学类论文。 (2) 代写代发高会、高审
发表于 01-11 16:14
MATLAB多项式函数命令Roots 求多项式根 Poly 构造具有指定根的多项式 Polyvalm 带矩阵变量的多项式计算 Residue 部分分式展开(留数计算) Polyfit 数据的多项式拟合 Polyder 微分多项式 Conv 多项式乘法 Decon
发表于 09-22 16:01
足球机器人控制中的应用--毕业论文足球机器人融合了计算机视觉、模式识别、决策对策、自动控制、无线通信、多智能体合作等多项摘要 技术,具有极高的研究价值。本文设计了基于A R M 7微处理器的集中
发表于 05-25 15:35
评论