旷视科技孙剑:云、端、芯上的视觉计算

深度学习大讲堂 2018-07-10 08:53 次阅读

2018 全球人工智能与机器人峰会(CCF-GAIR)在深圳召开,峰会由中国计算机学会(CCF)主办,雷锋网、香港中文大学(深圳)承办,得到了深圳市宝安区政府的大力指导,是国内人工智能和机器人学术界、工业界及投资界三大领域的顶级交流盛会,旨在打造国内人工智能领域最具实力的跨界交流合作平台。

孙剑博士在CCF-GAIR现场演讲

6 月 30 日,计算机视觉专场举行,会场现场爆满,不少听众站着听完了长达数小时的演讲。上午场的议题为“计算机视觉前沿与智能视频”,由香港科技大学 RAM-LAB 主任刘明担纲主持。在他的串联下,ICCV 2011 与 CVPR 2022 大会主席权龙、旷视科技首席科学家孙剑、云从科技联合创始人姚志强、臻识科技 CEO 任鹏、云飞励天首席科学家王孝宇以及商汤联合创始人林达华等学界、业界大咖进行了 6 场深度分享,既有计算机视觉技术的前沿研究动态,也有相关技术落地的具体方向。

旷视科技首席科学家、研究院院长孙剑博士为大家带来题为 “云、端、芯上的视觉计算”的精彩演讲。孙剑认为,计算机视觉简单讲就是使机器能看,旷视科技希望能够做到“赋能亿万摄像头”,让应用在所有领域的摄像头都具备智能,不管是在云、端还是在芯上。

计算机视觉的发展史就是研究如何表示图像的历史。深度学习流行之前,最好的办法是基于特征的,从图像里抽取特征,再进行分析;但是这个方法有两个大缺点:首先,该方法完成的非线性变换次数非常有限;其二,大多数参数都是人工设计的,包括 Feature。深度神经网络的办法弥补了手工设计特征的缺陷,整个非线性变换可以做非常多次,换句话说可以很深,所以特征表示能力非常强,并且可以自动地联合训练所有参数。孙剑博士在微软时提出 152 层的 ResNet,第一次在 ImageNet 大规模图像分类任务上超过了人的能力。

接着,孙剑博士从计算机平台的角度对出现的各种神经网络结构进行了分类:GoogleNet、ResNet 在“云”上;MobileNet 以及旷视提出的 ShuffleNet 属于“端”这一类;BNN、XNOR Net 和旷视提出的 DorefaNet 则是在“芯”上。针对目前分平台设计相关网络的现状,孙剑相信未来会有一个“MetaNet 出现,能够统一解决各个平台上的神经网络设计和优化问题”。

最后,孙剑简单介绍了旷视在云、端、芯三个平台上的计算机视觉应用,包括人脸识别、车辆识别、人脸支付、智慧安防、智慧金融、城市大脑、仓储物流、新零售等。

以下为孙剑演讲全文,雷锋网进行了不改变原意的编辑。

目前人工智能一般划分为感知和认知两块,这一张图可以看到计算机视觉在人工智能领域所处的位置,绿色表示技术上有重大突破或者应用落地相对成熟、橙色和黄色表示还需重大突破。

旷视科技成立至今已经 7 年,一直专注于计算机视觉领域。去年,旷视获得了两个非常好的荣誉,MIT 评选的 2017 年度十大突破性技术中旷视科技的“刷脸支付技术”榜上有名,这是中国公司的技术第一次获此殊荣;MIT 也将旷视列为 2017 年度全球五十大最聪明公司的第 11 位。旷视去年也完成了新一轮 4.6 亿美金的融资,用于做更好、更深入的研究和商业落地。

简单来讲,计算机视觉就是让机器能看。旷视科技自创立就一直在回答“如果机器能自动理解一张图像或者一段视频,我们能做什么?”这个问题。当然这么说比较抽象,其实具体讲我们想做的是“赋能亿万摄像头”。日常生活和各个行业中有很多的摄像头,比如说手机、安防、工业、零售、无人车、机器人、家庭、无人机、医疗、遥感等等。在这些地方,大多摄像头还没智能化,我们的使命是使这些摄像头有智能,不管是在云、端还是在芯片上;我们要构建智能大脑来理解智能摄像头输入的大量信息。

相对于语音识别来说,计算机视觉应用面非常广泛。语音识别的输入和输出较为单一,核心目标是把一段语音变成一句文字。但计算机视觉系统的输出要丰富很多,你需要知道图像/视频里面的物体、运动、场景,其中有什么人、人的位置、行为、表情、注意力等等。你会在不同行业或场景中面临各种各样不同的任务,这也让计算机视觉成为一个很大并增长很快的学术领域(今年计算机视觉年会 CVPR 参会人达到近 7000 人),也诞生出众多的优秀创业公司。

计算机视觉的核心问题包括分类、检测、分割,分别是对一张图、一张图的不同区域和一张图的每个像素做识别。另外如果输入的是视频,我们还需要利用时间关系做识别;其中最核心的是分类问题,因为它是后面三个任务的核心和基础。

其实,人工智能一出现时,计算机视觉也诞生了。计算机视觉有一个先驱人物叫 David Marr,他在 80 年代初期提出了 Primal Sketch 方法,以及一个研究计算机视觉的大框架,认为图像应该先检测 Edge,然后出 2 ½ D sketch 和 3D 模型。但是 MIT 教授 Marvin Minsky 批评说你这个理论很好,但是忽略了核心问题的研究——如何表述一张图像。

计算机视觉的早期图像表示模型是 Part-based,比如人体可以分解成头、胳膊、腿;人脸可以分解成眉毛、眼睛、鼻子,这样就可以通过 Part 这种组合式的方法表示物体。如果一个物体有结构,这种组合式方法很合适,但很多自然场景的物体没有这么强的结构就不合适了。

80 年代,早期的神经网络也成功运用在人脸和手写数字识别上,但是仅限于这两个领域。2001 年有一个叫作 Viola & Jones 的人脸检测的方法,它先是定义一组 Haar 小波基,然后通过机器学习的方法学习 Harr 小波基的组合来表示图像。这个方法的好处是引入学习来构造图像表示,坏处是它限定在这个小波基上,对有结构的物体做得好,对没有结构的物体就不一定合适了。

大概在 2000 - 2012 年,在深度学习之前最流行的表示是 Local Feature-based。该方法从一张图片里面抽取数百个 Feature,去人工形成一些诸如 SIFT/HOG 的 Descriptor,编码获得高维向量之后,再送给 SVM 分类器,这是深度学习之前最好的方法。

对人脸也类似。我以前的研究组也用同样方法做过人脸关键点抽取,获得高维 Feature,这也是当时最好的人脸识别方式,但是它有两个大缺点:第一,这个方法整体上是从输入向量到另外高维向量的非线性变换,这个向量的变换次数是有限的,如果真正算它的非线性变换也就三、四次,变多了是不行的,性能不会提高;第二,其中大多数参数是人工设计的,包括 Feature,但人设计复杂系统的能力是有限的。

今天的主流方法是深度神经网络,这两个特性就被改变了,整个非线性变换非常长,可以做非常多次,所以系统的表示能力非常强;第二是所有的参数联合训练。这两点让深度神经网络真正能够取得非常好的效果,也包括当时我们在微软提出的 152 层的残差网络 ResNet,第一次在 ImageNet 上超过了人的性能。

ResNet 为什么能够工作呢?到今天也没有一个明确答案,当然有很多解释。最直观的解释是说当你的非线性变换层数非常多,相邻两层变换的差别就非常小,与其直接学习这个映射,不如学习映射的变化,这样的方式就让整个学习过程,特别是训练优化过程变得更容易。

还有一个解释来自该论文(Kaiming He,Xiangyu Zhang,Shaoqing Ren,Jian Sun. Deep Residual Learning For Image Recognition. CVPR 2016.)的第二作者张祥雨,他认为 ResNet 的整个学习过程是一个由浅到深的动态过程,在训练初期等效训练一个浅层网络,在训练后期等效训练一个深层网络。

论文第一作者何恺明有另外一个更“科学”的解释,他认为整个训练过程相当于深度学习的梯度下降过程中,最为困难的梯度消失问题被 ResNet 解决了,该解释也发表在 ECCV 2016 的一篇论文(Kaiming He, Xiangyu Zhang, Shaoqing Ren, and Jian Sun. Identity Mapping in Deep Residual Networks. ECCV 2016.)中,并在该论文中第一次训练了一个 1001 层的神经网络。

还有一些同行提出的解释。一种是把 ResNet 和 RNN 关联起来,认为如果有 Weight Share, ResNet 可以看作是一种 RNN。还有一种解释把 ResNet 看成是指数多个不同深度网络的集成。用“集成”这个词其实有些问题,因为一般我们做集成算法不联合训练,但这里面整个 ResNet 里指数多个网络是联合训练的,所以很难定义它是不是集成。

我个人比较认同的一种解释是 Iterative Refinement,它是说网络初期的层学习表示,后期很多层不断迭代和 Refine 这个表示。这跟人理解看图识字很相似,一个不容易理解的东西你要看一会,是基于当前一些已看内容的理解,反复看才能看懂。

还有从从优化观点的解释,如果不用 ResNet 这种构造,系统的损失函数会非常坑坑洼洼和高低不平,所以很难优化。我们知道整个网络训练是非凸的优化问题,如果是这种不光滑的损失函数,训练很难跳出局部极小;如果是上图右边使用 ResNet 的情况,就可以比较容易地达一个很好的局部极小。最近研究表明,局部极小区域的面积和平坦性和一个方法的推广能力非常强相关。

多层 ResNet 学习高度非线性映射的能力非常强。去年,ResNet 成功应用于 DeepMind 的 AlphaGo Zero 系统中,用 一个40 或 80 层的网络就可以学到从棋盘图像到落子位置这样一个高度复杂的映射,这非常让人吃惊。

2012 年开始有各种各样的神经网络结构出现。如果从计算平台的角度看这些工作,大概可以分成三类:第一类是在“云”上,像 GoogleNet、ResNet,其目标是向着最高精度方向走,有 GPU、TPU 可以训练非常大的模型,来探知我们的认知边界;第二类平台是在“端”上,特别是一些嵌入式设备,这些设备上的计算能力,内存访问都有限制,但很多真实的场景就是如此,那你怎么去做这上面的研究工作呢?谷歌在去年提出 MobileNet 运行在移动端设备上,旷视科技去年提出 ShuffleNet,其目标是说如何在一个给定计算量的设备上得到最好的效果。

一个网络的最基本结构是多个 3×3 的卷积,ResNet 加了一个跳转连接,我们在 ResNet 中还引入一个 Bottleneck 结构,先做 1×1,再做 3×3,再回到 1×1,这样可以提高卷积的效率。

去年何恺明有一项工作叫 ResNeXt,它在 3x3 的基础上引入分组卷积的方法,可以很好地提高卷积的有效性;谷歌的 MobileNet 是一个 3x3 分层卷积的方式,每个层各卷各的,这种方式非常有效,特别是在低端设备上。ShuffleNet 结合分组卷积和分层卷积的思想,对 1×1 Conv 分组;但是如果只分组的话,组间的信息不会交换,这样会影响特征学习,因此我们通过引入 Shuffle 操作,让不同分组的信息更好地交换,然后做 3×3 的分层卷积,再回到 1×1 分组卷积,这就是 ShuffleNet 的核心思想。和其它方法相比,在相同的精度下,ShuffleNet 在真实设备上的速度要比 AlexNet 快 20 倍左右。

这是我们去年专为手机设计的 ShuffleNet,它在 CPU/ARM 上效果非常好;如果在 GPU 上,它的性能并不好,因为 CPU 和 GPU 的特性不太一样,这里面有很多原因,比如卷积的设计,Group 卷积等等,我就不赘述了。

今年我们设计了 ShuffleNet v2,也就是第二版,抛弃分组卷积的思想,引入 Channel Split 和 Channel Shuffle 组合的新方法。这个方法把 Channel 先一分为二,并把每个分支用非常简单的结构来做,然后在用 Shuffle 操作合并 Channel,这样做的根源是我们在网络设计中发现的一些基本指导原则,比如说我们需要平衡的卷积而不是稀疏的卷积,更加规整的卷积而不是零乱的卷积。

这项工作目前在 CPU 和 GPU 上都获得了最好的精度和速度;不光在小模型,在大模型上同样取得了非常好的效果,上图最后一行是说 ShuffleNet v2 目前在计算量只有 12.7G Flops 情况下在 ImageNet 上取得了非常高的精度。

我们还需要将神经网络运行在芯片上,这不光对网络结构设计有要求,还要对网络内部精度的表示做限制,现在最流行的方法是做低精度化,比如 BNN 和 XNOR Net,还有旷视科技提出的 DorefaNet。低精度方法是指神经网络的权重或激活值用低精度表示,比如 1 位,2 位,4 位。如果可以用低精度表示两个向量,那么卷积计算就可以通过芯片上非常简单的位运算完成计算。

我们提出的 DorefaNet 是第一个对梯度也做量化的研究工作,从而可以让我们在 FPGA 甚至 ASIC 上训练。在这些设备上计算量是一方面,但是它的内存访问限制更大,DorefaNet 这种方法可以做到更好。上图是我们在 ImageNet 上得到的 1 位,2 位,4 位和 6 位量化精度下的最好分类结果。

上述分类问题网络设计需要考虑不同的平台,其它问题多是以分类为基础,比如说检测,上图是检测最近几年的发展路程,从 R-CNN 到我们提出的 SPP-Net,到 Fast R-CNN,再到我们提出的 Faster R-CNN,它们都是先应用基础分类网络,然后构建不同的物体检测框架。

检测方面的目前最有权威性的竞赛是 COCO,检测精度用 mAP 来表示,越高越好。2015 年我们在微软亚洲研究院用 ResNet 做到了 37.3,旷视研究院去年参加了这个竞赛,取得第一名的成绩 52.5(满分 100 分),又推进了一大步。我们获得 COCO 2017 冠军的论文是 MegDet。COCO 可以对人进行检测,也可以抽取特征,我们也在研究后者的工作(Yilun Chen, Zhicheng Wang, Yuxiang Peng, Zhiqiang Zhang, Gang Yu, Jian Sun. Cascaded Pyramid Network for Multi-Person Pose Estimation. CVPR 2018.),提取人体骨架,通过骨架表示人体运动,进行行为分析,这样比直接分析图片进行行为训练更为有效。

最后介绍一些我们做的基于云、端、芯上的商业应用。

在云上,旷视科技最早推出了面向开发者的 www.faceplusplus.com 的 AI 云服务。第二个云服务产品是 www.FaceID.com,这是目前最大的在线身份认证平台,为互联网金融、银行、出行等行业提供在线身份认证服务。第三个非常大的云服务产品是城市大脑,它的核心是通过很多的传感器,获取大量信息,最后做出决策。视觉是目前最大的一个感知方式,因为中国有非常多的摄像头,通过赋能这些视觉传感器,我们可以知道人和车的属性,了解交通和地域情况。其中一个很重要的应用是公共安防,即如何用赋能亿万摄像头来协助城市安全和高效运转。

在端上的应用更多,第一个就是手机。vivo V7 是第一款海外上市旗舰机,搭载了我们的人脸解锁技术,还有小米 Note 3 的人脸解锁。我们帮助 vivo 和小米在 iPhoneX 发布之前推出了人脸解锁手机。华为荣耀 V10 和 7C 手机同样使用了我们的技术。华为为什么请孙杨做代言人?因为他长期游泳,指纹已经磨光了,必须用人脸解锁才能很好地使用手机。

不光是人脸解锁,还包括人脸 AI 相机的场景识别,实时知道你在拍什么,更好地调节相机参数,还可以做人脸三维重建,自动实现 3D 光效。另外一个很有趣的应用是深圳和杭州的肯德基旗舰店,消费者可以直接刷脸点餐,这些图是我在现场刷脸支付喝到一杯果汁的过程。第二个是新零售,借助图像感知系统,能把线下的人、货、场的过程数字化。线上零售是数字化的,可以根据数字化的用户统计信息或者个人信息做用户画像、大数据分析,帮助提升新零售效率。我们在线下零售,需要用图像感知来做数字化。

最后是芯片。我们去年在安防展发布了一款智能人像抓拍机——MegEye-C3S,把 DorefaNet 跑在 FPGA 上,再放到相机里,这是业界第一款全画幅(1080p)、全帧率(30fps)人脸实时检测抓拍机。

再往下应该怎么做呢?今天我们是分平台,根据平台的特性设计不同的网络。我们相信下一代会有一个“MetaNet”,统一解决各个平台上的神经网络设计和优化的问题。

谢谢大家。

简介:

孙剑,目前在旷视科技(Face++)担任首席科学家、旷视研究院院长。孙剑博士2003年毕业于西安交通大学人工智能与机器人研究所,其主要研究方向是计算摄影学、人脸识别和基于深度学习的图像理解。

自2002年以在CVPR,ICCV,ECCV,SIGGRAPH,PAMI五个顶级学术会议和期刊上发表学术论文100+篇,Google Scholar引用20,000+次,H-index 58,两次获得CVPR Best Paper Award(2009,2016)。孙剑博士于2010年被美国权威技术期刊MIT Technology Review 评选为“全球35岁以下杰出青年创新者”。孙剑博士带领的团队于2015年获得图像识别国际大赛五项冠军(ImageNet分类,检测和定位,MS COCO检测和分割),其团队开发出来的“深度残差网络”和“基于区域的快速物体检测”技术已经被广泛应用在学术和工业界。同时孙剑带领的团队的研究成果也广泛被应用在微软Windows,Office,Bing,Azure,Surface,Xbox等多条产品线上。目前孙剑博士正在带领旷视科技的研究团队推进计算机视觉技术的进步,和探索其在工业和商业上的实践。

热门推荐

原文标题:孙剑:如何打造云、端、芯上的视觉计算 | CCF-GAIR 2018

文章出处:【微信号:deeplearningclass,微信公众号:深度学习大讲堂】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
分享:

评论

相关推荐

赛灵思成立两年成长为AI独角兽,已推出多款产品刚刚宣布进军自动驾驶

深鉴科技 CTO单羿表示:“我们对深鉴科技加入赛灵思大家庭感到非常兴奋。我们期待着他们的加入能进一步....

的头像 芯智讯 发表于 07-20 17:38 81次 阅读
赛灵思成立两年成长为AI独角兽,已推出多款产品刚刚宣布进军自动驾驶

人工智能助力全网智能技术应用落地

深度学习技术在人脸识别领域的技术成果,在安防行业激起不小的波澜,各厂家纷纷推出人脸识别技术产品及解决....

的头像 机器人博览 发表于 07-20 17:37 82次 阅读
人工智能助力全网智能技术应用落地

人工智能将成为工业物联网的核心运算架构

智能化是近年来制造业最重要的趋势,历经过去几年的市场教育,这两年市场询问度已开始提高,而从2016年....

的头像 机器人博览 发表于 07-20 17:35 110次 阅读
人工智能将成为工业物联网的核心运算架构

云知声C轮系列融资总金额已达13亿元人民币,创下语音技术领域单轮融资最高记录

云知声专注于物联网人工智能服务,是行业为数不多的拥有 AI 算法、计算能力、芯片能力全栈式技术链条的....

的头像 物联网资本论 发表于 07-20 17:21 71次 阅读
云知声C轮系列融资总金额已达13亿元人民币,创下语音技术领域单轮融资最高记录

盘点2018人工智能5大发展趋势

人类一直对机器人和人工智能(AI)的概念保持非常强的好奇心。好莱坞电影和科幻小说可能激发了一些科学家....

的头像 人工智能学家 发表于 07-20 17:15 78次 阅读
盘点2018人工智能5大发展趋势

AI技术快速发展 失业率激增如何解决?

AI技术可以快速发展,并不意味着所有的工作都要由AI来做,将人替代。首先,这是一个必然趋势,但也是一....

的头像 AI人工智能D1net 发表于 07-20 17:08 103次 阅读
AI技术快速发展 失业率激增如何解决?

科学家已找到AI换脸视频的破解之法

利用Deepfake换脸技术制作的假视频足以乱真。但日前研究人员通过人工智能对虚假视频中的人像眨眼进....

的头像 重庆人工智能 发表于 07-20 17:05 95次 阅读
科学家已找到AI换脸视频的破解之法

美国自己用产业政策和政府补贴“两手”来推动科技产业发展

 美国非政府组织“履行职责研究中心”跟踪了美国各行业接受政府补贴的情况。记录显示,特斯拉(322.6....

的头像 人工智能 发表于 07-20 16:42 84次 阅读
美国自己用产业政策和政府补贴“两手”来推动科技产业发展

未来无限大 终端侧AI引领未来

其实,公众对于终端侧 AI 最感兴趣的体验之一,就是希望设备足够智能,可以学习周边环境,掌握自己的生....

的头像 Qualcomm中国 发表于 07-20 16:39 97次 阅读
未来无限大 终端侧AI引领未来

中国的人工智能产业要站上新台阶,仍需过好“三关”

抓标准制定,是关键环节。没有规矩难成方圆,标准是产业竞争的制高点。缺失标准,人工智能的研发和应用有可....

的头像 AI人工智能D1net 发表于 07-20 16:31 199次 阅读
中国的人工智能产业要站上新台阶,仍需过好“三关”

蓝海将至?安防机器人几大痛点尚未解决

从1920年捷克作家雷尔·恰佩克的科幻小说《罗萨姆的机器人万能公司》中的"robot"一词开始,机器....

的头像 安全自动化 发表于 07-20 16:28 166次 阅读
蓝海将至?安防机器人几大痛点尚未解决

AI人工智能进入落地阶段 高估值时代结束

在中国市场这一波AI人工智能热潮中,出现了第一例AI明星企业被收购的案例,并且还是被美资企业收购,这....

的头像 摄像头观察 发表于 07-20 15:11 226次 阅读
AI人工智能进入落地阶段 高估值时代结束

华为手机2018年全球发货量突破1亿台,布局人工智能抓住未来

华为因何能提前两月达到1亿台发货量的里程碑?华为消费者业务手机产品线总裁何刚在发布会后的媒体采访中作....

的头像 C114通信网 发表于 07-20 14:55 200次 阅读
华为手机2018年全球发货量突破1亿台,布局人工智能抓住未来

用AI技术分析卫星遥感照片 违章建筑无所遁形

近日,山东省淄博市国土资源局通过与阿里巴巴合作,在全国首次利用人工智能技术,实现了卫星遥感照片的自动....

的头像 高工智能未来 发表于 07-20 14:53 180次 阅读
用AI技术分析卫星遥感照片 违章建筑无所遁形

高通拓展终端人工智能 异构AI平台为AI手机带来AI引擎

高通的人工智能引擎将AI手机中骁龙AI芯片的CPU、GPU、DSP组成一个异构AI平台,再与合作伙伴....

发表于 07-20 14:44 17次 阅读
高通拓展终端人工智能 异构AI平台为AI手机带来AI引擎

人工智能技术在智能视觉技术方面的应用

最近几年,人工智能(AI)已成为非常流行的热点话题。在过去的二十年中,人类在计算能力、数据积累、数学....

的头像 Thundersoft中科创达 发表于 07-20 14:39 237次 阅读
人工智能技术在智能视觉技术方面的应用

为什么这些有用的技术通常会带来负面效应?对此我们应该怎么做呢?

至少在某种程度上,技术出现负面效应是由于缺乏公民规划,由于我们在考虑新的情景和创新时出现了疏漏,也由....

的头像 全球技术地图 发表于 07-20 14:38 151次 阅读
为什么这些有用的技术通常会带来负面效应?对此我们应该怎么做呢?

智能康辅,为创新赋能

随着人口老龄化的加快和居民对医疗、康辅诉求的不断上升,如何以物联网等新技术推动智能康复辅具的发展,逐....

的头像 物联网之声 发表于 07-20 14:12 112次 阅读
智能康辅,为创新赋能

商汤科技入选2018 Q2胡润独角兽榜 成AI产业“角尖力量”

7月18日,胡润研究院发布《2018第二季度胡润大中华区独角兽指数》,共有162家企业上榜。在人工智....

的头像 商汤科技 发表于 07-20 11:46 373次 阅读
商汤科技入选2018 Q2胡润独角兽榜 成AI产业“角尖力量”

Google AI的一款有趣的社交微信小程序--猜画小歌

当 AI 猜出你图画中的物体时,你就会进入下一轮,你的猜画连胜次数也会相应增加。你还可以邀请朋友或家....

的头像 Linux爱好者 发表于 07-20 11:37 188次 阅读
Google AI的一款有趣的社交微信小程序--猜画小歌

前百度深度学习研究院科学家分享:机器视觉开发实战经验

发表于 07-20 11:06 80次 阅读
前百度深度学习研究院科学家分享:机器视觉开发实战经验

摩尔定律所说的“指数发展曲线”的真正意义

让我们再来看图2。如果从2018年的情况开始看,那么整个20世纪中每十年一次的性价比翻倍,在曲线上看....

的头像 新智元 发表于 07-20 10:30 71次 阅读
摩尔定律所说的“指数发展曲线”的真正意义

情感机器人真实存在吗?人工智能可以纠正我们的偏见?

人是什么?人有什么特别?情感是人类独有的吗?仿生人会不会梦见电子羊?机器人会不会哭泣?

的头像 机器人大讲堂 发表于 07-20 10:26 173次 阅读
情感机器人真实存在吗?人工智能可以纠正我们的偏见?

DeepMind新推出的“生成查询网络”模仿了大脑的预测编码机制

研究人员注意到,当研究对象看到“狗”这个出乎意料的词时,会出现更激烈的大脑反应,这些反应的具体特点为....

的头像 新智元 发表于 07-20 09:53 64次 阅读
DeepMind新推出的“生成查询网络”模仿了大脑的预测编码机制

谷歌最新AI算法 递归神经网络绘制大脑神经图像

谷歌研究人员使用了一种边缘检测算法,该算法可以识别神经突(神经元本体的分支)的边界,以及一种复发性卷....

发表于 07-20 09:45 27次 阅读
谷歌最新AI算法 递归神经网络绘制大脑神经图像

养老机器人产业现状及未来发展趋势

就目前市场上的产品来看,入局机器人养老的玩家较少,具有针对性的产品也较少,更多的玩家为了抢占市场,采....

的头像 机器人前沿 发表于 07-20 09:32 251次 阅读
养老机器人产业现状及未来发展趋势

地平线杨铭:从无形视觉到有形芯片

本文中,地平线联合创始人、美国西北大学杨铭博士,来和大家分享“在芯片上加速神经网络用于视觉任务的挑战....

的头像 人间烟火123 发表于 07-20 09:31 396次 阅读
地平线杨铭:从无形视觉到有形芯片

深度学习上演“皇帝的新衣”如何剖析CoordConv?

他们尝试在ImageNet上将坐标特征添加到ResNet-50网络的第一个图层上。我猜作者希望在这里....

的头像 论智 发表于 07-20 09:18 119次 阅读
深度学习上演“皇帝的新衣”如何剖析CoordConv?

一名天才工程师从Apple II到Lisa,再到Macintosh经历

由于是公司大型团队按正式流程设计的,我们一直觉得Lisa没有Apple II那么接地气,它不能被称为....

的头像 论智 发表于 07-20 09:15 384次 阅读
一名天才工程师从Apple II到Lisa,再到Macintosh经历

人工智能或许比怀疑论者想象的更强大

IBM的Debater人工智能系统在辩论赛中不输于人类辩手,这是否进一步说明,人脑的许多能力其实都能....

的头像 1号机器人网 发表于 07-20 09:01 228次 阅读
人工智能或许比怀疑论者想象的更强大

信息化和工业化深度融合 推动制造强国和网络强国建设

推动互联网、大数据、人工智能和实体经济深度融合,既从侧面凸显了信息化在培育新动能促进新发展中的重要作....

的头像 智能制造 发表于 07-20 08:13 206次 阅读
信息化和工业化深度融合 推动制造强国和网络强国建设

埃隆马斯克的经典语录有哪些?最新的是承诺不发展人工智能武器

最新的埃隆马斯克的经典语录是承诺不发展人工智能武器;特斯拉创始人埃隆马斯克领衔的美国科技圈大佬们签署....

的头像 天津机器人 发表于 07-19 17:39 858次 阅读
埃隆马斯克的经典语录有哪些?最新的是承诺不发展人工智能武器

机器学习技术带你领略重要的生物医学发现

杜克大学化学和物理学教授和一群来自世界各地的科学家,与谷歌大脑的研究人员合作,使用最先进的机器学习算....

的头像 将门创投 发表于 07-19 17:33 197次 阅读
机器学习技术带你领略重要的生物医学发现

盘点智慧医疗现状及行业发展趋势

未来几年将是中国智慧医疗建设飞速发展的时期,在新医改方案的指导下,各地方政府将会加大当地智慧医疗建设....

的头像 物联网智慧城市D1net 发表于 07-19 17:12 464次 阅读
盘点智慧医疗现状及行业发展趋势

地平线和百丽战略合作落地,将联合打造智慧零售门店

7月19日消息,今日,地平线与知名鞋服运动零售商百丽国际签署战略合作协议。据悉,双方双方将联合探索线....

的头像 人间烟火123 发表于 07-19 17:07 783次 阅读
地平线和百丽战略合作落地,将联合打造智慧零售门店

地平线与百丽国际携手打造智慧零售案例 推动人工智能商业落地

人工智能企业到了考验商业落地的时候,技术和产品有多好是核心要素,商业地盘有多大更是技术变现和决定市场....

的头像 人间烟火123 发表于 07-19 16:59 577次 阅读
地平线与百丽国际携手打造智慧零售案例 推动人工智能商业落地

丰田砸一亿美元强势进军人工智能和机器人领域

AI,机器人行业日益火爆,传统行业纷纷涉足。世界500强的丰田汽车公司不甘落后,在近日通过投资的方式....

的头像 机器人前沿 发表于 07-19 15:25 203次 阅读
丰田砸一亿美元强势进军人工智能和机器人领域

华为开展达芬奇计划人工智能新项目

海思与世界知名IC设计公司还有不小差距,高通营收高达170亿美元比海思营收47亿美元,多出3倍有余。....

的头像 面包板社区 发表于 07-19 14:36 222次 阅读
华为开展达芬奇计划人工智能新项目

人工智能浪潮_先进技术和商业需求相结合才能走的更远

不净则不静,社会上诱惑太多,难免迷失自我,而老子所提的“道”或许能守住自己的本心,比如当前如日中天的....

的头像 传感物联网 发表于 07-19 14:35 225次 阅读
人工智能浪潮_先进技术和商业需求相结合才能走的更远

智慧停车成为行业香饽饽,它的发展空间到底怎么样?

作为“城市病”的主要病症,“停车难”问题已成为大城市的通病,并已逐渐发展为影响交通秩序与社会的一大难....

的头像 机器人大讲堂 发表于 07-19 11:51 315次 阅读
智慧停车成为行业香饽饽,它的发展空间到底怎么样?

奥比中光完成超2亿美金D轮融资,迎来全新的发展阶段

奥比中光今年主要推进3D传感进入手机行业的应用,奥比中光副总裁陈挚认为,AI手机对于手机终端人工智能....

的头像 MEMS 发表于 07-19 11:46 374次 阅读
奥比中光完成超2亿美金D轮融资,迎来全新的发展阶段

华为设立达芬奇计划,将AI渗入到所有产品和服务中

据外媒the information报道,华为目前正在开展一个代号为达芬奇计划“Project Da....

的头像 1号机器人网 发表于 07-19 11:33 352次 阅读
华为设立达芬奇计划,将AI渗入到所有产品和服务中

谷歌研发AI系统 助力研究员理解大脑结构和功能

针对这方面,谷歌与马克斯普朗克研究所的研究员一起合作打造了一个人工智能系统,只需要7天的训练,这一系....

的头像 1号机器人网 发表于 07-19 11:29 379次 阅读
谷歌研发AI系统 助力研究员理解大脑结构和功能

人工智能发展的新机遇与安全挑战

人工智能作为一项高赋能的技术,在为产业发展提供新机遇的同时,也带来了安全的挑战。

的头像 1号机器人网 发表于 07-19 11:26 262次 阅读
人工智能发展的新机遇与安全挑战

美陆军“布雷德利”战车和NGCV的“多功能”传感器

陆军战略主要集中在以下几个关键技术领域:远程多功能传感器、有人无人编队以及人工智能。为此,设计新的轻....

的头像 Qualcomm中国 发表于 07-19 10:53 213次 阅读
美陆军“布雷德利”战车和NGCV的“多功能”传感器

自动驾驶迟迟不能落地,真正的难点在哪?

感知、决策、控制是自动驾驶的三个技术环节,但真正的难点在哪呢?

的头像 智车科技 发表于 07-19 09:52 203次 阅读
自动驾驶迟迟不能落地,真正的难点在哪?

深度学习在自然语言处理方面的研究进展

要是关注深度学习在自然语言处理方面的研究进展,我相信你一定听说过Attention Model(后文....

的头像 Imagination Tech 发表于 07-19 09:20 480次 阅读
深度学习在自然语言处理方面的研究进展

2018中国人工智能大会日程发布_聚焦AI展望未来

中国人工智能学会和深圳市罗湖区人民政府主办,马上科普承办的 “ 2018 中国人工智能大会 ” ( ....

的头像 中国人工智能学会 发表于 07-19 09:03 246次 阅读
2018中国人工智能大会日程发布_聚焦AI展望未来

探讨英特尔AI修缮长城背后的奥秘

当人工智能走到科技和人文的十字路口,它会迸发出怎样的能量?

的头像 电子发烧友网工程师 发表于 07-19 08:38 363次 阅读
探讨英特尔AI修缮长城背后的奥秘

我国出版了第一本人工智能教材,AI从高中学起

计算机要从娃娃抓起,AI可以从高中学起。近日我国为高中生出版了第一本人工智能(AI)教材——《人工智....

的头像 人工智能头条 发表于 07-18 18:47 821次 阅读
我国出版了第一本人工智能教材,AI从高中学起

人工智能引擎助力小米8,带来哪些好处?

从语音助手到人脸识别,随着人工智能的不断落地成型,越来越多的消费者期待在手机上可以拥有更加智慧便捷的....

的头像 Qualcomm中国 发表于 07-18 18:15 568次 阅读
人工智能引擎助力小米8,带来哪些好处?

AI冲入法律界,律师也开始变得更智能

发表于 07-18 09:25 73次 阅读
AI冲入法律界,律师也开始变得更智能

2018年中盘点 | 这半年,科技圈好忙好忙的

发表于 07-18 09:12 85次 阅读
2018年中盘点 | 这半年,科技圈好忙好忙的

选手SHOW|精通 “十八般武艺” 的机器人已经这么酷了?

发表于 07-16 09:39 104次 阅读
选手SHOW|精通 “十八般武艺” 的机器人已经这么酷了?

AI黑科技 | 教你变美变Fashion,试衣间有了新的打开方式

发表于 07-12 10:00 111次 阅读
AI黑科技 | 教你变美变Fashion,试衣间有了新的打开方式

选手SHOW|我们想做的,是让你卸下心防的AI

发表于 07-09 09:15 125次 阅读
选手SHOW|我们想做的,是让你卸下心防的AI

《奇葩说》第五季新生出发,你有问题想问马东吗?

发表于 07-09 09:04 126次 阅读
《奇葩说》第五季新生出发,你有问题想问马东吗?

机器翻译三大核心技术原理 | AI知识科普 2

发表于 07-06 10:46 246次 阅读
机器翻译三大核心技术原理 | AI知识科普 2

机器翻译三大核心技术原理 | AI知识科普

发表于 07-06 10:30 171次 阅读
机器翻译三大核心技术原理 | AI知识科普

科技晚自习 | 世界杯你变了,变得不那么单纯了!

发表于 07-06 09:08 154次 阅读
科技晚自习 | 世界杯你变了,变得不那么单纯了!