旷视科技孙剑:云、端、芯上的视觉计算

深度学习大讲堂 2018-07-10 08:53 次阅读

2018 全球人工智能与机器人峰会(CCF-GAIR)在深圳召开,峰会由中国计算机学会(CCF)主办,雷锋网、香港中文大学(深圳)承办,得到了深圳市宝安区政府的大力指导,是国内人工智能和机器人学术界、工业界及投资界三大领域的顶级交流盛会,旨在打造国内人工智能领域最具实力的跨界交流合作平台。

孙剑博士在CCF-GAIR现场演讲

6 月 30 日,计算机视觉专场举行,会场现场爆满,不少听众站着听完了长达数小时的演讲。上午场的议题为“计算机视觉前沿与智能视频”,由香港科技大学 RAM-LAB 主任刘明担纲主持。在他的串联下,ICCV 2011 与 CVPR 2022 大会主席权龙、旷视科技首席科学家孙剑、云从科技联合创始人姚志强、臻识科技 CEO 任鹏、云飞励天首席科学家王孝宇以及商汤联合创始人林达华等学界、业界大咖进行了 6 场深度分享,既有计算机视觉技术的前沿研究动态,也有相关技术落地的具体方向。

旷视科技首席科学家、研究院院长孙剑博士为大家带来题为 “云、端、芯上的视觉计算”的精彩演讲。孙剑认为,计算机视觉简单讲就是使机器能看,旷视科技希望能够做到“赋能亿万摄像头”,让应用在所有领域的摄像头都具备智能,不管是在云、端还是在芯上。

计算机视觉的发展史就是研究如何表示图像的历史。深度学习流行之前,最好的办法是基于特征的,从图像里抽取特征,再进行分析;但是这个方法有两个大缺点:首先,该方法完成的非线性变换次数非常有限;其二,大多数参数都是人工设计的,包括 Feature。深度神经网络的办法弥补了手工设计特征的缺陷,整个非线性变换可以做非常多次,换句话说可以很深,所以特征表示能力非常强,并且可以自动地联合训练所有参数。孙剑博士在微软时提出 152 层的 ResNet,第一次在 ImageNet 大规模图像分类任务上超过了人的能力。

接着,孙剑博士从计算机平台的角度对出现的各种神经网络结构进行了分类:GoogleNet、ResNet 在“云”上;MobileNet 以及旷视提出的 ShuffleNet 属于“端”这一类;BNN、XNOR Net 和旷视提出的 DorefaNet 则是在“芯”上。针对目前分平台设计相关网络的现状,孙剑相信未来会有一个“MetaNet 出现,能够统一解决各个平台上的神经网络设计和优化问题”。

最后,孙剑简单介绍了旷视在云、端、芯三个平台上的计算机视觉应用,包括人脸识别、车辆识别、人脸支付、智慧安防、智慧金融、城市大脑、仓储物流、新零售等。

以下为孙剑演讲全文,雷锋网进行了不改变原意的编辑。

目前人工智能一般划分为感知和认知两块,这一张图可以看到计算机视觉在人工智能领域所处的位置,绿色表示技术上有重大突破或者应用落地相对成熟、橙色和黄色表示还需重大突破。

旷视科技成立至今已经 7 年,一直专注于计算机视觉领域。去年,旷视获得了两个非常好的荣誉,MIT 评选的 2017 年度十大突破性技术中旷视科技的“刷脸支付技术”榜上有名,这是中国公司的技术第一次获此殊荣;MIT 也将旷视列为 2017 年度全球五十大最聪明公司的第 11 位。旷视去年也完成了新一轮 4.6 亿美金的融资,用于做更好、更深入的研究和商业落地。

简单来讲,计算机视觉就是让机器能看。旷视科技自创立就一直在回答“如果机器能自动理解一张图像或者一段视频,我们能做什么?”这个问题。当然这么说比较抽象,其实具体讲我们想做的是“赋能亿万摄像头”。日常生活和各个行业中有很多的摄像头,比如说手机、安防、工业、零售、无人车、机器人、家庭、无人机、医疗、遥感等等。在这些地方,大多摄像头还没智能化,我们的使命是使这些摄像头有智能,不管是在云、端还是在芯片上;我们要构建智能大脑来理解智能摄像头输入的大量信息。

相对于语音识别来说,计算机视觉应用面非常广泛。语音识别的输入和输出较为单一,核心目标是把一段语音变成一句文字。但计算机视觉系统的输出要丰富很多,你需要知道图像/视频里面的物体、运动、场景,其中有什么人、人的位置、行为、表情、注意力等等。你会在不同行业或场景中面临各种各样不同的任务,这也让计算机视觉成为一个很大并增长很快的学术领域(今年计算机视觉年会 CVPR 参会人达到近 7000 人),也诞生出众多的优秀创业公司。

计算机视觉的核心问题包括分类、检测、分割,分别是对一张图、一张图的不同区域和一张图的每个像素做识别。另外如果输入的是视频,我们还需要利用时间关系做识别;其中最核心的是分类问题,因为它是后面三个任务的核心和基础。

其实,人工智能一出现时,计算机视觉也诞生了。计算机视觉有一个先驱人物叫 David Marr,他在 80 年代初期提出了 Primal Sketch 方法,以及一个研究计算机视觉的大框架,认为图像应该先检测 Edge,然后出 2 ½ D sketch 和 3D 模型。但是 MIT 教授 Marvin Minsky 批评说你这个理论很好,但是忽略了核心问题的研究——如何表述一张图像。

计算机视觉的早期图像表示模型是 Part-based,比如人体可以分解成头、胳膊、腿;人脸可以分解成眉毛、眼睛、鼻子,这样就可以通过 Part 这种组合式的方法表示物体。如果一个物体有结构,这种组合式方法很合适,但很多自然场景的物体没有这么强的结构就不合适了。

80 年代,早期的神经网络也成功运用在人脸和手写数字识别上,但是仅限于这两个领域。2001 年有一个叫作 Viola & Jones 的人脸检测的方法,它先是定义一组 Haar 小波基,然后通过机器学习的方法学习 Harr 小波基的组合来表示图像。这个方法的好处是引入学习来构造图像表示,坏处是它限定在这个小波基上,对有结构的物体做得好,对没有结构的物体就不一定合适了。

大概在 2000 - 2012 年,在深度学习之前最流行的表示是 Local Feature-based。该方法从一张图片里面抽取数百个 Feature,去人工形成一些诸如 SIFT/HOG 的 Descriptor,编码获得高维向量之后,再送给 SVM 分类器,这是深度学习之前最好的方法。

对人脸也类似。我以前的研究组也用同样方法做过人脸关键点抽取,获得高维 Feature,这也是当时最好的人脸识别方式,但是它有两个大缺点:第一,这个方法整体上是从输入向量到另外高维向量的非线性变换,这个向量的变换次数是有限的,如果真正算它的非线性变换也就三、四次,变多了是不行的,性能不会提高;第二,其中大多数参数是人工设计的,包括 Feature,但人设计复杂系统的能力是有限的。

今天的主流方法是深度神经网络,这两个特性就被改变了,整个非线性变换非常长,可以做非常多次,所以系统的表示能力非常强;第二是所有的参数联合训练。这两点让深度神经网络真正能够取得非常好的效果,也包括当时我们在微软提出的 152 层的残差网络 ResNet,第一次在 ImageNet 上超过了人的性能。

ResNet 为什么能够工作呢?到今天也没有一个明确答案,当然有很多解释。最直观的解释是说当你的非线性变换层数非常多,相邻两层变换的差别就非常小,与其直接学习这个映射,不如学习映射的变化,这样的方式就让整个学习过程,特别是训练优化过程变得更容易。

还有一个解释来自该论文(Kaiming He,Xiangyu Zhang,Shaoqing Ren,Jian Sun. Deep Residual Learning For Image Recognition. CVPR 2016.)的第二作者张祥雨,他认为 ResNet 的整个学习过程是一个由浅到深的动态过程,在训练初期等效训练一个浅层网络,在训练后期等效训练一个深层网络。

论文第一作者何恺明有另外一个更“科学”的解释,他认为整个训练过程相当于深度学习的梯度下降过程中,最为困难的梯度消失问题被 ResNet 解决了,该解释也发表在 ECCV 2016 的一篇论文(Kaiming He, Xiangyu Zhang, Shaoqing Ren, and Jian Sun. Identity Mapping in Deep Residual Networks. ECCV 2016.)中,并在该论文中第一次训练了一个 1001 层的神经网络。

还有一些同行提出的解释。一种是把 ResNet 和 RNN 关联起来,认为如果有 Weight Share, ResNet 可以看作是一种 RNN。还有一种解释把 ResNet 看成是指数多个不同深度网络的集成。用“集成”这个词其实有些问题,因为一般我们做集成算法不联合训练,但这里面整个 ResNet 里指数多个网络是联合训练的,所以很难定义它是不是集成。

我个人比较认同的一种解释是 Iterative Refinement,它是说网络初期的层学习表示,后期很多层不断迭代和 Refine 这个表示。这跟人理解看图识字很相似,一个不容易理解的东西你要看一会,是基于当前一些已看内容的理解,反复看才能看懂。

还有从从优化观点的解释,如果不用 ResNet 这种构造,系统的损失函数会非常坑坑洼洼和高低不平,所以很难优化。我们知道整个网络训练是非凸的优化问题,如果是这种不光滑的损失函数,训练很难跳出局部极小;如果是上图右边使用 ResNet 的情况,就可以比较容易地达一个很好的局部极小。最近研究表明,局部极小区域的面积和平坦性和一个方法的推广能力非常强相关。

多层 ResNet 学习高度非线性映射的能力非常强。去年,ResNet 成功应用于 DeepMind 的 AlphaGo Zero 系统中,用 一个40 或 80 层的网络就可以学到从棋盘图像到落子位置这样一个高度复杂的映射,这非常让人吃惊。

2012 年开始有各种各样的神经网络结构出现。如果从计算平台的角度看这些工作,大概可以分成三类:第一类是在“云”上,像 GoogleNet、ResNet,其目标是向着最高精度方向走,有 GPU、TPU 可以训练非常大的模型,来探知我们的认知边界;第二类平台是在“端”上,特别是一些嵌入式设备,这些设备上的计算能力,内存访问都有限制,但很多真实的场景就是如此,那你怎么去做这上面的研究工作呢?谷歌在去年提出 MobileNet 运行在移动端设备上,旷视科技去年提出 ShuffleNet,其目标是说如何在一个给定计算量的设备上得到最好的效果。

一个网络的最基本结构是多个 3×3 的卷积,ResNet 加了一个跳转连接,我们在 ResNet 中还引入一个 Bottleneck 结构,先做 1×1,再做 3×3,再回到 1×1,这样可以提高卷积的效率。

去年何恺明有一项工作叫 ResNeXt,它在 3x3 的基础上引入分组卷积的方法,可以很好地提高卷积的有效性;谷歌的 MobileNet 是一个 3x3 分层卷积的方式,每个层各卷各的,这种方式非常有效,特别是在低端设备上。ShuffleNet 结合分组卷积和分层卷积的思想,对 1×1 Conv 分组;但是如果只分组的话,组间的信息不会交换,这样会影响特征学习,因此我们通过引入 Shuffle 操作,让不同分组的信息更好地交换,然后做 3×3 的分层卷积,再回到 1×1 分组卷积,这就是 ShuffleNet 的核心思想。和其它方法相比,在相同的精度下,ShuffleNet 在真实设备上的速度要比 AlexNet 快 20 倍左右。

这是我们去年专为手机设计的 ShuffleNet,它在 CPU/ARM 上效果非常好;如果在 GPU 上,它的性能并不好,因为 CPU 和 GPU 的特性不太一样,这里面有很多原因,比如卷积的设计,Group 卷积等等,我就不赘述了。

今年我们设计了 ShuffleNet v2,也就是第二版,抛弃分组卷积的思想,引入 Channel Split 和 Channel Shuffle 组合的新方法。这个方法把 Channel 先一分为二,并把每个分支用非常简单的结构来做,然后在用 Shuffle 操作合并 Channel,这样做的根源是我们在网络设计中发现的一些基本指导原则,比如说我们需要平衡的卷积而不是稀疏的卷积,更加规整的卷积而不是零乱的卷积。

这项工作目前在 CPU 和 GPU 上都获得了最好的精度和速度;不光在小模型,在大模型上同样取得了非常好的效果,上图最后一行是说 ShuffleNet v2 目前在计算量只有 12.7G Flops 情况下在 ImageNet 上取得了非常高的精度。

我们还需要将神经网络运行在芯片上,这不光对网络结构设计有要求,还要对网络内部精度的表示做限制,现在最流行的方法是做低精度化,比如 BNN 和 XNOR Net,还有旷视科技提出的 DorefaNet。低精度方法是指神经网络的权重或激活值用低精度表示,比如 1 位,2 位,4 位。如果可以用低精度表示两个向量,那么卷积计算就可以通过芯片上非常简单的位运算完成计算。

我们提出的 DorefaNet 是第一个对梯度也做量化的研究工作,从而可以让我们在 FPGA 甚至 ASIC 上训练。在这些设备上计算量是一方面,但是它的内存访问限制更大,DorefaNet 这种方法可以做到更好。上图是我们在 ImageNet 上得到的 1 位,2 位,4 位和 6 位量化精度下的最好分类结果。

上述分类问题网络设计需要考虑不同的平台,其它问题多是以分类为基础,比如说检测,上图是检测最近几年的发展路程,从 R-CNN 到我们提出的 SPP-Net,到 Fast R-CNN,再到我们提出的 Faster R-CNN,它们都是先应用基础分类网络,然后构建不同的物体检测框架。

检测方面的目前最有权威性的竞赛是 COCO,检测精度用 mAP 来表示,越高越好。2015 年我们在微软亚洲研究院用 ResNet 做到了 37.3,旷视研究院去年参加了这个竞赛,取得第一名的成绩 52.5(满分 100 分),又推进了一大步。我们获得 COCO 2017 冠军的论文是 MegDet。COCO 可以对人进行检测,也可以抽取特征,我们也在研究后者的工作(Yilun Chen, Zhicheng Wang, Yuxiang Peng, Zhiqiang Zhang, Gang Yu, Jian Sun. Cascaded Pyramid Network for Multi-Person Pose Estimation. CVPR 2018.),提取人体骨架,通过骨架表示人体运动,进行行为分析,这样比直接分析图片进行行为训练更为有效。

最后介绍一些我们做的基于云、端、芯上的商业应用。

在云上,旷视科技最早推出了面向开发者的 www.faceplusplus.com 的 AI 云服务。第二个云服务产品是 www.FaceID.com,这是目前最大的在线身份认证平台,为互联网金融、银行、出行等行业提供在线身份认证服务。第三个非常大的云服务产品是城市大脑,它的核心是通过很多的传感器,获取大量信息,最后做出决策。视觉是目前最大的一个感知方式,因为中国有非常多的摄像头,通过赋能这些视觉传感器,我们可以知道人和车的属性,了解交通和地域情况。其中一个很重要的应用是公共安防,即如何用赋能亿万摄像头来协助城市安全和高效运转。

在端上的应用更多,第一个就是手机。vivo V7 是第一款海外上市旗舰机,搭载了我们的人脸解锁技术,还有小米 Note 3 的人脸解锁。我们帮助 vivo 和小米在 iPhoneX 发布之前推出了人脸解锁手机。华为荣耀 V10 和 7C 手机同样使用了我们的技术。华为为什么请孙杨做代言人?因为他长期游泳,指纹已经磨光了,必须用人脸解锁才能很好地使用手机。

不光是人脸解锁,还包括人脸 AI 相机的场景识别,实时知道你在拍什么,更好地调节相机参数,还可以做人脸三维重建,自动实现 3D 光效。另外一个很有趣的应用是深圳和杭州的肯德基旗舰店,消费者可以直接刷脸点餐,这些图是我在现场刷脸支付喝到一杯果汁的过程。第二个是新零售,借助图像感知系统,能把线下的人、货、场的过程数字化。线上零售是数字化的,可以根据数字化的用户统计信息或者个人信息做用户画像、大数据分析,帮助提升新零售效率。我们在线下零售,需要用图像感知来做数字化。

最后是芯片。我们去年在安防展发布了一款智能人像抓拍机——MegEye-C3S,把 DorefaNet 跑在 FPGA 上,再放到相机里,这是业界第一款全画幅(1080p)、全帧率(30fps)人脸实时检测抓拍机。

再往下应该怎么做呢?今天我们是分平台,根据平台的特性设计不同的网络。我们相信下一代会有一个“MetaNet”,统一解决各个平台上的神经网络设计和优化的问题。

谢谢大家。

简介:

孙剑,目前在旷视科技(Face++)担任首席科学家、旷视研究院院长。孙剑博士2003年毕业于西安交通大学人工智能与机器人研究所,其主要研究方向是计算摄影学、人脸识别和基于深度学习的图像理解。

自2002年以在CVPR,ICCV,ECCV,SIGGRAPH,PAMI五个顶级学术会议和期刊上发表学术论文100+篇,Google Scholar引用20,000+次,H-index 58,两次获得CVPR Best Paper Award(2009,2016)。孙剑博士于2010年被美国权威技术期刊MIT Technology Review 评选为“全球35岁以下杰出青年创新者”。孙剑博士带领的团队于2015年获得图像识别国际大赛五项冠军(ImageNet分类,检测和定位,MS COCO检测和分割),其团队开发出来的“深度残差网络”和“基于区域的快速物体检测”技术已经被广泛应用在学术和工业界。同时孙剑带领的团队的研究成果也广泛被应用在微软Windows,Office,Bing,Azure,Surface,Xbox等多条产品线上。目前孙剑博士正在带领旷视科技的研究团队推进计算机视觉技术的进步,和探索其在工业和商业上的实践。

原文标题:孙剑:如何打造云、端、芯上的视觉计算 | CCF-GAIR 2018

文章出处:【微信号:deeplearningclass,微信公众号:深度学习大讲堂】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
分享:

评论

相关推荐

微软、FB联合开发人工智能软件挑战谷歌领先地位

微软CTO凯文·斯科特(Kevin Scott)本周在接受CNBC采访时说,微软的人工智能软件有自己....

的头像 高工智能未来 发表于 11-19 19:06 374次 阅读
微软、FB联合开发人工智能软件挑战谷歌领先地位

三星明确表示目标在2020年在5G技术领域至少拥有20%的市场份额

他补充说,5G网络将使智能工厂更加智能和高效。因为工厂的每一个环节都会产生大量数据,而由5G驱动的智....

的头像 高工智能未来 发表于 11-19 19:03 169次 阅读
三星明确表示目标在2020年在5G技术领域至少拥有20%的市场份额

“通过分析、人工智能和机器学习将媒体与娱乐(M&E)内容货币化”

随着时间的推移,世界各地的电影制片厂和制片公司,都捕捉到了大量的素材。但这些资源深处其实还隐藏着未被....

发表于 11-19 18:40 1902次 阅读
“通过分析、人工智能和机器学习将媒体与娱乐(M&E)内容货币化”

感受科学技术的革新体会创新设计的魅力

该系统是国内首款分布式多通道表面肌电采集系统,填补国内同类技术空白。该系统拥有多个体表面肌电采集模块....

的头像 深圳创新设计研究院 发表于 11-19 18:26 194次 阅读
感受科学技术的革新体会创新设计的魅力

在人工智能时代,PC厂商该如何自救

国内 PC 企业中最为知名的非联想莫属,作为一家成立于 1984 年的老企业,需要不停地进化才能保证....

的头像 高工智能未来 发表于 11-19 17:10 202次 阅读
在人工智能时代,PC厂商该如何自救

共同探讨了机器人行业未来将如何发展

机器人创新生态自2015年成立以来,已走过三年时光。这三年里,整个机器人行业经历了“2016人工智能....

的头像 机器人创新生态 发表于 11-19 17:09 304次 阅读
共同探讨了机器人行业未来将如何发展

英伟达汽车平台业务是未来 营收创新纪录

全球人工智能的龙头英伟达,因为发布的Q3财报不及预期,在过去的一个交易日,股价暴跌18.76%,盘中....

发表于 11-19 17:02 51次 阅读
英伟达汽车平台业务是未来 营收创新纪录

谷歌合并DeepMind部门,将Streams应用转变为人工智能驱动助手

DeepMind的创立者在博客中表示这是公司的重要转折点,并将其用于帮助英国公立医疗系统(NHS)的....

的头像 高工智能未来 发表于 11-19 17:00 118次 阅读
谷歌合并DeepMind部门,将Streams应用转变为人工智能驱动助手

三星将投资220亿美元在5G网络和人工智能方面 3年内至少抢占全球两成市场份额

据媒体报道,近日,三星电子网络业务总裁兼主管金英姬(Youngky Kim)在参加WSJ.DLive....

发表于 11-19 16:52 39次 阅读
三星将投资220亿美元在5G网络和人工智能方面 3年内至少抢占全球两成市场份额

牛奎光分享了对未来十年中国硬科技投资机会的洞察

中国的情况与之类似,每天上网时间到了四小时之后,就很难再往上突破。然而中国有一个有意思的特殊现象——....

的头像 甲子光年 发表于 11-19 16:38 105次 阅读
牛奎光分享了对未来十年中国硬科技投资机会的洞察

中国人工智能产业发展迅速,但整体实力仍落后于美国

在中国,政府正通过多种形式支持人工智能的发展。中国形成了科学技术部、国家发改委、中央网信办、工信 部....

的头像 半导体行业联盟 发表于 11-19 16:29 154次 阅读
中国人工智能产业发展迅速,但整体实力仍落后于美国

2018年大数据趋势预测

根据调研机构Forrester Research最近发布的营销报告,随着组织的领导者开始意识到大量使....

的头像 高工智能未来 发表于 11-19 16:28 118次 阅读
2018年大数据趋势预测

清华大学取代麻省理工成为计算机专业最强的大学

清华大学计算机系为社会培养计算机人才达1.7万人,并在人工智能、科研计算机网CERNET、甚至下一代....

的头像 半导体行业联盟 发表于 11-19 16:23 114次 阅读
清华大学取代麻省理工成为计算机专业最强的大学

AI应届博士年薪持续升高_供不应求成最大难题

就在近日,关于AI应届博士的年薪成为了人们及其关注的话题也因此上了热搜。随着AI的不断发展,如今的人....

的头像 电子魔法师 发表于 11-19 16:18 170次 阅读
AI应届博士年薪持续升高_供不应求成最大难题

柔性AMOLED屏 以多种方式呈现未来

给音箱配上360度的屏幕,把电子书像真正的书一样折叠起来……这些听似科幻的场景,已经真正地呈现了出来....

的头像 PCB商情 发表于 11-19 15:48 85次 阅读
柔性AMOLED屏 以多种方式呈现未来

人工智能也许可以拆除中国的定时炸弹

德国《商报》网站10月18日刊登《嘀嗒作响的定时炸弹》,称印度人口红利或成定时炸弹。

的头像 机器人博览 发表于 11-19 15:43 649次 阅读
人工智能也许可以拆除中国的定时炸弹

智能制造的定义、关键技术与实现智能制造的意义是什么

美国“智能制造创新研究院”对智能制造的定义是:智能制造是先进传感、仪器、监测、控制和过程优化的技术和....

的头像 OFweek工控 发表于 11-19 15:37 109次 阅读
智能制造的定义、关键技术与实现智能制造的意义是什么

当前安防与人工智能的各种关联大揭秘

继移动互联网、物联网、大数据、云计算浪潮之后,人工智能已经成为新的“风口”。当前市场中人工智能落地的....

发表于 11-19 15:26 30次 阅读
当前安防与人工智能的各种关联大揭秘

人工智能“头雁”效应,发展人工智能治理需跟上

要培育具有重大引领带动作用的人工智能企业和产业,构建数据驱动、人机协同、跨界融合、共创分享的智能经济....

的头像 AI聂潜 发表于 11-19 15:21 145次 阅读
人工智能“头雁”效应,发展人工智能治理需跟上

人工智能在安防行业应用中还存在诸多的难点与困境

在安防行业,AI技术的先进性及未来发展趋势是毋庸置疑的,并且行业中已经有众多企业推出了相关产品和解决....

发表于 11-19 15:13 38次 阅读
人工智能在安防行业应用中还存在诸多的难点与困境

如何区分人工智能和通用人工智能

这对于计算机来说可不算是件好事,想要理解人类语言的真正含义,不仅需要理解其字面意思,还要能够结合上下....

的头像 机器人博览 发表于 11-19 15:10 211次 阅读
如何区分人工智能和通用人工智能

人工智能和机器人的伦理研究

北京大学哲学系副主任刘哲认为,具有完全自主性的人工智能和机器人产品暂时不会出现,但仍应尽快加快我国的....

的头像 全球技术地图 发表于 11-19 14:51 134次 阅读
人工智能和机器人的伦理研究

SLAM的历史、理论以及实现的方式

后一个公式给出了计算三维点的方法。先从深度图中读取深度数据(Kinect给的是16位无符号整数),除....

的头像 智车科技 发表于 11-19 14:42 167次 阅读
SLAM的历史、理论以及实现的方式

从单品智能到智能物联 长虹推动智能化不断进步

2016年,长虹推出全球第一台人工智能电视,就是这款CHiQ人工智能电视,在接下来的3年中,影响了家....

发表于 11-19 14:38 41次 阅读
从单品智能到智能物联 长虹推动智能化不断进步

虹软CEO邓晖:开放赋能!虹软人工智能开放平台产业链初步形成

邓晖表示,“而在实现全行业AI应用落地的进程中,除了资本高度集中的智能安防、智慧医疗等大行业领域,更....

的头像 Duke 发表于 11-19 14:15 164次 阅读
虹软CEO邓晖:开放赋能!虹软人工智能开放平台产业链初步形成

人工智能风口已至 金融业加速转型大势所趋

当前,我国大力发展人工智能的春天已至,AI技术正加速渗透到社会的各行各业当中,成为推动经济高质量发展....

发表于 11-19 11:34 42次 阅读
人工智能风口已至 金融业加速转型大势所趋

中国人工智能发展面临怎样的障碍

中国一度炙手可热的人工智能行业如今陷入了恐慌:遭到投资者抛弃、未能交付尖端技术、难以带来回报。

的头像 1号机器人网 发表于 11-19 11:17 315次 阅读
中国人工智能发展面临怎样的障碍

在人工智能火爆的当下 谷歌AI高管强调要意识到AI的局限性

最近人工智能的炒作变得非常热门,然而这里有来自谷歌云部门人工智能领导者的冷水。

发表于 11-19 11:01 34次 阅读
在人工智能火爆的当下 谷歌AI高管强调要意识到AI的局限性

英伟达Xavier的量产已经临近

凭借通用GPU登上人工智能芯片的一哥位置,在自动驾驶(L3级及以上)芯片算力更是无人能敌,英伟达一直....

的头像 高工智能汽车 发表于 11-19 10:56 228次 阅读
英伟达Xavier的量产已经临近

发展AI+教育 切忌用力过猛

AI就像是一个魔法,当它出现的时候,各个领域都充满了新的生机与想象力,尤其在教育领域。然而,随着AI....

发表于 11-19 10:54 27次 阅读
发展AI+教育 切忌用力过猛

AI赋能农业 数据必不可少

在不少舆论抱怨着资本寒冬,风口不再的时刻,我们似乎忽略了一个巨大的蓝海市场—农业。随着物联网、大数据....

发表于 11-19 10:47 31次 阅读
AI赋能农业 数据必不可少

全球范围内 人工智能领域的专利申请量总体上呈逐年上升趋势

据报道,中国专利保护协会近日发布《人工智能技术专利深度分析报告》(下称《报告》),对人工智能技术在世....

发表于 11-19 10:41 21次 阅读
全球范围内 人工智能领域的专利申请量总体上呈逐年上升趋势

深兰科技源源不断注入新鲜血液 推进人工智能技术研发落地

11月12-13日,深兰科技董事长助理刘凤义博士带来了“人工智能服务民生”的主题演讲,介绍了深兰科技....

发表于 11-19 10:37 23次 阅读
深兰科技源源不断注入新鲜血液 推进人工智能技术研发落地

机器学习+精准医疗是未来超算中心研究的重点

众所周知,中国的超级计算机在世界上处于领先水平,天河二号和神威太湖之光都先后霸占世界超级计算机排名榜....

发表于 11-19 10:32 47次 阅读
机器学习+精准医疗是未来超算中心研究的重点

AI和特朗普这两件事紧密相连且备受关注

上海华力微电子(Huali Microelectronics Corp.;HLMC)执行副总裁舒....

的头像 电子发烧友网工程师 发表于 11-19 10:29 238次 阅读
AI和特朗普这两件事紧密相连且备受关注

人工智能遵循“赢者通吃”的规则 只有少数玩家能够占据主导地位

以闹得轰轰烈烈的亚马逊第二总部选址来说,总共三个国家200多个城市参与角逐,20个城市入围候选名单,....

发表于 11-19 10:26 256次 阅读
人工智能遵循“赢者通吃”的规则 只有少数玩家能够占据主导地位

AI显微镜未来对各个应用领域的核心技术将提出更新、更高的要求

日前,腾讯人工智能实验室对外宣布,一款可以应用于病例分析领域的人工智能显微镜已在研发测试阶段,这项新....

发表于 11-19 10:19 22次 阅读
AI显微镜未来对各个应用领域的核心技术将提出更新、更高的要求

英伟达市值暴跌 人工智能神话将要破灭

受益于人工智能,这家显卡著称的英伟达迅速成为炙手可热的人工智能企业,在过去一两年业绩和利润不断上升,....

发表于 11-19 10:13 40次 阅读
英伟达市值暴跌 人工智能神话将要破灭

英伟达漂亮的财报背后隐藏怎样的危机

“加密业务如同一场宿醉,带来了很多惊喜,但并不知道它将持续多久。”这句话是英伟达CEO黄仁勋近期接受....

的头像 TechSugar 发表于 11-19 10:06 227次 阅读
英伟达漂亮的财报背后隐藏怎样的危机

随着人工智能的飞速发展 已经有越来越多的岗位被机器人代替

在很多场景中,我们都能看到他们的身影,毕竟他们是不怕苦不怕累,充电就走,抗压抗恶劣环境的。于是乎,他....

发表于 11-19 10:01 23次 阅读
随着人工智能的飞速发展 已经有越来越多的岗位被机器人代替

人工智能有怎样的黑暗一面

机器学习是现在大家都打了鸡血想用或者在用的技术。

的头像 悟空智能科技 发表于 11-19 10:01 230次 阅读
人工智能有怎样的黑暗一面

下一代机器学习技术为BlackBerry技术组合提供全面补充

嵌入式人工智能技术将加速BlackBerry Spark 企业物联网平台的发展。

的头像 TechSugar 发表于 11-19 09:57 148次 阅读
下一代机器学习技术为BlackBerry技术组合提供全面补充

景嘉微JM7200芯片正抓紧与整机、操作系统厂商适配

据报道,华硕高管表示,尽管英特尔在今年9月就承诺会尽快解决供货问题,并进一步加大10nm的产能,但事....

的头像 电子发烧友网 发表于 11-19 09:56 230次 阅读
景嘉微JM7200芯片正抓紧与整机、操作系统厂商适配

国际大学生超级计算机竞赛,清华夺ASC、ISC、SC三项超算比赛大满贯

要求参赛队伍在总功率 3000 瓦的限制条件下,自行搭建计算集群并在集群系统上进行 6 个应用程序的....

的头像 电子发烧友网工程师 发表于 11-19 09:48 254次 阅读
国际大学生超级计算机竞赛,清华夺ASC、ISC、SC三项超算比赛大满贯

AI又入侵了机械狗的另一个防线——机械设计

Autodesk 为设计着陆器拿出了自家的人工智能软件,它能在短时间内开发出数百种不同的设计。这款软....

的头像 电子发烧友网工程师 发表于 11-19 09:39 213次 阅读
AI又入侵了机械狗的另一个防线——机械设计

大规模特征构建实践总结

背景 一般大公司的机器学习团队,才会尝试构建大规模机器学习模型,如果去看百度、头条、阿里等分享,都有提到过这类模型。当...

发表于 11-19 09:35 55次 阅读
大规模特征构建实践总结

CVPR2019一共收到5165篇有效投递论文,在线编辑器一度崩溃!

由于CVPR 2019截稿日将近,众多投稿人都在抓紧最后的时间修改提交论文,在线论文编辑网站Over....

的头像 新智元 发表于 11-19 09:25 357次 阅读
CVPR2019一共收到5165篇有效投递论文,在线编辑器一度崩溃!

别人家的孩子:5岁学编程、8岁开发iOS应用程序

从这之后,Bakshi的编程能力被IBM看中,在Twitter上最开始联系他的人两个人成了他的导师,....

的头像 新智元 发表于 11-19 09:21 255次 阅读
别人家的孩子:5岁学编程、8岁开发iOS应用程序

人工智能技术专利深度分析报告

随着人工智能成为新一轮科技革命和产业变革的重要驱动力量,AI 成为科技企业研发重点,专利申请量也在逐....

的头像 电子发烧友网工程师 发表于 11-19 09:17 208次 阅读
人工智能技术专利深度分析报告

AI创维翻开新篇章

一年一度的“双11”盛宴刚刚落幕,家电巨头创维集团又有喜讯传来。在“双11”当天,创维&酷开仅用时4....

的头像 科技数码馆 发表于 11-18 11:31 806次 阅读
AI创维翻开新篇章

是否需要考虑拥有一个智能助理

智能设备市场正在爆炸式增长,同时,用于改装“非智能”房屋的智能家居套件变得越来越便宜了。今年早些时候....

的头像 物联之家网 发表于 11-18 11:26 699次 阅读
是否需要考虑拥有一个智能助理

人工智能:复杂问题求解的结构和策略(中文版)

发表于 11-15 16:17 97次 阅读
人工智能:复杂问题求解的结构和策略(中文版)

解读人工智能的未来

已历经60多年的人工智能在物联网以及大数据的推动下,实现飞跃式的发展,并且迎来了第三个黄金周期。必优传感今天和大家解读一下...

发表于 11-14 10:43 47次 阅读
解读人工智能的未来

如何使用人工智能来发挥传感器数据的协同作用?

          (AI)目前正在为社会的方方面面带来革新。比如,通过结合数据挖掘和深度学习的优势...

发表于 11-09 16:11 94次 阅读
如何使用人工智能来发挥传感器数据的协同作用?

工智能取款机将取代银行柜员?

随着科技的进步以及时代的快速变迁,“人工智能”这个词汇已经逐渐进入银行业。日本一家企业研制出日本首台人工智能自动取款机...

发表于 11-09 11:32 133次 阅读
工智能取款机将取代银行柜员?

人工智能机器学习程序可分析患者肺癌肿瘤影像

美国纽约大学医学院研究者报告的一种新的美国纽约大学医学院研究者报告的一种新的人工智能/机器学习程序可分析患者肺癌肿瘤影像...

发表于 11-08 06:45 140次 阅读
人工智能机器学习程序可分析患者肺癌肿瘤影像

人工智能可检出肺癌类型

发表于 11-08 06:43 146次 阅读
人工智能可检出肺癌类型

“洗牌”当前 人工智能企业如何延续热度?

最新统计数据显示,自2017年以来,全球人工智能企业的数量激增,总数已翻了一番。这些人工智能企业已在新零售、医疗、金融、无人...

发表于 11-07 11:49 94次 阅读
“洗牌”当前 人工智能企业如何延续热度?

资深大牛认证的干货:人工智能与matlab学习资料

超10多年工作经验的资深大牛推荐的人工智能&MATLAB学习资料。 1. 主题演讲: 人工智能 & 你, 准备好了吗? 2. 《MAT...

发表于 11-06 15:47 393次 阅读
资深大牛认证的干货:人工智能与matlab学习资料

全语音人工智能AI耳机,或将引爆智能耳机市场

2017年,在中国媒体十大流行语中,人工智能逐渐受大众所熟知。而最初将人工智能这一概念在大众中普及开来,无疑是智能音箱了。如...

发表于 11-02 11:55 177次 阅读
全语音人工智能AI耳机,或将引爆智能耳机市场