谷歌李飞飞:人工智能研究道路漫长而曲折 我们依旧在起点龟速前进

人工智能学家 2018-07-12 10:38 次阅读

说起人工智能,孕育了卷积神经网络深度学习算法的 ImageNet 挑战赛恐怕是世界上最著名的 AI 数据集。8 年来,在 ImageNet 数据集的训练下,人工智能对于图像识别的准确度整整提高了 10 倍,甚至超越了人类视觉本身。

然而,AI 领域的科学家们并没有停下前进的脚步。上个周末,人工智能领域最卓越的科学家之一:斯坦福大学终身教授、谷歌云首席科学家李飞飞在未来论坛年会上,为我们做了一场名为“超越 ImageNet 的视觉智能”的精彩演讲。她告诉我们,AI 不仅仅能够精准辨认物体,还能够理解图片内容、甚至能根据一张图片写一小段文章,还能“看懂”视频......

今天小编给大家带来的是我们最近的一些研究思路,今天小编的演讲内容是视觉智能。我们都知道,地球上有很多种动物,这其中的绝大多数都有眼睛,这告诉我们视觉是最为重要的一种感觉和认知方式。它对动物的生存和发展至关重要。

所以无论我们在讨论动物智能还是机器智能,视觉是非常重要的基石。世界上所存在的这些系统当中,我们目前了解最深入的是人类的视觉系统。从 5 亿多年前寒武纪大爆发开始,我们的视觉系统就不断地进化发展,这一重要的过程得以让我们理解这个世界。而且视觉系统是我们大脑当中最为复杂的系统,大脑中负责视觉加工的皮层占所有皮层的 50%,这告诉我们,人类的视觉系统非常了不起。

谷歌李飞飞:人工智能研究道路漫长而曲折 我们依旧在起点龟速前进

寒武纪物种大爆发

一位认知心理学家做过一个非常著名的实验,这个实验能告诉大家,人类的视觉体系有多么了不起。大家看一下这个视频,你的任务是如果看到一个人的话就举手。每张图呈现的时间是非常短的,也就是 1/10 秒。不仅这样,如果让大家去寻找一个人,你并不知道对方是什么样的人,或者 TA 站在哪里,用什么样的姿势,穿什么样的衣服,然而你仍然能快速准确地识别出这个人。

1996 年的时候,法国著名的心理学家、神经科学家 Simon J. Thorpe 的论文证明出视觉认知能力是人类大脑当中最为了不起的能力,因为它的速度非常快,大概是 150 毫秒。在 150 毫秒之内,我们的大脑能够把非常复杂的含动物和不含动物的图像区别出来。那个时候计算机与人类存在天壤之别,这激励着计算机科学家,他们希望解决的最为基本的问题就是图像识别问题。

在 ImageNet 之外,在单纯的物体识别之外,我们还能做些什么? 

过了 20 年到现在,计算机领域内的专家们也针对物体识别发明了几代技术,这个就是众所周知的 ImageNet。我们在图像识别领域内取得了非常大的进步:8 年的时间里,在 ImageNet 挑战赛中,计算机对图像分类的错误率降低了 10 倍。同时,这 8 年当中一项巨大的革命也出现了: 2012 年,卷积神经网络(convolutionary neural network)和 GPU(图形处理器,Graphic Processing Unit)技术的出现,对于计算机视觉和人工智能研究来说是个非常令人激动的进步。作为科学家,我也在思考,在 ImageNet 之外,在单纯的物体识别之外,我们还能做些什么?

谷歌李飞飞:人工智能研究道路漫长而曲折 我们依旧在起点龟速前进

8年的时间里,在ImageNet挑战赛中,计算机对图像分类的错误率降低了10倍。

通过一个例子告诉大家:两张图片,都包含一个动物和一个人,如果只是单纯的观察这两张图中出现的事物,这两张图是非常相似的,但是他们呈现出来的故事却是完全不同的。当然你肯定不想出现在右边这张图的场景当中。

谷歌李飞飞:人工智能研究道路漫长而曲折 我们依旧在起点龟速前进

这里体现出了一个非常重要的问题,也就是人类能够做到的、最为重要、最为基础的图像识别功能——理解图像中物体之间的关系。为了模拟人类,在计算机的图像识别任务中,输入的是图像,计算机所输出的信息包括图像中的物体、它们所处的位置以及物体之间的关系。目前我们有一些前期工作,但是绝大多数由计算机所判断的物体之间的关系都是十分有限的。

最近我们开始了一项新的研究,我们使用深度学习算法和视觉语言模型,让计算机去了解图像中不同物体之间的关系。

计算机能够告诉我们不同物体之间的空间关系,能在物体之间进行比较,观察它们是否对称,然后了解他们之间的动作,以及他们之间的介词方位关系。所以这是一个更为丰富的方法,去了解我们的视觉世界,而不仅仅是简单识别一堆物体的名称。

谷歌李飞飞:人工智能研究道路漫长而曲折 我们依旧在起点龟速前进

Visual Relationship Detection with Language Priors

更有趣的是,我们甚至可以让计算机实现 Zero short(0 样本学习)对象关系识别。举个例子,用一张某人坐在椅子上、消防栓在旁边的图片训练算法。然后再拿出另一张图片,一个人坐在消防栓上。虽然算法没见过这张图片,但能够表达出这是“一个人坐在消防栓上”。类似的,算法能识别出“一匹马戴着帽子”,虽然训练集里只有“人骑马”以及“人戴着帽子”的图片。

让 AI 读懂图像

在物体识别问题已经很大程度上解决以后,我们的下一个目标是走出物体本身,关注更为广泛的对象之间的关系、语言等等。

ImageNet 为我们带来了很多,但是它从图像中识别出的信息是非常有限的。COCO 软件则能够识别一个场景中的多个物体,并且能够生成一个描述场景的短句子。但是视觉信息数据远不止这些。

经过三年的研究,我们发现了一个可以有更为丰富的方法来描述这些内容,通过不同的标签,描述这些物体,包括他们的性质、属性以及关系,然后通过这样的一个图谱建立起他们之间的联系,我们称之为 Visual Genome dataset(视觉基因组数据集)。这个数据集中包含 10 多万张图片,100 多万种属性和关系标签,还有几百万个描述和问答信息。在我们这样一个数据集中,能够非常精确地让我们超越物体识别,来进行更加精确的对于物体间关系识别的研究。

谷歌李飞飞:人工智能研究道路漫长而曲折 我们依旧在起点龟速前进

那么我们到底要怎么使用这个工具呢?场景识别就是一个例子:它单独来看是一项简单的任务,比如在谷歌里搜索“穿西装的男人”或者“可爱的小狗”,都能直接得到理想的结果。但是当你搜索“穿西装的男人抱着可爱的小狗”的时候,它的表现就变得糟糕了,这种物体间的关系是一件很难处理的事情。

绝大多数搜索引擎的这种算法,在搜索图像的时候,可能很多还是仅仅使用物体本身的信息,算法只是简单地了解这个图有什么物体,但是这是不够的。比如搜索一个坐在椅子上的男性的图片,如果我们能把物体之外、场景之内的关系全都包含进来,然后再想办法提取精确的关系,这个结果就会更好一些。

2015 年的时候,我们开始去探索这种新的呈现方法,我们可以去输入非常长的描述性的段落,放进 ImageNet 数据集中,然后反过来把它和我们的场景图进行对比,我们通过这种算法能够帮助我们进行很好的搜索,这就远远地超过了我们在之前的这个图像搜索技术当中所看到的结果。

谷歌李飞飞:人工智能研究道路漫长而曲折 我们依旧在起点龟速前进

Google图片的准确率已经得到了显著提升

这看起来非常棒,但是大家会有一个问题,在哪里能够找到这些场景图像呢?构建起一个场景图是一件非常复杂并且很困难的事情。目前 Visual Genome 数据集中的场景图都是人工定义的,里面的实体、结构、实体间的关系和到图像的匹配都是我们人工完成的,过程挺痛苦的,我们也不希望以后还要对每一个场景都做这样的工作。

所以我们下一步的工作,就是希望能够出现自动地产生场景图的一个技术。所以我们在今年夏天发表的一篇 CVPR 文章中做了这样一个自动生成场景图的方案:对于一张输入图像,我们首先得到物体识别的备选结果,然后用图推理算法得到实体和实体之间的关系等等;这个过程都是自动完成的。

谷歌李飞飞:人工智能研究道路漫长而曲折 我们依旧在起点龟速前进

Scene Graph Generation by Iterative Message Passing

人工智能可以像人类一样看懂视频?

Visual Genome 数据集能让计算机更好地了解场景信息,但是还是不够的。而且实际上到现在为止,我们仅仅探索了认知心理学家所讨论的一个概念——现场感知(scene gist perception):只需要轻轻一瞥,就能把握主整个场景中的物体和它们之间的关系。那么在此之外呢?

小编想回过头去看看十年前我在加州理工学院读博士的时候做的一个心理学实验,小编用 10 美元/小时的费用招募人类被试,通过显示器给他们快速呈现出一系列照片,每张照片闪现之后用一个类似墙纸一样的图像盖住它,目的是把他们视网膜暂留的信息清除掉。然后让他们尽可能多地写下自己看到的东西。有些照片只显示了 1/40 秒(27毫秒),有些照片则显示了 0.5 秒的时间,我们的被试能够在这么短的时间里理解场景信息。如果小编给的实验费用更高的话,大家甚至能做的更好。进化给了我们这样的能力,只看到一张图片就可以讲出一个很长的故事。

2015 年开始,我们使用卷积神经网络和递归神经网络算法比如 LSTM 来建立图像和语言之间的关系。从此之后我们就可以让计算机给几乎任何东西配上一个句子。比如这两个例子,“一位穿着橙色马甲的工人正在铺路”和“穿着黑色T恤的男人正在弹吉他”。

不过图像所包含的信息很丰富,一个简短的句子不足以涵盖所有,所以我们下一步的工作就是稠密捕获(dense capture)。让计算机将一张图片分为几个部分,然后分别对各个部分进行描述,而不是仅仅用一个句子描述整个场景。

除了此之外,我们今年所做的工作迈上了一个新的台阶,计算机面对图像不只是简单的说明句子,还要生成文字段落,把它们以具有空间意义的方式连接起来。这与认知心理学家所做的实验当中人类的描述结果是非常接近的。

谷歌李飞飞:人工智能研究道路漫长而曲折 我们依旧在起点龟速前进

COCO 能够根据图片写出几个句子(粉色部分)

新算法能够生成一个段落(蓝色部分)

A Hierarchical Approach for Generating Descriptive Image Paragraphs

但是我们并没有停止在这里,我们开始让计算机识别视频。这是一个崭新且丰富的计算机视觉研究领域。互联网上有很多视频,有各种各样的数据形式,了解这些视频是非常重要的。我们可以用跟上面相似的稠密捕获模型去描述更长的故事片段。把时间的元素加入进去,计算机就能够识别一段视频并对它进行描述。

视觉认知和逻辑推理的结合

最后,小编想谈谈在简单认知以外,我们如何让人工智能达到任务驱动的水平。从一开始人类就希望用语言给机器人下达指定,然后机器人用视觉方法观察世界、理解并完成任务。

在 20 世纪七八十年代的时候,人工智能的先驱们就已经在研究如何让计算机根据他们的指令完成任务了。比如下面这个例子,人类说:“蓝色的角锥体很好。我喜欢不是红色的立方体,但是我也不喜欢任何一个垫着角锥体的东西。那我喜欢那个灰色的盒子吗?” 那么机器或者人工智能就会回答:“不,因为它垫着一个角锥体”。它能够对这个复杂的世界做理解和推理。

最近,我们和 Facebook 合作重新研究这类问题,创造了带有各种几何体的场景,我们命名为 Clever dataset。这个数据集包含成对的问题和答案,这其中会涉及到属性的辨别、计数、对比、空间关系等等。我们会给人工智能提问,看它会如何理解、推理、解决这些问题。

我们将人工智能和人类对这类推理问题的回答做了个比较:人类能达到超过 90% 的正确率,机器虽然能做到接近 70% 了,但是仍然有巨大的差距。有这个差距就是因为人类能够组合推理,机器则做不到。

因此我们开始寻找一种能够让人工智能表现得更好的方法:我们把一个问题分解成带有功能的程序段,然后在程序段基础上训练一个能回答问题的执行引擎。这个方案在尝试推理真实世界问题的时候就具有高得多的组合能力。这项工作我们刚刚发表于 ICCV。

比如我们提问“紫色的东西是什么形状的?”,它就会回答“是一个立方体”,并且能够准确定位这个紫色立方体的位置。这表明了它的推理是正确的。它还可以数出东西的数目。这都体现出了算法可以对场景做推理。

总的来看,我给大家分享的是一系列超越 ImageNet 的工作:

首先,计算机视觉能够做到除物体识别之外的关系识别、复杂语义表征和场景图景的构建;

这之后,我们使用视觉+语言处理单句标注、段落生成、视频理解、联合推理;

最后是任务驱动的视觉问题,这里还是一个刚刚起步的领域,我相信视觉和逻辑的组合会在这个领域真正携起手来。

人类视觉已经发展了很久,计算机的视觉识别虽然在出现后的 60 年里有了长足的进步,但也仍然只是一门新兴学科。

原文标题:谷歌李飞飞:我们依旧站在人工智能研究的起点

文章出处:【微信号:AItists,微信公众号:人工智能学家】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
分享:

评论

相关推荐

矿机真的不好卖了 比特大陆陷财务困局矿机暴跌90%

比特大陆的困境,一定程度上也折射出国内整个矿机行业的现状。

的头像 投资界 发表于 09-23 22:56 610次 阅读
矿机真的不好卖了 比特大陆陷财务困局矿机暴跌90%

碧桂园机器人公司博智林机器人与西湖大学签约设立研究院

西湖大学校长施一公表示,博智林机器人不仅是西湖大学科研成果展现的前线,也是人才培养的坚实后盾,“我们....

的头像 天津机器人 发表于 09-22 22:51 1258次 阅读
碧桂园机器人公司博智林机器人与西湖大学签约设立研究院

移动GPU经典的Rogue架构浅析 人工智能的新战场

Rogue架构是一种可编程的架构,能够支持通用计算和图形渲染。Rogue架构针对顶点和像素的传输、计....

的头像 ssdfans 发表于 09-22 22:43 407次 阅读
移动GPU经典的Rogue架构浅析  人工智能的新战场

AI公司VC化?为什么AI公司都在一边融资一边投资?

还在融资的AI公司频频出手投资,背后原因几何?

的头像 甲子光年 发表于 09-22 22:37 3222次 阅读
AI公司VC化?为什么AI公司都在一边融资一边投资?

2018Google开发者大会精彩看点回顾

一年一度的谷歌开发者大会落下了帷幕,感谢数千位新老朋友的到场参与,以及数百万通过直播远程参加的小伙伴....

的头像 TensorFlow 发表于 09-22 22:33 1791次 阅读
2018Google开发者大会精彩看点回顾

阿里巴巴机器人亮相云栖大会 语音交互自动下单

2018年云栖大会在9月19至22日在杭州云栖小镇举行,阿里巴巴展示了几款智能机器人,这些机器人比真....

的头像 电子发烧友网工程师 发表于 09-21 18:06 1797次 阅读
阿里巴巴机器人亮相云栖大会 语音交互自动下单

英特尔新使命:全球领先的IOT端到端整体方案提供商

目前我们正处于一个以数据为中心驱动的全新万物互联时代,英特尔不仅敏锐地看到了新的蓬勃增长的物联网市场....

的头像 罗欣 发表于 09-21 17:34 1832次 阅读
英特尔新使命:全球领先的IOT端到端整体方案提供商

盘点美国五大科技巨头的人工智能竞赛

毫无疑问,人工智能已经开始渗透到各行各业,并正在改变我们的工作方式和生活方式。

的头像 人工智能学家 发表于 09-21 17:30 1951次 阅读
盘点美国五大科技巨头的人工智能竞赛

“感知技术”浪潮来临,如何加快传感器发展?

传感器更新迭代的速度十分迅速,郭源生认为,在这股“新人工智能”信息化浪潮的洪流中,传感器应紧跟市场脚....

的头像 MEMS 发表于 09-21 17:27 1938次 阅读
“感知技术”浪潮来临,如何加快传感器发展?

麻省理工学院设计出人工智能系统可用来识别物体的变形

机器人努力实现这些逻辑上的飞跃。但在麻省理工学院计算机科学与人工智能实验室的一篇论文中,研究人员描述....

发表于 09-21 17:08 51次 阅读
麻省理工学院设计出人工智能系统可用来识别物体的变形

制造业不会消失,只有落后的制造业会消失

马云相信,当新制造取代旧制造,贸易战将不复存在。他认为,不仅流水线是工业时代产物,贸易战也是工业时代....

的头像 工业4俱乐部 发表于 09-21 17:05 1837次 阅读
制造业不会消失,只有落后的制造业会消失

你最看好哪个深度学习框架呢?

开源的深度学习神经网络正步入成熟,而现在有许多框架具备为个性化方案提供先进的机器学习和人工智能的能力....

的头像 人工智能 发表于 09-21 17:02 1683次 阅读
你最看好哪个深度学习框架呢?

中国信通院联合Gartner联合公开发布《2018世界人工智能产业发展蓝皮书》

蓝皮书主要由五个部分组成:产业发展环境、技术环境、全球人工智能企业情况、全球投融资情况、产业发展情况....

的头像 工业4俱乐部 发表于 09-21 17:00 1225次 阅读
中国信通院联合Gartner联合公开发布《2018世界人工智能产业发展蓝皮书》

南京高校成立的第4个人工智能学院

南京邮电大学人工智能学院院长、教育部长江学者特聘教授岳东介绍,根据教育部的规划,到2030年,高校要....

的头像 中国人工智能学会 发表于 09-21 16:57 1311次 阅读
南京高校成立的第4个人工智能学院

传感器是未来改变人类十大颠覆技术之首

传感器更新迭代的速度十分迅速,郭源生认为,在这股“新人工智能”信息化浪潮的洪流中,传感器应紧跟市场脚....

发表于 09-21 16:22 393次 阅读
传感器是未来改变人类十大颠覆技术之首

如何推动社会变革、为产业赋能,以“AI+行业”的方式应用落地

中共中央政治局委员、上海市委书记李强在开幕式上致辞时表示,作为引领未来的战略性技术,人工智能正全面赋....

的头像 科沃斯商用机器人 发表于 09-21 15:32 492次 阅读
如何推动社会变革、为产业赋能,以“AI+行业”的方式应用落地

智能安防才刚进入初级阶段 未来大有可为

中国一年有5000万个摄像头需求,但实际只有50万个智能摄像头在应用,这个比例只有1%,这预示着智能....

发表于 09-21 15:31 109次 阅读
智能安防才刚进入初级阶段 未来大有可为

人工智能技术正在彻底改变临床研究

医疗保健正在成为人工智能研究和应用的重要领域。几乎整个行业的每个领域都会受到技术崛起的影响。

的头像 高工智能未来 发表于 09-21 15:24 509次 阅读
人工智能技术正在彻底改变临床研究

AI在5年内多创造近6000万个新岗位

世界经济论坛(WEF)在周一发布报告称,到2025年时,机器将超过人类在工作场所执行更多任务。不过,....

的头像 高工智能未来 发表于 09-21 15:15 270次 阅读
AI在5年内多创造近6000万个新岗位

谷歌与雷诺日产三菱联盟达成协议,安卓进军车载系统

近日,在珞石2018新品发布会|暨B轮融资发布会&智能装备产业园签约仪式在上海工博会举办。发布会现场....

的头像 智能制造发展联盟 发表于 09-21 15:11 592次 阅读
谷歌与雷诺日产三菱联盟达成协议,安卓进军车载系统

Android 9 Pie亮相2018谷歌中国开发者大会

2018谷歌中国开发者大会今天上午在上海世博中心举行,这是谷歌第三次在中国举行面向中国开发者的大会。

的头像 高工智能未来 发表于 09-21 15:11 796次 阅读
Android 9 Pie亮相2018谷歌中国开发者大会

IBM公司推出了一项提高人工智能透明度的技术

它使用通俗易懂的术语提供解释,说明是哪些因素的权重使决策朝某一方向倾斜,决策建议的置信度有多大,置信....

的头像 IBM中国 发表于 09-21 15:03 301次 阅读
IBM公司推出了一项提高人工智能透明度的技术

人工智能将是“中国制造”优势突破口

改革开放40年,中国制造业已经积累了雄厚的实力,同时也面临着传统增长动力逐渐减弱、工业核心技术的竞争....

发表于 09-21 14:56 94次 阅读
人工智能将是“中国制造”优势突破口

AI零售柜蹿红世界人工智能大会盛大开启

在AI+零售应用场景,哈哈零兽和腾讯共同携手为来自全球的现场嘉宾与媒体带来了承载新一代“AI+即时零....

发表于 09-21 14:54 42次 阅读
AI零售柜蹿红世界人工智能大会盛大开启

重庆百应销售机器人系统取代繁重低效的人工电销

这是一段平时最正常的对话了,我们每个人都经历过这样的场景。可你能想象和你一直对话的是机器人吗?

发表于 09-21 14:49 77次 阅读
重庆百应销售机器人系统取代繁重低效的人工电销

人工智能机器人其实离你很近 只要你用心留意

2018年,人工智能正在带来一场新的革命,全球也将因此迎来新一轮生产率增长浪潮,上海作为国际化金融大....

发表于 09-21 14:43 330次 阅读
人工智能机器人其实离你很近 只要你用心留意

安防机器人未来可期 企业资本纷纷进入市场

海康威视以移动机器人为载体,依托“阡陌”成熟的核心技术,推出了智能泊车机器人。

发表于 09-21 14:40 102次 阅读
安防机器人未来可期 企业资本纷纷进入市场

人工智能及人形机器人企业优必选上中国AI50强榜单

月19日,在天津举行的达沃斯世界经济论坛上,现场发布了中国AI 50强榜单及相关研究。

发表于 09-21 14:32 56次 阅读
人工智能及人形机器人企业优必选上中国AI50强榜单

五大纬度推进数字化转型

根据中国软件网、海比研究联合中国软件行业协会应用软件产品云服务分会发布《2017年中国云ERP市场研....

的头像 SAP天天事 发表于 09-21 14:29 757次 阅读
五大纬度推进数字化转型

区块链技术能够解决广告花费浪费的问题

在一个几乎无限制地访问信息和娱乐的世界中,整个系统只有一种方式来支持自己:广告。然而,免费增值模式和....

发表于 09-21 14:12 121次 阅读
区块链技术能够解决广告花费浪费的问题

讯飞AI同传被指造假:同传译员亲自揭发,讯飞用人类翻译冒充AI

2018年9月,人类的AI技术已经可以流畅实现同传了?

的头像 罗欣 发表于 09-21 14:11 465次 阅读
讯飞AI同传被指造假:同传译员亲自揭发,讯飞用人类翻译冒充AI

AI制药是什么?它会改变医疗行业吗?

阿里云与正大天晴合作制药,筛选准确率可提高20%。

发表于 09-21 11:34 167次 阅读
AI制药是什么?它会改变医疗行业吗?

谷歌已陷入危急关头,拉里·佩奇为何还不发声?

Google 创始人之一拉里·佩奇在公众心目中一贯就是沉默、低调的形象,这本来似乎是一个加分项。但对....

的头像 ICChina 发表于 09-21 11:12 844次 阅读
谷歌已陷入危急关头,拉里·佩奇为何还不发声?

IBM发布云服务帮助企业检测和减少AI偏差

偏差是人工智能(AI)中的一个严重问题。研究表明,流行的智能扬声器在理解非美国本土口音方面的可能性降....

的头像 E4Life 发表于 09-21 11:01 357次 阅读
IBM发布云服务帮助企业检测和减少AI偏差

如何成功部署人工智能?

人工智能的落地和应用,一项基本常识是不存在所谓的通用人工智能,AI无法解决多种多样不同类型问题;所有....

的头像 科工力量 发表于 09-21 10:30 682次 阅读
如何成功部署人工智能?

AI场景识别大比分领先旗舰机小米8

近段时间,有网友在网上上传了一段荣耀8X和小米8 AI场景识别的对比视频。视频中,荣耀8X能迅速地识....

发表于 09-21 10:18 1558次 阅读
AI场景识别大比分领先旗舰机小米8

达沃斯现场:专家畅谈生物识别技术未来

Visa公司高级副总裁利文斯顿 支付这个行业非常注重安全性,同时也需要便利。生物识别技术可以同时提供....

发表于 09-21 10:15 132次 阅读
达沃斯现场:专家畅谈生物识别技术未来

OCR护照识别系统是什么?在实际应用中有何亮点

传统护照信息采集依赖于人工手动操作,需要核对证照分栏目逐条录入,不仅工作效率低下,耗费大量时间,且正....

发表于 09-21 10:13 50次 阅读
OCR护照识别系统是什么?在实际应用中有何亮点

海信全面升级AI推场景自动识别电视

业内人士认为,海信此系列手机树立起当今AI电视的新标杆,真正实现了全面AI智慧视听。

发表于 09-21 10:09 83次 阅读
海信全面升级AI推场景自动识别电视

人工智能瞬间识别慢性疾病还有多远?

对很多人来说,人工智能已经可以为我们的健康做出巨大贡献,现在人工智能(AI)只需不到一秒钟就可以识别....

发表于 09-21 10:07 270次 阅读
人工智能瞬间识别慢性疾病还有多远?

又一新车横空出世 启用生物识别指令控制

车的发展似乎在向手机等人工智能看齐,新车带有多个先进生物识别技术传感器,不但可以指纹识别和人脸识别,....

发表于 09-21 10:05 64次 阅读
又一新车横空出世 启用生物识别指令控制

谷歌人脸识别门铃的摄像头和门铃二合一

出色的智能设备配备可选视频录制和面部识别功能也可用作门铃谷歌的新款Nest Hello是一款视频门铃....

发表于 09-21 10:02 47次 阅读
谷歌人脸识别门铃的摄像头和门铃二合一

平安科技的“高精尖”与“广布局”并驾齐驱

彼时,人工智能的浪潮山雨欲来。2014年的一天,国际知名科技公司动用了1000万照片和1000台电脑....

发表于 09-21 10:00 134次 阅读
平安科技的“高精尖”与“广布局”并驾齐驱

平安科技智能VIP识别系统的人像捕获率达99%

平安π智能VIP识别系统是以平安科技AI、大数据等技术为基础,以智慧楼宇、银行、新零售等场景的VIP....

发表于 09-21 09:57 107次 阅读
平安科技智能VIP识别系统的人像捕获率达99%

AI技术在算法、算力、数据上还有多大突破潜力?

生命2.0,或者说所谓的文明阶段,是人类现在所处的地方:人类能够学习,适应不断变化的环境,并能有意识....

的头像 新智元 发表于 09-21 09:37 612次 阅读
AI技术在算法、算力、数据上还有多大突破潜力?

华为nova3i采用前置双摄2400万+200万解决方案,让拍照效果更真实

华为nova3i为提高用户体验,采用前置双摄2400万+200万解决方案。而AI的应用,则让摄影有了....

发表于 09-21 09:36 165次 阅读
华为nova3i采用前置双摄2400万+200万解决方案,让拍照效果更真实

精通Visual C++数字图像模式识别技术及工程实践(第2版)

本书介绍了模式识别和人工智能中的基本理论以及相关的模型详细讲述贝叶斯决策、线性判别神经网络理论、隐马尔可夫模型、聚类技术...

发表于 09-19 17:01 288次 阅读
精通Visual C++数字图像模式识别技术及工程实践(第2版)

人工智能的原理与方法(马宪民著)

本书全面系统地介绍了人工智能的基础理论、基本方法和应用技术。内容涉及人工智能的基本概况和数学基础、知识表示、基于谓词的逻...

发表于 09-17 17:08 288次 阅读
人工智能的原理与方法(马宪民著)

中医AI,机器也能“望闻问切”!

中华民族悠悠五千年,中医是老祖宗留给我们最宝贵的财富之一。它的独特与高明之处在于:四诊八纲的辨证方法、六经六气的对应原则...

发表于 09-14 10:42 128次 阅读
中医AI,机器也能“望闻问切”!

『深思考』打造人工智能机器大脑,让AI更懂你!

在人机交互中,人机对话是最自然的方式之一。机器对于交互内容的理解,直接关乎人机交互的质量。如果人机交互可以像人与人之间的...

发表于 09-13 09:40 171次 阅读
『深思考』打造人工智能机器大脑,让AI更懂你!

【免费名额30个】手把手教你快速学习和应用人工智能技术

听说,最近有一个深圳地区线下学习和交流的技术讲座,有好几位在业内有10多年技术背景的资深大牛齐齐开课,帮助大家快速地学习和...

发表于 09-12 11:21 312次 阅读
【免费名额30个】手把手教你快速学习和应用人工智能技术

3种适用于人工智能开发的编程语言

人工智能是一个很广阔的领域,很多编程语言都可以用于人工智能开发,所以很难说人工智能必须用哪一种语言来开发。选择多也意味着...

发表于 09-12 10:45 282次 阅读
3种适用于人工智能开发的编程语言

普通话二级甲等? 可我们数学老师明明n、l不分啊

又是一年开学季,莘莘学子们又背着书包,生机勃勃 (垂头丧气 )地回归校园了。可爱 (逗比) 的同学,敬爱 (严厉) 的老师,还...

发表于 09-07 10:03 240次 阅读
普通话二级甲等? 可我们数学老师明明n、l不分啊

AI+大文娱,他是如何做到精准切入、稳步发展的——极链科技

如果有一天,不买会员看视频也没有那烦人的广告 如果有一天,视频植入的广告不再那么尬 如果有一天,视频里的idol周边,...

发表于 09-07 09:57 194次 阅读
AI+大文娱,他是如何做到精准切入、稳步发展的——极链科技

华云智能客服改善客户服务和降低成本

在当今充满挑战的经济环境下,企业更加注重采用人工智能技术来提高在线客户服务的质量和效率。从聊天机器人到智能客服机器人,人...

发表于 09-05 11:46 355次 阅读
华云智能客服改善客户服务和降低成本

人工智能深度学习发展迅速,智能科技公司都已经涉足人工智能产品的研发!

深度学习(Deep Learning)核心技术开发与应用 1,Deep Learning—循环神经网络         ...

发表于 09-05 10:22 218次 阅读
人工智能深度学习发展迅速,智能科技公司都已经涉足人工智能产品的研发!