人工智能在视频应用中的实践探索,涉及编解码器、超分辨率等

LiveVideoStack 2018-01-18 13:56 次阅读

人工智能热度很高,但泡沫也很大。人工智能在视频领域的应用已经走入寻常人的生活,人脸识别,视频自动抠像技术已经比较成熟。除此之外,人工智能还能为视频应用带来哪些变化呢?描述了人工智能在视频应用中的实践探索,涉及编解码器、超分辨率等。

序:人工智能来生今世

人工智能是一个非常广泛的领域,当前人工智能涵盖很多大的学科,大致归纳为六个:

计算机视觉(暂且把模式识别,图像处理等问题归入其中);

自然语言理解与交流(暂且把语音识别、合成归入其中,包括对话);

认知与推理(包含各种物理和社会常识);

机器人学(机械、控制、设计、运动规划、任务规划等);

博弈与伦理(多代理人agents的交互、对抗与合作,机器人与社会融合等议题);

机器学习(各种统计的建模、分析工具和计算的方法)。

这里值得强调几点:

第一)目前的人工智能都是属于弱人工智能的范围,在某一个专业领域内作为被人类使用的工具存在。 目前还不存在离开人类主体自行运行的人工智能,更不存在可以开发人工智能自我迭代进化的强人工智能。

第二)机器学习在近几年取得了很大进展,有些人直接把机器学习当成了人工智能的代名词。这是不准确的。举例来说,不可否认机器学习在计算机视觉领域发挥着越来越大的作用,但是传统意义上,通过人工建模,分析取得的模式识别,图像识别,图像增强仍旧是很成功的人工智能技术,并且也是机器学习进一步发展的基础。

第三)统计分析方法在1990年代就出现并在一定领域内使用了。统计分析方法也多种多样的,根据实际需要产生过很多成功的案例,不一定采用目前标准的建模和分析方法。这里面举个典型的例子,在1997年Intel推出mmx技术之前,程序员中流传着一个非常著名的查表IDCT(反余弦变换),实际上就是对MPEG1编解码过程的IDCT变换,做了统计分析后发现的,超过之前所有快速算法的实战案例。具体细节请点击『阅读原文』下载IDCT 8x8.DOC。

第四)机器学习有这几个比较明显的缺陷,想要在实战中取得良好的效果,就必须做出合理的取舍和优化。这几个缺陷是:

严重依赖数据,训练方法和训练量非常关键。

计算量偏高。

虽然有时候取得了良好的效果,但是机器学习本身并不能理解这个过程,也不能给出合理的解释。

涉及自然科学常识和社会科学常识的问题,目前机器学习还不能在开放领域内取得良好的效果。

(一)人工智能对视频应用的渗透

传统视频应用的流程:

人工智能在视频应用中的实践探索,涉及编解码器、超分辨率等

前面我们说过,目前的人工智能还处于工具阶段,也就是说还没有人工智能开发出来的任何的超越时代的编码方法、传输协议、解码、交互技术存在。目前人工智能渗透包括预处理和后处理,超分辨率,机器视觉等等,人们在这些过程中使用人工智能工具来提升开发效率或者处理效果。而编解码技术,则属于人类专家技术团队才能解决的问题,目前的人工智能还很难介入。

人工智能在视频应用中的实践探索,涉及编解码器、超分辨率等

近年来网络直播应用的兴起,出现了跟以往广播电视编解码不太一样的需求。那就是:

编码端,保证编码实时性和码率的要求的同时,保证尽量高的图像质量。

发送,传输,缓冲,延时尽量小。

解码器尽量能输出最好的质量,最好能超分辨率。

这两年我一直在努力把人工智能(主要是机器学习)技术跟编解码做更深的融合,用来解决传统方法一直很难解决的这几个问题。

编码器遇到的问题:硬件编码器性能好,但是图像质量差,码率高。软件编码器效率较低,遇到复杂视频,比如物体繁多,较大运动,闪光,旋转,既不能满足实时编码的需求,同时输出码率也出现较大抖动。对于网络应用来说是很大的障碍。

解码器需要增强的点:大家都在构想能不能应用超分辨率技术,把较低分辨率的视频的播放质量提升一大块。目前有很多算法显示出巨大的潜力,比如谷歌的RAISR,处理图像时候效果很好。能不能实时用到视频上,或者硬件化,或者采用更快的能实时运行的算法。我们在后面会讨论一种折中方案,在牺牲一点质量的前提下,能够实时运行的超分辨率算法。

人工智能在视频应用中的实践探索,涉及编解码器、超分辨率等

(二)人工智能增强的编码器

(2.1)动态编码器

不同场景下编码保持恒定质量的码率:

编码时间和码率是正相关的,在码率暴涨的同时,编码时间也剧烈延长。对于低延时需求强烈的直播应用,会造成严重的卡顿。

一般就只好使用绝对不变码率ABR. 不同场景下ABR的图像质量:

人工智能在视频应用中的实践探索,涉及编解码器、超分辨率等

这样带来的结果就是图像质量不稳定。

我们希望是下图这样的曲线:

人工智能在视频应用中的实践探索,涉及编解码器、超分辨率等

这就需要编码器能够提前判定大码率场景出现的可能性。需要判定的几种情况:

物体繁多且有摄像机运动。

背景不动但是有大量物体的大范围运动,包括快速运动,旋转,仿射,蠕变等。

出现闪光,风沙,粒子系统。

这就需要开发一种适用于高清晰度直播应用的面向场景的智能编码技术。该技术通过监督学习将常见视频编码卡顿场景分类并快速识别,提前预判视频场景的编码复杂度和码率抖动,使用动态参数配置来编码,保证编码的实时性和限定码率下最好的图像质量。

(2.2)内容自动植入

人工智能在视频应用中的实践探索,涉及编解码器、超分辨率等

这里讨论广告的自动植入问题。一种是在编码前合成到视频里面,这个过程跟编码关系不大。但是直接合成到视频之后,所有的观众看到的内容就都一样。

要做到个性化,精准的广告投放,就只有在播放端解码后合成。要做到这点,服务器不仅要发送原始视频流,还要发送后期合成物体的定位方法和图像数据,以便客户端按照需求进行动态合成。

首先,自动植入的广告跟前贴片比起来优势很明显,可以植入的广告数量非常巨大,效果也更自然,用户也不会产生明显的反感。

其次,个性化精准投放,又进一步扩大了广告投放的总容量和效率。

(2.3)交互式视频

人工智能在视频应用中的实践探索,涉及编解码器、超分辨率等

目前基本做法是图像识别后,与搜索引擎连接,产生一个内容链接。

人工智能在视频应用中的实践探索,涉及编解码器、超分辨率等

(三)人工智能增强的解码器

(3.1)单个图像的超分辨率

自然图像基本上是平坦的纹理填充和显著的边缘(线条)组合形成的。

常规拉伸算法有双线性插值和双三次样条曲线差值。一般说来,三次曲线要比线性插值效果好。

然而在 15 年前,我在金山做 DVD 播放器的时候,正在研究去隔行技术。

人工智能在视频应用中的实践探索,涉及编解码器、超分辨率等

如上图所示,第一排和第三排是原图数据,第二排是需要插入的数据。普通的插值方法是在 B 方向上做一个三次插值。但是我这次计算了 A,B,C 三个方向的梯度,取方向梯度最小,像素梯度和最大的方向做简单的线性插值。

这时候我有一个惊奇的发现,简单的双线性插值的目视效果居然要好过三次曲线。这是为什么呢?

图像模糊的原因有以下几个:

低分辨率下线条会变得模糊。

低分辨率图像在拉伸到高分辨率时候会在线条上引入额外的模糊。

噪音的存在。

对于第2点我们具体说明:比如B样条,三次样条曲线有一个应用条件,那就是样本数据本身应该是光滑的,至少是分段光滑。但是在图像里面,物体的边界和背景的结合处,就不满足这个条件了。普通的三次样条曲线插值并没有考虑图像内部各个物体的不同,简单的把整个图像作为一个整体来计算。这样必然就在边界处引入了严重的模糊。

因此超分辨率主要从以上几个方面进行处理。噪音的处理技术已经比较成熟了。今天我们就不讨轮了。

第一个讨论点,如何降低线条的拉伸效应,也就是线条的锐度保持。

比如一个4x4的像素块,比较常见的是如下的形态:

人工智能在视频应用中的实践探索,涉及编解码器、超分辨率等

普通的三次b样条的滤波器参数矩阵为:

比如我们打算在4x4像素块中心插入一个点:

第一种情况,插入点在边界上。

人工智能在视频应用中的实践探索,涉及编解码器、超分辨率等

使用标准滤波器:

人工智能在视频应用中的实践探索,涉及编解码器、超分辨率等

使用改进滤波器:

人工智能在视频应用中的实践探索,涉及编解码器、超分辨率等

第二种情况,插入点在边界内:

人工智能在视频应用中的实践探索,涉及编解码器、超分辨率等

标准滤波:

人工智能在视频应用中的实践探索,涉及编解码器、超分辨率等

效果可以接受。

第三种情况,插入点在边界外:

人工智能在视频应用中的实践探索,涉及编解码器、超分辨率等

使用标准滤波器:

人工智能在视频应用中的实践探索,涉及编解码器、超分辨率等

使用改进滤波器:

人工智能在视频应用中的实践探索,涉及编解码器、超分辨率等

第三种情况实际上和第一种是一样的。所以我们只要考虑插入点在边界上的情况就可以了。

考虑到每个像素实际是8位的,一个4x4像素块的可能的组合基本就是128位整数。这是一个极其巨大的数字。然而实际上经常出现的可能远远少于理论上限,基本上考虑几千种组合就够用了。这种情况下需要使用统计方法,或者说是机器学习的办法来获得一个比较好的滤波器参数表。这是一个很稀疏的分布,需要设计比较好hash方法来构造和查找。

一般的机器学习过程都是类似的:准备一些原始 HR 图象(2x2)和从采样生成的 LR(1x1)图象,作为配对数据。然后采用了几个优化操作:

第一步,将复杂 4x4 梯度图象点阵处理成为简单的码本图象(HASH)。

第二步,针对这个码本图象,使用考虑临近像素梯度权重的方法重构B样条滤波器参数,每次都和原始的 2x2 倍图象进行 SAD (COST函数)计算,寻找最接近的拟合曲线参数(下山法)。

第三步,对上一步获得的大量参数计算概率分布,取最大概率的参数作为该码本的最优解。

第四步,对近似的码本进行合并处理,以减小码本的数量。

还有一个讨论点,就是低分图像对边界造成的模糊,有没有办法来去除。有人提出了一个梯度变换的方法:

人工智能在视频应用中的实践探索,涉及编解码器、超分辨率等

这种算法的思路就是计算出梯度的分布,然后适当把梯度收窄。不考虑实现速度的话,这个方法取得效果也是很惊人的。

人工智能在视频应用中的实践探索,涉及编解码器、超分辨率等

这个算法的运算量太大了。我们只能是想办法把这个过程融合到寻找滤波器参数矩阵的过程中来。

在实际处理过程中,我们就使用上面过程获得的进行超分辨率计算。那么我们可以估计这样算法的大致运算量:4x4矩阵配准,查找滤波器,然后每个点16次乘加法。整个过程预估相当于40次乘法运算。因此以现在的cpu性能,使用avx256/512或者hvx充分优化,完全有可能实现1080p到4k的超分辨率上达到实时30fps。

这样某些时候得到的图象目视效果甚至要超过原始输入图象。

人工智能在视频应用中的实践探索,涉及编解码器、超分辨率等

(3.2)视频的超分辨率

上面是单个图像的超分辨率。视频的超分辨率和单个图像是不同的。单个图像的超分辨率算法可以融合到视频超分辨率里面来。

视频的超分辨率基本思路是从连续的视频序列来重建高分辨率的图像,涉及到图像配准和子像素提取。研究方法和评价方法也存在很大差异。有些人用图像的超分辨率方法来套用的话就会出现一些疑惑:

首先视频编码是一个有损压缩过程,不同分辨率的序列压缩退化过程是不同的,因此找不到合适的HR/LR配对。视频质量的评估也是远比图像质量评估要复杂。因此目视质量是一个比较简易的评估标准。当然寻找一个HR/LR配对来计算PSNR也是可以的,但是说服力远不如图像配对的情况。

评估模型:

人工智能在视频应用中的实践探索,涉及编解码器、超分辨率等

比如这个过程,由于未经压缩的视频图像体积巨大,所以HR(0)不适合用来做原始分辨率参照。我们可以选取HR(1)和HSR来比较获取一个PSNR(0), 然后选取HR(1)和普通拉伸获得的HBR来比比较获取一个PSNR(1). 如果PSNR(0)比PSNR(1)要高的话,就说明超分辨取得了效果。

普通的视频序列物体配准和子像素提取是非常慢的。为了加快速度,我们把这个过程简化了一下,省去配准和空间预测的过程,参照解码生成分数运动向量,直接在解码过程中完成一部分像素块的子像素提取工作。

为了进一步提高处理速度,这里面的还采用了一些优化措施:

实验发现,在一个视频播放序列中,如果每间隔2帧清晰度稍差的图像,加入一帧相对高质量图像,和逐帧高质量图像对比起来,人眼的感觉不会造成太多差异。

因此在视频SR过程中,可以每隔两帧用普通 b 样条+降噪生成的基础图象HBR+,做一次HSR处理:

[HSR] ,[HBR+] ,[HBR+], [HSR], [HBR+], [HBR+], [HSR], [HBR+], [HBR+]

这个视频上面的快速超分辨率过程SR详细过程可以描述为:

人工智能在视频应用中的实践探索,涉及编解码器、超分辨率等

预估整个超分辨率过程输出的HSR视频图像质量提升1个dB左右。

原文标题:人工智能在视频应用领域的探索

文章出处:【微信号:livevideostack,微信公众号:LiveVideoStack】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
分享:

评论

相关推荐

4个月过去了 交行区块链国内信用证项目成果怎样了?

 在人工智能应用上,交通银行积极探索人工智能与银行业务的应用触点,以客户体验为核心,利用智能感知、智....

发表于 08-19 09:55 363次 阅读
4个月过去了 交行区块链国内信用证项目成果怎样了?

陆奇“入驻” YC,开启新征程,TensorFlow 2.0 即将发布,所有 tf.contrib 将被弃用

据美国财经网站 CNBC 报道,中国电动汽车制造商蔚来汽车(Nio)向美国证券交易委员会(SEC)提....

的头像 电子发烧友网工程师 发表于 08-19 09:44 824次 阅读
陆奇“入驻” YC,开启新征程,TensorFlow 2.0 即将发布,所有 tf.contrib 将被弃用

关于DLP技术与DLP光显电视的简单介绍

在DLP TV视频前端设计中,建议选用数据精度高、ADC高速过采样的3D Video Decoder....

发表于 08-19 09:25 35次 阅读
关于DLP技术与DLP光显电视的简单介绍

英伟达发布Q2财报,实现营收31.2亿美元

英伟达的汽车业务收入为1.61亿美元,高于预期的1.48亿美元。原始设备制造商和知识产权(包括用于加....

的头像 新智元 发表于 08-19 09:17 310次 阅读
英伟达发布Q2财报,实现营收31.2亿美元

新时代下的人工智能+围棋会碰撞出什么样的火花?

围棋被誉为“人类智慧最后的堡垒”,曾任总参办公厅主任的林建超将军组织专门的力量进行核算,得出的结论是....

发表于 08-19 09:07 179次 阅读
新时代下的人工智能+围棋会碰撞出什么样的火花?

“小芯片,大加速” 2018世界人工智能大会即将召开

2018世界人工智能大会今年9月17到19日将在上海徐汇西岸举办。大会由国家发展改革委、科技部、工业....

发表于 08-19 09:04 717次 阅读
“小芯片,大加速” 2018世界人工智能大会即将召开

广东省新一代人工智能发展规划发布 人工智能产业形势愈发良好

人工智能是引领未来的战略性技术,预示着新一轮科技革命和产业变革的方向,是真正的大国重器。

发表于 08-19 09:00 81次 阅读
广东省新一代人工智能发展规划发布 人工智能产业形势愈发良好

全国十五强 厦门跻身全国人工智能城市第一梯队

 省政府今年出台实施意见明确,厦门将打造具有国际竞争力的人工智能产业集群。

发表于 08-19 08:56 49次 阅读
全国十五强 厦门跻身全国人工智能城市第一梯队

人工智能时代 教育领域将有何改变?

研究人员发现,单一层次可以做一些类似于计算、算法等较为基础的事情;当模型里的层次不断加深时,计算的效....

发表于 08-19 08:53 117次 阅读
人工智能时代 教育领域将有何改变?

又一位AI科学家进军华尔街!

Shaw 于1980 年在美国斯坦福大学获得了博士学位, 30 岁不到就成为哥伦比亚大学计算机科学系....

的头像 新智元 发表于 08-19 08:50 408次 阅读
又一位AI科学家进军华尔街!

2018-2019年十项最具特色的成长性技术的AI技术

胶囊网络。是指在深度神经网络中构建多层神经元模块,用以发现并存储物体详细空间位置和姿态等信息的技术。....

的头像 新智元 发表于 08-19 08:41 403次 阅读
2018-2019年十项最具特色的成长性技术的AI技术

一张“迷你地图”,教你如何进击机器学习!

由图可见,想要进击机器学习,成为机器学习方面的专家,那么你需要从入门、深度学习、数据科学、R语言、P....

的头像 新智元 发表于 08-19 08:34 281次 阅读
一张“迷你地图”,教你如何进击机器学习!

多元化战略推进,人工智能公司深兰科技与绿地金融达成战略合作

8月16日,人工智能独角兽深兰科技宣布与绿地金融达成战略合作,合作签约仪式在深兰科技总部——深兰人工....

的头像 AI机器人 发表于 08-18 16:47 675次 阅读
多元化战略推进,人工智能公司深兰科技与绿地金融达成战略合作

从数据、算力、算法、教学总结机器学习的民主化

Siraj Raval从数据、算力、算法、教学四个方面总结了近年来机器学习是如何民主化的

的头像 论智 发表于 08-18 11:35 224次 阅读
从数据、算力、算法、教学总结机器学习的民主化

Firefly AIO-3288C Android8.1固件发布

AIO-3288C Android8.1固件已发布! 【固件更新】 1、支持HDMI音频输出 2、支持AP6212/AP6236 wifi蓝牙模组 ...

发表于 08-18 11:35 15次 阅读
Firefly AIO-3288C Android8.1固件发布

软件巨头Salesforce带来AutoML杀手TransmogrifAI

如果说去年“机器换人”的舆论来自车间的机器人手,那今年在全球范围内挥舞起“自动化”大棒的,就成了机器....

的头像 论智 发表于 08-18 11:32 620次 阅读
软件巨头Salesforce带来AutoML杀手TransmogrifAI

医疗人工智能该如何发展?又该如何应对疫苗危机?

报告从医疗人工智能的发展角度出发,以商业落地为切入点,总结出中国医疗人工智能发展10大洞察。梳理了国....

发表于 08-18 11:22 360次 阅读
医疗人工智能该如何发展?又该如何应对疫苗危机?

谷歌研发新型AI系统,可为50多种眼疾推荐准确率高达94%的治疗方案

据VentureBeat报道,由谷歌旗下DeepMind Health、Moorfields眼科医院....

发表于 08-18 11:07 67次 阅读
谷歌研发新型AI系统,可为50多种眼疾推荐准确率高达94%的治疗方案

兵器工业集团实现智能无人平台激光雷达核心器件自主研发

兵器工业集团实现智能无人平台激光雷达核心器件自主研发;Comma.ai发布Openpilot二级自动....

的头像 智能制造发展联盟 发表于 08-18 10:49 743次 阅读
兵器工业集团实现智能无人平台激光雷达核心器件自主研发

机器学习数据驱动中如何对小裂纹扩展的方向和速度进行识别

小裂纹的扩展是导致结构部件进入疲劳期的主要因素。尽管人们对此有很大的兴趣,但就裂缝扩展的方向和速度而....

的头像 知社学术圈 发表于 08-18 10:31 178次 阅读
机器学习数据驱动中如何对小裂纹扩展的方向和速度进行识别

科技王凡:如何保证自主泊车的安全

纵目科技王凡提出了“自动驾驶安全的马斯洛三角形”,让人耳目一新。

的头像 佐思汽车研究 发表于 08-18 10:12 515次 阅读
科技王凡:如何保证自主泊车的安全

SKT部署赛灵思FPGA 让其人工智能工作性能大大提高

自适应和智能计算的全球领先企业赛灵思公司(Xilinx, Inc.,(NASDAQ:XLNX)) 与....

的头像 电子发烧友网工程师 发表于 08-18 10:04 426次 阅读
SKT部署赛灵思FPGA 让其人工智能工作性能大大提高

什么是城市大脑?城市大脑是怎么破案的?

我们所生活的这座城市,正在变得越来越智能,因为它有一个聪明的脑袋——城市大脑。  简单来说,城市大脑....

的头像 人工智能 发表于 08-18 09:51 166次 阅读
什么是城市大脑?城市大脑是怎么破案的?

机器学习中如何实现数据转换?数据转化的方法实践详细概述

通常情况下是为了消除量纲的影响。譬如一个百分制的变量与一个5分值的变量在一起怎么比较?只有通过数据标....

的头像 人工智能爱好者社区 发表于 08-18 09:36 185次 阅读
机器学习中如何实现数据转换?数据转化的方法实践详细概述

英特尔宣布收购深度学习创业公司Vertex.AI

英特尔公司想要把更多人工智能(AI)技术整合到各项业务中,该公司在周四宣布收购深度学习创业公司Ver....

的头像 ICChina 发表于 08-18 09:32 347次 阅读
英特尔宣布收购深度学习创业公司Vertex.AI

人工智能拯救小鸡 科技改变生活

你知道一年有多少小鸡因为生病死掉么?1.5亿只作为一个农场主,最关心的莫过于自己的牲畜能否健康的成长....

的头像 SAP天天事 发表于 08-18 09:30 393次 阅读
人工智能拯救小鸡 科技改变生活

机器会意识有吗?如何能让人工智能机器拥有意识?

意识,没有一个客观的科学定义,难以观测认定,但它是每个人都能主观感受到的真实。当你看到嫣红的桃花轻摇....

的头像 人工智能学家 发表于 08-18 09:24 326次 阅读
机器会意识有吗?如何能让人工智能机器拥有意识?

重庆汽车电子再增新生力量

恩智浦中国汽车电子应用开发中心开业典礼 重庆汽车电子产业再添新动能。8月15日,恩智浦中国汽车电子应....

的头像 电子发烧友网工程师 发表于 08-18 09:19 320次 阅读
重庆汽车电子再增新生力量

美国人工智能发展竞赛中要落后于他国?

专注于数据、技术与公共政策的美国科技智库数据创新中心的高级政策分析师Joshua New撰文表示,由....

的头像 人工智能快报 发表于 08-18 09:18 311次 阅读
美国人工智能发展竞赛中要落后于他国?

AI人工智能电话机器人的发展分析,中国人工智能发展情况

李开复先生在TED关于人工智能的演讲,这场15分钟的演讲让人对于人工智能有了新的认识。

的头像 人工智能领域 发表于 08-18 09:14 461次 阅读
AI人工智能电话机器人的发展分析,中国人工智能发展情况

为什么AI的翻译水平还远不能和人类相比?

AI 的翻译水平真的已经可以和人类媲美了吗?而本文的作者从 NMT 技术出发,分析了这项技术仍存在的....

的头像 电子发烧友网工程师 发表于 08-18 08:49 377次 阅读
为什么AI的翻译水平还远不能和人类相比?

ARM史上第一次公开发布了一份CPU规划路线图

ARM首次公布了一份5/7nm CPU规划路线图。ARM称计算性能每一代都可以提升超过15%,并表示....

的头像 电子发烧友网工程师 发表于 08-18 08:42 175次 阅读
ARM史上第一次公开发布了一份CPU规划路线图

生活被机器人包围,这是件好事还是坏事?

作为地球上发展最快的行业之一,通过部署利用改进的人工智能技术,机器人已成为生活无处不在的新时代产物。....

的头像 安全自动化 发表于 08-17 17:53 932次 阅读
生活被机器人包围,这是件好事还是坏事?

探究昆虫如何完成面孔识别任务

人识别面孔的能力在很大程度上以“整体处理”过程为基础——将不同的面部特征粘合在一起,以提供有效识别。....

的头像 高工智能未来 发表于 08-17 17:27 245次 阅读
探究昆虫如何完成面孔识别任务

中国2018 Google开发者大会今天起开放报名

报告显示,今年第一度,全球智能音箱出货量预估达到920万台。其中,亚马逊稳居第一,出货量预计400万....

的头像 科技美学 发表于 08-17 17:23 1650次 阅读
中国2018 Google开发者大会今天起开放报名

在当前深度学习比较火热的情景下需要避免的三个坑

深度学习在过去几年一直是人工智能领域最热门的话题。事实上,正是它激发了科学家、政府、大公司以及其他所....

的头像 人工智能学家 发表于 08-17 17:16 253次 阅读
在当前深度学习比较火热的情景下需要避免的三个坑

人工智能已可以用于三维医学影像,快速准确的做出医疗诊断

人工智能在医疗领域的应用以数见不鲜了。在医学影像方面更是具有其独特的价值。

发表于 08-17 16:40 181次 阅读
人工智能已可以用于三维医学影像,快速准确的做出医疗诊断

盘点人工智能在无人机中的应用

科技正在以一种近乎革命性的手段,解决生活中真实存在的难题!人工智能的出现,重新定义了人类所认知的无人....

的头像 机器人博览 发表于 08-17 16:36 718次 阅读
盘点人工智能在无人机中的应用

探讨人工智能技术在心理学研究中的应用前景

人工智能及相关技术的发展,为心理学研究提供了突破性的研究方法和工具;心理学对大脑机制的研究成果运用于....

的头像 人工智能学家 发表于 08-17 16:33 883次 阅读
探讨人工智能技术在心理学研究中的应用前景

浅析人工智能在心理学研究中的应用前景

人工智能及相关技术的发展,为心理学研究提供了突破性的研究方法和工具;心理学对大脑机制的研究成果运用于....

的头像 重庆人工智能 发表于 08-17 16:21 406次 阅读
浅析人工智能在心理学研究中的应用前景

人工智能技术将与传统的自动化、机器人技术融合,重塑制造业

劳动力套利时代已经结束,人力成本不再是竞争焦点,制造业的未来在更小、更靠近消费者、更加敏捷的工厂里。....

的头像 工业4俱乐部 发表于 08-17 16:02 636次 阅读
人工智能技术将与传统的自动化、机器人技术融合,重塑制造业

人工智能在教育领域有哪些实践?

AI+确实会对行业产颠覆影响,但是本身还是一个工具,那须得以内容为载体。AI+教育,技术和内容结合才....

的头像 高工智能未来 发表于 08-17 15:32 468次 阅读
人工智能在教育领域有哪些实践?

GDPR对AI的挑战和基于联邦迁移学习的对策

7月28-29日,由中国人工智能学会和深圳市罗湖区人民政府共同主办,马上科普承办的“2018 中国人....

的头像 中国人工智能学会 发表于 08-17 14:48 317次 阅读
GDPR对AI的挑战和基于联邦迁移学习的对策

缩水近百亿美元,百度还能在人工智能领域走下去吗?

每天从不缺话题,从沸沸扬扬的联想,周五(5月18日)百度公司突然宣布陆奇将在7月不再担任总裁和COO....

发表于 08-17 14:39 293次 阅读
缩水近百亿美元,百度还能在人工智能领域走下去吗?

MIT利用人工智能技术做到 “穿墙看人”

一直以来,用X射线穿透墙壁看到对面的人,似乎都是科幻小说中天马行空的想象。但在过去的十年间,来自于....

发表于 08-17 14:19 94次 阅读
MIT利用人工智能技术做到 “穿墙看人”

如何借助Watson API 赋予主角生命

为了帮助她演绎书中场景,我使用了文本转语音 API 的表达功能“Expressiveness”,该功....

的头像 IBM中国 发表于 08-17 14:11 285次 阅读
如何借助Watson API 赋予主角生命

Arm首次公布CPU路线图:每年提升15% 超越低压版i5

Arm此前刚刚在6月初发布了新一代高性能CPU核心Cortex-A76,可搭配10nm、7nm工艺,....

的头像 章鹰 发表于 08-17 10:38 962次 阅读
Arm首次公布CPU路线图:每年提升15% 超越低压版i5

科大讯飞加速布局少儿编程 战略投资编玩边学

8月16日,编玩边学宣布获得科大讯飞千万级人民币的战略投资,君联资本跟投。这是编玩边学今年完成的第2轮融资,也是pre-B轮融资...

发表于 08-16 15:09 77次 阅读
科大讯飞加速布局少儿编程 战略投资编玩边学

区块链手表:智能穿戴,智能家居的挖矿时代

来源:贝壳手表CCT 在万众垂涎三尺的热切期盼中,中国人工智能在近两三年中掀起了一阵阵高潮。根据投资界的统计,2017年中...

发表于 08-16 14:07 139次 阅读
区块链手表:智能穿戴,智能家居的挖矿时代

一只住在心里的猛兽 | 1024创意街

「1024创意街」第一期,我们邀请了科大讯飞研究院科学家李鑫来和大家分享他的创意,以下是他创意分享的文字整理稿件。 创意分...

发表于 08-16 10:12 112次 阅读
一只住在心里的猛兽 | 1024创意街

可与传入的视频信号进行同步分离的视频时钟子系统包含BOM,CAD文件及光绘文件

描述 一种视频时钟子系统,用于为视频和音频子系统执行视频同步分离并衍生同步视频时钟。 主要特色 与传入的视频信...

发表于 08-16 07:35 258次 阅读
可与传入的视频信号进行同步分离的视频时钟子系统包含BOM,CAD文件及光绘文件

机器学习能通过类似「指纹辨识」的方式识别出代码的编写者

这方法可以用来辨识黑客和意图瓢窃资料的人,但也有可能对隐私造成威胁。 虽然每位程序员都拥有自己独特的风格,但光通过观察...

发表于 08-14 09:48 150次 阅读
机器学习能通过类似「指纹辨识」的方式识别出代码的编写者

Firefly支持AI引擎Tengine,性能提升,轻松搭建AI计算框架

Tengine 是OPEN AI LAB 为嵌入式设备开发的一个轻量级、高性能并且模块化的引擎。基于ARM平台高效的计算库实现,针...

发表于 08-13 15:58 1012次 阅读
Firefly支持AI引擎Tengine,性能提升,轻松搭建AI计算框架

麦克风 | AI+医疗,站上了新一轮的风口?

人工智能最近几年一直很火,特别是在谷歌的AlphaGo以4:1的成绩战胜了世界围棋冠军李世石后,人工智能在全世界范围内被引爆。...

发表于 08-13 09:28 87次 阅读
麦克风 | AI+医疗,站上了新一轮的风口?

【百度人脸识别开发套件】开放人脸识别APP及SDK,加速二次开发进程

百度人脸识别套件是集算法与软硬件为一体的一站式开发套件,目前人脸识别APP及SDK已开放,助力企业二次开发,加速产品落地...

发表于 08-10 15:31 1358次 阅读
【百度人脸识别开发套件】开放人脸识别APP及SDK,加速二次开发进程

晚自习回顾 | “药神”不在,AI已来

自从7月5日上映以来,《我不是药神》已经突破30亿票房,位列中国电影票房第五名。高票房的背后,是民众对医疗行业的深切关注。 ...

发表于 08-10 11:56 250次 阅读
晚自习回顾 | “药神”不在,AI已来