人工智能在视频应用中的实践探索,涉及编解码器、超分辨率等

LiveVideoStack 2018-01-18 13:56 次阅读

人工智能热度很高,但泡沫也很大。人工智能在视频领域的应用已经走入寻常人的生活,人脸识别,视频自动抠像技术已经比较成熟。除此之外,人工智能还能为视频应用带来哪些变化呢?描述了人工智能在视频应用中的实践探索,涉及编解码器、超分辨率等。

序:人工智能来生今世

人工智能是一个非常广泛的领域,当前人工智能涵盖很多大的学科,大致归纳为六个:

计算机视觉(暂且把模式识别,图像处理等问题归入其中);

自然语言理解与交流(暂且把语音识别、合成归入其中,包括对话);

认知与推理(包含各种物理和社会常识);

机器人学(机械、控制、设计、运动规划、任务规划等);

博弈与伦理(多代理人agents的交互、对抗与合作,机器人与社会融合等议题);

机器学习(各种统计的建模、分析工具和计算的方法)。

这里值得强调几点:

第一)目前的人工智能都是属于弱人工智能的范围,在某一个专业领域内作为被人类使用的工具存在。 目前还不存在离开人类主体自行运行的人工智能,更不存在可以开发人工智能自我迭代进化的强人工智能。

第二)机器学习在近几年取得了很大进展,有些人直接把机器学习当成了人工智能的代名词。这是不准确的。举例来说,不可否认机器学习在计算机视觉领域发挥着越来越大的作用,但是传统意义上,通过人工建模,分析取得的模式识别,图像识别,图像增强仍旧是很成功的人工智能技术,并且也是机器学习进一步发展的基础。

第三)统计分析方法在1990年代就出现并在一定领域内使用了。统计分析方法也多种多样的,根据实际需要产生过很多成功的案例,不一定采用目前标准的建模和分析方法。这里面举个典型的例子,在1997年Intel推出mmx技术之前,程序员中流传着一个非常著名的查表IDCT(反余弦变换),实际上就是对MPEG1编解码过程的IDCT变换,做了统计分析后发现的,超过之前所有快速算法的实战案例。具体细节请点击『阅读原文』下载IDCT 8x8.DOC。

第四)机器学习有这几个比较明显的缺陷,想要在实战中取得良好的效果,就必须做出合理的取舍和优化。这几个缺陷是:

严重依赖数据,训练方法和训练量非常关键。

计算量偏高。

虽然有时候取得了良好的效果,但是机器学习本身并不能理解这个过程,也不能给出合理的解释。

涉及自然科学常识和社会科学常识的问题,目前机器学习还不能在开放领域内取得良好的效果。

(一)人工智能对视频应用的渗透

传统视频应用的流程:

人工智能在视频应用中的实践探索,涉及编解码器、超分辨率等

前面我们说过,目前的人工智能还处于工具阶段,也就是说还没有人工智能开发出来的任何的超越时代的编码方法、传输协议、解码、交互技术存在。目前人工智能渗透包括预处理和后处理,超分辨率,机器视觉等等,人们在这些过程中使用人工智能工具来提升开发效率或者处理效果。而编解码技术,则属于人类专家技术团队才能解决的问题,目前的人工智能还很难介入。

人工智能在视频应用中的实践探索,涉及编解码器、超分辨率等

近年来网络直播应用的兴起,出现了跟以往广播电视编解码不太一样的需求。那就是:

编码端,保证编码实时性和码率的要求的同时,保证尽量高的图像质量。

发送,传输,缓冲,延时尽量小。

解码器尽量能输出最好的质量,最好能超分辨率。

这两年我一直在努力把人工智能(主要是机器学习)技术跟编解码做更深的融合,用来解决传统方法一直很难解决的这几个问题。

编码器遇到的问题:硬件编码器性能好,但是图像质量差,码率高。软件编码器效率较低,遇到复杂视频,比如物体繁多,较大运动,闪光,旋转,既不能满足实时编码的需求,同时输出码率也出现较大抖动。对于网络应用来说是很大的障碍。

解码器需要增强的点:大家都在构想能不能应用超分辨率技术,把较低分辨率的视频的播放质量提升一大块。目前有很多算法显示出巨大的潜力,比如谷歌的RAISR,处理图像时候效果很好。能不能实时用到视频上,或者硬件化,或者采用更快的能实时运行的算法。我们在后面会讨论一种折中方案,在牺牲一点质量的前提下,能够实时运行的超分辨率算法。

人工智能在视频应用中的实践探索,涉及编解码器、超分辨率等

(二)人工智能增强的编码器

(2.1)动态编码器

不同场景下编码保持恒定质量的码率:

编码时间和码率是正相关的,在码率暴涨的同时,编码时间也剧烈延长。对于低延时需求强烈的直播应用,会造成严重的卡顿。

一般就只好使用绝对不变码率ABR. 不同场景下ABR的图像质量:

人工智能在视频应用中的实践探索,涉及编解码器、超分辨率等

这样带来的结果就是图像质量不稳定。

我们希望是下图这样的曲线:

人工智能在视频应用中的实践探索,涉及编解码器、超分辨率等

这就需要编码器能够提前判定大码率场景出现的可能性。需要判定的几种情况:

物体繁多且有摄像机运动。

背景不动但是有大量物体的大范围运动,包括快速运动,旋转,仿射,蠕变等。

出现闪光,风沙,粒子系统。

这就需要开发一种适用于高清晰度直播应用的面向场景的智能编码技术。该技术通过监督学习将常见视频编码卡顿场景分类并快速识别,提前预判视频场景的编码复杂度和码率抖动,使用动态参数配置来编码,保证编码的实时性和限定码率下最好的图像质量。

(2.2)内容自动植入

人工智能在视频应用中的实践探索,涉及编解码器、超分辨率等

这里讨论广告的自动植入问题。一种是在编码前合成到视频里面,这个过程跟编码关系不大。但是直接合成到视频之后,所有的观众看到的内容就都一样。

要做到个性化,精准的广告投放,就只有在播放端解码后合成。要做到这点,服务器不仅要发送原始视频流,还要发送后期合成物体的定位方法和图像数据,以便客户端按照需求进行动态合成。

首先,自动植入的广告跟前贴片比起来优势很明显,可以植入的广告数量非常巨大,效果也更自然,用户也不会产生明显的反感。

其次,个性化精准投放,又进一步扩大了广告投放的总容量和效率。

(2.3)交互式视频

人工智能在视频应用中的实践探索,涉及编解码器、超分辨率等

目前基本做法是图像识别后,与搜索引擎连接,产生一个内容链接。

人工智能在视频应用中的实践探索,涉及编解码器、超分辨率等

(三)人工智能增强的解码器

(3.1)单个图像的超分辨率

自然图像基本上是平坦的纹理填充和显著的边缘(线条)组合形成的。

常规拉伸算法有双线性插值和双三次样条曲线差值。一般说来,三次曲线要比线性插值效果好。

然而在 15 年前,我在金山做 DVD 播放器的时候,正在研究去隔行技术。

人工智能在视频应用中的实践探索,涉及编解码器、超分辨率等

如上图所示,第一排和第三排是原图数据,第二排是需要插入的数据。普通的插值方法是在 B 方向上做一个三次插值。但是我这次计算了 A,B,C 三个方向的梯度,取方向梯度最小,像素梯度和最大的方向做简单的线性插值。

这时候我有一个惊奇的发现,简单的双线性插值的目视效果居然要好过三次曲线。这是为什么呢?

图像模糊的原因有以下几个:

低分辨率下线条会变得模糊。

低分辨率图像在拉伸到高分辨率时候会在线条上引入额外的模糊。

噪音的存在。

对于第2点我们具体说明:比如B样条,三次样条曲线有一个应用条件,那就是样本数据本身应该是光滑的,至少是分段光滑。但是在图像里面,物体的边界和背景的结合处,就不满足这个条件了。普通的三次样条曲线插值并没有考虑图像内部各个物体的不同,简单的把整个图像作为一个整体来计算。这样必然就在边界处引入了严重的模糊。

因此超分辨率主要从以上几个方面进行处理。噪音的处理技术已经比较成熟了。今天我们就不讨轮了。

第一个讨论点,如何降低线条的拉伸效应,也就是线条的锐度保持。

比如一个4x4的像素块,比较常见的是如下的形态:

人工智能在视频应用中的实践探索,涉及编解码器、超分辨率等

普通的三次b样条的滤波器参数矩阵为:

比如我们打算在4x4像素块中心插入一个点:

第一种情况,插入点在边界上。

人工智能在视频应用中的实践探索,涉及编解码器、超分辨率等

使用标准滤波器:

人工智能在视频应用中的实践探索,涉及编解码器、超分辨率等

使用改进滤波器:

人工智能在视频应用中的实践探索,涉及编解码器、超分辨率等

第二种情况,插入点在边界内:

人工智能在视频应用中的实践探索,涉及编解码器、超分辨率等

标准滤波:

人工智能在视频应用中的实践探索,涉及编解码器、超分辨率等

效果可以接受。

第三种情况,插入点在边界外:

人工智能在视频应用中的实践探索,涉及编解码器、超分辨率等

使用标准滤波器:

人工智能在视频应用中的实践探索,涉及编解码器、超分辨率等

使用改进滤波器:

人工智能在视频应用中的实践探索,涉及编解码器、超分辨率等

第三种情况实际上和第一种是一样的。所以我们只要考虑插入点在边界上的情况就可以了。

考虑到每个像素实际是8位的,一个4x4像素块的可能的组合基本就是128位整数。这是一个极其巨大的数字。然而实际上经常出现的可能远远少于理论上限,基本上考虑几千种组合就够用了。这种情况下需要使用统计方法,或者说是机器学习的办法来获得一个比较好的滤波器参数表。这是一个很稀疏的分布,需要设计比较好hash方法来构造和查找。

一般的机器学习过程都是类似的:准备一些原始 HR 图象(2x2)和从采样生成的 LR(1x1)图象,作为配对数据。然后采用了几个优化操作:

第一步,将复杂 4x4 梯度图象点阵处理成为简单的码本图象(HASH)。

第二步,针对这个码本图象,使用考虑临近像素梯度权重的方法重构B样条滤波器参数,每次都和原始的 2x2 倍图象进行 SAD (COST函数)计算,寻找最接近的拟合曲线参数(下山法)。

第三步,对上一步获得的大量参数计算概率分布,取最大概率的参数作为该码本的最优解。

第四步,对近似的码本进行合并处理,以减小码本的数量。

还有一个讨论点,就是低分图像对边界造成的模糊,有没有办法来去除。有人提出了一个梯度变换的方法:

人工智能在视频应用中的实践探索,涉及编解码器、超分辨率等

这种算法的思路就是计算出梯度的分布,然后适当把梯度收窄。不考虑实现速度的话,这个方法取得效果也是很惊人的。

人工智能在视频应用中的实践探索,涉及编解码器、超分辨率等

这个算法的运算量太大了。我们只能是想办法把这个过程融合到寻找滤波器参数矩阵的过程中来。

在实际处理过程中,我们就使用上面过程获得的进行超分辨率计算。那么我们可以估计这样算法的大致运算量:4x4矩阵配准,查找滤波器,然后每个点16次乘加法。整个过程预估相当于40次乘法运算。因此以现在的cpu性能,使用avx256/512或者hvx充分优化,完全有可能实现1080p到4k的超分辨率上达到实时30fps。

这样某些时候得到的图象目视效果甚至要超过原始输入图象。

人工智能在视频应用中的实践探索,涉及编解码器、超分辨率等

(3.2)视频的超分辨率

上面是单个图像的超分辨率。视频的超分辨率和单个图像是不同的。单个图像的超分辨率算法可以融合到视频超分辨率里面来。

视频的超分辨率基本思路是从连续的视频序列来重建高分辨率的图像,涉及到图像配准和子像素提取。研究方法和评价方法也存在很大差异。有些人用图像的超分辨率方法来套用的话就会出现一些疑惑:

首先视频编码是一个有损压缩过程,不同分辨率的序列压缩退化过程是不同的,因此找不到合适的HR/LR配对。视频质量的评估也是远比图像质量评估要复杂。因此目视质量是一个比较简易的评估标准。当然寻找一个HR/LR配对来计算PSNR也是可以的,但是说服力远不如图像配对的情况。

评估模型:

人工智能在视频应用中的实践探索,涉及编解码器、超分辨率等

比如这个过程,由于未经压缩的视频图像体积巨大,所以HR(0)不适合用来做原始分辨率参照。我们可以选取HR(1)和HSR来比较获取一个PSNR(0), 然后选取HR(1)和普通拉伸获得的HBR来比比较获取一个PSNR(1). 如果PSNR(0)比PSNR(1)要高的话,就说明超分辨取得了效果。

普通的视频序列物体配准和子像素提取是非常慢的。为了加快速度,我们把这个过程简化了一下,省去配准和空间预测的过程,参照解码生成分数运动向量,直接在解码过程中完成一部分像素块的子像素提取工作。

为了进一步提高处理速度,这里面的还采用了一些优化措施:

实验发现,在一个视频播放序列中,如果每间隔2帧清晰度稍差的图像,加入一帧相对高质量图像,和逐帧高质量图像对比起来,人眼的感觉不会造成太多差异。

因此在视频SR过程中,可以每隔两帧用普通 b 样条+降噪生成的基础图象HBR+,做一次HSR处理:

[HSR] ,[HBR+] ,[HBR+], [HSR], [HBR+], [HBR+], [HSR], [HBR+], [HBR+]

这个视频上面的快速超分辨率过程SR详细过程可以描述为:

人工智能在视频应用中的实践探索,涉及编解码器、超分辨率等

预估整个超分辨率过程输出的HSR视频图像质量提升1个dB左右。

热门推荐

原文标题:人工智能在视频应用领域的探索

文章出处:【微信号:livevideostack,微信公众号:LiveVideoStack】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
分享:

评论

相关推荐

AI辩论机器人问世,理性思维流畅对话

IBM开发的人工智能已经可以与人类展开辩论,讨论的主题很深刻,有“医疗的未来”,还有“体育教育的价值....

的头像 IBM中国 发表于 06-23 10:22 302次 阅读
 AI辩论机器人问世,理性思维流畅对话

下一代互联网发展的新机遇和新图景

从人与人相连接,到万物互联,互联网技术的演进正在给人类社会带来巨大变革。

的头像 智能制造 发表于 06-23 09:43 558次 阅读
下一代互联网发展的新机遇和新图景

AI2.0,真的能引领智能制造吗?

去年早些时候,“互联网+”曾经被视为“智能制造”的灵丹妙药。经过一段时间的争吵、实践和沉淀,“制造业....

的头像 智能制造 发表于 06-23 09:41 336次 阅读
AI2.0,真的能引领智能制造吗?

将互联网技术搬到芯片内部

当前信息技术的一个主要矛盾,是急剧增长的数据流与有限带宽之间的矛盾,伴随人工智能与5G技术发展,数据....

的头像 TechSugar 发表于 06-23 09:14 302次 阅读
将互联网技术搬到芯片内部

运用腾讯AI Lab在腾讯服务中的自然语言处理和深度学习等AI技术

依托“腾讯觅影”AI辅诊引擎和微信智慧医院生态,医院和医疗信息化厂商能实现移动医疗服务的智慧化升级,....

的头像 高工智能未来 发表于 06-22 16:37 886次 阅读
运用腾讯AI Lab在腾讯服务中的自然语言处理和深度学习等AI技术

在5G网络的支持下,智能汽车或将变身“贾维斯”,更懂你

我们现在正处在4G时代,网速已经可以满足我们绝大部分场景的需求。但是不久的将来,5G通讯技术的成熟,....

的头像 Thundersoft中科创达 发表于 06-22 14:44 363次 阅读
在5G网络的支持下,智能汽车或将变身“贾维斯”,更懂你

人工智能的影响超乎你想象

发表于 06-22 14:40 64次 阅读
人工智能的影响超乎你想象

云从科技“再添一把火”,成功入选Nanalyze“世界十大AI创业公司

云从科技是专注于计算机视觉的人工智能国家队,孵化于中国科学院重庆分院,是唯一一家纯内资的计算机视觉企....

的头像 你好张江 发表于 06-22 14:34 830次 阅读
云从科技“再添一把火”,成功入选Nanalyze“世界十大AI创业公司

人工智能手机成为行业新趋势,中国手机市场又开始新一轮野蛮生长

AI作为今后智能手机的发力点,是毋庸置疑的。机器代替人简单思考、测量感知并提供建议。以目前的技术成熟....

的头像 ICChina 发表于 06-22 14:30 423次 阅读
人工智能手机成为行业新趋势,中国手机市场又开始新一轮野蛮生长

恩智浦S32V视觉处理解决方案投入量产

全球最大的汽车电子及人工智能物联网芯片公司恩智浦半导体(纳斯达克代码:NXPI,以下简称“恩智浦”)....

的头像 人间烟火123 发表于 06-22 14:08 476次 阅读
恩智浦S32V视觉处理解决方案投入量产

Aoole在iOS 12的更新中增加了机器学习功能,将可以预测反射、光照等智能环境纹理

每年iOS的更新都是非常具有话题性的,关于今年的WWDC大会上,iOS 12带来了不少有趣的新功能,....

的头像 AR酱 发表于 06-22 11:40 346次 阅读
Aoole在iOS 12的更新中增加了机器学习功能,将可以预测反射、光照等智能环境纹理

一颗足球蕴藏科技密码,视觉大脑追踪球员一举一动

除了赛事判决本身运用新科技,观众本身对于对观赛要求也越来越高。IBM曾针对赛事运用“AI Visio....

的头像 DIGITIMES 发表于 06-22 11:26 421次 阅读
一颗足球蕴藏科技密码,视觉大脑追踪球员一举一动

一座特殊“城市”——机器人未来城

机器人未来城将重点打造以“智造、创新、人才、示范、金融”五大平台为核心的产业生态圈,实现工业机器人、....

的头像 机器人在线订阅号 发表于 06-22 11:23 398次 阅读
一座特殊“城市”——机器人未来城

高通将人工智能和视觉处理带入广泛的消费和工业应用

高通在2017财年超过10亿美元的物联网收入后,宣布为物联网应用专门构建新的产品系列。

的头像 机器人博览 发表于 06-22 11:23 394次 阅读
高通将人工智能和视觉处理带入广泛的消费和工业应用

人工智能将引发各行业数字化变革

如今,全球正迈向数字化新时代。以云计算、大数据、人工智能与物联网为代表的数字技术,其能量在持续释放。

的头像 机器人博览 发表于 06-22 11:14 568次 阅读
人工智能将引发各行业数字化变革

寒武纪——中国人工智能未来的希望

中科院计算所陈云霁、陈天石团队将研发的全球首款人工智能处理器命名为“寒武纪”,也意喻着人工智能即将迎....

的头像 机器人博览 发表于 06-22 11:08 434次 阅读
寒武纪——中国人工智能未来的希望

智慧芽完成3800万美元D轮融资

6月14日,全球研发情报与知识产权管理SaaS服务提供商智慧芽(PatSnap)宣布已经完成3800....

的头像 机器人技术与应用 发表于 06-22 10:54 473次 阅读
智慧芽完成3800万美元D轮融资

IBM认为,企业具备以下三大必杀技,才能打好信息安全的硬仗

随着人工智能技术变得日趋主流和开源化,网络犯罪份子正采用人工智能,不仅将他们的犯罪活动加速并自动化,....

的头像 IBM中国 发表于 06-22 10:49 314次 阅读
IBM认为,企业具备以下三大必杀技,才能打好信息安全的硬仗

创新工场、创新奇智南京开业,助力南京打造人工智能地标

6月21日,创新工场南京国际人工智能研究院、创新工场人工智能工程院华东总部以及创新奇智(南京)科技有....

的头像 机器人技术与应用 发表于 06-22 10:47 473次 阅读
创新工场、创新奇智南京开业,助力南京打造人工智能地标

韩国洪性志对局使用AI作弊胜柯洁

韩国棋院排名第20位的洪性志九段(31岁)最近被质疑网络对局中使用人工智能围棋程序(AI)。

的头像 人工智能 发表于 06-22 10:41 302次 阅读
韩国洪性志对局使用AI作弊胜柯洁

如何玩转“IC+”?交给IC Park就够了

未来行业发展势头势必迅猛,这源于近些年前沿科技领域的井喷式发展,其中人工智能、自动驾驶、VR/AR、....

的头像 Duke 发表于 06-22 10:40 343次 阅读
如何玩转“IC+”?交给IC Park就够了

AI自学就可用更少步数复原任意3阶魔方

魔术方块是非常有趣的益智玩具,但从难度来说,并不比其他棋类游戏困难,如果人工智能(AI)算法可以在国....

的头像 人工智能 发表于 06-22 10:24 228次 阅读
AI自学就可用更少步数复原任意3阶魔方

全新复合翼无人机——ZT-3V,聚焦警用安防和测绘领域

 但是在民用行业无人机应用中,为了应用场景和城市飞行的安全性,飞机的重量必须很轻,载荷的作用距离只有....

的头像 无人机网 发表于 06-22 10:19 305次 阅读
全新复合翼无人机——ZT-3V,聚焦警用安防和测绘领域

人工智能驱动的数据分析:这种变革趋势的内幕

主要基于机器学习的现实世界人工智能数据项目十分瞩目,并且在很大程度上是成功的。有些首席信息官将人工智....

的头像 AI人工智能D1net 发表于 06-22 10:10 291次 阅读
人工智能驱动的数据分析:这种变革趋势的内幕

执行高性能目标检测的编码教程

作为人工智能的一个重要领域,计算机视觉是一门可以识别并理解图像和场景的计算机及软件系统科学。该领域主....

的头像 人工智能头条 发表于 06-22 10:07 177次 阅读
执行高性能目标检测的编码教程

Sklearn与TensorFlow机器学习实用指南

以一个简单的线性回归模型为例,讨论两种不同的训练方法来得到模型的最优解。

的头像 人工智能爱好者社区 发表于 06-22 10:02 212次 阅读
Sklearn与TensorFlow机器学习实用指南

Airdoc副总裁张京雷带来了医学人工智能院内和院外的筛查的探索和反思

自2009年开始的第二轮鼓励社会资本办医以来,医疗是无论在软件还是硬件方面都投入大的领域,对于非公医....

的头像 悟空智能科技 发表于 06-22 10:02 416次 阅读
Airdoc副总裁张京雷带来了医学人工智能院内和院外的筛查的探索和反思

2018中国异构系统架构标准暨人工智能产业高层研讨会在南京召开

本次论坛由中国电子技术标准化研究院、全球异构系统架构联盟中国区域委员会(HSA CRC)主办,由中国....

的头像 Duke 发表于 06-22 09:56 854次 阅读
2018中国异构系统架构标准暨人工智能产业高层研讨会在南京召开

深度学习高效化与专用处理芯片设计

在人工智能领域,机器学习研究与芯片行业的发展,即是一个相因相生的过程。自第一个深度网络提出,深度学习....

的头像 深度学习大讲堂 发表于 06-22 09:55 162次 阅读
深度学习高效化与专用处理芯片设计

与人工智能进行AR乒乓球对抗

Leap Motion已经开发出了一款惊人流畅的增强现实乒乓球游戏,其不仅展示了其开源项目“北极星”....

的头像 AR联盟 发表于 06-22 09:42 222次 阅读
与人工智能进行AR乒乓球对抗

“中国芯”短板何在?垂直整合或成行业趋势

近日,格力电器董事长董明珠表示,哪怕投资500亿元,格力也要把芯片研究成功。而引起更大行业震动的是互....

的头像 中国半导体论坛 发表于 06-22 09:17 756次 阅读
“中国芯”短板何在?垂直整合或成行业趋势

中兴紧急澄清:美参议院恢复处罚投票非美国法律,港股大涨20%

中美贸易战在持续发酵,正业科技近日发布公告表示,公司产品基本没有出口到美国。公司是专业提供高端装备及....

的头像 电子发烧友网 发表于 06-22 08:57 604次 阅读
中兴紧急澄清:美参议院恢复处罚投票非美国法律,港股大涨20%

一文快速了解机器学习任务中的重要成分和结构

很显然,当训练数据集足够大的时候,经验风险最小化这一策略能够保证很好的学习效果——这也就是我们当代深....

的头像 电子发烧友网工程师 发表于 06-22 08:39 405次 阅读
一文快速了解机器学习任务中的重要成分和结构

柯洁泪洒乌镇一周年 AI已重写围棋江湖

“人类对抗AI”的悲壮才过去一年,围棋国手们已能放下尊严向AI讨教,但他们要适应的远不止全新的围棋理....

的头像 新智元 发表于 06-21 17:44 605次 阅读
柯洁泪洒乌镇一周年 AI已重写围棋江湖

为何人工智能人才如此稀缺?人才紧缺成为行业现状

顶级人才有了,基层人才又是如何培养起来的呢?如果单靠高校培养,时间上会有延迟,所以目前业内的基本情况....

的头像 机器人博览 发表于 06-21 15:16 407次 阅读
为何人工智能人才如此稀缺?人才紧缺成为行业现状

人工智能到底是不是“创业噱头”?人工智能创业的两种形态

人工智能的商业化有三大核心,即技术、数据和场景,科技巨头们拥有数据上的优势,目前的焦点在于人工智能的....

的头像 机器人博览 发表于 06-21 15:12 497次 阅读
人工智能到底是不是“创业噱头”?人工智能创业的两种形态

人工智能之父:不是AI,而是IA

像《我,机器人》这样水平的人工智能多久能被制造出来一直有两种声音,一种是人们认为它很快就能到来,另一....

的头像 人工智能 发表于 06-21 15:00 410次 阅读
人工智能之父:不是AI,而是IA

重要通知!2018 iFLYTEK AI 开发者大赛方言赛初赛正式开启!

发表于 06-21 14:59 56次 阅读
重要通知!2018 iFLYTEK AI 开发者大赛方言赛初赛正式开启!

5G和人工智能,从云端到终端的人工智能

现今的人工智能技术,特别是以深度学习(机器学习的一个分支)为代表的,需要海量的数据作为基础支撑,并以....

的头像 人工智能 发表于 06-21 14:55 368次 阅读
5G和人工智能,从云端到终端的人工智能

人脸识别是啥玩意儿?人脸识别技术发展

人脸检测算法的原理简单来说是一个“扫描”加“判定”的过程。即首先在整个图像范围内扫描,再逐个判定候选....

的头像 人工智能学家 发表于 06-21 14:51 314次 阅读
人脸识别是啥玩意儿?人脸识别技术发展

启用和应用“可靠的人工智能”负责

人工智能应该能够增强人们的判断力,帮助人们识别和解决偏见,而不是无形地改变其行为以反映出所期望的结果....

的头像 AI人工智能D1net 发表于 06-21 14:35 276次 阅读
启用和应用“可靠的人工智能”负责

盲人创业者朱清毅:用耳朵听世界,闯未来

发表于 06-21 14:35 61次 阅读
盲人创业者朱清毅:用耳朵听世界,闯未来

谷歌正在训练机器来预测病患的死亡时间

人工智能主管迪恩强调称,这种实验依赖的是认真严肃的医疗咨询,而不仅仅是好奇的软件程序员。谷歌公司正在....

的头像 人工智能大趋势 发表于 06-21 14:31 490次 阅读
谷歌正在训练机器来预测病患的死亡时间

Inception V2/V3/V4的发展历程以及它们的网络结构和亮点

在机器学习中,我们通常会做一种假设:训练样本独立同分布(iid)且训练样本与测试样本分布一致,如果真....

的头像 人工智能爱好者社区 发表于 06-21 14:27 158次 阅读
Inception V2/V3/V4的发展历程以及它们的网络结构和亮点

人工智能的商业价值都持有高期望,而商业“奇点”在哪儿呢?

2018年将是人工智能商业落地的元年。一个显著的变化是,去年创始人还在拿数据和算法讲故事,今年则开始....

的头像 重庆人工智能 发表于 06-21 14:23 482次 阅读
人工智能的商业价值都持有高期望,而商业“奇点”在哪儿呢?

智慧家居会为生活带来哪些改变呢?机器人可以替代人?

送餐机器人、购物指引机器人、巡检机器人、教学机器人、政务机器人给人们的生活带来更多的便捷。随着技术不....

的头像 人工智能和机器人研究院 发表于 06-21 14:15 322次 阅读
智慧家居会为生活带来哪些改变呢?机器人可以替代人?

低价的智能音箱物有所值吗?人工智能靠“补贴”能否有效落地?

一边是各个人工智能平台对智能音箱的信心满满纷纷补贴来培育市场,另一边则是不少消费者的观望或者低开机率....

的头像 人工智能和机器人研究院 发表于 06-21 14:13 302次 阅读
低价的智能音箱物有所值吗?人工智能靠“补贴”能否有效落地?

人工智能提高会计工作效率, 推动会计职业架构转型

随着人工智能对传统会计职业架构的冲击,会计人才培养也将向多元化、高端型发展,会计人员的核算(反映)....

的头像 人工智能和机器人研究院 发表于 06-21 14:09 325次 阅读
人工智能提高会计工作效率, 推动会计职业架构转型

阿里巴巴成全球最害怕的创新破坏王

阿里巴巴和亚马逊(Amazon)一样,都是靠着对人工智能(AI)、机器学习与认知运算的投入和投资,获....

的头像 DIGITIMES 发表于 06-21 11:43 377次 阅读
阿里巴巴成全球最害怕的创新破坏王

未来课栈@成都栈:这是我们一起走过的第四栈!

发表于 06-16 22:40 82次 阅读
未来课栈@成都栈:这是我们一起走过的第四栈!

未来课栈@成都栈:不断降低开发门槛,用AI能力星云构建完整产业生态

发表于 06-15 20:36 145次 阅读
未来课栈@成都栈:不断降低开发门槛,用AI能力星云构建完整产业生态

请问编码后发给网络端,视频不清楚这是怎么回事?请问是压缩比大小的问题吗?

发表于 06-15 01:10 55次 阅读
请问编码后发给网络端,视频不清楚这是怎么回事?请问是压缩比大小的问题吗?

迎战世界杯,讯飞翻译机中俄离线翻译重磅上线!

发表于 06-14 08:59 131次 阅读
迎战世界杯,讯飞翻译机中俄离线翻译重磅上线!

我们的故事远到天南地北,这一次带你来成都

发表于 06-13 20:34 149次 阅读
我们的故事远到天南地北,这一次带你来成都

在成都,世界杯的打开方式不止是啤酒小龙虾

发表于 06-13 09:21 117次 阅读
在成都,世界杯的打开方式不止是啤酒小龙虾

选手SHOW|一支可以让所有书本“说话”的「神奇之笔」

发表于 06-12 11:43 172次 阅读
选手SHOW|一支可以让所有书本“说话”的「神奇之笔」