人工智能在视频应用中的实践探索,涉及编解码器、超分辨率等

LiveVideoStack 2018-01-18 13:56 次阅读

人工智能热度很高,但泡沫也很大。人工智能在视频领域的应用已经走入寻常人的生活,人脸识别,视频自动抠像技术已经比较成熟。除此之外,人工智能还能为视频应用带来哪些变化呢?描述了人工智能在视频应用中的实践探索,涉及编解码器、超分辨率等。

序:人工智能来生今世

人工智能是一个非常广泛的领域,当前人工智能涵盖很多大的学科,大致归纳为六个:

计算机视觉(暂且把模式识别,图像处理等问题归入其中);

自然语言理解与交流(暂且把语音识别、合成归入其中,包括对话);

认知与推理(包含各种物理和社会常识);

机器人学(机械、控制、设计、运动规划、任务规划等);

博弈与伦理(多代理人agents的交互、对抗与合作,机器人与社会融合等议题);

机器学习(各种统计的建模、分析工具和计算的方法)。

这里值得强调几点:

第一)目前的人工智能都是属于弱人工智能的范围,在某一个专业领域内作为被人类使用的工具存在。 目前还不存在离开人类主体自行运行的人工智能,更不存在可以开发人工智能自我迭代进化的强人工智能。

第二)机器学习在近几年取得了很大进展,有些人直接把机器学习当成了人工智能的代名词。这是不准确的。举例来说,不可否认机器学习在计算机视觉领域发挥着越来越大的作用,但是传统意义上,通过人工建模,分析取得的模式识别,图像识别,图像增强仍旧是很成功的人工智能技术,并且也是机器学习进一步发展的基础。

第三)统计分析方法在1990年代就出现并在一定领域内使用了。统计分析方法也多种多样的,根据实际需要产生过很多成功的案例,不一定采用目前标准的建模和分析方法。这里面举个典型的例子,在1997年Intel推出mmx技术之前,程序员中流传着一个非常著名的查表IDCT(反余弦变换),实际上就是对MPEG1编解码过程的IDCT变换,做了统计分析后发现的,超过之前所有快速算法的实战案例。具体细节请点击『阅读原文』下载IDCT 8x8.DOC。

第四)机器学习有这几个比较明显的缺陷,想要在实战中取得良好的效果,就必须做出合理的取舍和优化。这几个缺陷是:

严重依赖数据,训练方法和训练量非常关键。

计算量偏高。

虽然有时候取得了良好的效果,但是机器学习本身并不能理解这个过程,也不能给出合理的解释。

涉及自然科学常识和社会科学常识的问题,目前机器学习还不能在开放领域内取得良好的效果。

(一)人工智能对视频应用的渗透

传统视频应用的流程:

人工智能在视频应用中的实践探索,涉及编解码器、超分辨率等

前面我们说过,目前的人工智能还处于工具阶段,也就是说还没有人工智能开发出来的任何的超越时代的编码方法、传输协议、解码、交互技术存在。目前人工智能渗透包括预处理和后处理,超分辨率,机器视觉等等,人们在这些过程中使用人工智能工具来提升开发效率或者处理效果。而编解码技术,则属于人类专家技术团队才能解决的问题,目前的人工智能还很难介入。

人工智能在视频应用中的实践探索,涉及编解码器、超分辨率等

近年来网络直播应用的兴起,出现了跟以往广播电视编解码不太一样的需求。那就是:

编码端,保证编码实时性和码率的要求的同时,保证尽量高的图像质量。

发送,传输,缓冲,延时尽量小。

解码器尽量能输出最好的质量,最好能超分辨率。

这两年我一直在努力把人工智能(主要是机器学习)技术跟编解码做更深的融合,用来解决传统方法一直很难解决的这几个问题。

编码器遇到的问题:硬件编码器性能好,但是图像质量差,码率高。软件编码器效率较低,遇到复杂视频,比如物体繁多,较大运动,闪光,旋转,既不能满足实时编码的需求,同时输出码率也出现较大抖动。对于网络应用来说是很大的障碍。

解码器需要增强的点:大家都在构想能不能应用超分辨率技术,把较低分辨率的视频的播放质量提升一大块。目前有很多算法显示出巨大的潜力,比如谷歌的RAISR,处理图像时候效果很好。能不能实时用到视频上,或者硬件化,或者采用更快的能实时运行的算法。我们在后面会讨论一种折中方案,在牺牲一点质量的前提下,能够实时运行的超分辨率算法。

人工智能在视频应用中的实践探索,涉及编解码器、超分辨率等

(二)人工智能增强的编码器

(2.1)动态编码器

不同场景下编码保持恒定质量的码率:

编码时间和码率是正相关的,在码率暴涨的同时,编码时间也剧烈延长。对于低延时需求强烈的直播应用,会造成严重的卡顿。

一般就只好使用绝对不变码率ABR. 不同场景下ABR的图像质量:

人工智能在视频应用中的实践探索,涉及编解码器、超分辨率等

这样带来的结果就是图像质量不稳定。

我们希望是下图这样的曲线:

人工智能在视频应用中的实践探索,涉及编解码器、超分辨率等

这就需要编码器能够提前判定大码率场景出现的可能性。需要判定的几种情况:

物体繁多且有摄像机运动。

背景不动但是有大量物体的大范围运动,包括快速运动,旋转,仿射,蠕变等。

出现闪光,风沙,粒子系统。

这就需要开发一种适用于高清晰度直播应用的面向场景的智能编码技术。该技术通过监督学习将常见视频编码卡顿场景分类并快速识别,提前预判视频场景的编码复杂度和码率抖动,使用动态参数配置来编码,保证编码的实时性和限定码率下最好的图像质量。

(2.2)内容自动植入

人工智能在视频应用中的实践探索,涉及编解码器、超分辨率等

这里讨论广告的自动植入问题。一种是在编码前合成到视频里面,这个过程跟编码关系不大。但是直接合成到视频之后,所有的观众看到的内容就都一样。

要做到个性化,精准的广告投放,就只有在播放端解码后合成。要做到这点,服务器不仅要发送原始视频流,还要发送后期合成物体的定位方法和图像数据,以便客户端按照需求进行动态合成。

首先,自动植入的广告跟前贴片比起来优势很明显,可以植入的广告数量非常巨大,效果也更自然,用户也不会产生明显的反感。

其次,个性化精准投放,又进一步扩大了广告投放的总容量和效率。

(2.3)交互式视频

人工智能在视频应用中的实践探索,涉及编解码器、超分辨率等

目前基本做法是图像识别后,与搜索引擎连接,产生一个内容链接。

人工智能在视频应用中的实践探索,涉及编解码器、超分辨率等

(三)人工智能增强的解码器

(3.1)单个图像的超分辨率

自然图像基本上是平坦的纹理填充和显著的边缘(线条)组合形成的。

常规拉伸算法有双线性插值和双三次样条曲线差值。一般说来,三次曲线要比线性插值效果好。

然而在 15 年前,我在金山做 DVD 播放器的时候,正在研究去隔行技术。

人工智能在视频应用中的实践探索,涉及编解码器、超分辨率等

如上图所示,第一排和第三排是原图数据,第二排是需要插入的数据。普通的插值方法是在 B 方向上做一个三次插值。但是我这次计算了 A,B,C 三个方向的梯度,取方向梯度最小,像素梯度和最大的方向做简单的线性插值。

这时候我有一个惊奇的发现,简单的双线性插值的目视效果居然要好过三次曲线。这是为什么呢?

图像模糊的原因有以下几个:

低分辨率下线条会变得模糊。

低分辨率图像在拉伸到高分辨率时候会在线条上引入额外的模糊。

噪音的存在。

对于第2点我们具体说明:比如B样条,三次样条曲线有一个应用条件,那就是样本数据本身应该是光滑的,至少是分段光滑。但是在图像里面,物体的边界和背景的结合处,就不满足这个条件了。普通的三次样条曲线插值并没有考虑图像内部各个物体的不同,简单的把整个图像作为一个整体来计算。这样必然就在边界处引入了严重的模糊。

因此超分辨率主要从以上几个方面进行处理。噪音的处理技术已经比较成熟了。今天我们就不讨轮了。

第一个讨论点,如何降低线条的拉伸效应,也就是线条的锐度保持。

比如一个4x4的像素块,比较常见的是如下的形态:

人工智能在视频应用中的实践探索,涉及编解码器、超分辨率等

普通的三次b样条的滤波器参数矩阵为:

比如我们打算在4x4像素块中心插入一个点:

第一种情况,插入点在边界上。

人工智能在视频应用中的实践探索,涉及编解码器、超分辨率等

使用标准滤波器:

人工智能在视频应用中的实践探索,涉及编解码器、超分辨率等

使用改进滤波器:

人工智能在视频应用中的实践探索,涉及编解码器、超分辨率等

第二种情况,插入点在边界内:

人工智能在视频应用中的实践探索,涉及编解码器、超分辨率等

标准滤波:

人工智能在视频应用中的实践探索,涉及编解码器、超分辨率等

效果可以接受。

第三种情况,插入点在边界外:

人工智能在视频应用中的实践探索,涉及编解码器、超分辨率等

使用标准滤波器:

人工智能在视频应用中的实践探索,涉及编解码器、超分辨率等

使用改进滤波器:

人工智能在视频应用中的实践探索,涉及编解码器、超分辨率等

第三种情况实际上和第一种是一样的。所以我们只要考虑插入点在边界上的情况就可以了。

考虑到每个像素实际是8位的,一个4x4像素块的可能的组合基本就是128位整数。这是一个极其巨大的数字。然而实际上经常出现的可能远远少于理论上限,基本上考虑几千种组合就够用了。这种情况下需要使用统计方法,或者说是机器学习的办法来获得一个比较好的滤波器参数表。这是一个很稀疏的分布,需要设计比较好hash方法来构造和查找。

一般的机器学习过程都是类似的:准备一些原始 HR 图象(2x2)和从采样生成的 LR(1x1)图象,作为配对数据。然后采用了几个优化操作:

第一步,将复杂 4x4 梯度图象点阵处理成为简单的码本图象(HASH)。

第二步,针对这个码本图象,使用考虑临近像素梯度权重的方法重构B样条滤波器参数,每次都和原始的 2x2 倍图象进行 SAD (COST函数)计算,寻找最接近的拟合曲线参数(下山法)。

第三步,对上一步获得的大量参数计算概率分布,取最大概率的参数作为该码本的最优解。

第四步,对近似的码本进行合并处理,以减小码本的数量。

还有一个讨论点,就是低分图像对边界造成的模糊,有没有办法来去除。有人提出了一个梯度变换的方法:

人工智能在视频应用中的实践探索,涉及编解码器、超分辨率等

这种算法的思路就是计算出梯度的分布,然后适当把梯度收窄。不考虑实现速度的话,这个方法取得效果也是很惊人的。

人工智能在视频应用中的实践探索,涉及编解码器、超分辨率等

这个算法的运算量太大了。我们只能是想办法把这个过程融合到寻找滤波器参数矩阵的过程中来。

在实际处理过程中,我们就使用上面过程获得的进行超分辨率计算。那么我们可以估计这样算法的大致运算量:4x4矩阵配准,查找滤波器,然后每个点16次乘加法。整个过程预估相当于40次乘法运算。因此以现在的cpu性能,使用avx256/512或者hvx充分优化,完全有可能实现1080p到4k的超分辨率上达到实时30fps。

这样某些时候得到的图象目视效果甚至要超过原始输入图象。

人工智能在视频应用中的实践探索,涉及编解码器、超分辨率等

(3.2)视频的超分辨率

上面是单个图像的超分辨率。视频的超分辨率和单个图像是不同的。单个图像的超分辨率算法可以融合到视频超分辨率里面来。

视频的超分辨率基本思路是从连续的视频序列来重建高分辨率的图像,涉及到图像配准和子像素提取。研究方法和评价方法也存在很大差异。有些人用图像的超分辨率方法来套用的话就会出现一些疑惑:

首先视频编码是一个有损压缩过程,不同分辨率的序列压缩退化过程是不同的,因此找不到合适的HR/LR配对。视频质量的评估也是远比图像质量评估要复杂。因此目视质量是一个比较简易的评估标准。当然寻找一个HR/LR配对来计算PSNR也是可以的,但是说服力远不如图像配对的情况。

评估模型:

人工智能在视频应用中的实践探索,涉及编解码器、超分辨率等

比如这个过程,由于未经压缩的视频图像体积巨大,所以HR(0)不适合用来做原始分辨率参照。我们可以选取HR(1)和HSR来比较获取一个PSNR(0), 然后选取HR(1)和普通拉伸获得的HBR来比比较获取一个PSNR(1). 如果PSNR(0)比PSNR(1)要高的话,就说明超分辨取得了效果。

普通的视频序列物体配准和子像素提取是非常慢的。为了加快速度,我们把这个过程简化了一下,省去配准和空间预测的过程,参照解码生成分数运动向量,直接在解码过程中完成一部分像素块的子像素提取工作。

为了进一步提高处理速度,这里面的还采用了一些优化措施:

实验发现,在一个视频播放序列中,如果每间隔2帧清晰度稍差的图像,加入一帧相对高质量图像,和逐帧高质量图像对比起来,人眼的感觉不会造成太多差异。

因此在视频SR过程中,可以每隔两帧用普通 b 样条+降噪生成的基础图象HBR+,做一次HSR处理:

[HSR] ,[HBR+] ,[HBR+], [HSR], [HBR+], [HBR+], [HSR], [HBR+], [HBR+]

这个视频上面的快速超分辨率过程SR详细过程可以描述为:

人工智能在视频应用中的实践探索,涉及编解码器、超分辨率等

预估整个超分辨率过程输出的HSR视频图像质量提升1个dB左右。

原文标题:人工智能在视频应用领域的探索

文章出处:【微信号:livevideostack,微信公众号:LiveVideoStack】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
分享:

评论

相关推荐

2019中国各地智能制造政策汇总

智能制造行业作为中国制造业的主要驱动力之一,利好政策的不断出台,行业将持续稳定增长,中国制造业中所起....
的头像 联动原素 发表于 01-16 16:02 26次 阅读
2019中国各地智能制造政策汇总

2018年影响中国互联网行业发展的十件大事

据了解,“中国互联网行业自律贡献奖”由中国互联网协会举办,每两年评选一次,旨在表彰互联网企业在开展行....
的头像 智能制造 发表于 01-16 14:54 103次 阅读
2018年影响中国互联网行业发展的十件大事

全球工联网应用现状究竟怎么样?哪些企业现在需要工业互联网?

目前应用最广泛的是对生产过程进行控制和优化(37%)。应用集中在提高生产自动化、减少人工作业、自动物....
的头像 智能制造 发表于 01-16 14:51 63次 阅读
全球工联网应用现状究竟怎么样?哪些企业现在需要工业互联网?

探究人工智能的读心术

对于许多无法发出声音的人来说,他们想说的话会通过某种信号隐藏在大脑中。人类无法直接破译这些信号。但是....
的头像 中国人工智能学会 发表于 01-16 14:32 76次 阅读
探究人工智能的读心术

改进粒子群优化神经网络的葡萄酒质量识别

随着我国经济的崛起,葡萄酒业也搭上了我国经济崛起的快速列车。葡萄酒产业规模不断壮大,但葡萄酒质量评定....
发表于 01-16 14:25 5次 阅读
改进粒子群优化神经网络的葡萄酒质量识别

盘点2018存储器行业的发展状况

存储器一直被看成是半导体行业的晴雨表,它的表现也影响着整个市场的枯荣变换。2018年的存储器行业在兴....
的头像 物联网技术 发表于 01-16 14:20 42次 阅读
盘点2018存储器行业的发展状况

亿航率先在无人机飞行上全程采用人工智能与航空调度中心融合的方式

根据国家邮政局数据显示,2018年1-8月,全市快递量在中国主要城市中排名第一,快递业务量累计完成超....
的头像 无人机网 发表于 01-16 14:13 36次 阅读
亿航率先在无人机飞行上全程采用人工智能与航空调度中心融合的方式

缺了情感的对联水平难达优秀 AI对对联还需进一步改善

对联,中国传统文化之一。春节临近,家家户户都要贴春联,不过这对联如果是人工智能对的,你能分辨出来吗?....
发表于 01-16 13:59 23次 阅读
缺了情感的对联水平难达优秀 AI对对联还需进一步改善

出于对可靠性证明缺失的担忧甚至恐惧 人类或将放弃人工智能技术

众所周知,神经网络是出了名的难理解——计算机虽然能够提出一项解决方案,但却无法就产生的结论做出解释。....
发表于 01-16 13:53 19次 阅读
出于对可靠性证明缺失的担忧甚至恐惧 人类或将放弃人工智能技术

近十年人工智能21个子领域高引学者

在推荐系统领域(Recommender System),高引学者排名前三的学者依次是:纽约大学教授A....
的头像 电子发烧友网工程师 发表于 01-16 11:34 171次 阅读
近十年人工智能21个子领域高引学者

全球芯片排名再次确认:中国有5家企业的芯片入围

而高通更多的是用在手机端上,大家都以为pc已经没有市场了,实际上还是有很强的生命力的。而在人工智能芯....
的头像 电子发烧友网工程师 发表于 01-16 11:25 178次 阅读
全球芯片排名再次确认:中国有5家企业的芯片入围

AI技术除了赋能广告 还在视频领域适用于以下这些需求

根据行业报告显示,2017上半年中国在线视频行业用户规模已经接近6亿,而2017年在线视频市场规模已....
发表于 01-16 11:23 14次 阅读
AI技术除了赋能广告 还在视频领域适用于以下这些需求

人工智能深度学习算法在工业机械臂上的应用

从功能上来说,你这个应用非常适合采用深度学习,事实上,深度学习本质上就是用来做分类识别的,尤其是针对....
的头像 IOT万物互联 发表于 01-16 10:55 223次 阅读
人工智能深度学习算法在工业机械臂上的应用

清华学霸用AI写歌挑战周杰伦《止战之殇》

在开启AI项目前,宿涵的未来规划一度在技术和音乐之间两难,“很多人是热爱音乐的,他们也很想用音乐表达....
的头像 电子发烧友网工程师 发表于 01-16 10:52 109次 阅读
清华学霸用AI写歌挑战周杰伦《止战之殇》

区块链技术与产业融合推动产业互联网发展模式

区块链电子处方”项目是利用区块链技术去中心化、不可篡改、可溯源的特点打造电子处方共享平台建设方案,为....
发表于 01-16 10:48 16次 阅读
区块链技术与产业融合推动产业互联网发展模式

全球范围内尚无公认评测指标 建立人工智能芯片评测标准非常重要

近日,清华大学发布的《2018人工智能芯片研究报告》(以下简称《报告》)指出,人工智能芯片是人工智能....
发表于 01-16 09:48 13次 阅读
全球范围内尚无公认评测指标 建立人工智能芯片评测标准非常重要

AI时代 华为再次领先迎接挑战

在丢包率为0.1%的传统以太网中,我们生活安然,并无不适。而现在,人工智能(AI)带来的数据量激增改....
发表于 01-16 09:38 16次 阅读
AI时代 华为再次领先迎接挑战

AI赋能智能安防 并不意味着替代安防

不可否认,2018年的安防行业将‘AI+安防”的主旋律发挥到极致,但遗憾的是,在这场AI狂欢盛宴中,....
发表于 01-16 09:33 23次 阅读
AI赋能智能安防 并不意味着替代安防

2019年AI应用彻底爆发,这是程序员给时代的魔法

人工智能的火爆,最直接的体现,就是人才的薪酬水平,最近,财经网一则题为《AI 人才抢夺生猛:应届博士....
的头像 电子发烧友网工程师 发表于 01-16 09:11 111次 阅读
2019年AI应用彻底爆发,这是程序员给时代的魔法

中国、欧洲和美国的人工智能研究现状浅析

人工智能研究的全球竞争中,谁拔得头筹?1月11日,爱思唯尔集团在中国首次解读其最新发布的人工智能研究....
发表于 01-16 09:08 19次 阅读
中国、欧洲和美国的人工智能研究现状浅析

人工智能时代硬件和软件如何共生演化和彼此影响

工信部于2018年12月正式印发了《促进新一代人工智能产业发展三年行动计划》,为2018年到2020....
的头像 电子发烧友网工程师 发表于 01-16 09:08 122次 阅读
人工智能时代硬件和软件如何共生演化和彼此影响

马桶MT到底是什么?“马桶MT”刚面世就已凉凉?

的社交产品应该能让朋友圈重新建立连接,我们不再需要一款像微信一样的长连接的聊天沟通产品。建立基于场景....
的头像 电子发烧友网工程师 发表于 01-16 09:07 427次 阅读
马桶MT到底是什么?“马桶MT”刚面世就已凉凉?

人工智能并不能解决制造业的所有问题

人工智能是当下的产业热词,也是我国制造业转型升级的有效手段和重要路径。但事事皆有两面性,人工智能虽好....
发表于 01-16 09:05 19次 阅读
人工智能并不能解决制造业的所有问题

AI已成为世界各国竞争的关键领域之一 中国人工智能发展虽晚却迅猛

人工智能作为引领未来的战略性技术,世界各国都高度重视,纷纷制定人工智能发展战略,力争抢占该领域的制高....
发表于 01-16 08:56 15次 阅读
AI已成为世界各国竞争的关键领域之一 中国人工智能发展虽晚却迅猛

TensorFlow 2.0马上要来了,还不速来了解下新架构?

TensorFlow始终为生产提供了直接部署方式。无论是部署在服务器、边缘设备还是Web上,Tens....
的头像 新智元 发表于 01-16 08:45 75次 阅读
TensorFlow 2.0马上要来了,还不速来了解下新架构?

探讨制造业智能化的发展史

中国这几年信息化的发展已经出现很多概念和热点,从云计算到物联网,智慧城市到大数据,到现在的人工智能这....
的头像 电子发烧友网工程师 发表于 01-16 08:44 104次 阅读
探讨制造业智能化的发展史

人工智能助力智能家居 但以下三大问题成智能家居的拦路虎

纵观过去一年的智能家居行业,人工智能和物联网这两个概念对大众来说并不陌生了,各大厂商纷纷在家居行业落....
发表于 01-16 08:32 37次 阅读
人工智能助力智能家居 但以下三大问题成智能家居的拦路虎

中国各地智能制造政策汇总

智能制造行业作为中国制造业的主要驱动力之一,利好政策的不断出台,行业将持续稳定增长,中国制造业中所起....
的头像 工业4俱乐部 发表于 01-15 16:47 422次 阅读
中国各地智能制造政策汇总

周涛:四个方面来谈大数据和人工智能可能带来的挑战

2018年初,有一篇文章讲述了一个很有趣的故事,有人设计了一套推荐系统,这个系统专门给求职的人推荐一....
的头像 电子发烧友网工程师 发表于 01-15 16:25 281次 阅读
周涛:四个方面来谈大数据和人工智能可能带来的挑战

数据科学能力是否能够靠培训课程培养?

探索数据,尝试不同的特征工程和构建模型的方法是一项持久战。花费大量时间在这上面也可能会让你在Kagg....
的头像 电子发烧友网工程师 发表于 01-15 16:23 224次 阅读
数据科学能力是否能够靠培训课程培养?

我国人工智能是新一轮产业变革的核心驱动力 核心技术领域仍待突破

人工智能是新一轮产业变革的核心驱动力,被多个国家列为战略性发展目标。我国人工智能产业发展迅速,截止到....
发表于 01-15 16:10 28次 阅读
我国人工智能是新一轮产业变革的核心驱动力 核心技术领域仍待突破

探究人工智能在安防领域的应用前景

2018年,AI在智能家居中的应用并不是初始年,而是深化年。AI已经是安防领域与楼宇对讲的主流趋势,....
的头像 司南物联 发表于 01-15 16:10 242次 阅读
探究人工智能在安防领域的应用前景

探索了神经科学技术的相关应用,以确定人工神经网络中信息是如何结构化的

在 Mayes Meisen 和他同事的研究中,研究人员希望以破坏神经网络的特定区域的方法,观察该区....
的头像 电子发烧友网工程师 发表于 01-15 16:06 164次 阅读
探索了神经科学技术的相关应用,以确定人工神经网络中信息是如何结构化的

无人配送产品今年的目标:适应不同场景,处理异常流程

回到上述一个关键问题,就是场景,现在美团外卖日订单量高达 2400 万单,“可能占到全世界外卖市场的....
的头像 电子发烧友网工程师 发表于 01-15 16:02 282次 阅读
无人配送产品今年的目标:适应不同场景,处理异常流程

Cornami构建了一个革命性的脉动阵列架构

Cornami构建了一个可以根据需要构建任何尺寸,任何形状的收缩阵列的架构。
的头像 ssdfans 发表于 01-15 16:01 156次 阅读
Cornami构建了一个革命性的脉动阵列架构

机器学习算法基本概念及选用指南

本文对机器学习的一些基本概念给出了简要的介绍,并对不同任务中使用不同类型的机器学习算法给出一点建议。
的头像 Imagination Tech 发表于 01-15 15:55 114次 阅读
机器学习算法基本概念及选用指南

DARPA的最新项目就旨在创建一个机器学习系统

尽管这些很容易在我们的脑海中想象出来,但要以计算机系统能够理解的方式对它们进行正式定义却异常困难。通....
的头像 电子发烧友网工程师 发表于 01-15 15:39 191次 阅读
DARPA的最新项目就旨在创建一个机器学习系统

华为发布业界首款面向AI时代的数据中心交换机 助力人工智能的发展

随着人工智能(AI)技术的快速进步,越来越多的行业都在尝试向自身的业务和系统中引入AI。在刚刚过去的....
发表于 01-15 15:32 67次 阅读
华为发布业界首款面向AI时代的数据中心交换机 助力人工智能的发展

浅谈AI视觉技术的发展与创新

随着现代科学技术的发展以及人民生活水平的提高,智能设备的普及率已经越来越高,住宅家居智能化将是一个重....
的头像 中山市物联网协会 发表于 01-15 15:29 273次 阅读
浅谈AI视觉技术的发展与创新

生物识别技术迎来了发展机遇期 但安全问题也不容忽视

近年来,得益于人工智能热潮的快速推进,生物识别技术迎来了发展机遇期,其应用安全问题也越发受到关注。不....
发表于 01-15 15:19 38次 阅读
生物识别技术迎来了发展机遇期 但安全问题也不容忽视

利用人工智能提高企业效率有以下这些办法

现在人工智能的发展越来越快,各风投纷纷进行人工智能领域,如果企业能够利用互联网+人工智能+行业,必定....
发表于 01-15 15:10 255次 阅读
利用人工智能提高企业效率有以下这些办法

从制造到“智能制造”政策视野中的制造业升级

现实中智能制造的发展与政策呼应。随着制造业与信息化的融合,制造业逐渐数字化,越来越多的数据得以汇聚在....
的头像 电子发烧友网工程师 发表于 01-15 14:59 286次 阅读
从制造到“智能制造”政策视野中的制造业升级

万物互联的时代 车联网有望成为未来汽车行业增长的新动力

近几年来,随着人们的生活水平不断提升,汽车已基本成为了每个家庭的标配。不过,随着汽车行业增长放缓,购....
发表于 01-15 14:53 51次 阅读
万物互联的时代 车联网有望成为未来汽车行业增长的新动力

计算机普及要从娃娃抓起,我国编程教育的现状

就在2017年,国务院印发《新一代人工智能发展规划》,明确指出人工智能成为国际竞争的新焦点,应逐步开....
的头像 电子发烧友网工程师 发表于 01-15 14:22 212次 阅读
计算机普及要从娃娃抓起,我国编程教育的现状

美团携配送无人机首次亮相CES

美团作为参展企业,在现场打造了一个“智慧城市”,通过实景搭建的城市、无人配送大屏、智慧餐厅等多个互动....
的头像 无人机网 发表于 01-15 14:02 145次 阅读
美团携配送无人机首次亮相CES

李飞飞等人提出Auto-DeepLab:自动搜索图像语义分割架构

简单地移植图像分类的方法不足以进行语义分割。在图像分类中,NAS 通常使用从低分辨率图像到高分辨率图....
的头像 电子发烧友网工程师 发表于 01-15 13:51 234次 阅读
李飞飞等人提出Auto-DeepLab:自动搜索图像语义分割架构

科技巨头大举布局 不断向医疗保健市场进军

1月7日-10日,被视为是行业发展风向标之一的摩根大通医疗健康全球峰会在美国旧金山举行,大型并购整合....
发表于 01-15 13:50 68次 阅读
科技巨头大举布局 不断向医疗保健市场进军

2019北京消费电子展:智能语音成消费电子发展新引擎

随着互联网概念的遍及,人工智能的快速发展,中国在智能语音技术的专利数量持续增长,通过庞大的用户群基础以及互联网系统优势明...
发表于 01-11 17:13 100次 阅读
2019北京消费电子展:智能语音成消费电子发展新引擎

在指甲上贴一个可穿戴传感器,你的健康状况“尽收眼底”

一个小型指甲可穿戴传感器可以监测疾病和病症,这在近期的IBM故事中得到了解释。该团队设计了这些小型传感器,可以帮助临床医...
发表于 01-06 20:46 102次 阅读
在指甲上贴一个可穿戴传感器,你的健康状况“尽收眼底”

2019亚洲消费电子展(CEE Asia)

2019北京国际消费电子博览会 2019北京国际消费电子博览会 2019北京国际消费电子博览会 Beijing International Consumer E...
发表于 01-05 16:41 130次 阅读
2019亚洲消费电子展(CEE Asia)

官方推荐2019第二十二届中国人工智能产业博览会

人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用...
发表于 01-05 14:42 126次 阅读
官方推荐2019第二十二届中国人工智能产业博览会

在指甲上贴一个可穿戴传感器,你的健康状况“尽收眼底”

可穿戴传感器可以监测疾病和病症,这在近期的IBM故事中得到了解释。该团队设计了这些小型传感器,可以帮助临床医生通过人工智...
发表于 01-03 21:31 101次 阅读
在指甲上贴一个可穿戴传感器,你的健康状况“尽收眼底”

高效的PC端车牌识别在人工智能机器人领域的应用

车牌识别SDK、车牌OCR、车牌识别软件、车牌识别系统、车牌识别技术、汽车号牌识别、号牌识别软件、车牌识别方案 DSP车牌...
发表于 01-02 16:59 175次 阅读
高效的PC端车牌识别在人工智能机器人领域的应用

数据如何改变现代农业

数字技术正在向农业领域蔓延,帮助确保日益增长的食物需求。 机械化是我们目前看到的大规模农作物生产的关键,但它远非完美。需...
发表于 01-02 09:27 174次 阅读
数据如何改变现代农业

AI人工智能与机器智能:未来事实还是幻想?

一群杰出的科学家 - 斯蒂芬霍金,斯图尔特罗素(伯克利)和马克斯泰格马克(麻省理工学院) - 可能受到电影超越的刺激甚至可能是...
发表于 12-31 16:42 250次 阅读
AI人工智能与机器智能:未来事实还是幻想?

机器学习实验中图像增强的库imgaug详解

Py之imgaug:Python库之imgaug简介、安装、使用方法之详细攻略...
发表于 12-28 14:30 172次 阅读
机器学习实验中图像增强的库imgaug详解

AIRU解决人工智能零售无人售货店/机新方案

前言:在十九大报告中,习总书记不仅提出了四个重要概念,还提到了人工智能,指出人工智能将和实体经济深度融合。报告中提到:“...
发表于 12-28 08:46 192次 阅读
AIRU解决人工智能零售无人售货店/机新方案

TVP5150AM1-EP 增强型产品超低功耗 NTSC/PAL/SECAM 视频解码器

TVP5150AM1器件是超低功耗NTSC /PAL /SECAM视频解码器。 TVP5150AM1解码器采用节省空间的32端TQFP封装,可将NTSC,PAL和SECAM视频信号转换为8位ITU-R BT.656格式。也可以使用离散同步。 TVP5150AM1解码器的优化架构可实现超低功耗。该解码器在典型操作中功耗为115 mW,在省电模式下功耗不到1 mW,大大延长了便携式应用的电池寿命。解码器仅使用一个晶体来支持所有标准。可以使用I 2 C串行接口对TVP5150AM1解码器进行编程。解码器的模拟和数字电源采用1.8 V电源,I /O采用3.3 V电源。 TVP5150AM1解码器将基带模拟视频转换为数字YCbCr 4:2:2分量视频。支持复合和S-video输入。 TVP5150AM1解码器包括一个带2倍采样的9位模数转换器(ADC)。采样是ITU-R BT.601(27.0 MHz,由14.31818-MHz晶振或振荡器输入产生)并且是线路锁定的。输出格式可以是8位4:2:2或带有嵌入式同步的8位ITU-R BT.656。 TVP5150AM1解码器利用德州仪器专利技术锁定弱电,噪声或信号不稳定。生成同步锁相/实时控制(RTC)输出,用于同步下游视频编码器。 可以为亮度和色度数据路径...
发表于 11-02 19:30 22次 阅读
TVP5150AM1-EP 增强型产品超低功耗 NTSC/PAL/SECAM 视频解码器

THS8200-EP 增强型产品三路 10 位全格式视频 DAC

THS8200是一款完整的视频后端D /A解决方案,适用于DVD播放器,个人视频录像机和机顶盒,或任何需要转换的系统数字分量视频信号进入模拟域。 THS8200可接受4:4:4和4:2:2格式的各种数字输入格式,3×10位,2 ×10位或1×10位接口。该设备通过专用的Hsync /Vsync输入或通过从视频流内的嵌入式同步(SAV /EAV)代码中提取同步信息来同步输入的视频数据。或者,当配置为生成PC图形输出时,THS8200还提供主时序模式,在该模式下,它从外部(存储器)源请求视频数据。 THS8200包含一个完全可编程的显示时序发生器标准和非标准视频格式,最大支持像素时钟为205 MSPS。因此,该设备支持所有分量视频和PC图形(VESA)格式。包含完全可编程的3×3矩阵运算,用于色彩空间转换。所有视频格式,高达HDTV 1080I和720P格式,也可以在内部进行2倍过采样。过采样放宽了对DAC背后尖锐外部模拟重建滤波器的需求,并改善了视频特性。 输出兼容范围可通过外部调节电阻设置,可选择两种设置,以便无需硬件更改即可适应分量视频/PC图形(700 mV)和复合视频(1.3 V)输出。视频数据上的内部可编程限幅/移位/乘法功能可确保符合标准的...
发表于 11-02 18:49 16次 阅读
THS8200-EP 增强型产品三路 10 位全格式视频 DAC