0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

为何我们不把机器学习更广泛地应用在文件压缩方面呢?

MqC7_CAAI_1981 来源:未知 作者:李倩 2018-11-09 15:45 次阅读

移动互联网时代,人类生产的新数据正以指数级别增长,数据中心越来越大,并消耗着地球上难以想象的巨大能耗,但人类依然可能面临着“数据无处存放”的境地。

因此,让文件变小一点,这绝对是个值得投资的点子。

神剧《硅谷》剧组就选中了这个点子。在剧中,几个主角的得以创业成功的核心算法——“魔笛”即是选中了“压缩”这一多数人都能理解但对技术要求颇高的领域:允许用户在线将图片压缩至一半的大小,并依然保持其清晰度。

“魔笛算法”也一度引发了不少跟风打造属于自己的“魔笛手”,此外,包括谷歌等人工智能巨头公司近年来也在这个领域频频发力。

2016年,谷歌相关团队推出了一款叫RAISR(Rapid and Accurate Image Super-ResoluTIon)的图像压缩技术。希望以人工智能技术作为压缩路径,将图片大小压缩到源文件的1/4, 但基本不会改变图片的清晰度。

尽管引来如此高的关注,但很多人还是不认可它会在未来的发展中取得压倒性的优势。谷歌的RAISR算法也被不好业内认识吐槽说“压缩一张图片耗时久”、“压缩后图片清晰度没有那么高”等等。

谷歌机器学习工程师、Jetpac创始人Pete Warden近期发布了一篇文章,认为在短期内压缩算法可能会成为机器学习应用最可能出现的杀手级应用的领域,他从“压缩”这一技术的起源开始,希望告诉大家问什么压缩技术的前景是如此的广阔。

大数据文摘对这篇文章进行了编译。

OSDI上的一篇文章“神经自适应型内容感知互联网视频传输”激发了我对这一领域的兴趣。

这篇文章告诉我们:通过神经网络,在带宽相同的条件下,用户体验将能提高43%,或者在带宽缩减17%的条件下可以保持体验的质量基本不变。还有其他同类的论文将类似方法运用在了生成压缩或自适应图像压缩等方面。他们都展示出了惊人的成果。那么,为何我们不把机器学习更广泛地应用在文件压缩方面呢?

我们尚未拥有性能配套的计算设备

上文所提到的所有方法都需要相对较大的神经网络,并且所需的计算量与像素数量成正比。这意味着大型图片文件或每秒帧数较高的视频文件可能需要比当前广泛使用的移动设备更强的计算能力。

现行的大多数CPU每秒仅能处理百亿级的运算,而在高清视频上用机器学习进行压缩很轻易便能达到十倍于此的计算量。

当然,好消息是目前我们已经有了一些硬件解决方案,比如Edge TPU等,可以让我们看到未来达到更多计算量的可能性。我期待这种压缩方法能够运用到各种类型文件的压缩转换上,从视频到图像,到音频,乃至更多充满想象力的方式。

自然语言是终极压缩目标

近来机器学习在自然语言处理中取得了大量有趣的成果。这是另一个让我觉得机器学习是较为优越的压缩转换途径的原因。

如果你稍稍观察,便会发现字幕其实是将声音压缩为图像的一种形式。我一直想做一个项目,试图创造出一种相机,每秒生成一帧字幕,并将所有字幕逐一按行输出至一个日志文件中。由此便可简单记录下基于相机的拍摄内容随时间的推移而发生的故事,这可以被定义为一个叙事类的传感器

我将这一技术归类到压缩方法中的原因是你可以通过生成性的神经网络将字幕还原为图像。尽管重新生成的图像不会跟原图像完全一致,但也能够从原图像继承一些信息。如果你希望结果与原图像尽可能接近,你也可以从风格化方面考虑,例如为每个场景生成简图。这些技术的共同特征在于他们提取出了输入文件中对于我们人类重要的部分,并省略了余下的部分。

不仅仅是图像

语言世界也有类似的趋势。语音识别正在迅速改进,合成语音的能力也在迅速提高。识别可以看作是将音频压缩为自然语言文本的过程,而合成则恰好相反。你可以想象将对话高度压缩为自然语言文字而非音频。诚然,我们不需要达到那种要求,但似乎通过扩展我们对于表达的认知类型,我们可以实现在低带宽情况下的更好的结果。

我甚至还发现一些有趣的将机器学习应用在文本本身上的可能性。Andrej Karpathy的CHAR-RNN(递归神经网络)展示了神经网络对某些模板进行模仿的优越性,而对于压缩技术来说,预测也是相同的道理。考虑到普通的HTML页面有不少冗余,这一情况下GZIP压缩方法似乎有很大机率能被机器学习改进,尽管我认为这没有机器学习对文本的处理那么容易。

对于压缩的研究已立项拨款

在我创业期间,营销失败的经历让我学到了一件事:如果已经有一笔预算要购买你所推销的产品,该产品的销售会容易得多。预算的存在意味着公司在是否应该花钱购买解决方案上已经赢得了艰难的斗争,现在唯一的问题是购买哪种解决方案。

这也是我认为机器学习可以在这个领域取得巨大突破的原因之一,因为制造商已经拥有专门用于视频和音频压缩的工程师、资金和芯片。如果我们能够证明将机器学习添加到现有解决方案中能够以一些可度量的方式(例如质量、速度或功耗)改进它们,那么它们将被快速采用。

带宽将会花费用户和运营商的大量的成本,质量和电池寿命将会成为产品的卖点,因此采用机器学习改进压缩的优势将比其他运用更为显而易见。

许多激动人心的研究表明这种方式将会非常高效,而且我乐观地认为还有许多应用尚未被发掘。我希望机器学习在压缩中的应用将发展成为一门核心技术。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    5852

    浏览量

    103246
  • 神经网络
    +关注

    关注

    42

    文章

    4572

    浏览量

    98714
  • 机器学习
    +关注

    关注

    66

    文章

    8116

    浏览量

    130546

原文标题:被《硅谷》选中的“压缩算法”,为什么说下一个机器学习杀手应用将由此诞生

文章出处:【微信号:CAAI-1981,微信公众号:中国人工智能学会】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    请问ADA4302-4适合应用在差分的CVBS信号的分拆吗?

    请问ADA4302-4适合应用在差分的CVBS信号的分拆么?如果适合,除了手册之外还有其他文档供使用么?或者使用过程中需要注意哪些内容
    发表于 12-18 06:44

    热重差热分析仪应用在哪些方面

    热重差热分析仪是在升温、恒温或降温过程中,观察样品的质量随温度或时间变化,主要用于研究材料的热稳定性和组份。热重差热分析仪被广泛应用在塑料、涂料、药品、金属材料和无机材料等。热重差热分析仪应用在哪些方面
    的头像 发表于 12-12 14:23 296次阅读
    热重差热分析仪<b class='flag-5'>应用在哪些方面</b>

    机器学习技术在智能制造应用实例

    智能制造应用在工业领域中,可实现自动化作业,在企业生产与产线管理和设备控制方面有良好的效果。智能制造以机器学习技术作为支撑。
    发表于 10-27 09:29 394次阅读
    <b class='flag-5'>机器</b><b class='flag-5'>学习</b>技术在智能制造应用实例

    倾倒开关应用在电风扇上有哪些优势

    随着科技的不断发展,电风扇在我们的生活中扮演了越来越重要的角色。无论是炎炎夏日还是热带雨林,电风扇都能为我们带来清凉舒适的感觉。近年来,倾倒开关的应用在电风扇的设计中越来越常见,那么,倾倒开关
    的头像 发表于 10-18 14:59 308次阅读
    倾倒开关<b class='flag-5'>应用在</b>电风扇上有哪些优势

    sharp lz9gh236一般应用在哪个方面上?

    求助sharp lz9gh236一般应用在哪个方面
    发表于 10-17 07:11

    java中的压缩文件是如何解压与压缩

    (String name):表示压缩文件中的一个文件或者目录 void putNextEntry(ZipEntry e):写入新的压缩文件或者目录 ZipIutputStream:是一种
    的头像 发表于 10-10 15:49 407次阅读

    为什么高斯滤波广泛应用在图像处理中?

    为什么高斯滤波广泛应用在图像处理中
    发表于 10-09 06:31

    TouchGFX图形应用在亮屏时的低功耗实现

    电子发烧友网站提供《TouchGFX图形应用在亮屏时的低功耗实现.pdf》资料免费下载
    发表于 09-20 11:26 1次下载
    TouchGFX图形<b class='flag-5'>应用在</b>亮屏时的低功耗实现

    labview可以应用在哪些地方?

    labview可以应用在哪些地方? LabVIEW是一款非常广泛应用的工程软件,可以应用在各个领域中。它的主要特点是基于图形化编程,易于使用且功能强大,因此得到了众多的用户和应用。以下
    的头像 发表于 08-31 17:23 3645次阅读

    机器学习技术是什么?机器学习技术在新型电力系统安全稳定中的应用

    一些能够推断未知数据的规则和模型。机器学习技术目前已经广泛应用于许多领域,如图像和语音识别、自然语言处理、金融风险管理等等。 在电力系统安全稳定方面
    的头像 发表于 08-17 16:30 791次阅读

    机器学习theta是什么?机器学习tpe是什么?

    机器学习theta是什么?机器学习tpe是什么? 机器学习是近年来蓬勃发展的一个领域,其相关技术
    的头像 发表于 08-17 16:30 1218次阅读

    Linux中常用的压缩和解压缩命令介绍

    在Linux中,压缩和解压缩文件是常见的操作。有时候,我们需要将大文件压缩成较小的文件,以便于传
    发表于 07-31 11:50 1797次阅读

    安全光幕和安全光栅的区别是什么呢?主要应用在什么行业?

    安全光幕和安全光栅的区别是什么呢?主要应用在什么行业?
    的头像 发表于 06-29 09:55 565次阅读
    安全光幕和安全光栅的区别是什么呢?主要<b class='flag-5'>应用在</b>什么行业?

    如何在Linux上使用Pigz来更快地压缩文件

    Pigz是一款快速压缩文件的工具,它能够使用多个CPU核心进行压缩,使得压缩速度得到了极大的提升。在本文中,我们将介绍如何在Linux上使用Pigz来更快地
    的头像 发表于 05-12 16:42 1891次阅读
    如何在Linux上使用Pigz来更快地<b class='flag-5'>压缩文件</b>

    变频器主要应用在哪些方面

    变频器主要应用在哪些方面 变频器(Variable-frequency Drive,VFD)是应用变频技术与微电子技术,通过改变电机工作电源频率方式来控制交流电动机的电力控制设备。 变频器主要由整流
    发表于 05-12 11:35 1433次阅读