0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

机器学习的下一个杀手级应用是什么

jmiy_worldofai 来源:未知 作者:胡薇 2018-11-17 09:34 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

机器学习的研究正进行的如火如荼,各种新方法层出不穷。尽管这样,还有一个问题摆在面前,研究这些算法对于现实有什么用。特别是当讨论起机器学习在手机和其他设备上的应用时,经常会被问到到:「机器学习有什么杀手级应用?」

机器学习工程师 Pete Warden 思考了很多种答案,包括从语音交互到全新的使用传感器数据的方法等,但他认为实际上短期内最激动人性的一个方向是压缩算法。尽管压缩算法在研究领域基本上是人尽皆知的一个方向,还是有很多人还是会对这个看法感到惊讶。在本篇博文中,Pete Warden 分享了他的关于为什么压缩算法如此有前景的看法。雷锋网(公众号:雷锋网)AI 科技评论编译如下。

当我读到一篇名为「神经自适应内容感知的互联网视频分发」(Neural Adaptive Content-aware Internet Video Delivery)的论文的时候,我意识到了这个领域的重要性。这篇文章在总结里说到,通过神经网络,在保证带宽相同的情况下,该方法能够将质量体验指标提高 43%。或者在在保证相同的观看质量下,减少 17% 的带宽使用。实际上还有很多类似研究方向的论文,比如生成式压缩(https://arxiv.org/pdf/1703.01467.pdf)和自适应图像压缩(https://arxiv.org/pdf/1705.05823.pdf ) ,但为什么没有听说到更多的关于压缩算法的机器学习实际应用呢?

目前还没有足够的计算能力

所有这些基于机器学习的压缩方法都需要相对较大的神经网络,并且所需的计算量与像素数量成正比。这意味着高分辨率图像或者高帧率视频需要更多的计算能力,可能远远超过当前移动电话或类似设备能够提供计算量。目前大多数CPU能够处理每秒几百亿次的算术运算,而在高清视频上运行机器学习压缩算法很容易就需要十倍以上的计算量。

好消息是现在有了一些新的硬件解决方案,比如 Edge TPU 等,在未来可能能够提供更多可用的计算资源。我希望我们能够将这些资源应用于各种压缩问题,从视频和图像以及到音频

自然语言是最终极的压缩

我认为机器学习非常适合于压缩算法的另一个原因是,我们最近在自然语言处理中得到了很多有趣的结果。如果你仔细琢磨图片的话,其实是可以将图像描述看作是图片的一种终极压缩方法。我一直以来都希望创建一个项目,一个能够以每秒一帧的速度给照相机拍下的图片配上描述文字,之后将这些描述文字写入到日志文件中。通过这个就能够得到一个非常简单的故事,讲述着相机随着时间的推移看到了什么。我认为这就可以看作一个能够叙事的传感器。

我将这种东西叫做压缩的原因是,我们其实可以使用一个生成神经网络来根据字幕生成图片。这个生成出的图片并不一定要与输入图片完全一样,只要它们具有同样的意思就可以了,这就可以看作是一个解压缩算法。如果想要输出的结果与输入尽可能相似的压缩算法,可以参考图像风格化的算法,将图片压缩为每个场景的轮廓线。这些算法与传统压缩算法的共同之处在于,它们找到了输入中对于我们人类最重要的信息,而忽略了其他的细枝末节。

不仅仅是图像

语言世界也有类似的趋势。语音识别技术正在迅速改进,合成语音的能力也在迅速提高。识别过程可以看作是将音频压缩为自然语言文本的过程,而合成则正好反过来。而人之间的对话可以通过将音频翻译为文字表示而的到极大的压缩。我现在还很难想象是否需要走那么远,但是似乎有可能通过我们对与语言特征的新理解来实现更好的压缩质量以及更低的带宽。

我甚至看到了将机器学习压缩算法应用到文本本身的可能。Andrej Karpathy 的 Char-RNN(https://github.com/karpathy/char-rnn)展示了神经网络可以很好的模拟给定样本的风格,这种学习风格的本质与压缩问题是很相似的。如果考虑一下典型的 HTML 页面有多少冗余,机器学习压缩算法其实有很好的机会去改进 gzip。但这只是我的一个猜想,毕竟我没有机器学习文本压缩的经验。

压缩算法已经是一个有市场的项目

在我创业生涯中,我曾尝试向企业销售产品而最终失败,从中我学到了一件事情,就是如果企业已经有大量的资金分配在你所销售的产品类别上,那么进行销售会更加容易。企业对于某种产品有预算意味着公司已经做出了是否要在该项解决方案上花钱的决定,现在的唯一问题是要购买哪种解决方案。这就是为什么我认为机器学习可以在这个领域取得巨大进展的原因之一,因为制造商已经拥有专门用于视频和音频的压缩工程师,以及对应的资金和芯片制造产业。如果我们能够证明将机器学习添加到现有的解决方案中可以提高某些指标,如质量速度或者功耗,这些方法就能够很快被采用。

带宽成本需要平摊到用户和运营商身上,而质量和续航是产品的一大卖点,因此采用机器学习进行压缩相比于其他应用方向有更直接的动机。现有的研究表明,机器学习算法进行压缩非常的高效,而且我乐观的认为还有很多方法等着被发现,所以我希望压缩算法会成为机器学习的一个重要应用。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器学习
    +关注

    关注

    66

    文章

    8541

    浏览量

    136271
  • 自然语言
    +关注

    关注

    1

    文章

    292

    浏览量

    13927

原文标题:「压缩」会是机器学习的下一个杀手级应用吗?

文章出处:【微信号:worldofai,微信公众号:worldofai】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    价格有望跌至5万,保姆机器人将成为下一个智能手机?

    电子发烧友网报道(文/黄山明)当下的人类社会已经进入到了场新的竞争当中,这场竞争并非是人与人之间的,而是人与机器人之间的竞争,是在劳动力造成缺口的同时,机器人技术能否发展到填补劳动力缺口,甚至
    的头像 发表于 08-05 07:55 9623次阅读
    价格有望跌至5万,保姆<b class='flag-5'>机器</b>人将成为<b class='flag-5'>下一个</b>智能手机?

    AI驱动的人形机器人,成为激光雷达产业的下一个爆发点

    速腾和禾赛最新的财报电话会议上,都提到了不少机器人的应用。禾赛在近期还预告了在明年1月的CES上,将会发布款全新的面向机器人领域的迷你3D激光雷达产品。   从汽车到机器人,激光雷达
    的头像 发表于 12-23 09:07 3715次阅读
    AI驱动的人形<b class='flag-5'>机器</b>人,成为激光雷达产业的<b class='flag-5'>下一个</b>爆发点

    桌面CNC,3D打印后的下一个爆款市场?

    。   在创客工具领域,CNC 设备与 3D 打印、激光切割并称为 “三大桌面加工神器”,但三者的普及度却存在明显差距。3D 打印与激光切割已快速渗透大众视野,走进创客空间、中小企业甚至家庭,而桌面 CNC 长期受困于三大痛点:   使用门槛高:传统
    的头像 发表于 11-04 09:20 2779次阅读

    科技云报到:西湖大学、智元机器人都选它,存储成为AI下一个风口

    科技云报到:西湖大学、智元机器人都选它,存储成为AI下一个风口
    的头像 发表于 09-03 11:24 545次阅读

    机器视觉的下一个十年:三大创新趋势与产业突破

    工业4.0推动机器视觉向3D、国产化、场景体化发展,提升检测精度与效率,推动智能制造升级。
    的头像 发表于 08-14 09:39 712次阅读

    【原创】TDMS设置下一个写入位置函数的摸索

    labview在20版本前,tdms都有高级函数,写入文件位置set file positon,但是在20版本后被取消了。取而代之是‘tdms设置下一个写入位置函数’ 本意是想利用tdms设置
    发表于 08-11 20:54

    有温度的创新,有灵魂的机器 —— 华成工控,与您共赴下一个 20 年!

    行业资讯
    华成工控
    发布于 :2025年08月06日 16:33:36

    AI玩具或成为下一个万亿新赛道

    如果你将拥有家庭新成员,你首先会想到什么?是孩子还是宠物?如果我说你下一个家庭成员,或许是会“察言观色”的AI玩具,这件事是不是听上
    的头像 发表于 07-29 10:15 931次阅读

    无人配送车卷至不到2万元,激光雷达下一个增量市场来了

    的无人轻卡。   而值得提的是,近期这三家品牌的商用无人配送车,均搭载了激光雷达。在Robotaxi之外,或许商用无人配送车会成为激光雷达的下一个增量市场?   豪华传感器配置:3 颗激光雷达、20 颗摄像头、12 颗毫米波雷达   京东物流最
    的头像 发表于 07-09 00:12 6066次阅读
    无人配送车卷至不到2万元,激光雷达<b class='flag-5'>下一个</b>增量市场来了

    封装工艺中的晶圆封装技术

    我们看下一个先进封装的关键概念——晶圆封装(Wafer Level Package,WLP)。
    的头像 发表于 05-14 10:32 1466次阅读
    封装工艺中的晶圆<b class='flag-5'>级</b>封装技术

    ad7616 burst模式读取数据时,是否可以在下一个convst启动转换?

    ad7616 burst模式读取数据时,是否可以在下一个convst启动转换,但busy还没有拉低的情况下继续读取上次转换的数据吗?主要是串行读取时,有可能出现convst临界的情况,如果这样可以的话,能够提升小部分con
    发表于 04-15 07:50

    请问STM32H5递增HDPL后如何跳转下一级程序?

    STM32H5的HDP保护,比如某一级ROT提升HDP等级并跳转下一级代码运行。那设置HDP等级提升后,立刻生效吗?如果生效,芯片不能再执行当前ROT中的程序,接下来怎么跳转到下一级程序的呢
    发表于 03-11 06:00

    名单公布!【书籍评测活动NO.58】ROS 2智能机器人开发实践

    万开发者走上 ROS 机器人开发之路,其中不乏现今机器人行业的众多中流砥柱。 如今,为了帮助大家更好地学习ROS,全面系统地了解下一个可能的计算平台,为迎接智能
    发表于 03-03 14:18

    Chiplet,半导体的下一个前沿?

    的服务器等切设备提供动力。现代设备的明显趋势是可用于专门任务的空间越来越小,要求这些设备在有限的物理限制内有效处理多个工作负载。半导体行业正在经历重大转型。随着
    的头像 发表于 12-30 10:53 1142次阅读
    Chiplet,半导体的<b class='flag-5'>下一个</b>前沿?

    传统机器学习方法和应用指导

    用于开发生物学数据的机器学习方法。尽管深度学习般指神经网络算法)是强大的工具,目前也非常
    的头像 发表于 12-30 09:16 1992次阅读
    传统<b class='flag-5'>机器</b><b class='flag-5'>学习</b>方法和应用指导