0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

改变世界的无损压缩算法发展史

算法与数据结构 来源:CSDN 作者:CSDN 2021-05-10 14:00 次阅读

近日,国际电气电子工程学会(Institute of Electrical and Electronics Engineers,简称 IEEE)宣布,授予 IEEE 终身 Fellow Jacob Ziv 2021 年度 IEEE 荣誉勋章。

这位如今已 90 岁的前辈,是一位以色列科学家,他开发了通用无损压缩算法 Lempel-Ziv,为后来的 GIF、PNG 和 ZIP 文件的开发奠定了坚实的基础。

1、无损压缩算法发展史

20 世纪 70 年代,随着互联网及 PC 时代的来临,如何在有限内存空间的设备上节省出更多的空间,并减少对带宽的占用,让文件在较低的网络带宽下实现更快的传输,成为彼时 IT 行业亟需解决的一大难题。

正因此,数据压缩技术也从背后逐渐走入大众视野,并开始在计算机领域扮演重要角色。

现如今,想必很多人都知道,数据压缩主要有两种类型:一种是有损压缩,一种是无损压缩。

所谓有损压缩,主要是利用了人类对图像或声波中的某些频率成分不敏感的特性,允许压缩过程中损失一定的信息,日常生活中,我们常见的语言、图像、视频压缩其实都是有损压缩的方式。

与有损压缩相比,无损压缩要更为复杂一些,对此,IEEE 官方使用了「魔术」一词来形容这门技术,其中原因主要是因为无损压缩技术是利用数据的统计冗余进行压缩,在解压之后,可完全恢复原始数据而不引起任何失真。这就像一位魔术师拿着魔术棒一挥,手中的东西不见了,再一挥,又原封不动地出现了,无损压损技术就像表演魔术一样。

而 Jacob Ziv 就是这位在数据压缩领域拿着魔术棒的大师。

不过,在 Jacob Ziv 这位魔术师带来奇特的魔术之前,压缩算法也经历了百年的发展历程(http://ethw.org/History_of_Lossless_Data_Compression_Algorithms):

事实上,发明于 1838 年的 Morse code,是最早的数据压缩实例。

随着大型机的兴起,数学家香农和 Robert Fano(CSAIL的计算先驱和创始人)发明了 Shannon-Fano(香农-范诺)编码算法。他们的算法基于符号(symbol)出现的概率来给符号分配编码(code)。一个符号出现的概率大小与对应的编码成反比,从而用更短的方式来表示符号。

1951 年,作为麻省理工的一名学生,David Huffman 选择写学期论文而非期末考试的方式来完成学业任务,彼时他的论文题目是寻找二叉编码的最优算法。不过,遗憾的是,经过几个月的努力后依然没有任何成果,Huffman 决定放弃所有论文相关的工作,开始学习为参加期末考试做准备。就在那时,Huffman 偶然间找到一个与 Shannon-Fano 编码相类似但是更有效的编码算法,这种编码方式效率高、运算速度快。

后来到了 20 世纪 70 年代,随着在线存储的出现,哈夫曼编码得到了广泛应用。不过,经过不断地尝试,不少科学家发现哈夫曼编码所得的编码长度只是对信息熵(描述信源的不确定度)计算结果的一种近似,还无法真正逼近信息熵的极限。同时,它需要两次通过数据文件:一次计算文件的统计特征,第二次编码数据。将字典与编码数据一起存储,增加了压缩文件的大小。

1977 年,来自以色列的 Jacob Ziv 和 Abraham Lempel 两位技术大神打破传统的设计思想,创造出一种哈夫曼编码更有效的压缩算法,并以两个人名字来命名。同时,他们还发表了一篇名为《A Universal Algorithm for Sequential Data Compression》(顺序数据压缩的一个通用算法 ,https://www2.cs.duke.edu/courses/spring03/cps296.5/papers/ziv_lempel_1977_universal_algorithm.pdf)的论文,揭晓了独创的 LZ77 算法,这也是第一个使用字典来压缩数据的算法。

次年,Jacob Ziv 和 Abraham Lempel 再次发表一篇改进版的论文(《Compression of Individual Sequences via Variable Rate Coding》),并带来了 LZ78 的压缩算法。与 LZ77 不同,LZ78 解析输入数据,生成一个静态字典,不像 LZ77 动态产生。该算法成为 80 年代初使用的 Unix 压缩程序的基础;影响了 90 年代的 WinZip 和 Gzip,为 GIF、TIFF 图片格式的开发带来了一定的指引。

如果没有这些算法的存在,现在的我们不一定能够使用更为便捷的网络就可以发送大型数据文件,或还停留在将大型数据文件拷贝到光盘上进行传输时代;听音乐时,还有可能需要 CD 而不是通过流式传输。..。..

2、 Ziv 的过往经历

这一切都需要感谢 Jacob Ziv 和 Abraham Lempel。

“LZ 算法是第一个成功的通用压缩算法”,一位支持 Ziv 获奖的工程师如是说。这些算法以及 Jacob Ziv 对它们的分析,为后续关于通用算法的大多数工作奠定了基础。

回顾 Ziv 的过往经历,其跨越了半个世纪,将自己全身心地投入到压缩算法领域中。

1931 年,出生在当时由英国统治的巴勒斯坦城市 Tiberias(现属于以色列)的 Ziv,在很小的时候,Ziv 就对电力和电子产品有着浓厚的兴趣,譬如,在练习小提琴的时候,他会尝试把乐谱架变成一盏灯。此外,他还试图用钢琴弹奏的金属零件制作一个马可尼发射机。

1948 年,第一次阿以战争爆发时他在读高中,后来被征召到前线短暂地服过役。由于一群母亲组织抗议,他才从前线回到了后方,在空军受训担任雷达技师。战争结束后,他进入以色列理工学院学习电气工程。

在 1955 年完成硕士学位后,Ziv 重返国防界,并加入了以色列国防研究实验室(现为拉斐尔先进防御系统),开发用于导弹和其他军事系统的电子元件。

1959 年,Ziv 被选为以色列国防实验室为数不多的出国留学的研究人员之一。那时,Ziv 计划继续从事通信工作,但他不再只对硬件感兴趣。偶然机遇之下,他阅读了《信息理论》(Prentice-Hall,1953年)的书籍,他决定将信息理论作为他关注的焦点。然而,除了麻省理工学院之外,还有什么地方可以研究信息理论呢?

当然还是麻省理工!于是,1960 年,Ziv 进入 MIT 读博,在信息理论方面深造,在毕业返回以色列后进入了国防部担任通信部门主管。

1968 年,他返回美国,进入了贝尔实验室。

两年后,Ziv 和几个同事一起加入了以色列理工学院。就是在这里,他遇到了 Abraham Lempel,两个人共同讨论了如何改进无损数据压缩。

Ziv 和 Lempel 都想知道他们是否可以开发一种无损数据压缩算法,该算法适用于任何类型的数据,不需要预处理,并且能够实现数据的最佳压缩,这个目标被称为 Shannon 熵的对象定义。在设想时,他们并不清楚是否可以实现他们的目标。于是,他们决定找出答案。

在深入研究几年后,随着 LZ77 和 LZ78 的出现,代表了其研究成功。Ziv 和 Lempel 开创了通用源编码,一系列无需知道固有信息压缩数据的算法,减少了从不失真和失真数据重建图像所需的数据率。

对此,斯坦福大学从事信息理论的电气工程教授 Tsachy Weissman 表示:“在他们发表作品时,算法清晰优雅,易于实现,计算复杂度低,这一事实几乎无关紧要。更多的是关于理论结果,为接下来的研究带来重要意义。”

另外,Ziv 还促成了错误校正代码的低计算复杂性解码理论。并于:

1993 年,因精确科学而被授予以色列奖(Israel Prize);

1995 年,因其“对信息理论、数据压缩的理论和实践的贡献”获得 IEEE 理查德 · 汉明奖章;

1997 年,获得 IEEE 信息论学会的克劳德 · 香农奖;

2008 年,获得 BBVA 基金会知识前沿奖。

如今,凭借「其对信息理论和数据压缩技术的重要贡献和杰出的研究领导地位」,被授予 2021 年度 IEEE 荣誉勋章,可谓实至名归,向依旧奋战在研究一线的前辈致敬!

原文标题:90 岁程序员:他的压缩算法改变了世界!

文章出处:【微信公众号:算法与数据结构】欢迎添加关注!文章转载请注明出处。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据
    +关注

    关注

    8

    文章

    6511

    浏览量

    87590
  • 计算机
    +关注

    关注

    19

    文章

    6646

    浏览量

    84490

原文标题:90 岁程序员:他的压缩算法改变了世界!

文章出处:【微信号:TheAlgorithm,微信公众号:算法与数据结构】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    FPGA压缩算法有哪些

    在图像压缩算法中可以采用哈夫曼编码的方式对编码冗余的信息进行压缩,可以采用预测的方式来减少像素间冗余,可以采用量化的方式完成心理视觉冗余信息的去除
    的头像 发表于 04-15 11:48 173次阅读
    FPGA<b class='flag-5'>压缩</b><b class='flag-5'>算法</b>有哪些

    基于门控线性网络(GLN)的高压缩无损医学图像压缩算法

    实现基于门控线性网络(GLN)的高压缩无损医学图像压缩算法,以提高医学图像存储和分发系统的效率。与“传统”的基于上下文的数据压缩
    的头像 发表于 04-08 10:29 167次阅读
    基于门控线性网络(GLN)的高<b class='flag-5'>压缩</b>比<b class='flag-5'>无损</b>医学图像<b class='flag-5'>压缩</b><b class='flag-5'>算法</b>

    电阻柜的发展史

    电阻柜发展史
    的头像 发表于 03-08 15:22 115次阅读

    高性能无损数据压缩FPGA IP,LZO无损数据压缩IP

    LZOAccel-C是一个无损数据压缩引擎的FPGA硬件实现,兼容LZO 2.10标准。 Core接收未压缩的输入数据块,产生压缩后的数据块。Core使用合适的头和尾封装了
    的头像 发表于 01-25 13:39 210次阅读
    高性能<b class='flag-5'>无损</b>数据<b class='flag-5'>压缩</b>FPGA IP,LZO<b class='flag-5'>无损</b>数据<b class='flag-5'>压缩</b>IP

    机器人技术的发展史简介

    机器人的诞生地在美国,1962年美国研制出世界上第一台工业机器人,经过30多年的发展,美国现已成为世界上的机器人强国之一,基础雄厚,技术先进。综观它的发展史,道路是曲折不平坦的。
    发表于 12-20 10:17 567次阅读

    目标检测算法YOLO的发展史和原理

    大家或许知道,首字母缩写YOLO在英文语境下较为流行的含义,即You Only Live Once,你只能活一次。我们今天要介绍的YOLO却有着与前者不一样的含义。在算法世界中,YOLO寓意You Only Look Once,你只需要看一眼——这不失为一种来自开发者的
    的头像 发表于 11-18 10:33 2343次阅读
    目标检测<b class='flag-5'>算法</b>YOLO的<b class='flag-5'>发展史</b>和原理

    你不知道的FPC,它的发展史竟然是这样的!

    你不知道的FPC,它的发展史竟然是这样的!
    的头像 发表于 11-15 10:48 446次阅读

    大语言模型无损压缩方面超越PNG和FLAC

    Google DeepMind 和 Meta 的研究人员发表论文《Language Modeling Is Compression》,他们发现 DeepMind 的大语言模型 Chinchilla 70B 在图像和音频的无损压缩上超过了 PNG 和 FLAC。
    的头像 发表于 10-08 11:24 552次阅读
    大语言模型<b class='flag-5'>无损压缩</b>方面超越PNG和FLAC

    无损质量等级视频浅压缩领域的实践与探索

    感知无损强调压缩图像的质量达到无损等级。最开始时起名是轻压缩,与重压缩相对,主要强调在编解码的过程中相对较低的计算复杂度。
    发表于 09-20 10:57 457次阅读
    <b class='flag-5'>无损</b>质量等级视频浅<b class='flag-5'>压缩</b>领域的实践与探索

    存储新篇章:超越想象,打造全国产高通量NAS存储新未来!

    SmarStorC2000是一款基于全国产化平台的企业级高通量NAS存储产品,融合文件、对象等多种存储架构和存储协议,具备自主可控、创新RAID算法、自动快照保护、在线无损压缩、一键配置等多种特性。
    的头像 发表于 09-19 17:20 916次阅读
    存储新篇章:超越想象,打造全国产高通量NAS存储新未来!

    CMOS发展史

    电路元器件电容晶体管电子技术电子diy
    学习电子知识
    发布于 :2023年08月30日 23:07:19

    8K无损压缩分布式系统,开创分布式新时代!

    近年来,分布式产品可谓遍地开花,很多厂商络绎不绝的在AV over IP化下足功夫,行业各类分布式产品层出不穷,当大家还以4K产品引以为傲的时候,近日讯维率先推出最新一代分布式产品:8K无损压缩
    的头像 发表于 08-24 10:28 462次阅读
    8K<b class='flag-5'>无损压缩</b>分布式系统,开创分布式新时代!

    基于SYSBIOS系统如何将PCM格式的音频编码为MP3格式?

    音频编解码的主要对象是音乐和语音,音频的编解码格式可分为无压缩的格式、无损压缩格式、有损音乐压缩格式、有损语音压缩格式和合成算法
    的头像 发表于 08-09 16:53 749次阅读
    基于SYSBIOS系统如何将PCM格式的音频编码为MP3格式?

    DOS/Windows 操作系统的发展史

    来说说微软的DOS和Windows系列的发展史
    的头像 发表于 08-01 18:41 1013次阅读
    DOS/Windows 操作系统的<b class='flag-5'>发展史</b>

    数据无损压缩

    在数据存储和传输系统中,增加冗余数据可提高数据的可靠性,而消除或减少冗余数据可降低对存储容量和传输带宽的要求。本章的核心内容是介绍几种消除或减少冗余数据的数据无损压缩技术,包括统计编码、RLE编码和词典编码。
    发表于 06-05 17:34 0次下载