0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

探究音频冗余的主要表现形式

讯维官方公众号 来源:讯维官方公众号 作者:讯维官方公众号 2021-06-09 15:57 次阅读

数字信号有自身相应的缺点,即存储容量需求的增加及传输时信道容量要求的增加。以CD为例,其采样率为44.1 kHz,量化精度为16 bit,则1 min的立体声音频信号需占约10 MB的存储容量,也就是说,张CD唱盘的容量只有1 h左右。

当然,在带宽高得多的数字视频领城这一问题就显得更加突出。是不是所有这些比特都是必需的呢?研究发现,接采用PCM码流进行存储和传输存在非常大的冗余度。事实上,在无损的条件下对声首至少可进行4:1压缩,即只用25%的数字量保留所有的信息,而在视频领域压缩比甚至可以达到几百倍。因此,为利用有限的资源,压缩技术从一出现便受到广泛的重视。

信号(数据)之所以能进行压缩,是因为信号本身存在很大冗余度。根据统计分析结果,音频信号中存在着多种冗余,其主要部分可分别从时域和频域来考虑。另外,由于音频主要是给人听的,所以考虑人的听觉机理,也能对音频信号实行压缩。

1、时城冗余

音频信号在时城上的冗余主要表现为以下几个方面:

(1)幅度分布的非均匀性

统计表明,在大多数类型的音频信号中,小幅度样值出现的概率比大幅度样值出现的概率要高。人的语音中,间歇、停顿等出现了大量的低电平样值;实际讲话的功率电平也趋向于出现在编码范围的较低电平端。

(2)样值间的相关性

对语音波形的分析表明,相邻样值之间存在很强的相关性。当采样频率为8 kHz时,相邻样值之间的相关系数大于0.85。如果进步提高采样频率,则相邻样值之间的相关性将更强。因此,根据较强的维相关性,可以利用差分编码技术进行有效的数据压缩。

(3)周期之间的相关性

虽然音频信号分布于20 Hz ~ 20 kHz的频带范围,但在特定的瞬间,某一声音却往往只是该频带内的少数频率成分在起作用。当声音中只存在少数几个频率时,就会像某些振荡波形一样,在周期与周期之间存在着一定的相关性。利用音频信号周期之间的相关性进行压缩的编码器,比仅仅利用邻近样值间的相关性的编码器效果好,但要复杂得多。

(4)静止系数

两个人之间打电话,平均每人讲话时间为通话时间的一半,并且在这一半的通话过程中也会出现间歇停顿。分析表明,话音间隙使全双工话路的典型效率约为40% (或称静止系数为0.6)。?显然,话音间隔本身就是一种冗余,若能正确检测出这些静止段,可“插空”传输更多信息。

(5)长时自相关函数

统计样值、周期间的一些相关性时,在20 ms时间间隔内进行统计的称为短时自相关函数。如果在较长的时间间隔(如几十秒)内进行统计时,则称为长时自相关函数。长时统计表明,当采样频率为8 kHz时,相邻的样值之间的平均相关系数可高达0.9。

2、频域冗余

音频信号的频域冗余主要表现为以下几个方面:

(1)长时功率谱密度的非均匀性

在相当长的时间间隔内进行统计平均,可以得到长时功率谱密度函数,其功率谱呈现明显的非平坦性。从统计的观点看,这意味着没有充分利用给定的频段。或者说存在固有的冗余度。功率谱的高频成分能量较低。

(2)语音特有的短时功率谱密度

语音信号的短时功率谱,在某些频率上出现“峰值”,而在另一些频率 上出现“谷值”。这些峰值频率,也就是能量较大的频率,通常称其为共振峰频率。共振峰频率不止一个,最主要的是前三个,由它们决定不同的语音特征。另外,整个功率谱也是随频率的增加而递减的。更重要的是整个功率谱的细节以基音频率为基础,形成了高次谐波结构。

3、听觉冗余

人是音频信号的最终用户,因此,要充分利用人类听觉的生理和心理特性对音频信号感知的影响。利用人耳的频率特性灵敏度以及掩蔽效应,可以压缩数字音频的数据量。

①可以将会被掩蔽的信号分量在传输之前就去除,因为这部分信号即使传输了也不会被听见。

②可以不理会可能被掩蔽的量化噪声。

③可以将人耳不敏感的频率信号在数字化之前滤除,如语音信号只保留300 -3 400 Hz的信号。

编辑:jq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 噪声
    +关注

    关注

    13

    文章

    1070

    浏览量

    47060
  • 音频信号
    +关注

    关注

    9

    文章

    192

    浏览量

    33105
  • 函数
    +关注

    关注

    3

    文章

    3864

    浏览量

    61305
  • PCM码
    +关注

    关注

    0

    文章

    2

    浏览量

    5203

原文标题:音频冗余的主要表现形式

文章出处:【微信号:xunwei201508,微信公众号:讯维官方公众号】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    深入解析坐标转换应用实践

    测量坐标转换一般包括两方面的内容:坐标系转换和坐标基准转换。同一坐标基准下,空间点不同表现形式的转换叫做坐标系转换。
    的头像 发表于 04-01 14:33 121次阅读
    深入解析坐标转换应用实践

    什么是PLC的软冗余和硬冗余?PLC不做性能冗余可不可以?

    的逻辑功能或算法,使系统能够在主控制器故障时自动切换到备用的逻辑功能上运行。软冗余通常采用双重或多重输入检测方式来实现。当主控制器故障时,备用逻辑功能会接管处理并保证系统的正常运行。软冗余主要通过软件的方式实现,可以在现有的硬
    的头像 发表于 02-02 16:58 575次阅读

    二进制最佳接收原理 二进制最佳接收机的实现形式有哪两种?

    过来的数据。二进制最佳接收原理的实现形式主要分为两种,分别是非相干接收和相干接收。接下来,我将详细介绍这两种实现形式以及它们的工作原理。 非相干接收是一种简单且易实现的接收方式,它利用了接收机的直流分量进行信号检
    的头像 发表于 11-27 16:19 566次阅读

    线材对音频信号传输的影响表现在哪些方面

    线材对音频信号传输的影响表现在哪些方面
    的头像 发表于 11-14 10:40 332次阅读

    中国电信发布三大板块创新产品

    当前,以5G、移动物联网为代表的新型基础设施建设不断加快,移动物联网保持爆发式增长,成为承载大数据、云计算、人工智能等先进技术落地的重要表现形式
    的头像 发表于 11-10 15:32 441次阅读

    C2采用1个CPU+3个DSP架构实现网络化多媒体平台

    网络向我们提供日益丰富的内容,这些内容的表现形式多种多样,仅视频和音频就有几十种格式。传统的ASIC芯片最大缺点是缺乏灵活性和通用性,例如DVD解码芯片通常只支持MPEG-2,MPGE-4和MP3标准,如果要处理更多的格式还需要设计新的芯片,因此ASIC类的芯片不适合网络
    的头像 发表于 10-31 18:12 520次阅读

    如何判断变频器滤波电解电容是否损坏?

    如何判断滤波电解电容是否损坏?一般当电解电容出现下面表现形式就可以判断为损坏了:外观炸开、铝壳鼓包、塑料外套管裂开,流出了电解液、保险阀开启或被压出,小型电容器顶部分瓣开裂,接线柱严重锈蚀,盖板变形、脱落,这些都说明电解电容器已损坏。
    发表于 10-17 17:46 471次阅读

    OpenHarmony应用核心技术理念与需求机遇简析

    新的表现形式。 所以各种传统的WEB网站,客户端平台,尽早进入OpenHammony应用服务体系,享受各项支持政策和红利,从现有的红海互联网、移动互联网市场进入OpenHarmony智能物联网蓝海领域,大有可为。
    发表于 09-22 16:12

    电子吊秤独有的一种表现形式往往被误解!#硬声创作季

    电源电路工业自动化
    或许
    发布于 :2023年07月25日 14:59:44

    状态机的设计方法和三段式描述

    通过数据路径的逐步穿透,设计模块,是一种常见的设计方法。而从另外一种常规思想来看,电路的另一种表现形式,是状态的转换。
    的头像 发表于 07-13 16:11 1087次阅读
    状态机的设计方法和三段式描述

    教你如何书写高质量的Verilog代码?

    HDL 语言仅是对已知硬件电路的文本表现形式编写前,对所需实现的硬件电路“胸有成竹”
    的头像 发表于 06-27 11:16 1001次阅读
    教你如何书写高质量的Verilog代码?

    简读光干涉、衍射原理

    光,也叫电磁波,他的表现形式我们通常用正弦曲线来表示,如下图。
    的头像 发表于 06-10 11:05 2129次阅读
    简读光干涉、衍射原理

    两种特性的线圈的两种不同的表现形式

    我总结对启保停的线圈和普通线圈的区别是,普通线圈的输出结果是确定的,是直接反映的输入信号之间的逻辑关系。
    的头像 发表于 05-22 09:31 239次阅读
    两种特性的线圈的两种不同的<b class='flag-5'>表现形式</b>

    MIMO技术的工作重难点和5G的关系

      MIMO技术主要有两种表现形式,即空间复用和空时编码。这两种形式在WiMAX技术中都得到了应用。WiMAX技术还给出了同时使用空间复用和空时编码的形式。目前MIMO技术正在被开发应
    发表于 05-19 15:52 978次阅读

    什么是API?API接口表现形式分类理论

    简单对象访问协议(Simple Object Access Protocol,SOAP),它是广泛使用的最古老的以 Web 为中心的 API 协议。SOAP 于 1990 年代后期推出,是最早设计用于允许不同应用程序或服务使用网络连接以系统方式共享资源的协议之一。
    的头像 发表于 05-10 15:25 7803次阅读
    什么是API?API接口<b class='flag-5'>表现形式</b>分类理论