0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

探究PXA255的VoIP语音传输系统

电子工程师 来源:电子技术 作者: 刘华;李军红;阳武 2021-04-23 15:23 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

摘要:文章研究IP语音传输系统的总体架构,实现了一个基于PXA255处理器嵌入式IP电话终端硬件平台,为该平台建立了一个优化的嵌入式Linux环境,并研究基于GSM 06.10语音编解码实现,设计了一个IP语音实时传输系统,实现了IP语音的网络实时传输功能。

VoIP是基于Internet的新型数字化传输技术,是IP网上通过TCP/IP协议实现的一种电话应用技术。这种应用包括PC对PC、PC对电话、电话对电话等连接方式,其业务主要包括语音业务、E-mail、实时电话、实时传真等多种形式。与传统电话相比,IP电话的优点主要是节省带宽、通话费用低、易于开发增值业务、体系结构开放,有利于多种通信方式的统一。

对VoIP技术的研究主要围绕改善IP电话服务质量来进行,尤其是使用先进的硬件技术、可靠的实时传输技术和能随着网络状况自适应调整速率的低速率语音编码技术等研究及工程热点。

研究与实现基于嵌入式处理器的VoIP语音传输系统,可集成嵌入式系统、网络通讯、多媒体和语音处理等应用领域内的前沿技术,将嵌入式系统的高性能、低功耗、网络通讯的低成本特性融合于一体,经过进一步完善后可以取代固定电话,并发展可视电话等信息终端,可以实现电话网、广播电视网与Internet网的整合,具有很大的经济和技术优势。

1 PXA255嵌入式处理器

本文研究与设计的嵌入式IP数字语音系统将在以太网环境中工作。与目前大多数基于PC的IP电话终端相比,选择嵌入式IP电话终端具有如下优势:

(1)嵌入式硬件平台可以进行裁减和定制,因而可以大幅降低IP电话终端成本;

(2)可以定制嵌入式软件平台,容易升级,实时性好,而基于PC机的IP电话占用资源多,操作系统复杂,容易死机;

(3)嵌入式IP电话终端功耗低,可以使用电池进行供电,因而系统具有小型化、便携的特点,这是PC所无法比拟的。

PXA255处理器是Intel公司带ARM核的多媒体处理器。PXA255处理器的内部功能模块框图见图1所示。

o4YBAGCCdHuAYoC5AAC-ej-RMfI637.png

PXA255处理器具有如下特色:核心频率支持100~400MHz;多种系统存储器接口;外设资源非常丰富:有PCMCIA/Compact Flash卡控制引脚、LCD控制器、全功能UARTUSB客户端、AC97控制器、15个灵活的GPIO引脚等。

2 VoIP的嵌入式Linux环境构建

嵌入式IP吾音终端使用的嵌入式Linux平台可分为三个层次:应用软件层次、Linux内核层次和设备驱动层次。其中平台无关部分包括:Linux实时内核、文件系统、应用软件等部分;平台相关部分包括:硬件驱动的改造和启动过程改造,我们需要针对不同平台进行代码改造,

编写各种驱动。由图2可知,Linux对各种设备的操作都是以文件的形式进行的。

pIYBAGCCdI-AKuuVAAByGfzj83o160.png

基于RTP协议的语音实时网络传输软件,位于Linux网络结构的Socket应用层,如图3所示。在嵌入式Linux平台上利用Socket系统函数实现语音传输的RTP应用。在具体编程时,Linux平台上可供选用的语言有C、C++等。在这里我们也采用C语言,并采用编译器Arm-Linux-Gcc。

语音处理的音频库函数使用OSS(Open Sound System)。

pIYBAGCCdKGAGsgZAAAy5QHozg8376.png

嵌入式IP终端系统软件界面采用QT/Embed编程。利用qte的界面编程辅助工具QT Designer能很方便地实现界面规划布局。由于是可视化编程,能很好地控制界面布局、效果,操作方便。QT Designer生成的界面文件是以XML语言编写的.ui文件,通过QT附带的工具UIC,能让*.ui文件生成*.h和*.cpp的文件格式。使用QTDesigner大大降低了编程的工作量,并且能得到所见即所得的图形效果。

3 语音编解码器选型

对语音信号,有许多压缩算法和标准。这些编码算法可按照编码系统码率大小、输入信号频带宽度、所采用的编码技术等方面进行分类。编码系统优劣的评价主要体现在编解码系统的性能指标上,一个编解码器系统有输出声音的质量、编码速率、复杂度、迟延和容错性

等性能指标。

(1)编码速率。编码速率指的是编码器对输入声音经过压缩后每秒的比特数,即压缩后的传码率。这是编码系统的一个十分重要的指标。降低比特率而维持较高的解码声音质量,是语音和音频信号压缩编码的主要任务和主要目标。对电话级别的语音带宽而言,通常认为比特率超过16kb/s的为高速编码,而速率在8~16kb/s范围的为中速率编码,速率在8kb/s以下的为低速率编码。

(2)输出声音的质量。输出声音的质量是指经过编码系统再经过接收方的解码后恢复出的声音质量。衡量输出声音质量主要有二个指标:客观质量和主观质量。客观质量法易测量,但往往不能精确反映语音质量。由于声音的最终接收者是人,所以主观法更能反映声音质量的真正好坏,但它测试不易,费时费力。

(3)复杂度。在传统电话应用中,很少使用压缩,是因为压缩算法的复杂度太大,算法执行时间长,算法的延迟也一起带入到通信系统中。随着技术的进步,芯片处理速度越来越快。现在工程上一般采用单片数字信号处理器DSP芯片来实时实现语音编解码。语音编解码算法的复杂度可由算法所需的计算量、存储量、硬件尺寸、消耗功率及价格来衡量。

(4)时延。时延指完成编解码算法所需的时间。对于语音编解码器来说,时延也是一个非常重要的指标,如果时延太大,听起来很不舒服。对于时延,不同的应用场合有不同规定,如对长话网不加回波抑制的单向编解码时延不得大于10ms。对可视电话则放松到不超过500ms。对VOIP语音系统的时延要求不超过300ms。

(5)容错能力或鲁棒性。容错能力指编解码系统抗误差、线路噪声等各种干扰的能力。

表1对几种编码器的比特率、主观平均意见分法(MOS)、复杂度(以G.711为基准)和时延(帧大小)做了比较。

pIYBAGCCdQaATj9XAABqbZqGGmU320.png

本系统选用GSM 06.10语音标准算法,该算法在1988年被确定为数字移动通信的语音编码标准,其编码速率为13kb/s,算法简单,运算量小,语音质量高,接近32kb/s的ADPCM(ITU-G.712)。

4 IP语音实时传输系统设计

本文采用Intel公司推出的PXA255处理器,该芯片专用于网络和多媒体。其最高工作频率可达400MHz,并带内存管理单元MMU和DSP协处理器,可方便与高清晰的彩色LCD接口,同时该芯片可扩展连接AC97音频芯片CS4201、高性能网络接口芯片LANC9196,可方便移植嵌入式Linux和图形界面等。

基于PXA255处理器的IP语音系统用方案具有如下优势:将先进的硬件技术和软件技术有机融合,充分利用PXA255和Linux的强大功能,克服了传统的基于单片机功能不足和基于PC的非实时性的缺点,具有实时性、低成本、小型化、专用化和高可靠性的优点,能让IP数字语音终端系统具有更好的可扩展性和可移植性,与ARM7或DSP的方案相比,在技术上同样具有一定优越性。

系统设计硬件框图见图4所示。

pIYBAGCCdRyAELBlAABW_Xp8WEk175.png

系统设计语音流程框图见图5。

o4YBAGCCdSaAOFXVAABbt_m0XA4239.png

5 系统测试

将两个语音终端连接到局域网,分别设置其IP地址为192.168.0.100、192.168.0.101。整个软件的运行过程:在语音传输之前,首先由网络连接(通话双方的呼叫连接)模块进行呼叫连接,呼叫连接建立后,双方就可以进行接下来的语音通话,实现语音传输。

在送话方即发起会话的一方:语音首先通过麦克风进入系统,在语音录入与播放功能模块内进行录音,然后进入语音数据压缩、解压模块进行压缩,压缩后的语音数据打包后,以语音数据包的方式发送。

在受话方即接收会话的一方:通过网络传输过来的语音数据拆包后,首先进入语音数据缓存模块进行缓存,这种缓存方式可以保证语音回放连续和不失真,然后进入语音数据压缩与解压模块对其进行解压。经过语音解压缩过程以后,语音数据送入语音录入与播放功能模块内,通过扬声器进行播放,最终还原成语音。

测试过程中,我们使用RTP工具集rtptools-1.18中的rtpplay、rtpdump、rtpsend等命令截取语音实时传输模块在网络中的语音包,观察其RTP和RTCP报文,分析网络的当前状况等。网络的当前状况与语音传输延迟有很强的正相关性。网络状况好,传输延迟小,网络状况不好,传输延迟增大。

语音延时测试方法:因为语音传输的延迟时间在1s以内,用秒表或其他外设来测量,误差大、精度不高,所以我们基于软件的方式测量。通过在RTP工具集中设置一个计时器,计算时间差,记录端到端的语音延时。最后求平均值,延时数据见表2。测试分8组,每组10到40个延迟数据不等,表中数据为每组的延迟平均值。

pIYBAGCCdTeAUSj-AAAz-kKei3c741.png

8组的所有测试数据有210个,所有测试数据的平均延时计算过程:

(283*10+258*10+269*20+266*20+257*30+275*30+268*40+286*50)/210=271.86ms。

由计算可知,平均延时约为272ms。满足本文第三节中VoIP语音时延的上限300ms的要求。

6 小结

论文研究了IP语音传输系统的总体架构,实现了一个基于PXA255处理器的嵌入式IP电话终端硬件平台,为该平台建立了一个优化的嵌入式Linux环境,并研究基于GSM 06.10的语音编解码实现,设计了一个IP语音实时传输系统,实现了IP语音的网络实时传输功能,通过系统测试,语音时延符合工程要求,具有较好的实时性。

编辑:jq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 编码器
    +关注

    关注

    45

    文章

    4011

    浏览量

    143367
  • RTP
    RTP
    +关注

    关注

    0

    文章

    29

    浏览量

    12368
  • 压缩算法
    +关注

    关注

    1

    文章

    22

    浏览量

    10759
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    探索 ISL6401 RSLIC PWM 控制器评估板:为 VoIP 电源设计带来新思路

    探索 ISL6401 RSLIC PWM 控制器评估板:为 VoIP 电源设计带来新思路 在当今数字化通信的浪潮中,VoIP 技术的应用日益广泛,对于相关电源供应的要求也越来越高。今天,我们就来
    的头像 发表于 04-12 15:05 366次阅读

    德州仪器PTH08T255W电源模块:高性能与多功能的完美融合

    德州仪器PTH08T255W电源模块:高性能与多功能的完美融合 在电子工程师的日常工作中,电源模块的选择至关重要。它不仅关系到电路的稳定性,还会影响到整个系统的性能。今天,我将为大家详细介绍德州仪器
    的头像 发表于 03-04 17:10 617次阅读

    TLV320AIC22C:双VoIP编解码器的技术剖析与应用指南

    : tlv320aic22c.pdf 一、TLV320AIC22C概述 TLV320AIC22C专为语音应用设计,尤其适用于VoIP场景。它集成了两个编解码器
    的头像 发表于 02-03 14:40 407次阅读

    语音跳线:构建高效音频传输系统的核心组件

    在会议系统、录音棚、广播电台等专业音频场景中,语音跳线作为连接麦克风、调音台、功放等设备的“神经末梢”,其性能直接影响声音信号的保真度与传输稳定性。本文从技术原理、应用场景、选型要点三个维度,解析
    的头像 发表于 01-19 10:12 368次阅读
    <b class='flag-5'>语音</b>跳线:构建高效音频<b class='flag-5'>传输</b><b class='flag-5'>系统</b>的核心组件

    VoIP 与 VoLTE 在路由器中的原理与价值

    现在,路由器不仅仅是上网用的设备,尤其是在公司网络和无线接入(FWA)等场景里。它开始承担更多角色,比如整合数据、语音,甚至提供智能服务。其中,VoIP 和 VoLTE 这两项语音技术,正在改变我们
    的头像 发表于 01-16 11:01 1097次阅读
    <b class='flag-5'>VoIP</b> 与 VoLTE 在路由器中的原理与价值

    Samtec Flyover QSFP系统:高速信号传输新方案

    Samtec Flyover QSFP系统:高速信号传输新方案 在高速信号传输设计领域,信号完整性、成本控制和设计灵活性一直是工程师们关注的重点。Samtec的Flyover QSFP系统
    的头像 发表于 12-18 11:35 562次阅读

    楼宇自控系统语音控制集成,操作更便捷智能

    在智慧建筑升级浪潮中,楼宇自控系统的交互方式不断革新,语音控制集成作为新型操作模式,打破了传统按键、触屏的操作局限,让楼宇管理更高效、更人性化。这种 “动口不动手” 的控制方式,不仅简化了操作流程
    的头像 发表于 11-27 10:30 460次阅读

    广州唯创电子WTV380C-8S语音芯片:流式传输重塑电子锁语音提示新体验

    语音IC厂家,推出的WTV380C-8S语音芯片,以其创新的“流式传输”架构,为智能电子锁带来了颠覆性的简易解决方案。一、行业痛点:传统电子锁语音方案的复杂性与高成
    的头像 发表于 11-14 11:19 842次阅读
    广州唯创电子WTV380C-8S<b class='flag-5'>语音</b>芯片:流式<b class='flag-5'>传输</b>重塑电子锁<b class='flag-5'>语音</b>提示新体验

    什么是语音芯片串口AT指令?实现智能语音交互的核心技术详解

    什么是AT指令AT指令是一套基于串行通信接口的标准化指令集,专门用于声音播放芯片与其他设备之间的数据传输和控制操作。这种通信协议通过简单的文本命令格式,实现了对语音
    的头像 发表于 11-10 12:53 628次阅读
    什么是<b class='flag-5'>语音</b>芯片串口AT指令?实现智能<b class='flag-5'>语音</b>交互的核心技术详解

    介电温谱测试系统在高频段信号传输中的损耗抑制解析

    介电温谱测试技术要深入探究材料在高频条件下的极化机理与弛豫行为,就必须将高频电信号精准无误地传输至待测样品,并接收其微弱的响应信号。然而,随着频率的提升,信号在传输路径中的各种损耗会急剧增大,如同远
    的头像 发表于 09-24 09:28 522次阅读
    介电温谱测试<b class='flag-5'>系统</b>在高频段信号<b class='flag-5'>传输</b>中的损耗抑制解析

    “芯”声代,智未来—VS680本地语音交互系统 #语音交互 #芯片

    语音交互
    深蕾半导体
    发布于 :2025年09月17日 10:59:30

    语音识别系统的技术核心:从声音到文字的智能转换

          语音识别技术,也称为自动语音识别(ASR),其核心目标是将人类语音信号转换为对应的文本或指令。随着人工智能的发展,语音识别已成为智能助手、实时翻译、车载
    的头像 发表于 09-05 14:04 1000次阅读

    语音机器人交互系统:核心技术与应用挑战

          语音机器人交互系统是融合多学科技术的复杂工程,其核心目标是实现人与机器间的自然、流畅语音对话。该系统已广泛应用于智能客服、智能家居、企业助手等场景,其技术架构主要包含以下几
    的头像 发表于 09-02 11:08 993次阅读

    解锁高品质音频体验:探索音频质量评估与测试的科学之道

    流量,用于呼叫建立、媒体传输等全流程测试。同时,系统也支持用户自定义构建SIP信令和RTP媒体流,以模拟真实业务中的各种语音场景。 2. 在测试过程中,用户可以灵活选择音频输入方式,既可以使用
    发表于 07-22 11:15

    语音跳线和网络跳线区别

    语音跳线和网络跳线在传输信号类型、接口类型、线缆结构、应用场景等方面存在明显区别,以下是详细介绍: 传输信号类型 语音跳线:主要用于传输模拟
    的头像 发表于 06-27 10:09 1241次阅读