0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

解析多DSP的遥感图像实时压缩系统设计

电子工程师 来源:电子技术应用 作者:贺文静;胡坚;李子 2021-04-07 11:25 次阅读

0 引言

随着新型传感技术的发展,卫星遥感图像的分辨率迅速提升,数据量的爆炸式增长趋势为传输信道和存储空间带了极大的压力,因而,能否对遥感图像进行在轨实时高效压缩便成为制约遥感技术发展的一个关键问题[1]。目前,相对于基于离散余弦变化广泛采用的小波变换压缩算法具有非常好的抗误码性能,不过相对于早期的压缩算法,这类算法的复杂度明显提高,运算量和内存消耗增大[2],这对图像压缩处理系统提出了较高的要求。

FPGADSP在数据处理平台中发挥着日益重要的作用,FPGA擅长执行并行处理,而DSP擅长多算法任务和多条件操作等,因而采用FPGA和多片DSP的并行运算系统受到越来越多的关注。

为了探索遥感图像的机载实时压缩技术,本文首先根据遥感图像处理数据及流程特点,设计了2 FPGA+8 DSP的并行拓扑架构,并构建了机载实时处理硬件平台,最后基于该平台介绍了JPEG2000压缩算法的实现方法,实验结果表明该平台具有较强的遥感数据实时处理能力。

1 图像压缩系统设计

1.1 芯片选型

在本系统中,FPGA主要实现外部接口、逻辑控制和时序控制等功能,并承担部分数据处理工作,因此,需要具有较大的存储空间,支持PCIE接口设计,具备较多的逻辑资源实现图像预处理功能,并具有足够的I/O口为FPGA管理多片DSP提供管脚支持。本系统选用Xilinx公司的XC6VLX240T。

为了满足遥感图像实时压缩的要求,系统中选用的DSP要具有很强的定点和浮点运算能力;要具有高性能的互联接口;支持DSP之间、DSP与FPGA之间建立高速的数据通道;并且具有较大的内部存储空间,适应图像压缩过程中大量中间数据的高速缓存。因此本系统选用ADI公司的TS201。

1.2 并行互联方式

实现大规模运算的高速执行,需要借助多个处理单元同时运行来减少任务执行时间。并行技术可以体现在处理器内部、处理器级以及系统级等方面,处理器间的拓扑结构可分为两种[3]:(1)多处理器共享总线和存储器的紧耦合结构;(2)多处理器通过独立接口实现互联的松耦合结构。

紧耦合结构的优点在于提供全局物理地址空间,允许任何处理器对等访问全部存储器,便于程序设计。ADSP-TS201的主机接口可以支持最高64 bit位宽的总线共享,全局映射的统一寻址空间可实现多处理器及存储器间的无缝连接。但是,当处理器数目较多时,频繁的数据交换会产生严重的总线控制权竞争问题,从而导致系统运算效率降低,特别是在进行大数据量运算和大数据量通信时,这个缺点会极大地制约整个系统的运行效率。遥感图像的实时压缩是运算密集型、数据吞吐密集型的数据处理过程,紧耦合结构很难实现运算、存储、传输间的平衡,不利于实现复杂压缩算法的实时处理。

在分布式松耦合结构中,每片DSP通过独立的接口连接到FPGA,这样就能避免多个DSP同时访问FPGA时的数据冲突。FPGA与DSP间常用的接口设计方法主要有3种:(1)采用外部双口RAM;(2)在FPGA内部构建双口RAM;(3)通过DSP的高速传输接口。前两种连接方式中数据直接通过总线传输,且不涉及复杂的通信协议,接口设计比较简单[4],但是当芯片数量较多时,硬件设计中的管脚及布线压力会很大;

另外DSP的数据总线将同时用于与FPGA和与外部存储器通信,仍然会存在总线竞争风险。TS201可提供4路链路口,在采用4位并行方式传输时,可支持高达1.2 GB/s的双向吞吐率;数据通信可由处理器核控制,也可由DMA控制器控制,而不需要占用处理器资源,这能为FPGA与DSP、DSP与外部存储器以及DSP与DSP之间的高速数据传输提供便利,解决在数据密集型处理中这一制约系统整体性能的问题,因此,本系统将采用这种互联结构。

1.3 系统结构

本系统采用2片FPGA和8片DSP的拓扑结构,其结构框图如图1所示。8片DSP分为结构对称的2簇,构成两个并行的运算子模块。每簇内的4片DSP利用链路口点对点互联,并且每片DSP分别通过一个链路口与FPGA相连。2片FPGA各负责一个运算子模的任务和数据交互管理工作。这种拓扑结构使得簇内各DSP以及DSP与FPAG间都能实现高速互联,且增强了数据流的灵活性,可实现按任务划分的流水并行计算,也可实现按数据划分的分布式并行计算。

每片DSP都外挂4 M×32 bit的SDRAM作为外部存储空间,利用TS201内的SDRAM地址映射空间和外部接口,借助SDRAM控制器可轻松实现无缝连接,满足大量数据实时处理过程中的存储需求。DSP采用EPROM和链路口相结合的程序引导和加载方式[5],每簇外挂1片Flash,簇内其他DSP采用链路口形式,这种设计避免了给每片DSP配备Flash,降低了功耗和电路面积。

6356842630691979699527508.gif

1.4 FPGA程序设计

在本系统中,FPGA作为逻辑控制中心,主要实现以下几个功能:

(1)数据解包、切分、串/并转换、打包、分发等数据管理功能;

(2)数据缓存,利用DDR3 SDRAM乒乓作业的工作方式实现数据无缝缓存;

(3)快速流水协议,实现与TS201链路口进行高速通信;

(4)自定义接口协议,参考快速流水协议设计自定义协议,通过LVDS总线实现与另一片FPGA通信;

(5)数据预处理功能,利用内部DSP和逻辑资源实现数据预处理,发挥FPGA并行处理的运算优势。此外,系统中的FPGA_A还负责与上位机通信,因此,需要利用设计PCIE接口单元。FPGA_A中的逻辑结构如图2所示,FPGA_B采用相似的逻辑设计。

6356842633237279694362173.gif

2 JPEG2000压缩应用实例

JPEG2000作为新一代静止图像压缩标准,能在甚低比特率压缩时提供良好的率失真特性和主观视觉质量,并且具有非常好的抗误码性能,在星载遥感图像压缩领域受到越来越多的关注。

JPEG2000的基本编码过程为:源图像数据经正向预处理后进行离散小波变换(DWT),对变换后的DWT系数进行量化,再进行熵编码,最后根将熵编码后的数据组织成压缩码流输出[6]。

为了使程序在TS201上高效运行,从系统层、算法层、代码层三个不同层面上对JPEG2000压缩程序进行了优化[7,8],例如:优化DWT中的中间结果存储方式,在节约内存的同时减少访问时间;采用建立上下文索引表的方法减小嵌入式最优截断编码过程中的扫描运算量;适当修改数据类型,进行数据拼接存储,提高数据读写效率等。

2.1 DSP与FPGA接口设计

此外,系统的高效运行还依赖于高效的数据收发机制。DSP通过Link Port接口与FPGA通信,实现原始图像数据的接收和压缩码流的发送,本系统DSP中的发送和接收单元中分别采用了乒乓缓存+突发式DMA传输的设计方法。以数据接收单元为例,DSP中分配了3个缓存空间:input_buffer1、input_buffer2和input,其中,input_buffer1和input_buffer2以乒乓作业的方式缓存接收数据,input用于缓存预处理后的图像数据,以备后续压缩处理。

在接收数据时,DSP接收到FPGA的发送指令,便开启Link Port接口接收数据到Link Port Receive Buffer中,在接收到指定数据量后,Link Port接口自动开启DMA传输,将数据转移到input_buffer1中,并关闭Link Port口,以防止接收到错误数据。此后,DSP对input_buffer1中的数据进行数据类型转换等预处理,然后转存到input缓存区中。考虑到Link Port接收、DMA传输均需要耗时,而又可以不需要内核参与。

因此,设计了双通道乒乓作业的接收方式,这样在数据的突发传输任务中,可以配置好参数交给Link Port接口和DMA来独立完成,从而解放出内核的逻辑计算单元,使之专注于运算和判断。DSP内核在监测到本次DMA传输完成后,首先交换DMA接收端的选择指针,指向input_buffer2,再开启Link Port接口,便可以利用内核进行预处理操作了。处理过程中如果有新数据到来,硬件会自动完成接收操作并更改状态标识,内核只需要在完成当前处理后,查询其状态标识便可知道数据是否已经接收完成。如此循环,便可实现图像数据的快速接收。

2.2 软件设计流程

从系统层面来看,FPGA与其控制的4片DSP组成两个运算节点A、B,8个DSP之间执行以数据划分的分布式并行计算。FPGA_A通过PCIE总线接收源图像数据,解析包头获取任务信息并进行串/并转换、数据缓存、数据切分、将数据分发给DSP和FPGA_B等。DSP内的压缩处理以图像块为单位,在完成当前图像块数据的接收后,开始压缩处理并将压缩码流实时回传至FPGA,DSP内程序流程如图3所示。FPGA接收各DSP发送的压缩数码流数据包,再以图像块为单位进行码流重组、缓存,最终通过PCIE总线传输给上位机。

6356842641485879698245164.gif

3 实验结果

为了验证压缩系统的可行性,本文采用12 800×12 800的8 bit图像数据分别进行了2:1无损压缩和8:1高倍率压缩实验。图4所示为Lena图像和一副纹理复杂的城市场景遥感图像的无损压缩实验结果,可见系统具有较高的压缩质量。表1为应用本平台的JPEG2000压缩系统的性能测试结果,无损压缩时系统最高吞吐速率可达5.9 Mpixels/s,高倍率压缩时性能略有提升,最高吞吐速率可达6.2 Mpixels/s,可见,本系统具有较强的数据处理能力。

6356842645376679698260456.gif

6356842647654479696091060.gif

4 结论

本文首先分析了多DSP并行处理拓扑结构及片间互联方式,为了有效平衡系统运行速度、数据传输能力和板上存储空间三大因素,采用松耦合结构设计了基于2 FPGA+8 DSP的高速大容量实时压缩处理平台。最后,基于该平台实现了JPEG2000压缩处理。实验结果表明,该系统具有强大的数据处理和吞吐能力,能够为遥感图像实时压缩应用奠定技术基础。

参考文献

[1] 刘荣科,张晓林,廖小涛。星载遥感图像压缩编码技术综述[J]。遥测遥控,2004,25(2):7-12.

[2] 肖志东,肖明君,刘淼。基于小波变换的遥感图像压缩算法综述[J]。科技创新导报,2008(35):75.

[3] Wu Jie.分布式系统设计[M]。高传善,译。北京:机械工业出版社,2001.

[4] 唐垚,曹剑中,李变侠,等。高分辨率图像采集与压缩系统的设计实现[J]。科学技术与工程,2007,5(20):1510-1513.

[5] Analog Devices.ADSP-TS20x TigerSHARC processor boot loader kernels operation[Z].2004.

[6] ISO/IEC 15444-13:2008(E).Information technology-JPEG 2000 image coding system:An entry level JPEG 2000 encoder[S].2008.

[7] BISHOP S L,RAI S,GUNTURK B,et al.Reconfigurable implementation of wavelet integer lifting transforms for image compression[C].ReConFig 2006,IEEE International Conference on:1-9.

[8] LIAN C J,CHEN K F.Analysis and architecture design of block-coding engine for EBCOT in JPEG2000[J].IEEE Transactions on Circuits and Systems for Video Teehnology,2003,13(3):219-230.

编辑:jq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • dsp
    dsp
    +关注

    关注

    544

    文章

    7680

    浏览量

    344323
  • FPGA
    +关注

    关注

    1601

    文章

    21296

    浏览量

    593070
  • 数据传输
    +关注

    关注

    9

    文章

    1522

    浏览量

    63557
  • 三线耦合结构

    关注

    0

    文章

    2

    浏览量

    1652
收藏 人收藏

    评论

    相关推荐

    什么是被动遥感 被动遥感物理原理

    遥感传感器就像能看到更宽光谱的“天眼”,依赖于地物的光谱特性,在可见光波段分不清的地物,换到近红外波段,或者做个图像代数(近红外/红)就能分清,这也是遥感较之于普通航拍的主要优势。
    的头像 发表于 04-11 16:23 473次阅读
    什么是被动<b class='flag-5'>遥感</b> 被动<b class='flag-5'>遥感</b>物理原理

    基于门控线性网络(GLN)的高压缩比无损医学图像压缩算法

    实现基于门控线性网络(GLN)的高压缩比无损医学图像压缩算法,以提高医学图像存储和分发系统的效率。与“传统”的基于上下文的数据
    的头像 发表于 04-08 10:29 163次阅读
    基于门控线性网络(GLN)的高<b class='flag-5'>压缩</b>比无损医学<b class='flag-5'>图像</b><b class='flag-5'>压缩</b>算法

    电机仿真篇丨双电机实时仿真测试应用

    国内虚拟研究平台基于单电机设计,而实际工业中电机配合工作更为常见,如机器人、3D打印机等。电机同步控制在工业自动化生产系统中广泛存在,但目前基于FPGA纳秒级
    发表于 03-19 16:13

    基于大模型的遥感图像变化检测新网络

    高分辨率遥感图像已经成为复杂变化检测的有力工具。然而,在复杂场景中执行稳健的变化检测仍然是一个艰巨的挑战。变化检测聚焦“非语义变化”中的“有效变化”,即,由大气条件、遥感器、配准等引起的非语义变化,以及与下游应用无关的语义变化都
    发表于 01-12 16:42 385次阅读
    基于大模型的<b class='flag-5'>遥感</b><b class='flag-5'>图像</b>变化检测新网络

    如何将sigmastudio的compressor压缩限幅参数换算成DSP的设置值?

    如何将sigma studio的compressor压缩限幅参数换算成DSP的设置值(特别是压缩曲线各个点的参数如何得来)?另外,ADAU1452与ADAU1442的compressor算法控件
    发表于 11-29 06:43

    基于DSP的人耳图像识别系统的设计

    电子发烧友网站提供《基于DSP的人耳图像识别系统的设计.pdf》资料免费下载
    发表于 10-07 11:11 0次下载

    人体健康指标实时监测系统设计

    参量设备,并在Android智能手机平台上开发实时监测采集系统。并以体积小、功耗低、可实时监控等优点完成医院以及家庭医疗等条件下的家庭医疗的需求,充分实现了家庭医疗的
    发表于 09-27 07:06

    DSP的芯片架构解析 DSP的基本术语

    数字信号处理器 (DSP):Digital Signal Processor,用于高速实时信号处理(纳秒级别)、超低功耗处理,下游应用包括电源模块(OBC、逆变器)、电机控制、音频信号处理、图像信号
    发表于 09-24 10:12 1570次阅读
    <b class='flag-5'>DSP</b>的芯片架构<b class='flag-5'>解析</b> <b class='flag-5'>DSP</b>的基本术语

    如何用Python来实现图像压缩

    压缩图像 压缩图像的本质就是减少图像的大小和质量,从而减少图像占用的空间和带宽。我们可以通过以下几种方式来压缩图像: 改变
    的头像 发表于 09-12 17:33 604次阅读
    如何用Python来实现<b class='flag-5'>图像</b><b class='flag-5'>压缩</b>

    手持式地物光谱仪在遥感中的应用案例

    手持式地物光谱仪在遥感领域的应用广泛,以下是一些具体的应用案例: 1. 地面真实性验证 在遥感图像的解译和分类过程中,地面真实性验证(Ground Truthing)是非常关键的步骤。例如,科研人员
    的头像 发表于 09-05 14:23 359次阅读
    手持式地物光谱仪在<b class='flag-5'>遥感</b>中的应用案例

    TI DSP实时操作系统

    DSP/BIOS™是一个可定标的实时作业核心(kernel),特地为TMS320C5000™ 及 TMS320C6000™ DSP 的平台所设计。 DSP/BIOS 已被数以千计的客户
    的头像 发表于 08-07 16:55 645次阅读

    Ask调制压缩图像无线传输

    电子发烧友网站提供《Ask调制压缩图像无线传输.zip》资料免费下载
    发表于 06-29 09:17 0次下载
    Ask调制<b class='flag-5'>压缩图像</b>无线传输

    基于FPGA的实时图像边缘检测系统设计(附代码)

    今天给大侠带来基于FPGA的实时图像边缘检测系统设计,由于篇幅较长,分三篇。今天带来第一篇,上篇,话不多说,上货。 这里也超链接了中篇和下篇,方便各位大侠参考学习。基于FPGA的实时
    发表于 06-21 18:47

    基于FPGA的图像实时处理系统设计

    点击上方 蓝字 关注我们 由于现场实时测量的需要,机器视觉技术越来越多地借助硬件来完成,如DSP芯片、专用图像信号处理卡等。但是,DSP图像
    的头像 发表于 06-15 15:20 926次阅读
    基于FPGA的<b class='flag-5'>图像</b><b class='flag-5'>实时处理系统</b>设计

    基于稀疏分解的高光谱图像压缩方法

    高光谱图像压缩技术已经成为图像处理应用领域中最热点的领域之一,在许多领域都具备实际应用价值与发展前景。但
    的头像 发表于 05-20 17:03 822次阅读
    基于稀疏分解的高光谱<b class='flag-5'>图像</b><b class='flag-5'>压缩</b>方法