基于多核DSP互联架构的SAR处理研究与设计
摘 要: 提出了一种基于多核DSP互联架构的SAR成像处理方案。首先,介绍了一种基于方位子块插值的PFA实时成像算法。其次,研究了TI多核DSP TMS320C6678的处理性能,介绍了一种典型的RapidIO互联架构,并进一步提出基于该架构的SAR成像处理方案。最后,通过给出SAR成像结果并对比传统解决方案,证明了该处理方案的有效性和先进性。
0 引言
合成孔径雷达(SAR)是一种具有全天候、全天时、远距离获取地面信息能力的传感器。SAR具有防区外探测能力,在国境侦察、战场侦察和战场精确打击等应用中发挥着重要的作用,具有极高的军事价值[1]。SAR成像在高分辨率及高测绘带宽的指标需求下,距离方位二维数据量庞大,并且算法复杂,因此对信号处理系统的数据传输和实时处理能力提出了很高的要求。
传统的单核DSP架构限于点对点的连接方式,只能形成固定的拓扑结构,而且单核DSP的处理能力有限,提高系统实时处理能力只能通过多DSP间并行加流水的方式,导致系统规模巨大。系统规模的增加会带来如复杂性高、稳定性差、散热差、重量大等一系列问题,并且随着系统指标要求的提高,这种固定的拓扑架构已经接近极限。多核DSP架构除了提高单个DSP的处理能力,减少系统DSP数量,还支持RapidIO等高速串行总线,不仅满足了系统对数据吞吐量的需求,也提供了更灵活高效的互联模式。
1 PFA成像处理算法
在聚束模式合成孔径雷达中,由于天线波束始终指向固定的成像区域,因此产生了雷达相对于目标区域的转动。极坐标格式算法(Polar Format Algorithm,PFA)最早是作为一种有效的旋转目标成像方法提出的,很快该方法就被成功地应用于聚束模式SAR成像中,并且大大地提高了聚束SAR的聚焦成像范围[2]。
PFA是一种经典的聚束SAR成像算法,该算法采用极坐标格式存储数据,有效地解决了远离成像区中心散射点的越分辨单元走动问题,极大地提高了聚束SAR的有效聚焦成像范围。相比于其他算法,PFA算法具有简单高效、计算量小、实时性好和易于运动补偿等优点,广泛应用于SAR实时成像领域[3-4]。
本文采用PFA成像算法,流程如图1所示。
上述PFA算法在插值处理时需要存储大量数据,存储容量增加的同时还导致了成像时延变大。基于方位子块插值的PFA成像算法[5],将所有距离线的集合分割成若干互有重合的子集合,每个子集合作为一个子块,分发到相应的处理器进行插值处理,减少了的存储容量的要求,降低了成像延时。
2 TMS320C6678多核DSP处理模式与性能研究
2.1 多核DSP处理模式
TI推出新一代多核DSP TMS320C6678(C6678),内嵌8个核,核速率最大1.25 GHz,工业级芯片可达1 GHz,单核浮点运算能力最高可达20 GFLOP。C6678处理能力提高的同时还具备了更强的IO能力,其中RapidIO最高支持20 GB/s传输,以太网最高支持1 GB/s传输。该DSP的内存可分为本地内存(LL2)、共享内存(SL2)和片外内存(DDR)。其中LL2为512 KB,SL2为4 MB,DDR可寻址8 GB空间[6]。
常用的多核处理模式有两种,即主从模式和数据流模式,如图2所示。
(1)主从模式,即一个核做数据接收和分发,对其他核的处理进行管理,即1+N的工作模式;
(2)数据流模式,即处理按照数据的传输串行执行。
由于多核共享数据带宽,数据流模式仅适用于核间传输数据量较小的情况,而SAR处理数据量较大,因此采用主从模式。
基于C6678的多核主从模式如图3所示。由于缓存(cache)会占用一部分LL2的存储空间,剩余部分容量较小,所以LL2仅用于存储小数据量的常量;SL2用于保存各个核处理时使用的中间结果;DDR空间较大,可以存储DSP的输入、输出以及数据转角时需要存储的大量数据。
主核首先将接收到的DSP输入数据分配给相应的从核,再根据不同的处理启动从核进行相应的子处理,然后等待所有从核处理完毕,最后汇总从核的输出结果并发送给其他DSP。这种主从模式将DSP的处理与数据传输分离,简化了DSP间的时序关系,提高了系统的稳定性。
2.2 多核DSP处理性能研究
根据上述主从模式,以FFT运算为例,测试C6678多核并行处理性能。如图4所示,随着并行核数的增加,FFT处理时间也有所增加,这是由于多核共享SL2的数据带宽,从核并行处理时会产生竞争,导致DSP并行处理能力下降。因此,多核并行处理能力并不随着参与处理的从核数量的增加而线性增加。
根据PFA成像算法流程,以1+4主从模式(1个主核加4个从核)为例,测试了SAR处理中各子功能多核并行处理性能,并对比单核DSP TS201,结果如表1所示。由于两种处理器的主频、内存总线宽度、优化能力等都不尽相同,并且某些子功能不适于并行处理(如自聚焦迭代过程),C6678与TS201的处理能力并不是简单的4倍关系。
2.3 维护cache一致性
上文给出的结果,是在DSP使能cache的前提下得出的。对C6678来说,每个核都可以在LL2中开辟cache空间,在使能cache的情况下,每个核对SL2的读写操作都是在cache中进行的,这样极大地提高了内存读写效率。以4 096点FFT运算为例,使能cache的情况下耗时为68 μs,非使能cache的情况下则高达600 μs。
但是使能cache会导致cache一致性问题,cache一致性问题是指在含有多个cache的并行系统中,数据的多个副本因为没有同步更新而造成的不一致问题。这时需要软件来维护cache一致性,维护cache一致性的操作分为cache无效化和cache回写。例如当核A需要更新数据给核B时,核A首先要执行cache回写操作,使cache中的数据更新到内存中去,核B在读取核A更新的数据前要执行cache无效化操作,以保证从cache读取的数据和内存中一致。除了多核间维护cache一致性外,核与外设(如SRIO、EDMA等)间也要维护cache一致性,因为外设对内存的读写操作是不经过cache的。
3 基于RapidIO互联SAR实时处理系统设计
提高DSP的处理能力只是保证系统实时性的一方面,在典型的嵌入式系统中,瓶颈往往在于系统级互联,即各元件之间的通信速度。RapidIO互联架构消除了该瓶颈,它提供了一种高性能、分组交换的互联技术。目前C6678支持最高20 GB/s的传输速率。
图5所示为一个典型的多核DSP互联架构,板内DSP通过交换设备(SW)互联,板间又通过SW互联,从而组成一个RapidIO互联网络。传统的固定拓扑架构由于通信链路单一,使得系统内每个DSP都不可替代。而在这种互联架构中,DSP在系统内的逻辑位置都是等效的,可以方便地实现系统的重构。同时,该互联架构以4DSP板卡为最小单元,可根据系统的需求进行扩展。这种RapidIO互联架构使得软件设计不再受限于固定的拓扑结构,具有很高的重构性和扩展性。
为了充分利用多核DSP的并行处理性能,每个子功能模块需要尽可能地完成更多功能,这样也减少了子功能模块间即DSP间的数据传输,减少了流水级数,降低了系统的复杂度。
SAR处理时序如图6所示,补偿处理由于实时性要求高,需要4个DSP进行轮转处理,处理结果同样轮转发送到DSP_21、DSP_22和DSP_23 3个DSP进行子块插值和二维IFFT处理,DSP_21、DSP_22和DSP_23处理完毕后发送输出结果给DSP_24,DSP_24接收到所有子块结果后,产生复图像进行后续处理,最终产生图像并输出。
4 成像结果验证
图7所示为该SAR成像处理系统的验证平台,调试计算机通过以太网输入试飞获取的原始数据,经过处理系统进行SAR成像处理,成像结果如图8所示,图像分辨率为0.5 m。由图可见,该图像各个部位聚焦良好、细节清楚且层次丰富,验证了该成像系统的有效性。
传统的单核DSP架构,需要多达40个DSP才能勉强保证SAR成像处理的实时性,该多核DSP架构仅使用8个DSP即可满足需求,并且仍留有一定的余量(每个DSP仅使用5个核),相比之下,该多核DSP互联架构优势明显。
5 结 论
本文介绍了一种适于工程实现的实时SAR成像处理算法,重点研究了多核DSP(C6678)的处理模式、处理性能,并详细分析了多核DSP中cache一致性问题。根据研究结论,测试验证了SAR处理的子功能模块。随后,介绍了一种典型的RapidIO互联架构,设计并实现了基于该架构的SAR成像处理系统。结果表明,该系统相对于传统架构具有高效性、重构性和可扩展性。
参考文献
[1] 周峰,王琦,邢孟道,等.一种机载大斜视SAR运动补偿方法[J].电子学报,2007(35):463-468.
[2] 孙进平.机载聚束模式合成孔径雷达的成像算法研究[D].北京:北京航空航天大学,2001.
[3] 毛新华.PFA在SAR超高分辨率成像和SAR/GMTI中的应用研究[D].南京:南京航空航天大学,2009.
[4] CARRARA W G,GOODMAN R S,et al.Spotlight synthetic aperture radar signal processing algorithms.Artech House,Boston,1995.
[5] 李爱波,姜明,何涛.一种基于改进PFA算法的机载大斜视SAR实时信号处理系统设计[J].计算机工程与应用,2014.
[6] TMS320C6678 Multicore Fixed and Floating-Point Digital Signal Processor[J].USA:Texas,2011.
Ultra 9款比Ultra 7款便宜的12kg满配超轻薄本,有啥优缺点?
前些日子点评了ThinkPad X1 Carbon,关注的人很多,不过同样也有很多读者反馈说:对于普通的家用或个体购买,X1 Carbon的确偏贵,有没有价格更实惠且品质同样出色的国际大品牌超轻薄本呢?
答案是有的,华硕灵耀14 2024款就是不错选择,1.2kg超轻薄,5999元~6499元,同样是酷睿Ultra平台,且配置规格和性能表现其实比X1 Carbon更高。今天就来点评一下该机的优缺点。
特色和优点部分
●1.2kg超轻薄机型中,价格相对实惠
目前国内市面上的主流轻薄类机型,其实都有“高功率释放”倾向,最典型的就是小新Pro 14这类,其普遍重量在1.45kg左右。而要想14英寸做到1.3kg以内,则真的是“轻一两,值千金”——关键是这类超轻薄机型并不多见,所以“当代款”价格会明显高一头,而其中,5999元起,重1.21kg的(顶配款实测)的灵耀14 2024款反倒是价格相对实惠的。
注意,该机最近促销,京东自营平台上Ultra 9 185H款反而比Ultra 7 155H款便宜1元,所以Ultra 9款反而更有性价比!
· Ultra5-125H/32GB/1TB/2.8K OLED 京东5999元 拼多多N/A
· Ultra7-155H/32GB/1TB/2.8K OLED 京东6999元 拼多多5999元
· Ultra9-185H/32GB/1TB/2.8K OLED 京东6998元 拼多多6499元
●华硕的工艺质量宏观来说很靠谱
我们笔记本评测中很少会提到“质量、品质”。牛大叔我也经常在文章留言中告诉大家——因为评测的时间较短,所以媒体不可能对某一款笔记本的“品质”、“(长期)可靠性”给出准确答案。但我们评测过大量华硕的笔记本,从轻薄本到游戏本到顶级本到设计师本,极少遇到问题,因此宏观来说,华硕笔记本的工艺和质量是很靠谱的。
再举两个例:
第一个是2023年,因价格竞争过度激烈,厂商都开始在主流游戏本上省成本,导致市面上绝大部分品牌的主流价位游戏本,包含很多国际一线厂商的游戏本都出现了明显的质量问题。但华硕的主流价位游戏本天选系列却没爆出质量问题。
第二个例子就是这款灵耀14 2024。我们对比它和X1 Carbon 2024的考机情况就很说明问题:
▲这是ThinkPad X1 Carbon Ultra 7处理器的考机情况,其爆发功率54W,最高温度飙上了102℃。
▲这是灵耀14 Ultra 9款的考机情况,处理器封装功率最高也是54W(中途瞬间飙高到61W,但应该是初期几秒软件卡顿所致,未必准确),而最高温度仅91℃——是的,灵耀14 2024款的爆发功率稳定时间的确不及X1 Carbon 2024长,但这其实就反映出了“慎重”“求稳”的设计思路。
这里顺便也给大家说一下考机情况:室温24℃。我评测的是Ultra 9 185H款,处理器封装功率爆发阶段54W,但很快就降低到40W,然后是38W,稳定1分钟左右有降到30W。在考机2分半左右降到28W并保持稳定——最终处理器内部仅78℃。
●超轻薄本中“有点夸张”的应用性能表现
13.9mm/1.2kg的超轻薄本,主要应用自然不是“多核渲染”、“玩游戏”等重负载,而是日常办公、网页浏览、多媒体播放、图像编辑、轻量级视频剪辑等。所以我们直接上应用测试。而这个环节,各位也能一窥华硕笔记本的“高水平”:
·之前测试的X1 Carbon 2024在UL Procyon办公室生产力项目(基于Office四件套的应用实测)上的得分为5504分,超过了爆发/稳定功率释放77W/60W的小钢炮机型i5-13500H款联想小新Pro 14的5412分。而华硕灵耀14 2024的得分是6600分▼!
▲6600分是我们测试过的集显本中的最高分,超过X1 Carbon达20%,这个优势有些夸张了,毕竟该机的Ultra 9 185H和X1 Carbon的Ultra 7 155H都是6P+8E+2LPE/22T的处理器,理论性能差距按说并没有那么大。
▲UL Procyon照片处理,6678分,比X1 Carbon 2024的6270分高出6.5%。而爆发/稳定功率77W/60W的小钢炮机型i5-13500H款小新Pro 14的得分为5982,灵耀14 2024领先其11.6%。
这里再提请大家注意:从考机的功率释放曲线来看,灵耀14 2024的整体功率输出是略低于X1 Carbon 2024的,但这两项常见应用的得分却反超了。
▲最后来个对集显轻薄本压力较大的应用——视频编辑。准确说,UL Procyon的视频编辑考验的是高压力持续性能输出(视频导出环节)。得分3227分,也高于X1 Caron 2024的3159分。
总体来说,正如前面小标题所述,“在超轻薄本中,灵耀14 2024(Ultra 9款)的常见应用表现有点夸张”——这里面有来自酷睿Ultra平台的红利,也有华硕自身的实力。
●出色的2.8K OLED高刷屏
灵耀14 2024采用三星的100%DCI-P3/100%sRGB色域2880×1800分辨率OLED高刷屏,连Adobe RGB实测色域也高达96%。而这块屏的色准表现也相当优异,最高色彩偏差值ΔE也就1.9(48色测试),平均值仅为0.81!不过其亮度表现较普通,实测380nit左右。当然啦,室内是足足够用的。
●高端商用本级别的出色键盘/触控板操控
其实,作为华硕旗下高端轻薄本代表的灵耀家族,本来就有很多商用本的特质,比如屏幕可180°展平▲。而另一方面,你永远可以信任灵耀系列的键盘手感——不管它多轻薄。对该系列不熟悉的读者可能会觉得这有些“吹嘘成分”——但牛大叔我从来是有一说一,实际情况就是:不管灵耀本的尺寸、轻薄程度,其键盘的键程、手感一直是靠谱的(这也是我往往给不喜欢联想品牌的办公用户推荐华硕灵耀轻薄本的重要原因之一)!
落实到灵耀14 2024,其键盘外观设计倒是传统的华硕风格,除了按键个头大,按键间距大,似乎没什么特别。但如果你用一把直尺放上去,就会发现这些按键其实是有0.3mm左右弧面凹陷的——也正是这些弧面凹陷和较长的键程确保了舒适的手感▼。
还有个细节要说:其实银色键帽+白色背光的设计是“相当有风险的”,很容易导致“在较昏暗灯光环境下,开和不开键盘背光都看不清楚”。但灵耀14 2024没这个问题,其按键上的镂空字母个头大,且白色背光有三挡(注意,绝大部分厂商都把“关闭/1挡/2挡”算作“三挡背光”,但我这里说的是正儿八经有三级背光亮度),能适应各种光线环境。
该机触控板貌似顶级毛玻璃材质款,触感丝滑,可以很轻柔灵敏地操控。另外它个头很大,这一点比X1 Carbon的触控板讨喜很多。
简言之,灵耀14 2024乃至大部分灵耀轻薄本的操控舒适度是可以匹敌高端商用本的,很棒!
●两个超实用功能
IR人脸识别登录、摄像头背景虚化(目前新平台已能靠NPU运算)、屏幕亮度自动调节(环境光传感器),这些东西早已不稀奇就不赘述了。只说两个实用的功能:
第一个是 “键盘背光自动开/关”。这个功能靠的也是环境光传感器——大部分有环境光传感器的笔记本只用它来做屏幕亮度自动调节,但用它来决定键盘背光的自动开启和关闭才是实用价值更大的,体验更好更智能。
第二个是: 作为英特尔Evo认证机型,灵耀14 2024内置了“升级后的新版Unison”,也就是“英特尔官方推出的手机协同功能”。Unison早期版本相当糟,各种Bug基本没法用。但升级后的新版Unison绝对达到了可用水平——协同手机时速度快,传输速度也很快。这里多上几个图▼
▲作为“工程师思维”出来的软件,界面就别指望有啥美感了。功能也不多,就照片库、文件(无线)互传、短信/电话同步这几个,但都实用。说白了就是不用成天扭着手机一块6英寸屏折腾了,在笔记本上操作手机爽多了,而且(从手机)备份文件和照片既快又容易,不用通过微信(含PC版微信)的“文件传输助手”来回捣腾进而产生大量重复的垃圾文件!
另注意:英特尔Unison是安卓和iOS通杀的,厚道!
●大电池+酷睿Ultra平台=日常应用超长续航
1.21kg的14英寸超轻薄本里塞了一块75Wh大容量电池,得赞!而结合上酷睿Ultra平台的低功耗特性,该机的续航表现非常亮眼。咱直接上刺激的对比▼:
▲在线视频播放续航,腾讯视频的4K《碟中谍7》,灵耀14的续航长达815分钟!大家可能会觉得奇怪:57Wh和75Wh的差距也没有413分钟和815分钟(13小时35分钟)差距大啊,是灵耀14的成绩“意外偏高了”吗?其实不是,因为之前我们测试Ultra 5 125H/84Wh电池的联想小新Pro 16,这个项目的成绩是885分钟!所以,可以肯定的是,灵耀14的成绩是准确的!
▲本地视频播放续航,老规矩,Win11自带的“电影和电视”解码全屏播放720P MKV格式电影《LUCY》。搭载酷睿Ultra处理器的灵耀14倒是没与搭载13代酷睿H的机型拉开差距,在相同电池容量下(实际上小新Pro 14的电池容量为77Wh),基本打平——但接近20小时的本地视频播放时长也已相当夸张了!
▲办公续航测试,使用基于Office四件套的UL Procyon办公室生产力项目进行,得出的成绩15小时10分钟(910分钟),也是鹤立鸡群的存在——是的,这就是优化到位的酷睿Ultra机型+大容量电池诞生的魅力!
TIPS: 后续我们分析了和灵耀14对比,X1 Carbon(在单位电池容量下的)续航偏低的原因,可能与我们的测试顺序有关:灵耀14的续航测试是新机激活并完成系统升级后就测的;而X1 Carbon是在装了一大堆软件跑完了性能测试后才进行的,系统后台的干净程度不及新机。
这仨点可做得更好
人无完人,机无完机,下面列举可以进一步提升的点:
■该机的两个Type-C雷电4口(包含供电口)和HDMI口都布局在机身右侧,也就是“所有粗线缆接口都在右侧”。虽尽可能靠后远离用户了,但实际使用中多少会干扰到用户。后来,摸着持续满负载时凉爽的左侧C面,我似乎理解了设计师的用意——如果你要玩点游戏(算是持续高负载),让常用的左侧按键区域凉爽。但如此的超轻薄本,主要是轻负载,为什么非要考虑玩游戏这个点呢?总之,算是设计师的取舍吧!我不能百分百保证理解正确,请设计师指教。
■键盘自动背光等功能“藏太深”,不容易“挖掘出来”,建议和背光亮度调节一起合并到组合快捷键中并设计屏幕提示。
■在键盘区中的电源按键可设计一个和“麦克风禁用提示灯”一样常亮提示灯,防止用户误触。
一句话总结
搭载酷睿Ultra平台的华硕灵耀14 2024是综合表现相当优异的高品质14英寸主流价位高配超轻薄本,普通用户推荐京东购买Ultra 5款或拼多多平台购买Ultra 7款。
相关问答
那个是复制键复制粘贴的快捷键是什么电脑复制和粘贴的快捷键...alvin1314在绝大多数程序中,复制操作是Ctrl+C,粘贴操作是Ctrl+V。少数程序的快捷键定义不是这个,比如命令提示符中复制是回车键,粘贴是鼠标右键。有用(0)回...
上班族用于学习办公的笔记本电脑大家帮帮忙推荐一下哪个更好-...华硕顽石畅玩版R41414.0英寸笔记本电脑(i5-7200U4G500GBNV920MX2G独显HD白预装office2016)有用(0)回复lixu19961500左右随便...
怎么样才知道自己的显卡驱动要不要更新-ZOL问答7人讨论6678次围观关注问题写回答讨论回答(7)978689322你可以去找最新的驱动。找到后,你可以先在桌面上点右键,进入显示属性,选设置,再点高级,进入显卡的...
承租人能装修承租房屋吗-找法网立即咨询lj0n****b3qs1y10分钟前提交了咨询0kol****3x702e3分钟前提交了咨询e4t7****926wtq4分钟前提交了咨询7r6q****3a2fns7分钟前提交了咨...
联想笔记本电脑为什么在进入睡眠状态俩小时候,再次按开机键...联想Y400Y400N-IFI3人讨论407次围观关注问题写回答讨论回答(3)sdfgsfsffsaa楼主,还有指示灯的话,那是进入到待机状态,而不是休眠状态。只要按一下开机...
苹果笔记本连投影无法显示是怎么回事?-ZOL问答3、信号切换,普通电脑不用切换,投影机自己搜索,笔记本需要自己动手切换,一般是按Fn+F4键,你看你笔记本上面的F1-F8那个有双显示器的标志,就是那个键有用(0)回...
后备箱门打不开了,有什么方法能开门啊,谢谢了[回答]2008标志车后备箱打不开咋办啊?
a937r三极管参数?2N6678NPN12音频功放开关650V15A175W15MHZ2N6718NPN小铁音频功放开关100V2A2W50MHZ3DA87ANPN6视频放大100V0.1A1W3D...
【正方形ABCD的边长为8,M在DC上,且DM等于2,N是AC上一动点,则...[回答]在BC上取点P,使BP=2,连接DP,则DP的长度等于DN+MN的最小值证明:因为ABCD是正方形,所以AC平分∠BCD而CP=CM=8-2=6所以,AC垂直平分MP所以,MN=NP所以,DN...
家具英文单词怎么说_一起装修网furniture[ˈfɜːnɪtʃə(r)]n.家具例句:ThisoldAmericansquaretableisaveryvaluablepieceoffurnitu...