TMS320C6678 DSP的加载引导研究
摘 要 : 德州仪器公司(TI)推出的八核DSP芯片TMS320C6678是基于Keystone架构的高性能DSP器件,在高性能信号处理市场中得到了广泛应用。主要研究了TMS320C6678程序的加载,把TMS320C6678提供的几种加载模式按照实际应用和方便理解分成一次加载和二次加载,分别对一次加载和二次加载进行了研究和比对,最终为不同需求的加载提供了有效的参考。
0 引言
DSP芯片自从问世以来,以其低成本、低功耗、高性能的优点得到了广泛应用。作为TI最新推出的八核DSP芯片TMS320C6678[1-2],更是在高性能信号处理市场中占据大量市场份额[3]。为了适应市场的需求,其发展方向也在不断地发生变化。嵌入式系统的迅猛发展,使得TI公司在其开发软件CCS中开发DSP芯片的文件格式也在向兼容嵌入式系统的方向发展。在较新的CCS5.2版本中调试DSP6000系列程序生成的可执行文件格式最终过渡到了完全兼容Linux嵌入式系统的ELF文件格式[4]。由于DSP内部存储器比外部存储器的存取速度要快得多,但是内部存储器RAM中的数据是掉电易失的,因此DSP一般会在上电时通过固化到内部的ROM中的一段代码把外部存储器中的程序拷贝到内部RAM(具体到TMS320C6678是L2SRAM)中并运行,这段固化到ROM中的代码就叫RBL(ROM Bootloader)。外部存储器一般使用Flash、EEPROM等掉电非易失的材质。Flash存储容量大、价格便宜,在工程项目中得到了的广泛应用。因此,研究DSP的加载[5-6],研究怎样快捷方便地把ELF文件格式的调试程序代码烧写到外部存储器中,并在DSP上电时使用Bootloader把程序代码拷贝到内部存储器中被DSP正确识别并运行,这是很有意义的。
1 一次加载
目前关于TMS320C6678加载的文档资料较少而且讲得很凌乱,在经过研读其各种手册并且经过实际项目的检验,把TMS320C6678所提供的加载模式按照以下文章中提供的分类方法将各种模式分类会更容易理解。TMS320C6678的加载模式主要可以分为一次加载和二次加载。其中一次加载主要是兼容以前版本的DSP加载方式,主要特点是占用存储空间小,转换过程复杂;二次加载是较新的加载方式,主要特点是占用存储空间稍大一些,但是整体操作流程简单。
本文所使用的硬件是TI公司生产的DSP6678EVM开发板[7-8],所使用的软件是TI公司提供的CCS、MCSDK开发套件中的IBL(Intermediate Bootloader)和Flash烧写工具[9]。本文中定义一次加载为在DSP开机加载时使用RBL搬移外部存储器中的代码。因为IBL比RBL最主要的一个优势是搬移代码时不需要提前进行格式转换,可以自动识别和搬移ELF文件的格式。DSP TMS320C6678的一次加载同TI公司的较前期的产品6000系列和5000系列类似,主要是因为固化到核内部ROM中的Bootloader都大同小异,但是TMS320C6678 PG1.0的锁相环在ROM Bootloader中不能被锁定[10],因此在EVM6678开发板上FPGA首先会强制DSP TMS320C6678 boot时先把I2C EEPROM的0X51中的IBL拷贝到L2SRAM并运行IBL,配置好锁相环,然后再执行一次加载。IBL主要包含了参数的配置部分和不同存储器的代码搬移部分。也就是说一次加载运行了IBL代码的前一部分,配置完参数就重新跳转到RBL进行代码搬移的工作。所以烧写到外部存储器中的代码应该能让RBL识别,因此需要有一个格式转换的过程,然后再烧写到外部存储器中。
一次加载的过程如图1所示。开发板在上电之后,首先开发板上的FPGA采样boot模式的拨码开关,然后FPGA强制DSP从I2C总线的0x51地址启动拷贝IBL到L2SRAM,执行IBL,配置好锁相环,IBL从FPGA寄存器中读bootmode的值,如果不是二次加载,IBL把读到的bootmode值写入到DEVSTAT寄存器,如果是PCIE一次加载还需要配置PCIE工作环境,然后就在IBL中等待PCIE boot完成,如果不是PCIE boot而是从I2C的0x50 boot,IBL会直接从0X50 boot,否则IBL会直接跳入到RBL的起始位置并根据DEVSTAT寄存器的值进行相应的boot。
在一次加载中,想要boot的代码首先要先进行格式转换,转换成RBL可以识别的代码,同时要满足外部存储器件烧写格式的需求。使用TI提供的工具自己制作一个工具链就能完成[11-12],如图2所示。
rmd文件里面包含一些对Hex.6x操作的指令,首先用hex.6x把程序中有效数据按照指令剥离出来得到btbl文件,然后经过两个小工具得到ccs文件只包含各个段的内容,并不包含boot参数的任何内容,因此要给其配置参数头,由于RBL只识别大端模式,还要进行一次大小段的转换。最后把生成的文件烧写到外部存储器后断电,把boot开关拨到相应的位置,上电boot。
2 二次加载
查看IBL的源代码可以知道IBL主要被设计为两段Bootloader,即iblinit.c和iblmain.c,两个文件都有main函数,其中iblinit.c主要用来初始化锁相环,iblmain.c主要处理二次加载启动。TMS320C6678在上电boot时在IBL中读出bootmode是二次加载后会直接把该加载模式中对应的外部存储器中的代码搬移到L2SRAM并运行这段代码,完成boot。TMS320C6678提供的二次加载有I2C NOR Flash加载、I2C NAND Flash加载、I2C TFTP加载3种模式。
因为二次加载时是使用IBL进行代码搬移,所以二级加载时不需要格式转换,只需要把调试的.out文件后缀名改成.bin,使用MCSDK提供的烧写工具烧写到Flash中即可,IBL搬移代码时能自动识别。对比一次加载,二次加载不需要自己编写工具链,操作简便,虽然相比一级加载,ELF格式文件里面有一些无用信息会使得占用存储空间稍大一些,但是现在Flash存储空间足够大,价格便宜,因此二级加载相对更方便。
二次加载中的IBL代码其实就是一次加载中的放在外部存储器中的程序代码,所以使用二次加载前,要先把IBL代码按照一次加载的要求转换文件格式烧写到外部存储器件中。
3 结论
DSP TMS320C6678有一次加载和二次加载之分,最主要区别就是是否使用IBL中的搬移代码的功能,如果没有使用,则要对代码进行格式转换。如果外部存储器空间小对存储空间要求较高,建议使用一次加载;如果外部存储空间较大,推荐使用二次加载,过程简单。
参考文献
[1] Texas Instruments Corp. TMS320C6678 multicore fixed and floating-point digital processor user guide[EB/OL]. [2012-02-XX](2015-08-02). http://www.ti.com/lit/ds/symlink/tms320c6678.pdf.
[2] Texas Instruments Corp. TMS320C66x DSP corepac user guide[EB/OL]. [2013-06-XX](2015-08-02). http://www.ti.com/lit/ug/sprugw0c/sprugw0c.pdf.
[3] 庞娜,徐平江.基于多核DSP的MIMO雷达信号处理的实现[J].电子技术应用,2014,40(9):4-6,13.
[4] Texas Instruments Corp. Keystone architecture DSP bootloader user guide[EB/OL]. [2013-06-XX](2015-08-02). http://www.ti.com/lit/ug/sprugy5c/sprugy5c.pdf.
[5] 张乐年,关榆君.基于TMS320C6678的多核DSP加载模式研究[J].电子设计工程,2013,21(24):166-169,173.
[6] 沈发江.基于以太网的DSP网络加载技术研究[J].微型机与应用,2013,32(7):58-60,63.
[7] Texas Instruments Corp. TMDSEVM6678L EVM technical reference manual version 2.0[EB/OL].[2012-04-XX](2015-08-02). http://www.docin.com/p-673366367.html.
[8] Texas Instruments Corp. TI TMS320C6678 EVM board rev. 3A[EB/OL].[2012-04-XX](2015-08-02).http://www.ti.com/lit/df/tidrtt2/tidrft2.pdf.
[9] Texas Instruments Corp. BIOS MCSDK 2.0 user guide[EB/OL].[2015-04-XX](2015-08-02). http://processors.wiki.ti.com/index.php/BIOS_ MCSDK_2.0_User_Guide.
[10] Texas Instruments Corp. TMS320C6678 multicore fixed and floating-point digital signal processor silicon revision 1.0, 2.0[EB/OL]. [2015-05-XX](2015-08-02). http://www.ti.com/lit/er/sprz334h/sprz334h.pdf.
[11] Texas Instruments Corp. TMSC6000 assembly language tools v7.6 user′s guide[EB/OL]. [2014-04-XX](2015-08-02). http://www.ti.com/lit/ug/spru186x/spru186x.pdf.
[12] TMS320C6000 optimizing compiler v7.4 user′s guide[EB/OL]. [2012-06-XX](2015-08-02). http://www.ti.com/lit/ug/spru187v/spru187v.pdf.
TMS320C6678开发板( DSP+Zynq )RTOS综合功能案例,嵌入式必看
前 言
减少在产品开发过程中对DSP外设接口程序进行整合的难度,我们提供对DSP主要外设接口实现底层初始化的RTOS综合功能测试IFD(Integrated Function Demo)案例程序,助力有需要的朋友基于此IFD案例程序模板进行开发,加快项目研发进度。
本次测试板卡为TMS320C6678开发板,它是一款基于TI KeyStone架构C6000系列TMS320C6678八核C66x定点/浮点DSP,以及Xilinx Zynq-7000系列XC7Z045/XC7Z100 SoC处理器设计的高端异构多核评估板,TMS320C6678开发板每核心主频可高达1.25GHz,XC7Z045/XC7Z100集成PS端双核ARM Cortex-A9 + PL端Kintex-7架构28nm可编程逻辑资源,引出双路CameraLink、双路SFP+光口、四路千兆网口、双路SATA、双路PCIe、四路USB、双路CAN、双路CAMERA、HDMI IN/OUT、LVDS、LCD、RS485、RS232、Micro SD、HPC FMC等接口。
IFD案例主要功能为EEPROM、SPI FLASH和NAND FLASH等存储设备读写速率测试,以及PCIe、SRIO和Ethernet等外设接口测试,详细说明见下表。
表 1
设备/接口
测试内容
读写速率
EEPROM
数据读写速率及正确性
write:0.02MB/sread:0.04MB/s
NAND FLASH
数据读写速率及正确性
write:0.48MB/sread:0.80MB/s
SPI FLASH
数据读写速率及正确性
write:0.29MB/sread:1.27MB/s
DDR
数据写入速率及正确性
write:33351Mbps
PCIe
作为PCIe EP设备进行通信
write:690MBpsread:639MBps
SRIO(ZYNQ)
数据读写速率及正确性
write:12060Mbpsread:7616Mbps
Ethernet
IP地址动态获取
/
UART
串口回显
/
KEY
按键检测
/
本文档案例程序默认使用DSP端主频为1GHz的核心板,通过TL-XDS200仿真器加载运行进行操作效果演示。
硬件连接如下:
请通过Micro USB线将调试串口与PC机进行连接,打开串口调试终端SecureCRT并正确连接DSP端调试串口。如需测试Ethernet接口,请使用网线将评估板的千兆网口DSP SGMII0 ETH和DSP SGMII1 ETH分别连接至两个不同网段的路由器。如仅需测试一个网口,请将任意一个网口连接至路由器。如需测试PCIe接口,请使用ADT-Link公司的R22SR公对母PCIe信号交换线连接评估板PCIe EP(ZYNQ)金手指和PCIe RC(DSP)插槽,再加载案例bin目录下的axi_mig_pcie_demo_xc7z045.bit(ZYNQ端为XC7Z045)/axi_mig_pcie_demo_xc7z100.bit(ZYNQ端为XC7Z100)可执行文件至ZYNQ端后,再运行DSP端IFD案例。如需测试DSP与ZYNQ的SRIO通信,请先加载案例bin目录下的bram_srio_target_xc7z045.bit(ZYNQ端为XC7Z045)/bram_srio_target_xc7z100.bit(ZYNQ端为XC7Z100)可执行文件至ZYNQ端后,再运行DSP端IFD案例。
图 1
请运行IFD案例程序,DSP端串口调试终端将会打印如下测试结果。
备注:由于本次测试DSP与ZYNQ的SRIO通信,因此PCIe测试结果打印信息为"=== pcie test failed"。
图 2
EEPROM
测试数据大小为32KByte,读速率为0.04MB/s,写速率为0.02MB/s,误码率为0。
图 3
NAND FLASH
测试数据大小为128KByte,读速率为0.80MB/s,写速率为0.48MB/s,误码率为0。
图 4
SPI FLASH
测试数据大小为128KByte,读速率为1.27MB/s,写速率为0.29MB/s,误码率为0。
图 5
DDR3
测试数据大小为64MByte,写速率为33351Mbps,误码率为0。
图 6
PCIe
测试写速率为690MBps,读速率为639MBps,误码率为0。
图 7
SRIO(ZYNQ)
测试数据大小为64KByte,写速率为12060Mbps,读速率为7616Mbps,误码率为0。
图 8
Ethernet
实现TCP和UDP Sverver网络功能,串口调试终端同时打印动态获取到的IP地址。
图 9
UART
请在串口调试终端窗口输入任意字符,此时串口调试终端将会回显输入的字符。
图 10
LED
程序控制所有DSP端LED进行闪烁。
KEY
请按下评估板用户按键SW5,此时串口调试终端将会打印如下提示信息。
图 11
本次分享结束,后续还将分享更多关于DSP端、ZYNQ端、DSP + ZYNQ端等开发案例,包含多核DSP + ZYNQ架构通信教程,让大家都能解决多核开发瓶颈问题,感谢大家的关注,想要更详细的内容可以在评论区留言,一起交流下。
相关问答
那个是复制键复制粘贴的快捷键是什么电脑复制和粘贴的快捷键...10条回答:【推荐答案】在绝大多数程序中,复制操作是Ctrl+C,粘贴操作是Ctrl+V。少数程序的快捷键定义不是这个,比如命令提示符中复制是回车键,粘贴是鼠标右键。
一加手机5T适合重度使用吗?欢迎在点击右上角关注:「太平洋电脑网」,更多有趣资讯等着您哦。一加5T这么残暴的配置就是为了重度使用而生的,尤其是游戏。先看看一加5T的配置:在核心...而...