高性能浮點DSP芯片TMS320VC33
摘要:TMS320VC33是美國TI公司新推出的TMS320C3X系列新一代浮點式數字信號處理器。它以高速、低功耗、低成本、易于開發為顯著特點。是通信、手機、MODEM、DVD、便攜式儀器儀表中需要進行俘點運算應用中的一種理想 的DSP器件。文中介紹了TMS320VC33的硬件結構、性能特點、指令系統、仿真工具和開發環境,最后給出了由TMS320VC33組成的最小應用系統。
本文引用地址:http://www.j9360.com/article/242270.htmTMS320VC33是TI公司新推出的TMS320VC3X系列新一代浮點DSP。它是在原來的TMS320C31浮點DSP的基礎上開發一個價格更低的版本(15US$),該產品以高速、低功耗、低成本、易于開發為顯著特點。由于它采用了內部1.8V、外部3.3V供電,因而功耗比原有型號降低了大約一個數量級,而且能支持高達150M/FLOPS的運行速率,是需浮點運行的便攜式產品應用場合中的一種理想的DSP器件。
1 TMS320VC33的硬件結構
TMS320VC33采用144腳LQFP四邊形封裝。表1所列是其引腳號與引腳名稱的對應關系表。圖1是其功能結構圖。它的主要性能如下:
表1 144腳LQFP封裝的TMS320VC33引腳號碼與引腳名稱的對應關系表
引腳號 | 名 稱 | 引腳號 | 名 稱 | 引腳號 | 名 稱 | 引腳號 | 名 稱 | 引腳號 | 名 稱 | 引腳號 | 名 稱 |
1 | A20 | 25 | Vss | 49 | Vss | 73 | D15 | 97 | Vss | 121 | INT1 |
2 | Vss | 26 | A3 | 50 | D31 | 74 | D14 | 98 | TCK | 122 | INT0 |
3 | A19 | 27 | A2 | 51 | D30 | 75 | D13 | 99 | TDO | 123 | CVDD |
4 | A18 | 28 | CVDD | 52 | D29 | 76 | D12 | 100 | TDI | 124 | EDGENIDE |
5 | A17 | 29 | A1 | 53 | DVDD | 77 | DVDD | 101 | CVDD | 125 | NCBK/MP |
6 | DVDD | 30 | A0 | 54 | D28 | 78 | D11 | 102 | TMS | 126 | Vss |
7 | A16 | 31 | DVDD | 55 | D27 | 79 | D10 | 103 | TRST | 127 | RESET |
8 | A15 | 32 | PAG3 | 56 | Vss | 80 | Vss | 104 | DR0 | 128 | SHZ |
9 | Vss | 33 | PAG2 | 57 | D26 | 81 | D9 | 105 | Vss | 129 | DVDD |
10 | A14 | 34 | Vss | 58 | D25 | 82 | D8 | 106 | FSR0 | 130 | EXTCLK |
11 | A13 | 35 | PAG1 | 59 | D24 | 83 | CVDD | 107 | CLKR0 | 131 | PLLVDD |
12 | CDDD | 36 | PAG0 | 60 | DVDD | 84 | D7 | 108 | DVDD | 132 | XOUT |
13 | A12 | 37 | DVDD | 61 | D23 | 85 | D6 | 109 | CLKR0 | 133 | XIN |
14 | A11 | 38 | H1 | 62 | D22 | 86 | DVDD | 110 | FSX0 | 134 | PLLVSS |
15 | DVDD | 39 | H3 | 63 | Vss | 87 | D5 | 111 | DX0 | 135 | CLKMD1 |
16 | A10 | 40 | Vss | 64 | D21 | 88 | D4 | 112 | Vss | 136 | CLKMD0 |
17 | A9 | 41 | STRB | 65 | D20 | 89 | Vss | 113 | TCLK1 | 137 | CVDD |
18 | Vss | 42 | R/W | 66 | CVDD | 90 | D3 | 114 | TCLK0 | 138 | RSV1 |
19 | A8 | 43 | DVDD | 67 | D19 | 91 | D2 | 115 | DVDD | 139 | RSV0 |
20 | A7 | 44 | IACK | 68 | D18 | 92 | D1 | 116 | XF1 | 140 | Vss |
21 | A6 | 45 | RDY | 69 | DVDD | 93 | D0 | 117 | XF0 | 141 | A23 |
22 | A5 | 46 | CVDD | 70 | D17 | 94 | DVDD | 118 | Vss | 142 | A22 |
23 | DVDD | 47 | HOLD | 71 | D16 | 95 | EMU1 | 119 | INT3 | 143 | DVDD |
24 | A4 | 48 | HOLDA | 72 | Vss | 96 | EMU0 | 120 | INT2 | 144 | A21 |
●具有高速的浮點運算能力,其中TMS320VC33-150型在13ns單周期指令執行時間時為150MFLOPS和75MIPS;而TMS320VC33-120型在17ns單周期指令執行時間時為120MFLOPS;60MIPS;
●帶有34k×32位(1.1M位)的片內雙靜態RAM,分為2個16k×32位塊和2個1k×32位塊;
●內含5倍頻的鎖相環(PLL)時鐘發生器;
●低功耗,在150MFLOPS下運行時,功耗低于200mW。
●帶有32位的高性能CPU;
●可進行16/32位整數和32/40位的浮點操作;
●具有四個內部譯碼頁選,可大大簡化與I/O及存儲器的接口;
●帶有啟動程序裝載功能;
●外部中斷可選擇邊沿觸發方式和電平觸發方式;
●具有32位的指令字,24位的地址線;
●內含8個擴展精度寄存器;
●片內存儲器可映射外設,其中包括一個串行口、2個32位定時器和一個DMA;
●采用TI公司的0.8μm Timeline TM制造技術;
●采用144管腳LQFP封裝;
●帶有2個地址發生器、8個輔助寄存器和2個輔助寄存器算術單元(ARAUs);
●具有兩個低功耗模式;
●支持2個或3個操作數指令;
●在一個單指令周期并行進行算術/邏輯單元(ALU)和乘法器運算;
●具有塊重復功能;
●可零開銷循環和單周期分支;
●具有條件調用和條件返回指令;
●總線控制寄存器配置選通控制等待狀態數;
●采用1.8V內核,3.3V I/O供電;
●具有符合IEEE 1149標準的片內掃描仿真接口(JTAG)。
圖2是TMS320VC33存儲器映像圖。
2 TMS320VC33的指令系統
除了個別在C32才有的外設和在C30才有的第二個外部端口以及第二串行口外,所有的C3XDSP代碼都是兼容的,因此它們都是基于同樣技術的浮點CPU。TMS320VC33的指令集就是以前的C3X指令集。共分為6個功能組:1.裝入與存儲指令;2.兩操作數算術/邏輯運算指令;3.三操作數算術/邏輯運算指令;4.程序控制令;5.互鎖操作指令;6.并行操作指令等。使用C3X指令集編程需注意以下幾個問題:
(1)延時轉移的使用
延時轉移在單周期內執行,而通常的轉移需要4個周期,不管轉移發生與否,后面的三條指令總是要執行的。如果后面的指令少于三條,則使用延時轉移時要再加上無操作指令(NOP),這樣可以節省機器時間。
(2)單指令/指令塊循環結構的使用
使用這種方式可以做到零開鎖循環,不過要注意RPTS是不可中斷的。
(3)并行指令的使用
在執行乘法時,可以并行執行加(減);在做乘法或算術/邏輯運算時,可以并行行執行存儲。以此來提高單周期內執行的操作個數。為了最大限度地提高效率,要注意并行指令中的尋址模式,并適當地安排數據。
寄存器是訪問存儲器的有效途徑。加強寄存器的使用,有助于使用并行指令,也有助于防止在各種尋址模式中使用寄存器時可能產生的流水沖突。
(5)高速緩存的使用
在與此同時片外慢速存儲器連接時,高速緩存的使用顯得特別重要。對于使用者來說,cache是透明的,只需將其使能即可。
(6)盡量使用片內存儲器
片內存儲器的訪問速度要快得多。在單周期內存儲器可以調出2個操作數,如果首先使用與CPU并行的DMA來將數據傳入片內存儲器,以可以最大限度地發揮其功能。
(7)避免流水作業時的沖突
在時間要求很苛刻的情況下,要確保不會因為沖突而丟失任何機器周期。為了驗證沖突的存在,可在開發工具上(軟、硬仿真器)對該程序進行跟蹤,以及時確認流水作業的沖突,再經認真分析沖突的原因,進而解決有關問題。
3 仿真工具及開發環境
由于所有C3X DSP具有相同的CPU,所以'C30、'31或'32上的程序可以很方便地移植到VC33上來使用,也可以用現有的C3X開發工具來編寫VC33程序。
TMS320C3X的開發工具有:
C3X軟件仿真器;
C3X優化C編譯/匯編器;
DSK(Design Starter Kit);
評估板EVM(Evaluation Module);
XDS510'C3XC source dedugger software;
XDS510 emulator hardware with JTAG;
C3X/C4XCODECOMPOSSORSTUDIO.
其中,C3X/C4XCODECOMPOSSORSTUDIO是一個集成的開發平臺,具有編輯、匯編、編譯、軟硬件仿真調試功能,是一個界面非常友好、功能完善的開發軟件.
4 最小應用系統
在采用TMS320VC33來組成應用系統時,首先要考慮TMS320VC33所具有的各種功能是否滿足應用系統的要求,如能滿足,則稱這樣的系統為最小系統.VC33由于其片內無ROM(或EPROM或FLASH),故其最小應用系統還應包括外接的EPROM或FALSH程序存儲器芯片.當最小系統不能滿足系統功能的要求時,需擴展ROM、ROM、I/O、A/D、D/A及其它所需的外圍芯片.DSP最小系統還包括沒有集成在芯片內的其它器件如晶體振蕩電路、復位開發和電源管理芯片等。
圖3為典型的TMS320VC33最小應用系統的電路原理圖,利用該電路可以實時在線對TMS320VC33芯片系統仿真開發和學習研究,其中TPS73HD301用于向VC33提供3.3V和1.8V的電源信號,并由外部電路提供15MHz的時鐘信號,當EDGEMODE接高電平時,為外部邊沿觸發中斷方式;MCBL/MP引腳為高電平時可使VC33工作于微計算機自引導方式,在這種方式下,TMS320VC33可從JTAG仿真口直接設定裝入程序運行,不過在應用系統由三個特定的地址裝入程序(BOOT1,BOOT2,BOOT3)或從串口裝入程序時,具體應用系統應視需要來設計確定。
評論