基于TMS320DM3730的H.264編碼器移植與優化方法研
摘要:提出了一種在TI公司高性能數字信號處理器TMS320DM3730上進行H.264編碼器(即x264編碼器)移植與優化的方法,詳細描述了在CCS4.2開發平臺上進行x264編碼器移植工作的基本原理和需要注意的問題。為了提高編碼速度,針對DM3730處理器的結構特點,對x264編碼器進行了優化,主要方法包括編譯器優化、內存優化、C語言代碼優化及匯編代碼優化。對x264編碼器進行的CIF格式編碼測試結果表明,在均值信噪比略微降低的前提下,編碼速度得到了顯著提高,因此獲得了更優的編碼效率。
關鍵詞:TMS320DM3730;H.264標準;x264編碼器;移植與優化
H.264/AVC是ISO/IEC和ITU-T聯合推出的新一代的視頻編碼標準。其具有高壓縮率、高圖像質量、良好的網絡親和性等優點,被廣泛的應用于各個視頻相關產業中。在相同的圖像質量的前提下,和傳統的視頻標準MPEG-4相比,H.264的碼率只有MPEG-4的1/3。但是,H.2 64算法非常復雜,要實現實時編碼是比較困難的。因此,如何將H.264編碼器進行移植和優化,使其用于實際產品中成為了研究的熱點。
DSP芯片技術的快速發展為實現嵌入式多媒體技術提供了可能。TMS320DM3730(簡稱DM3730)作為TI公司2010年推出的高性能芯片,以其ARM+DSP結構體系、運算速度快、眾多多媒體接口等優點成為進行嵌入式系統開發首選平臺之一。
常用的H.264編碼器有JM編碼器、x264編碼器,T264編碼器,x264編碼器作為其中應用最廣,效率最好的編碼器,是進行嵌入式開發的首選H.264編碼器。故本文在DM3730數字媒體處理器上進行x264編碼器的移植與優化。本文首先介紹了DM3730的基本的結構和特點;然后結合DM3730的DSP,介紹了x264編碼器的移植和優化;最后進行編碼測試,結果表明編碼器移植的正確性,編碼速度得到了極大提高。
1 DM3730簡單介紹
DM3730數字媒體處理器是美國德州儀器(TI)推出的一款高性能達芬奇(DaVinci)芯片,由1 GHz的ARM Coretex—A8和800 MHz的TMS320 C64x+DSP Core兩部分組成,并集成了包括3D圖像處理器,圖像采集,USB2.0等模塊。其整體結構如圖1所示。
DM3730中ARM核作為主控制部分,負責整個芯片部分的設備的配置和控制、內存的分配、同外部接口的數據的交換;DSP核主要進行數據的處理和計算,其主頻高達800MHz,采用VLIW(超長指令字)體系結構,包含8個獨立的功能單元,每個功能單元在每個時鐘周期執行一條指令,最高運算速度高達6 400 MMACS(百萬乘法累加周期每秒)。同時擁有A、B兩個通用寄存器組。每個都有32個32-bits寄存器組成,每個通用寄存器都可以存放數據、地址和指針。
2 x264的移植
CCS(Code Composer Stdio)是TI公司提供的用于C語言開發的開發平臺,該平臺可以使用C語言進行DSP程序的開發。本文基于CCS4.2平臺進行x264編碼器的移植,具體流程如圖2所示。
評論