Tensilica發布四款用于SoC設計的視頻處理引擎
——
Diamond Standard VDO 引擎在處理器上通過軟件方式來實現所有視頻關鍵處理的功能,包括網絡抽象層(network abstraction layer,)、圖像層、條代層(slice layer)、比特流解析、以及熵解編碼,包括在H.264 Main Profile解碼器中進行CABAC(Context-Adaptive Bin
ary Arithmetic Coding)解碼。大多數其他解決方案都忽略了該功能,或采用獨立的復雜且不可編程的硬件模塊,或利用700MHz普通CPU來實現該功能(這種方法明顯增加功耗)。通過在指令集擴展中實現對CABAC的支持,Tensilica創造出一款低頻低功耗, 面積少于典型CABAC硬件一半的CABAC模塊。
Diamond VDO系列提供Baseline Profile和Main Profile兩種解決方案 –Main Profile提供更佳的數據壓縮率和視頻質量,是面向高級手機和PMP應用的D1或者更高分辨率的更好的編解碼機制。大多數其他的SoC視頻解決方案只實現Baseline Profile的視頻效果。
Tensilica總裁兼CEO Chris Rowen表示,“Tensilica已準備好向那些將開發高品質視頻產品的半導體制造商和系統 OEM公司提供全部經過測試的新產品解決方案。希望創造出象HiFi音頻引擎一樣的成功方案。HiFi音頻引擎已被廣泛應用于數十款流行的手機設備中,其中包括摩托羅拉公司最新KRZR和RIZR手機。”
基于Xtensa處理器技術的架構
為開發新的Diamond Standard VDO系列,Tensilica采用了Xtensa®可配置且可擴展處理器技術,創造了一個雙處理器的子系統模塊,包括一個集成DMA引擎,能以極低時鐘速率實現完整D1 Main profile的解碼和ASP編碼(完整的H.264 Main profile解碼僅需172MHz,而MPEG-4 Advanced Simple Profile (ASP)的解碼僅需156MHz)。
Diamond VDO雙核架構包括基于Xtensa架構配置得到的一個流處理器和一個像素處理器。流處理器指令集對視頻數據(熵解碼、運動向量的預測等等)的串行式處理進行了優化。流處理器需要32K字節的本地數據存儲器,40K本地指令存儲器。其指令的寬度優化到32位。像素處理器指令集采用SIMD(單指令多數據)技術,對像素數據的并行式處理進行了優化。像素處理器需要40K本地數據存儲器,24K本地指令存儲器。處理器之間的內部通信是通過一個128位的直連接口實現的,而外部視頻引擎接口通信是通過2個32位的總線實現的。
Tensilica在Diamond VDO系列中定義了400多條視頻專用指令,與通用DSP或通用32位微處理器相比,性能顯著提升。這些指令是針對視頻處理中性能要求苛刻的部分優化得到的,這些算法部分包括:CABAC,它可得到H.264 Main profile視頻的更高壓縮效果;CAVLC(Context-adaptive variable-length coding),是一種用于H.264 Baseline Profile和 Main Profile的低復雜度壓縮算法;Deblocking:去塊效應,可減少在高壓縮視頻碼流中的由塊效應所引起的失真;Transforms:各種變換(H.264中有很多種變換,在這是說支持多種變換)進行空間域的壓縮變換,類JPEG處理;運動補償和運動估計,用于在低速碼率條件下得到高質量畫面的算法。
Tensilica提供全套軟件包 —— 包括解碼器和編碼器
Tensilica針對新Diamond VDO引擎開發了編碼器和解碼器,客戶能直接從Tensilica購買到軟硬件完整的解決方案,SoC設計工程師不用依賴第三方應用提供商。Tensilica同時提供全套與之適配的軟件開發工具鏈,包括一個基于ECLIPSE框架的高級集成開發環境、一個世界級編譯器、一個周期精確(cycle-accurate)并兼容SystemC的指令集仿真器、以及完整的工業標準GNU工具鏈。另外,Tensilica廣泛的合作伙伴網絡提供操作系統、調試工具、ICE解決方案、以及其他有助于將Tensilica處理器快速設計進其產品中的支持。
基于處理器的視頻解碼的靈活性
新Diamond VDO引擎相比與基于硬件的視頻加速器和常規CPU結合的傳統方式會相當受歡迎。首先,Diamond VDO IP核減少了系統主控CPU的全部視頻解碼任務– 包括全部比特流解析。傳統的硬件加速器僅可減少如運動估計那樣的像素處理工作,而將大部分計算負擔(經常需要100MHz的持續的主控CPU開銷)交由系統控制器來完成。
第二,傳統解決方案包括了一個CPU和一個硬件加速器,當數據通過系統總線在CPU和加速器間進行傳輸時會產生大量的功耗 –通常出于方便,其他方案不計算這部分功耗,這樣使得他們宣
稱的硬件加速器模塊本身的消耗很低。
第三,當Diamond VDO引擎沒有被用于進行視頻處理時,可隨時以一種相當于有500多 Dhrystone MIPS處理能力的通用CPU 來執行其他系統任務 – 相反一個特定的視頻硬件模塊是不能被重用的。
第四,Diamond VDO引擎是可編程的,因此可支持今后出現的視頻標準。
最后,Diamond VDO引擎面積小,其面積在130nm工藝下僅有8mm2(包括處理器邏輯和內部存儲器)。
SoC的小面積低功耗解決方案
Diamond Standard VDO系列針對移動應用而優化,比其他競爭產品具有更小面積、更低的功耗。通過運用Xtensa處理器的一種特征-細粒度門控時鐘再結合可編程的電源管理指令(可以降低各種負載情況下視頻處理的功耗),其動態功耗被降至最低。進一步的能耗利用率的提升是通過DMA引擎和流處理器與像素處理器間的接口實現,而后者令外部存儲器帶寬要求降至最低。在節省面積方面,例如,Diamond 383VDO,其面積包括存儲器僅占10 mm2;全功能Diamond 388VDO可在D1分辨率下,提供完全的H.264 Main profile解碼和MPEG-4 ASP編碼的支持,而其包括存儲器的面積僅有 12 mm2,且在TSMC 0.13G工藝技術下運行速度為200MHz。
評論