a一级爱做片免费观看欧美,久久国产一区二区,日本一二三区免费,久草视频手机在线观看

新聞中心

EEPW首頁 > 嵌入式系統 > 設計應用 > 獨立于硬件技術的XC166單片機的DSP程序優化方法

獨立于硬件技術的XC166單片機的DSP程序優化方法

作者: 時間:2012-02-13 來源:網絡 收藏

  

本文引用地址:http://www.j9360.com/article/172110.htm

  1.4 指令流水線重排

  指令流水線重排的意思是通過軟件中的指令重排來改變指令流水線,以此來排除由于硬件引起的指令堵塞,從而加快的運行時間。這種操作通常用在匯編中,指令流水線重排是一個一般的原理,把這個原理用于不同類型的可以導出不同的與硬件相關的。下面介紹的基于的優化主要是應用這個優化原理得到的。

  2 與芯片相關的優化技術

  2.1 指令流水線

  單片機指令流水線共有7級,前兩級為取指令流水線,后5級為執行流水線,所有指令都必須經過5級執行流水線的每一級。

  第1級--指令預取。這一級根據預測順序,把指令從程序管理單元(PMU)取出,取出的指令在跳轉檢測單元進行前期處理,以檢測是否有跳轉,預測邏輯決定是否接收轉移。

  第2級--取指令。根據轉移預測規則計算出下一條被取指令的指針。對于零機器周期轉移,轉移合并單元先預處理,并將檢測到的轉移與正在執行的指令結合起來。預取出的指令存在FIFO緩存器中,同時,下一條要執行的指令輸出FIFO緩存器,進入執行流水線。

  第3級--譯碼。指令被譯碼,如需要,在間接尋址模式中,寄存器文件將被訪問,以讀取通用寄存器GPR。

  第4級--尋址。計算所有操作數地址,對于所有隱含訪問系統堆棧的指令,堆棧指針遞減或增加。

  第5級--存儲。所有需要的操作數被取出。

  第6級--執行。使用已取出的操作數進行MAC單元操作。對于非MAC單元指令,在這一級中,指令將由算術邏輯單元(ALU)執行。條件標志被更新,執行所有直接對CPU特殊功能寄存器CPU_SFRs進行寫操作的指令,在間接尋址時,作為地址指針的GPRs自動遞減或增加。

  第7級--寫回。所有外部操作數以及剩余的,在內部DPRAM空間內的操作器被寫回。定位在內部SRAM中的操作數進入寫回緩沖區。

  下面給出一個具體例子:

  

  

  上面程序的指令流水線如表1所列,(Tn表示機器周期)

  2.2 數據相關性排除

  在XC166的CPU中,由于指令流水線的設計要求,在使用通用寄存器(GPRs)的指令之間存在一些數據相互依賴的情況,盡管XC166單片機已經使用了專用硬件來檢測及解決數據相關性,但仍然有一些不可避免的數據相關性。在編程時,可以充分利用數據相關性來達到程序優化的目的,比如,在用GPR作為間接尋址指針時,如果PGR中的地址值被改變,間接尋址操作必須等待2個機器指令周期后,才能使用GPR作為地址指針尋址。在這種情況下,可以在這2個等待機器周期內插入2條其他單機器周期指令,充分利用這2個周期的等待時間以便程序更優化。

  下面舉一個例子:

  

  另外一種數據相關性發生在間接尋址訪問內存時,XC166單片機中的地址產生單元使用推測原理,在地址譯碼前,數據的讀取路經將根據歷史記錄表中選出;在歷史記錄表中,每個GPR都有一個入口。這些入口記錄了用相應GPR所訪問的內存空間情況。如果這種預測發生錯誤,讀取操作必須重新開始。

  因此,如果用GPR作為間接尋址,GPR最好能指向相同內存空間。如果更新后的GPR指向不同內存空間,下一個操作將出現訪問錯誤,讀操作必須重復,這就產生了指令流水線堵塞。例如:

  



評論


相關推薦

技術專區

關閉