高效的C編程之:C編譯器及其優化
本章將幫助讀者在ARM處理器上編寫高效的C代碼。本章涉及的一些技術不僅適用于ARM處理器,也適用于其他RISC處理器。本章首先從ARM編譯器及其優化入手,講解C編譯器在優化代碼時所碰到的一些問題。理解這些問題,將有助于編寫出在提高執行速度和減少代碼尺寸方面更高效的C源代碼。
本章假定讀者熟悉C語言,并且有一些匯編語言編程方面的知識。有關ARM編程的詳細信息,請參閱本書的相關章節。
14.1C編譯器及其優化
本章主要講解C編譯器在代碼優化時遇到的一些問題。要編寫高效的C語言源代碼,必須了解C編譯器對什么形式的代碼有所改動,編譯器涉及的處理器結構的限制,以及一些特殊的C編譯器的限制。
14.1.1為編譯器選擇處理器結構
在編譯C源文件時,必須為編譯器指定正確的處理器類型。這樣可以使編譯的代碼最大限度地利用處理器的硬件結構,如對半字加載(HalfwordLoad)、存儲指令(StoreInstructions)和指令調度(InstructionScheduling)的支持。所以編譯程序時,應該盡量準確地告訴編譯器該代碼是運行在什么類型的處理器上。有些處理器類型編譯器是不能直接支持,如SA-1100,這時可以使用與該類型處理器為同一指令集的基本處理器,比如對于SA-100,可以使用StrongARM。
注意 | 指定目標處理器可能使代碼與其他ARM處理器不兼容。例如,編譯時指定了ARMv6體系結構的代碼,可能不能運行在ARM920T的處理器上(如果代碼中使用了ARMv6體系結構中特有的指令)。 |
選擇處理器類型可以使用--cpuname編譯選項。該選項生成用于特定ARM處理器或體系結構的代碼。
如果name是處理器名稱。
·輸入名稱必須和ARM數據表中所示嚴格一致,例如ARM7TDMI。該選項不接受通配符字符。有效值是任何ARM6或更高版本的ARM處理器。
·選擇處理器操作會選擇適當的體系結構、浮點單元(FPU)以及存儲結構。
·某些--cpu選擇暗含--fpu選擇。例如,當使用--arm選項編譯時,--cpuARM1136JF-S暗含--fpuvfpv2。隱式FPU只覆蓋命令行上出現在--cpu選項前面的顯式--fpu選項。如果沒有指定--fpu選項和--cpu選項,則使用--fpusoftvfp。
14.1.2調試選項
如果在編譯C源程序時,設置了調試選項,這將很大程度地影響最終代碼的大小和執行效率。因為帶調試信息的代碼映像,為了能夠在調試程序時正確地顯示變量或設置斷點,包含很多冗余的代碼和數據。所以如果想最大限度地提供程序執行效率、減少代碼尺寸,就要在編譯源文件時,去除編譯器的調試選項。
以下選項指定調試表生成方法。
·-g(--debug):該選項啟用生成當前編譯的調試表。無論是否使用-g選項,編譯器都生成的代碼是相同的。惟一差別是調試表的存在與否。編譯器是否對代碼進行優化是由-O選項指定調的。默認情況下,使用-g選項等價于使用:-g-dwarf2--debug_macros。
注意 | 編譯程序時,只使用-g選項而沒有使用優化選項,編譯器會提示警告信息。 |
·--no_debug:該選項禁止生成當前編譯的調試表。這是默認選項。
·--no_debug_macros:當與-g一起使用時,該選項禁止生成預處理程序宏定義的調試表條目(Entry)。這會減小調試映像的大小。-gt-p是-gtp的同義字。
--debug_macros當與-g一起使用時,該選項啟用生成預處理程序宏定義的調試表條目。這是默認選項,會增加調試映像的大小。一些調試程序忽略預處理程序條目。
14.1.3優化選項
使用-Onum選擇編譯器的優化級別。優化級別分別為。
·-O0:除一些簡單的代碼編號之外,關閉所有優化。使用該編譯選項可以提供最直接的優化信息。
·-O1:關閉嚴重影響調試效果的優化功能。使用該編譯選項,編譯器會移除程序中未使用到的內聯函數和靜態函數。如果與--debug一起使用,該選項可以在較好的代碼密度下,給出最佳調試視圖。
·-O2:生成充分優化代碼。如果與--debug一起使用,調試效果可能不令人滿意,因為目標代碼到源代碼的映射可能因為代碼優化而發生變化。
c語言相關文章:c語言教程
評論