神經網絡預測編碼器的設計及應用
對Bayer圖像當前像素的預測可用下面兩式表示:
其中:(k,l)∈{(一3,O),(一2,一1),(一2,O),(一1,一2),(一l,一1),(一1,O),(O,一3),(O,一2),(O,一1)},x(i,j)為當前像素的真實值;互(i,j)是當前像素的預測值,e(i,j)是預測誤差。預測函數f用神經網絡實現。因此,輸入層有9個神經元。而網絡的輸出即是神經網絡預測器對當前像素的預測值,因此輸出層有1個神經元。
實際上,隱含層神經元數取決于訓練樣本數的多少、噪聲量的大小及網絡學習的輸入一輸出函數關系或分類關系的復雜程度。對許多應用場合均適用的一條有關確定隱結點數的規則即所謂的幾何金字塔規則(geometric pyramidrule):從輸入層到輸出層,結點數不斷減少,其形好似金字塔,如圖4所示。
本文通過大量實驗,最終確定神經網絡預測器的第一隱含層具有9個神經元,第二隱含層具有6個神經元。至此,神經網絡預測器結構已經確定,如圖5所示。
2.3 傳輸函數
在神經網絡圖像處理中,常使用的傳輸函數有兩大類:
(1)線性傳輸函數;
(2)非線性傳輸函數。
線性傳輸函數的變換較簡單,其輸出相對于輸入呈線性增長,因而函數輸入范圍較小,且它不具有可微分性,這對于具有非線性特性的圖像信息來說并不適用。經典的BP算法采用sigmoid函數,其輸出的動態范圍為[O,1],sigmoid和其導數為式1和式2:
評論