FPGA/CPLD 的設計思想與技巧
乒乓操作

“ 乒乓操作 ” 是一個常常應用于數據流控制的處理技巧,典型的乒乓操作方法如圖 1 所示。
乒乓操作的處理流程為:輸入數據流通過 “ 輸入數據選擇單元 ” 將數據流等時分配到兩個數據緩沖區,數據緩沖模塊可以為任何存儲模塊,比較常用的存儲單元為雙口 RAM(DPRAM) 、單口 RAM(SPRAM) 、 FIFO 等。在第一個緩沖周期,將輸入的數據流緩存到 “ 數據緩沖模塊 1” ;在第 2 個緩沖周期,通過 “ 輸入數據選擇單元 ” 的切換,將輸入的數據流緩存到 “ 數據緩沖模塊 2” ,同時將 “ 數據緩沖模塊 1” 緩存的第 1 個周期數據通過 “ 輸入數據選擇單元 ” 的選擇,送到 “ 數據流運算處理模塊 ” 進行運算處理;在第 3 個緩沖周期通過 “ 輸入數據選擇單元 ” 的再次切換,將輸入的數據流緩存到 “ 數據緩沖模塊 1” ,同時將 “ 數據緩沖模塊 2” 緩存的第 2 個周期的數據通過 “ 輸入數據選擇單元 ” 切換,送到 “ 數據流運算處理模塊 ” 進行運算處理。如此循環。
乒乓操作的最大特點是通過 “ 輸入數據選擇單元 ” 和 “ 輸出數據選擇單元 ” 按節拍、相互配合的切換,將經過緩沖的數據流沒有停頓地送到 “ 數據流運算處理模塊 ” 進行運算與處理。把乒乓操作模塊當做一個整體,站在這個模塊的兩端看數據,輸入數據流和輸出數據流都是連續不斷的,沒有任何停頓,因此非常適合對數據流進行流水線式處理。所以乒乓操作常常應用于流水線式算法,完成數據的無縫緩沖與處理。
乒乓操作的第二個優點是可以節約緩沖區空間。比如在 WCDMA 基帶應用中, 1 個幀是由 15 個時隙組成的,有時需要將 1 整幀的數據延時一個時隙后處理,比較直接的辦法是將這幀數據緩存起來,然后延時 1 個時隙進行處理。這時緩沖區的長度是 1 整幀數據長,假設數據速率是 3.84Mbps , 1 幀長 10ms ,則此時需要緩沖區長度是 38400 位。如果采用乒乓操作,只需定義兩個能緩沖 1 個時隙數據的 RAM( 單口 RAM 即可 ) 。當向一塊 RAM 寫數據的時候,從另一塊 RAM 讀數據,然后送到處理單元處理,此時每塊 RAM 的容量僅需 2560 位即可, 2 塊 RAM 加起來也只有 5120 位的容量。

另外,巧妙運用乒乓操作還可以達到用低速模塊處理高速數據流的效果。如圖 2 所示,數據緩沖模塊采用了雙口 RAM ,并在 DPRAM 后引入了一級數據預處理模塊,這個數據預處理可以根據需要的各種數據運算,比如在 WCDMA 設計中,對輸入數據流的解擴、解擾、去旋轉等。假設端口 A 的輸入數據流的速率為 100Mbps ,乒乓操作的緩沖周期是 10ms 。以下分析各個節點端口的數據速率。
A 端口處輸入數據流速率為 100Mbps ,在第 1 個緩沖周期 10ms 內,通過 “ 輸入數據選擇單元 ” ,從 B1 到達 DPRAM1 。 B1 的數據速率也是 100Mbps , DPRAM1 要在 10ms 內寫入 1Mb 數據。同理,在第 2 個 10ms ,數據流被切換到 DPRAM2 ,端口 B2 的數據速率也是 100Mbps , DPRAM2 在第 2 個 10ms 被寫入 1Mb 數據。在第 3 個 10ms ,數據流又切換到 DPRAM1 , DPRAM1 被寫入 1Mb 數據。
仔細分析就會發現到第 3 個緩沖周期時,留給 DPRAM1 讀取數據并送到 “ 數據預處理模塊 1” 的時間一共是 20ms 。有的工程師困惑于 DPRAM1 的讀數時間為什么是 20ms ,這個時間是這樣得來的:首先,在在第 2 個緩沖周期向 DPRAM2 寫數據的 10ms 內, DPRAM1 可以進行讀操作;另外,在第 1 個緩沖周期的第 5ms 起 ( 絕對時間為 5ms 時刻 ) , DPRAM1 就可以一邊向 500K 以后的地址寫數據,一邊從地址 0 讀數,到達 10ms 時, DPRAM1 剛好寫完了 1Mb 數據,并且讀了 500K 數據,這個緩沖時間內 DPRAM1 讀了 5ms ;在第 3 個緩沖周期的第 5ms 起 ( 絕對時間為 35ms 時刻 ) ,同理可以一邊向 500K 以后的地址寫數據一邊從地址 0 讀數,又讀取了 5 個 ms ,所以截止 DPRAM1 第一個周期存入的數據被完全覆蓋以前, DPRAM1 最多可以讀取 20ms 時間,而所需讀取的數據為 1Mb ,所以端口 C1 的數據速率為: 1Mb/20ms=50Mbps 。因此, “ 數據預處理模塊 1” 的最低數據吞吐能力也僅僅要求為 50Mbps 。同理, “ 數據預處理模塊 2” 的最低數據吞吐能力也僅僅要求為 50Mbps 。換言之,通過乒乓操作, “ 數據預處理模塊 ” 的時序壓力減輕了,所要求的數據處理速率僅僅為輸入數據速率的 1/2 。
通過乒乓操作實現低速模塊處理高速數據的實質是:通過 DPRAM 這種緩存單元實現了數據流的串并轉換,并行用 “ 數據預處理模塊 1” 和 “ 數據預處理模塊 2” 處理分流的數據,是面積與速度互換原則的體現!
評論