基于ACELP語音編譯碼算法的軟件實現及應用
摘要:文中針對Tetra通信系統中采用的ACELP算法,分析了該算法的基本原理,介紹了其算法基于VC++6.0的軟件實現過程,重點闡述了ACELP在網絡通信中的實現及應用情況。
本文引用地址:http://www.j9360.com/article/201610/306455.htm隨著通信技術的快速發展,語音編碼技術發展越來越迅速、應用越來越廣泛。TETRA(Terrestrial Trunked Radio)集群通信系統是歐洲電信標準協會ETSI制定的數字集群移動通信標準。近幾年發展很快,其產品已被包括我國在內的世界多個國家廣泛采用。TETRA承載的語音通信業務采用ACELP語音編碼算法,該算法是一種改進型的CELP,它繼承了傳統CELP的主要優點,并克服了其缺點。傳統CELP用固定的隨機碼本來逼近語音信號的余量信號,缺乏靈活性,不能很好地控制碼本的頻域特性。ACELP采用代數碼本結構,不僅降低了碼本的存儲量和搜索量,還提供了頻域控制函數,從而增強了碼本的靈活性和多樣性,能更好地逼近余量信號,保證了高質量的語音服務。該算法占用帶寬較小,其編碼速率僅為4.567 kbps,同時編碼語音質量高,特別適合多媒體語音通信使用。目前該算法已有許多在嵌入式系統中實現的方案,但由于編譯環境以及硬件條件的限制,應用不夠靈活方便,因此本文基于Visual C++軟件編程技術,采用服務器與客戶端網絡通信模式,在服務器端采用聲卡對語音信號進行實時AD采樣,對采樣數據進行ACELP語音編碼處理,并將編碼后數據通過網絡實時發送到客戶端;在客戶端實時接收服務器端發送的語音編碼數據并進行軟件譯碼處理,同時將譯碼后數據采用聲卡進行實時播放,從而實現基于ACELP算法的網絡語音通信。
1 ACELP語音編譯碼算法的基本原理
ACELP是一種改進的代數碼本激勵線性預測算法,該算法要求輸入語音信號為8 kHz采樣、16比特量化,信號以30 ms分幀,每一幀分為4個子幀,每個子幀7.5 ms,每幀數據編碼后為137比特,包括線性預測參數、基音延遲T、最佳碼本索引和最佳增益參數。編碼器原理框圖如圖1所示。

編碼過程主要由短時預測、長時線性預測、碼本搜素和增益計算等組成。其中短時預測提取聲道濾波器的LPC系數并進行插值和量化;長時線性預測通常分為開環基音分析和閉環基音分析兩步,開環基音分析每幀數據(30 ms)處理一次,采用自相關法估算基音周期,按較低基音延遲優先的原則獲取基音周期的大致范圍,閉環基音分析基于子幀完成,每7.5 ms處理一次,以獲取基音周期的準確值;碼本搜索和增益計算主要用于計算合適的碼本和增益,使重建語音的質量具有更高的清晰度和自然度。
解碼過程就是將線性預測參數、基音延遲T、最佳碼本索引和最佳增益參數等各個編碼參數等從編碼比特流中提取出來,重構輸出信號和各個濾波器,最后得到重構語音。解碼過程以分幀為單位進行。首先將LSP矢量轉換為LP濾波器系數,然后通過基音延時查找基音的整數和分數分量,將激勵進行解碼,對解碼后的激勵信號通過后基音濾波器送入合成濾波器,得到合成信號。合成信號經過共振峰后濾波器和增益放大單元控制得到語音信號。其ACELP解碼原理框圖如圖2所示。

2 ACELP語音編譯碼算法的軟件實現概述
根據ACELP語音編譯碼算法原理.本文基于VC++6.0軟件平臺,采用面向對象思想,編制CTetra_ACELP_Cod類和CTetra_ACELP_Dec類分別實現語音信號編、譯碼。另外,本文采用動態鏈接庫方式對編譯碼類進行封裝,接口簡潔,使用方便。
2.1 CTetra_ACELP_Cod編碼類
該類為ACELP語音編碼類,主要實現對輸入該模塊的8 kHz采樣,16比特量化的語音樣點數據流進行編碼,類的主要函數定義如下:

其中Init(TETRA_ACELP_COD_PARAM*pCodParam)函數完成編碼模塊初始化工作,TETRA_ACELP_COD_PARAM結構體參數實時存儲編碼過程中相關參數。void PreProcess(Word16 signal[],Word16 lg)函數完成待編碼語音信號幀的預處理。ACELPCod(Word16 signal[],Word16parm[],TETRA_ACELP_COD_PARAM*pCodParam)函數完成語音編碼處理,signal[]參數為待編碼的語音樣本幀數據,parm[]為編碼后參數。Prm2 bi ts(Word16 prm[],Word16 bits[])函數實現編碼參數到比特流的轉化。
2.2 CTetra_ACELP_Dec編碼類
該類為ACELP語音譯碼類,主要實現對輸入該模塊編碼數據幀(137比特幀長)進行譯碼處理,輸出8KHz采樣,16比特量化的語音數據。類的主要函數定義如下:

其中Init(TETRA_ACELP_DEC_PARAM*pDecParam)函數完成譯碼模塊的初始化工作,TETRA_ACELP_DEC_PARAM結構體參數實時存儲譯碼過程中相關參數。Bits2prm(Word16 bits[],Word16 prm[])函數實現137比特幀數據到ACELP編碼參數的轉化。ACELPDec(Word16 parm[],Word16 synth[],TETRA_ACELP_DEC_PARAM*pDecParam)函數完成編碼參數的譯碼處理。編碼參數通過ana數組返回。PostProcess(Word16 signal[],Word16 lg)對合成語音進行后處理工作。
2.3 動態鏈接庫封裝接口介紹


其中bits為137比特編碼比特幀,signal為240*16bits的語音樣點數據,pCodParam和pDecParam為編、譯碼過程中的中間結構體參量。
3 ACELP編譯碼算法在網絡通信中的應用
采用網絡服務器、客戶端通信模式,將ACELP編譯碼模塊應用到網絡語音通信中,最終實現了基于ACELP算法的網絡語音通信。具體通信過程為:服務器端采用聲卡以8 kHz采樣,16比特量化方式對語音信號進行實時采集,對采集到的語音信號每240樣點作為一幀送入ACELP編碼模塊進行壓縮編碼,壓縮后編碼數據幀長為137比特,每幀數據進一步封裝處理后通過網絡實時發送到客戶端。客戶端通過網絡實時接收服務器端編碼語音數據包,經ACELP譯碼處理后實時發送到聲卡進行播放處理,從而實現網絡語音通信。
3.1 語音信號實時采集與播放技術實現
在語音信號實時采集與播放實現過程中,如何實現聲卡采集與播放數據的實時性、連續性和可靠性是軟件設計的關鍵所在。在本文軟件系統中,通過直接凋用Windows最底層波形音頻接口函數,實現聲卡的編程控制,系統中采用了多線程多緩沖技術,即在服務器端,聲卡采集與語音壓縮編碼使用不同的工作線程,同時給聲卡提供多個用于承載采集數據的緩沖區,在同一時刻部分緩沖區供聲卡采集線程裝載數據的同時,另外已經裝滿數據的緩沖區供語音壓縮數據處理線程處理,從而使得語音信號采集和壓縮編碼處理工作同時進行,有效保證了采集數據的連續性和信號處理的實時性。服務器端聲卡實時采集原理框圖如圖3所示。

3.2 網絡通信技術實現
軟件系統采用客戶/服務器模式和TCP/IP協議,利用Socket套接字編程技術實現數據接收與發送。其中數據接收模塊采用VC++的CSo cket類,具體通信過程為:1)程序啟動的時候在指定端口創建網絡監聽套接字,用以監聽客戶端的連接請求。2)當有客戶請求連接時,創建接收套接字與客戶端建立連接。3)當有數據需要接收時,CAcceptSocket響應OnReceive消息,調用Receive函數從緩沖里獲取客戶端傳來的數據,實時的交給ACELP譯碼線程進行譯碼還原處理。4)當通信結束時,關閉監聽套接字和接收套接字并釋放資源。數據發送接口采用SOCKET通信技術,為了使系統在實時編碼處理的同時及時將編碼數據發送到服務器端,軟件采用多線程技術;同時為了避免由于待發送數據流不均勻導致的數據幀丟失等情況發生,系統采用了多緩沖機制。主程序編碼模塊將要發送的編碼數據源源不斷的向緩沖隊列中寫,同時發送線程不斷的檢測緩沖隊列中緩沖情況,當有緩沖滿時及時進行發送。由于多線程與多緩沖機制的有效使用,使得網絡通信能夠實時高效的運行。
3.3 系統情況介紹
該系統實現了基于ACELP算法的網絡語音通信,能夠對通信過程中的語音波形樣本數據、ACELP編碼數據等進行實時存儲和網絡發送,對通行過程中的波形進行實時顯示等。系統運行穩定,延遲較小,語音通信質量較好。圖4所示為本文設計的軟件系統運行截圖。

4 結束語
文中研究了TETRA系統采用的ACELP語音編譯碼算法,在此基礎上基于VC++編程技術實現ACELP編、譯碼軟件模塊,并采用動態鏈接庫對其進行封裝處理,接口簡單,使用方便。最后開發相應系統,實現了ACELP編譯碼算法在網絡語音通信中的應用。經實踐證明,ACELP算法編碼質量高,性能優異,具有較好的應用價值。
評論