3G 手機語音識別應用中DSP的選擇策略
除了DSP內核以外的其他要求
在選中最優化的DSP后,要想獲得高性能的ASR用系統級芯片還需要增加一些功能,例如快速緩存或快速指令/數據存取以及實時操作系統(RTOS)才能使ASR系統真正完成實時性能。多任務RTOS能使系統同時運行多個應用如雙通道語音識別,因此能極大地提高系統性能。
復雜SoC應用(如信道處理系統)設計工程師能從使用高效的高級語言編譯器的DSP和SoC中獲益,因為這些編譯器允許設計工程師使用C或C++語言進行編程。采用增強的片上仿真和調試功能還可以進一步縮短設計時間。對于3G移動手機應用中各層次的元器件與系統設計來說,除了實時性能和簡化設計流程外,功率管理控制同樣非常重要。在設計SoC時,選擇具有可調功率功能的內核將獲益非淺。例如當移動用戶在說話時,DSP需要全速運行(如300MHz)。當未使用ASR功能時,SoC電源管理電路可以逐步降低到較低的時鐘速度(如100MHz),從而有效地降低漏電和功耗。
由于ASR系統對計算速度的需求會根據識別特征的差異產生很大變化,例如孤字識別或連續語音識別、詞匯量和跟講者無關的語音識別等,因此,能支持ASR功能的信道處理系統的復雜性變化也很大。
SoC非常適合于構造芯片的基礎架構,因此在以客戶/服務器系統為中心的設計中是非常理想的選擇,但SoC器件由于功能太強大,因此并不非常適合于用戶端以終端為中心的設計。然而,隨著ASR系統的逐漸成熟以及3G手機支持越來越復雜的應用和復雜ASR,這類功能強大的SoC也能成功地運用到用戶端。
在SoC上使用多個DSP能使系統在完成語音識別的同時更容易地執行其它任務。例如三個內核中的一個可以專門指定用來完成多信道的服務器端ASR,而其它二個內核用于執行像語音信道和互聯網數據處理這樣的任務。將來如果手機鍵盤不復存在的話,ASR將成為用戶與手機之間的唯一接口,到時這一功能將占用大部分的工作時間。
采用多個DSP內核還能提供強大的計算能力,從而使執行非常復雜的ASR任務成為可能,如電子郵件聽寫中的連續語音識別、安全交易和VXML中的“口令+講者驗證”等。多個DSP再加上統一的大型片上存儲器可以極大地縮短跟講者無關的訓練過程,因為在統計型ASR中訓練過程的計算負載比識別處理過程的負載重得多。
本文小結
盡管3G手機要想贏得市場,人們對其功能和設計仍將拭目以待,但這些系統需要高性能的信號處理平臺以滿足多媒體任務需求是不容置疑的,而隨著ASR系統的不斷普及,3G手機肯定需要具備運行多任務能力的多DSP SoC作為解決方案。
評論