基于嵌入式系統的語音口令識別系統的實現
2.2 CDHMM算法
HMM是一種雙重隨機過程,用概率統計的方法描述語音信號的產生及變化過程。HMM的模型參數為λ=(N,M,π,A,B),其中,N為模型中馬爾克夫鏈的狀態數目;M為每個狀態對應的可能的觀察數目;π為初始狀態概率矢量,π=(π1,…,πN);A為狀態轉移矩陣,A=(aij)N*N;B為觀察概率矩陣,B=(bjk)N*N。
CDHMM的B不再是一個矩陣,而是一組觀察值概率密度函數,由M個連續高斯密度函數描述:
N(o,ujk,∑jk)為多維高斯概率密度函數,o是觀察矢量序列,即從語音中提取的特征矢量參數(o1,o2,…,ot),t為觀察矢量序列的時間長度。ujk,∑jk分別為高斯分布的均值和方差參數,Cjk為高斯分布的權值,滿足約束條件

CDHMM參數估計采用“分段K-平均法”。初始模型可以隨機選取,由
基于“分段K-平均法”的CDHMM參數估計具體過程為:
(1)設置模型參數初始值λ=(π,A,B)。
(2)根據此λ用Viterbi算法將輸入的訓練語音數據劃分為最可能的狀態序列,利用狀態序列估計參數A。本文引用地址:http://cqxgywz.com/article/151538.htm

(3)用分段K-平均法對B進行重新估計,即將第二步得到的每一種狀態的訓練語音數據搜集在一起并對其特征進行統計,從而得到B。
對于概率密度函數由若干正態分布函數線性相加的CDHMM系統,每個狀態θj(1≤j≤N)的概率密度函數bj(X)由K個正態分布函數線性相加而成,這樣可以把每一狀態語音幀分成K類,然后計算同一類中諸語音幀矢量X的均值矢量,方差矩陣∑jk和混合密度函數中各概率密度函數的權重系數Cjk。
(4)由(2)和(3)估計的CDHMM參數作為初值,利用重估公式對CDHMM參數進行重估,得到參數。
(5)利用(4)所得的計算,并與p(O/λ)相比較。如果差值小于預定的閾值或迭代次數超過預定的次數,即說明模型參數已經收斂,無需進行重估計算,可將作為模型參數輸出。反之,若差值超出閾值或迭代未到預定的次數,則將計算結果作為新的初值,重復
進行下一次迭代。
3 結束語
論文建立了一種基于嵌入式系統的語音口令識別系統,并且對上升、下降等14條口令進行測試,每條語音先切除靜音,預加重,然后通過Hamming窗分幀處理,幀長和幀移分別為20ms和10ms,然后對每一幀語音信號提取16MFCC+16AMFCC共32維參數作為特征矢量。該語音口令識別系統達到了實時的要求,可以使語音口令識別系統廣泛應用于便攜式設備中。







評論