基于ARM和Linux的字符采集與識別系統
2 圖像識別模塊
本文的目的是構建一個通用的字符識別系統,圖像采集模塊實現了對掃描件圖像數據的獲取。由于系統基于嵌入式Linux,使得后續的圖像處理與字符識別軟件設計可以脫離硬件系統獨立進行,具有較高的通用性,可以根據實際應用場合開發和擴展不同的識別軟件,本文僅探討手寫體數字識別的應用。
識別算法:
線性判別分析(Linearity Distinction Analysis,LDA)是有效的特征抽取方法之一,廣泛用于人臉識別和字符識別等領域。其基本思想是選擇使Fisher準則函數達到極值的一組矢量作為最佳投影方向,樣本在該矢量集上投影后,達到最大的類間離散度和最小的類內離散度。為找到投影軸,應最大化類間離散矩陣Sb和類內離散矩陣Sw的比值

其中,c表示為模式的類別數;μj表示為第j類的均值(其概率為Pj);μ0為全部樣本均值;*****為第j類模式i的h維向量;n是第j類的樣本數;N是所有樣本數。μj和μ0定義為

最優化問題可以通過Sb和Sw的特征值的求解而獲得。如果在樣本離散矩陣中非目標樣本占有比重較大,LDA并不能保證找到最優子空間。LDA的最優分類標準并不一定對分類準確性最優,有可能使得已經分開的鄰近類引起不必要的重迭。本文采用一種新的加權LDA方法(ILDA),其計算

顯然,如果σ(△)是個常數,在投影方向上,
實驗樣本取自手寫體通用數據庫UCI,在Bhattacharyya距離(BD)分類器下對加權線性判別分析與相應的算法進行實驗比較和分析,取得較好的識別性能,證實了該方法提取的特征的有效性。
3 結束語
本文采用嵌入式Linux和ARM處理器軟硬件平臺,利用CIS傳感器配合運動平臺實現了圖像的采集和存儲,為嵌入式字符識別系統構建了一個圖像采集平臺。在字符識別的應用方面,探討了廣泛應用的手寫數字識別算法,在已有的線性判別分析算法基礎上,提出了一種改進的加權線性判別分析算法,并對該算法進行了實驗驗證,獲得了較好的識別率。本文引用地址:http://cqxgywz.com/article/151002.htm












評論