2010年12月20日 星期一

識別印刷文字(二)

統計識別與結構識別的結合
結構模式識別與統計模式識別各有優缺點,隨著我們對於兩種方法認識的深入,這兩種方法正在逐漸融合。網格化特徵就是這種結合的產物。 字符圖像被均勻地或非均勻地劃分為若干區域,稱之為“網格”。 在每一個網格內尋找各種特徵,如筆劃點與背景點的比例,交叉點、筆劃端點的個數,細化後的筆劃的長度、網格部分的筆劃密度等等。特徵的統計以網格為單位,即使個別點的統計有誤差也不會造成大的影響,增強了特徵的抗干擾性。 這種方法正得到日益廣泛的應用。

人工神經網絡
人工神經網絡(Artificial Neural Network,以下稱ANN)是一種模擬人腦神經元細胞的網絡結構,它是由大量簡單的基本元件-神經元相互連接成的自適應非線性動態系統 。 雖然目前對於人腦神經元的研究還很不完善,我們無法確定ANN的工作方式是否與人腦神經元的運作方式相同,但是ANN正在吸引著越來越多的注意力。

ANN中的各個神經元的結構與功能較為簡單,但大量的簡單神經元的組合卻可以非常複雜,我們從而可以通過調整神經元間的連接係數完成分類、識別等複雜的功能。 ANN還具有一定的自適應的學習與組織能力,組成網絡的各個細胞可以並行工作,並可以通過調整“細胞”間的連接係數完成分類、識別等複雜的功能。這是馮·諾依曼的計算機無法做到的

ANN可以作為單純的分類器(不包含特徵提取,選擇),也可以用作功能完善的分類器。 在英文字母與數字的識別等類別數目較少的分類問題中,常常將字符的圖像點陣直接作為神經網絡的輸入。不同於傳統的模式識別方法,在這種情況下,神經網絡所提取的特徵並無明顯的物理含義,而是儲存在神經物理中各個神經元的連接之中,省去了由人來決定特徵提取的方法與實現過程。從這個意義上來說,ANN提供了一種字符自動識別的可能性。 此外,ANN分類器是一種非線性的分類器,它可以提供我們很難想像到的複雜的類間分界面,這也為複雜分類問題的解決提供了一種可能的解決方式。

目前,在對於象漢字識別這樣超多類的分類問題,ANN的規模會很大,結構也很複雜,現在還遠未達到實用的程度。 其中的原因很多,主要的原因還在於我們對人腦的工作方式以及ANN本身的許多問題還沒有找到完美的答案

沒有留言:

張貼留言