北京時間04月16日消息,中國觸摸屏網訊,
富士施樂于2013年4月12日宣布,該公司開發出了新型文字識別技術,通過模仿人腦的視覺信息處理方式,識別各種文字(圖1)。這項技術利用了大腦具備的“方位交差抑制性”,以及分級增加識別特征復雜度的特性。包括手寫文字在內,可識別多個語種的大約3萬個單字。
本文來自:http://www.zc28898.cn/touchscreen/news/front/201304/16-21198.html
文字識別分兩個步驟,一是在識別文字特征(線的朝向等)時,提取特征的粒度,分級增加復雜度。該步驟模仿的是大腦具備的初級視皮層(V1)、二級視皮層(V2)之類的分級構造。在大腦中,初級視皮層(V1)會對具有特定傾斜度的線段做出反應,二級視皮層(V2)則會對兩條線段組成的十字和夾角做出反應。
第二個步驟是在各個分級中,判斷提取的特征與已經學習的文字的特征是否吻合(線的傾斜方向是否一致等)(圖2)。在識別過程中,當某個特征存在明顯差異(線段的傾斜方向差別大,重疊時發生交錯等)時,考慮采用這一步驟。這模仿的是大腦的“方位交差抑制性”這一特性。有研究表明,大腦在受到不同特征的刺激時,會抑制自身對特征刺激做出的反應。
此次開發的算法分為利用方位交差抑制性的原理,判斷各個特征是否吻合的“子采樣部”,以及利用分級構造提取特征的“卷積運算部”兩部分,通過用這兩部分算法分級重疊、反復交叉實施來識別,最終判斷是哪一個文字。