北京時間08月26日消息,中國觸摸屏網(wǎng)訊, 富士通研究所和富士通研究開發(fā)中心開發(fā)出了一種通過模擬人腦活動進行學習的手寫漢字識別技術(shù)。該技術(shù)的開發(fā)目的是,針對各種各樣的合同文件等,提高手寫文本數(shù)字化錄入工作的效率。
本文來自:http://www.zc28898.cn/touchscreen/news/dynamic/201308/26-24560.html
據(jù)富士通研究所介紹,傳統(tǒng)的手寫漢字識別技術(shù)是把筆畫的方向和數(shù)量信息作為文字的特征,由此來識別每個字,但存在的問題是,無法識別變形較大的文字,而且,通過“學習”來提高識別精度是個非常耗時的過程。
在文字識別必需的數(shù)據(jù)學習方面,此次的新技術(shù)使用的是與人腦內(nèi)部細胞架構(gòu)類似的分層神經(jīng)元網(wǎng)絡模型。對文字的特征從簡單到復雜地分層提取,像人類記憶文字的過程那樣捕捉文字的特征,不斷積累學習成果。識別時,根據(jù)學習到的文字特征,通過分析哪一特征對輸入的文字做出了反應得到識別結(jié)果并輸出。
研究人員使用并行處理能力強的GPU(圖形處理單元)來構(gòu)筑學習數(shù)據(jù),將傳統(tǒng)方法需要4個月的學習時間縮短到了約一周。另外,此次技術(shù)在第12屆文檔分析與識別國際會議(ICDAR2013 : International Conference on Document Analysis and Recognition)主辦的手寫漢字識別比賽中獲得了第一名,并以94.8%的文字識別精度創(chuàng)下了歷史最高紀錄。 順便一提,該技術(shù)還可用于識別日文。