北京時間08月26日消息,中國觸摸屏網訊, 富士通研究所和富士通研究開發中心開發出了一種通過模擬人腦活動進行學習的手寫漢字識別技術。該技術的開發目的是,針對各種各樣的合同文件等,提高手寫文本數字化錄入工作的效率。
本文來自:http://www.zc28898.cn/touchscreen/news/dynamic/201308/26-24560.html
據富士通研究所介紹,傳統的手寫漢字識別技術是把筆畫的方向和數量信息作為文字的特征,由此來識別每個字,但存在的問題是,無法識別變形較大的文字,而且,通過“學習”來提高識別精度是個非常耗時的過程。
在文字識別必需的數據學習方面,此次的新技術使用的是與人腦內部細胞架構類似的分層神經元網絡模型。對文字的特征從簡單到復雜地分層提取,像人類記憶文字的過程那樣捕捉文字的特征,不斷積累學習成果。識別時,根據學習到的文字特征,通過分析哪一特征對輸入的文字做出了反應得到識別結果并輸出。
研究人員使用并行處理能力強的GPU(圖形處理單元)來構筑學習數據,將傳統方法需要4個月的學習時間縮短到了約一周。另外,此次技術在第12屆文檔分析與識別國際會議(ICDAR2013 : International Conference on Document Analysis and Recognition)主辦的手寫漢字識別比賽中獲得了第一名,并以94.8%的文字識別精度創下了歷史最高紀錄。 順便一提,該技術還可用于識別日文。