OCR是英文Optical Character Recognition的縮寫,意思為光學(xué)字符識別,通稱為文字識別,它的工作原理為通過掃描儀或數(shù)碼相機等光學(xué)輸入設(shè)備獲取紙張上的文字圖片信息,利用各種模式識別算法分析文字形態(tài)特征,判斷出漢字的標準編碼,并按通用格式存儲在文本文件中,由此可以看出,OCR實際上是讓計算機認字,實現(xiàn)文字自動輸入。它是一種快捷、省力、高效的文字輸入方法。
TH-OCR的突出特點
1.漢英雙語同時混排,識別率最高,居世界領(lǐng)先水平!
2.可以識別黑白、灰度、彩色圖像,可以讀取多種圖像格式。
3.首創(chuàng)對識別結(jié)果進行電子文檔版面復(fù)原功能,所見即所得。
4.首創(chuàng)日文、韓文、日英混排、韓英混排識別功能,識別率98%以上。
TH-OCR的六大優(yōu)勢
1. 是唯一可以識別2萬多漢字的多體文字識別系統(tǒng),漢字識別國內(nèi)最優(yōu)。
2. 漢字和英文混排、日文和英文混排、韓文和英文混排同時識別。
3. 漢字識別率最高。文通TH-OCR經(jīng)過"863"智能專家組對數(shù)十萬字的指標評測和中國軟件評測中心對產(chǎn)品的嚴格測試,識別正確率超過99.5%,代表了目前印刷體文字識別的最高水平。
4. 支持多種環(huán)境接口。文通TH-OCR支持WINDOWS環(huán)境和GB、BIG5、GBK、JIS、 SHIFT-JIS和KSC等多種內(nèi)碼,可以用于 WINDOWS NT和WINDOWS 98/2000/XP,適合全球各個地區(qū)使用。TH-OCR還具有自學(xué)習(xí)功能,不論什么生僻字,都可以通過鍵盤輸入進行學(xué)習(xí),大大拓寬了OCR系統(tǒng)的識別字符集。
5. 歷次國內(nèi)鑒定均被中國科學(xué)院院土和中國工程院院土等專家組成的鑒定委員會評定為“具有世界領(lǐng)先水平”。
廣泛的社會認可
1、 多年來為眾多著名的掃描儀廠商HP、UNISCAN、EPSON、CANON、 LENOVO等提供TH-OCR普及版作為其掃描儀的捆綁軟件。
2、美國MICROSOFT公司將TH-OCR作為東方文字識別捆綁到WINXP 操作系統(tǒng)中。
3、美國MOTOROLA公司確定TH-OCR的部分技術(shù)使用權(quán)。
4、美國INTEL公司確定TH-OCR為最新的MMX技術(shù)支持項目。
5、《計算機世界》市場調(diào)查結(jié)果,文通TH-OCR市場占有率達65%以上。
6、《中國計算機報》 CIWLAB組織的用戶調(diào)查認為, TH-OCR是一個性能極好的系統(tǒng),是一個值得用戶信賴的系統(tǒng)(對其他品牌OCR評價為:“是值得用戶選擇的產(chǎn)品”)。
如何使用清華紫光OCR
本站所有軟件,都由網(wǎng)友上傳,如有侵犯你的版權(quán),請發(fā)郵件[email protected]
湘ICP備2022002427號-10 湘公網(wǎng)安備:43070202000427號© 2013~2025 haote.com 好特網(wǎng)