TH-OCR是清华大学自1985年就开始研发的,TH是TsingHua(清华)的缩写,TH-OCR代表北京文通信息技术有限公司开发的OCR软件。在国家“863”计划支持下,持续了十多年的科研成果,从1.0版本开始已经升级到现在的9.0版本。
独家真正实现了汉英混排同时识别,在国际上首次突破了OCR产品只能处理汉字或英文单一文字的局限性,新增了东方文字(简繁汉、日文、韩文)识别功能,对日文和韩文与英文混排文档的识别水平甚至超过日本和韩国对本国文字的识别水平,在国内、外产生了重大的影响,并连续3年被中国软件行业协会评为优秀软件产品,成为汉字输入技术的一座里程碑。TH-OCR9.0版本已应用到了包括电子政务、电子出版物、报社、银行、邮政、税务、图书馆等多个领域,成为国内OCR市场的先锋。
你是否搞错了?OCR一般是一类软件,就是把图片上的字符辨认出来换成代码的。
例如,你有一本书,如果你用扫描仪扫出来的是图,文件比较大,还不方便重新修改排版,如果通过OCR处理一下,就可以转会word的文件格式,你可以打少很多字。
楼上的解释不错。问者。可以试试赛酷科技OCR。
清华紫光ocr
文字识别软件
借助扫描仪可将A4印刷文字导入电脑
文字识别软件
借助扫描仪可将A4印刷文字导入电脑