微软在Microsoft
Office
2003中的工具组件中有一个“Microsoft
Office
Document
Imaging”的组件包,它可以直接执行光学字符识别(OCR),下面笔者就为大家介绍利用Office
2003新增的OCR功能从图片中提取文字的方法。
第一步
我们需要安装“Microsoft
Office
Document
Imaging”的组件,点“开始→程序”,在
“Microsoft
Office
工具”
里点“
Microsoft
Office
Document
Imaging”
即可安装运行(如图1所示)。
第二步
打开带有文字的图片或电子书籍等,找到你希望提取的页面,按下键盘上的打印屏幕键(PrintScreen)进行屏幕取图。
第三步
打开Microsoft
Office
Word
2003
,将刚才的屏幕截图粘贴进去;点击“文件”菜单中的“打印”,在安装Microsoft
Office
Document
Imaging组件后,系统会自动安装一个名为“Microsoft
Office
Document
Imaging
Writer”的打印机。如图2所示,在“打印机”下拉列表框中选择“Microsoft
Office
Document
Imaging
Writer”打印机,其他选项无须额外设置,点击“确定”按钮后,设定好文件输出的路径及文件名(缺省使用源文件名),然后很快就可以自动生成一个MDI格式的文档了。
打开刚才保存的MDI类型文件(如图3所示),根据你的需要用鼠标选择文字内容(被选中的内容在红色的框内),然后单击鼠标右键,在弹出的快捷菜单中选择“将文本发送到Word”,即可将图片内容自动转换为一个新的Word文档,然后你就可以在Word文档中随心所欲地进行编辑了。
提示:如果你不想将转换的内容输入到一个新的Word
文档中,而是希望粘贴到一个已经打开的Word
文档,只需在上面的操作中点击右键菜单的“复制”,然后再到指定文档中执行粘贴即可。
以上是office工具
或者你也可以用photoshop软件处理
有。用尚书六号表格文字识别系统
下载地址: http://soft.fbook.net/SoftView.asp?SoftID=897
1 尚书六号能够识别多少种字体能不能识别繁体
尚书六号目前能够识别简体汉字的宋体仿宋体楷体
黑体圆体隶书隶变魏碑行楷等字体尚书六号还支
持简繁混排汉字的识别纯英文识别
2 尚书六号能够识别多少汉字
尚书六号的简体识别字集包括简体国标二级汉字共7000多
字繁体汉字识别字集包括简体二级字台湾繁体5401字和常
用的香港繁体字约10000字
3 尚书六号能不能识别竖排版的文件
尚书六号可以自动区分"横版"或"竖版" 并进行正确识别
4 尚书六号能不能识别表格
尚书六号可以识别印刷体表格尚书六号可以将表格识别
结果存为Microsoft Word的RTF格式或支持Excel的CSV格式还
可以存为HTML格式
5 尚书六号的识别率有多高
中文OCR的识别率在很大的程度上取决于扫描文本的图象
质量尚书六号对中上图象质量的文本的识别率在98%以上用
户熟练掌握扫描仪的背景亮度调节也对提高识别率有很大帮
助
汉王软件,识别率高
尚书。。。。。有很多破解版得提供下载!!
SHOCR60
尚书6,有很多!!
《尚书六号》汉字识别软件