注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

小新之家

心灵的放松地点

 
 
 

日志

 
 

在图片中获取文字  

2010-12-01 23:30:31|  分类: 默认分类 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |
 方法一:Snaglt文字提取

  Sn.agIt是一款功能强大的图片捕 捉工具,但是很多朋友可能不知道,它 还有文字捕捉的功能,能将文字从图片中提取出来。目前它的最新版本为7.O。启动SnagIt 7.O,在左侧选中“窗口文字”(如图),在左侧选择输入位置(比如屏幕、区域、窗口等),输出位置(比如打印机、剪贴板、文件等)。设置完成后,.回到要捕捉文字的文件窗口,按下“捕获”快捷键,即可将文字提取出来。

  此时我们会发现提取的文字中有很多空格或出现段落错乱等情况,这时我们可以用文字编辑工具进行重新编排。这里以WPS Offi.ce 2003为例:将提取文字复制粘贴至新文档中,依次选择菜单“工具”→“文字”下的 “段落重排”→“删除段首空格”→“删除空段”命令,这时文章已经变得很整齐了。

文字识别工具

  文字识别工具简称OCR工具。这里我们以清华紫光OCR文字识别工具为例。打开带有文字的图片(如果是电子书籍,可按下“Print Screerl”屏幕捕获键将其保存为图片),根据所要提取的文字进行裁剪。启动OCR,打开已裁减的图片,用鼠标在图片中绘制出待识别的文字区域,按下工具栏“识别"按钮即可。文字识别结束后,会自动在一个文本编辑器中打开已提取文字,将结果复制粘贴至其他文档中即可。

方法二 利用Office 2003从图片中提取文字

Office在2003版中增加了Document Imaging工具,用它可以把文字给“抠”出来。 

(1)打开传真图片,用抓图软件SnagIt对相关的内容进行抓取,然后在“文件”菜单中选择“复制到剪贴板”命令(也可以用其他抓图软件,当然最简单的是Windows中自带的Print Screen键来抓取整个屏幕,然后在“画图”程序中对不要的部分进行裁剪并保存,然后复制)。 

(2)在“开始”菜单的“Microsoft Office工具”中打开Microsoft Office Document Imaging,在左侧窗口中单击鼠标右键,选择“粘贴页面”,把复制的图片粘贴到Document Imaging中,在“工具”中选择“使用OCR识别文本”,Document Imaging的OCR识别程序就会对图片进行识别,完成后选择“工具”中的“将文本发送到Word”,程序会自动打开Word文档,展现在你面前的就是从图片中“抠”出来的文字。

提示:一般而言,识别的准确率可以达到95%以上,但对英文和数字的识别不是太好。

而在大部分用户都有安装的Office 2003套件中,也附带有OCR功能的组件Microsoft Office Document Imaging。如果您有安装Office 2003,那么可以单击“开始”按钮指向程序组“Microsoft Office”中的“Microsoft Office 工具”选择“Microsoft Office Document Imaging”,即可打开。但Microsoft Office Document Imaging不是Office 2003默认的安装选项,所以在初次启用时如果该组件仍未安装,则需要插入Office的安装光盘进行安装,但整个安装过程将自动完成,您只需要按提示信息操作即可。

而在大部分用户都有安装的Office 2003套件中,也附带有OCR功能的组件Microsoft Office Document Imaging。如果您有安装Office 2003,那么可以单击“开始”按钮指向程序组“Microsoft Office”中的“Microsoft Office 工具”选择“Microsoft Office Document Imaging”,即可打开。但Microsoft Office Document Imaging不是Office 2003默认的安装选项,所以在初次启用时如果该组件仍未安装,则需要插入Office的安装光盘进行安装,但整个安装过程将自动完成,您只需要按提示信息操作即可。

  评论这张
 
阅读(263)| 评论(0)
推荐 转载

历史上的今天

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017