如何取出PDF中的文字

如题所述

首先使用SnagIt的文字捕捉功能将文字提取出来。启动SnagIt,选择菜单输入/区域,选择菜单工具/文字捕获。
然后我们打开要捕捉的文件窗口,按下捕捉快捷键,选定捕捉区域即可捕捉到文字。
用WpsOfficd2003打开提取文章;然后选择工具菜单下的文字\段落重排。
这时你会看到提取文章重新进行排版;接下来选择工具菜单下的文字\删除段首空格命令,使得文章的每段参差不齐的行首空格被删除;再选择工具菜单下的文字\增加段首空格,文章变为正常的书写格式;提取文章一般都留有空段,为删除这些空段,继续选择工具菜单下的文字\删除空段命令,这时文章完全变为我们所要的形式;用你熟悉的界面任意编辑(格式化)文章吧。
第二种方法:用屏幕截图然后让OCR软件识别。
打开带有文字的图片或电子书籍,翻页到你希望提取的页面,点击键盘上的捕获键(PrintScreen)进行屏幕捕获;打开Windows自带的画图工具,将刚才捕获的屏幕截图,粘贴进去,保存为一个.bmp文件;接着打开刚才保存的文件,在编辑器中进行修正,根据你所要提取的文字进行裁剪,尽量去除不要的部分;最后启动OCR软件,在OCR中打开刚才保存的修改文件,进行文字识别,然后可随心所欲进行编辑。
温馨提示:答案为网友推荐,仅供参考
第1个回答  2013-10-07
如果是文本的你直接在Adobe Reader里使用【文件】-【另存为文本】就行了,如果是图片格式的呢就需要使用SolidConvertPDF转换为Word文档的Doc文件,然后使用OCR软件识别的,但识别的出错率可能有点高,需要你手工修正了。]
第2个回答  2013-10-07
PDF文件中的文字一种是真正的文字,一种是扫描或拍摄的图片。图片可以用ocr软件识别。文字直接复制出来。 如果PDF文件做了保护可能不能直接复制,这时可以找破解PDF文件保护的软件]
第3个回答  2013-10-08
可编辑格式的,复制不可编辑的,抓屏,OCR文字识别]
第4个回答  2018-06-26
2016版微软office专业版办公软件就行!
相似回答