怎样从pdf中提取文字

如题所述

要实现pdf的提取就必须要用到百度网盘,功能强大,使用方法简单。是一款必备的软件。

 第一步,打开百度网盘主界面选择文档。 

第二步,在文档页面选择全部工具。

 第三步,在全部工具里找到,选择pdf提取。

 第四步,选择网盘中的的文件。pdf文件开始提取。

第五步,等待提取完成。

注意事项

百度网盘一次可以提取20张pdf的文件,现在还是免费使用的,除了提取pdf还能把pdf转换成各种你需要的文档,ppt,word,Excel都不在话下。

温馨提示:答案为网友推荐,仅供参考
第1个回答  2019-05-21
用OCR就可以了.
比如Office
2003中也提供了文字识别服务,结合那个Image
writer可以很方便将PDF转成WORD。
Office2003实现PDF文件转Word文档
经过尝试,发现可以利用
Office
2003
中的
Microsoft
Office
Document
Imaging
组件来实现PDF转WORD文档,也就是说利用WORD来完成该任务。方法如下:
用Adobe
Reader
打开想转换的PDF文件
,接下来
选择
“文件→打印”菜单,在打开的“打印”窗口中将
“打印机”栏中的名称设置为
“Microsoft
Office
Document
Image
Writer”,确认后将该PDF文
件输出为
MDI格式的虚拟打印文件

注:
如果没有找到“Microsoft
Office
Document
Image
Writer”项,使用Office
2003安装光盘中的“添加/删除组件”更新安装该组件,选中“Office
工具
Microsoft
DRAW转换器”。
然后,
运行
“Microsoft
Office
Document
Imaging”,并利用它来
打开
刚才保存的MDI文件,选择“工具→
将文本发送到Word
”菜单,在弹出的窗口中选中“
在输出时保持图片版式不变
”,确认后系统会提示“必须在执行此操作前重新运行
OCR
。这可能需要一些时间”,不管它,
确认
即可。
注:
对PDF转DOC的识别率不是特别完美,转换后会丢失原来的排版格式,所以转换后还需要手工对其进行排版和校对工作。
以上仅在
word2003
中可用,其他版本没有Microsoft
Office
Document
Image
Writer。
回答者:Kant康德
-
高级经理
七级
11-5
19:26
第2个回答  2014-02-28
工具/原料
一台可正常工作的电脑
安装有Adobe Acrobat X Pro软件
方法/步骤
>01
首先运行Adobe Acrobat X Pro软件,打开你要提取文字的pdf文档,
>02
定位到你想要提取文字的页面,选中,点击右键可以看到,当前页面是一张图片,
>03
在Adobe Acrobat X Pro软件工具栏右侧,依次找到工具——识别文本,
>04
点击“在本文件中”,弹出识别文本的窗口,为了方便,我选择了当前页面,设置中内容一般不用设置,如有需要可以点击编辑,更改设置项目,
>05
点击“确定”后,软件会自动分析当前页面,然后自动识别其中的文本,
>06
识别完成后,仍然停留在当前页面,不同的是,当再次选择其中的文本点击右键后,就能看到熟悉的复制,也可以选择“将选定项目导出为…”,
>07
复制完成后,将其粘贴到文本文档中或者你需要的地方就可以了,pdf中的文字就这样提取出来了。
注意事项
文中提到的软件可自行下载,按照上述步骤操作即可。本回答被提问者和网友采纳
相似回答