欢迎来到天天文库
浏览记录
ID:38143303
大小:630.60 KB
页数:5页
时间:2019-05-25
《PDF转Word出现乱码解决方法》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、工具/原料Adobereader/Adobeacrobatpro软件SolidConverterPDF6/7软件ABBYYfinereader9/10软件步骤/方法1首先我们要明白这个转换出乱码是怎么回事?我们先用Adobereader或者AdobeacrobatPro软件打开我们会出现乱码的PDF文件,然后,菜单栏,文件--------属性--------字体项我们可以看到是不是文件内嵌了很多字体。我们这里找了一个文件为例:图中本文档中使用的字体就是文件内嵌的字体,由于PDF文件是可以内嵌字体的,所以你打开PDF文件的时候是先
2、读取内嵌的字体,如果内嵌的字体没有,那么再读取你系统中的字体来显示,然而WORD文件是直接读取系统中的字体的,那么如果你PDF文件中内嵌的某个或者某些字体在你的操作系统中没有,那么转换出来的word文件一般都会出现乱码。2知道了转换后为什么会出现乱码以后,现在我们找一个转换软件来测试转换结果,这里我们用AnyBizSoftPDFConverter2.5测试。转换完毕后我们打开得到的word文件看看会不会是乱码?我截取了其中一个典型的页面,大家可以看看和PDF原文的对比,转换成word后是一堆乱码。3接下来我们换一个转换软件,我们
3、使用SolidConverterPDF6/7软件。这款转换软件是灰常强大的一个PDF转换软件,转换效果很好,而且版面也保持的很好。而且在以前转换的使用过程中发现这个软件可以自动替换一部分PDF内嵌的字体,从而达到解决一些转换文件的乱码问题,但是这个软件不是能够解决所有的乱码问题,有时候转换出来的还会是乱码。比较惊喜的发现,用这个软件转换出来的虽然没有原文那样整齐,但是确实已经不是乱码了。如果你用这个软件处理出来不是乱码了,那么我们的目的就达到了,如果用这个软件转换出来还是乱码那么我们接着往下看。4如果SolidConverter
4、PDF搞不定的话,那么我们就只能用ABBYYfinereader这个软件对这个PDF进行OCR识别处理了。软件界面的设置如下图:转换的过程:如果中间出现错误什么的,会有提示的。转换完毕后我们打开转换好的WORD,截图,大家看效果:效果还是相当不错的~~~乱码解决了~~~效果甚至比SolidConverterPDF还好。总结:ABBYYfinereader几乎可以解决所有PDF转WORD乱码的问题,只要文件清晰度可以的话。OCR识别软件市面上有很多很多,但是ABBYYfinereader的混合识别能力和版面的保持能力是我见过的最好
5、的~~~~所以推荐个大家~~注意事项OCR识别存在着一定的错误率,这个和被识别文件的清晰度,分辨率有关系,文件分辨率高,清晰度好,准确率就高,反之,准确率就低,大家用ABBYYfinereader转换以后切记要和PDF原文内容校核一遍。我曾经遇到过PDF单词表,带有音标的,不管用什么软件转换,其他内容都是正确的,但是音标部分始终是乱码,遇上这种情况请你下载金山音标字体安装到你的操作系统中,然后你再重新转换一遍那个PDF文件即可完美解决。
此文档下载收益归作者所有