leescott 发表于 2023-3-7 15:29:43

ocr的校对

图像pdf直接可以做成词典。有时间,ocr再来做成文本一样的词典,更好。

一、pdf对照
(一)把已经ocr的pdf转换成双图层。保存为另一个pdf。
https://www.onelegal.com/blog/ho ... sing-adobe-acrobat/
如果没有make ocr,见这里最下面的方法。
https://community.adobe.com/t5/a ... flight/td-p/9193020
(二)两个pdf同时打开。窗口---平铺---垂直。后面的pdf只显示文本层。
或者只打开修改的pdf。窗口---新建窗口,再窗口---平铺---垂直。让一个pdf只显示文本层。
或者只打开修改的pdf。窗口---拆分,让pdf只显示文本层。(这个只有上下的模式。)
其实,第二步,还可以用文档比较,可以同步滚动。但是,我的软件比较的时候出问题,没有进去。

说明:acrobat自己ocr的,字体是Hidden Horz OCR。单选文本层,文字不可见。
这个用enfocus修改字体,可以显示。有些麻烦。可以试一试三的办法。



二、还想到一个办法,一边朗读,一边检查修改文本。



三、就校对来说,还可以把ocr的pdf导出为RTF。黑马校对2004(绿色)的HMCheck打开rtf,至少可以先检查一些错别字。校对保存。
然后,word里面一段一段选择朗读,对照pdf,检查修改为彩色字。最后,可以到pdf集中修改文字。
软件说明。解密版和Install似乎比较复杂,解密版的hmsc2004里面的安装文件可以在windows10运行。但是,我在word里面运行,没有成功。推荐绿色版。
**** Hidden Message *****










TJV 发表于 2023-3-7 20:46:20

谢谢分享经验

shuwushimang 发表于 2023-3-7 17:56:15

感谢分享

sg1968321 发表于 2023-3-7 18:32:46

谢谢分享。

yfz48516 发表于 2023-3-7 21:02:01

      OCR的校对是个大问题,可惜软件少,除了黑马校对2004,其他收费的不知校对率能有多少高?

江湖侠客 发表于 2023-3-7 22:24:43

看看啥内容

sparkler 发表于 2023-3-7 22:37:08

看看啥内容{:8_155:}

sparkler 发表于 2023-3-7 22:44:03

2004有点老了{:8_155:}

dliaas 发表于 2023-3-8 04:16:33

多谢!!

studyharding 发表于 2023-3-8 14:31:31

thank you for sharing.

Ydic 发表于 2023-3-8 16:13:42

谢谢你的经验分享

jonah_w 发表于 2023-3-8 16:15:16

感谢分享

北人无择 发表于 2023-3-8 16:38:58

谢谢分享方法

lwx228 发表于 2023-3-8 19:44:08

每次回帖、谢谢!辛苦了。

gjj 发表于 2023-3-9 08:06:14

批量ocr用什么软件识别率最高啊?

hzsfxy 发表于 2023-3-9 20:01:17

感谢分享

你去哪里 发表于 2023-4-1 01:06:28

谢谢作者,希望论坛还有重新开放的那一天!
页: [1]
查看完整版本: ocr的校对