|
0. 对所有的词典图片进行统一的精细处理$ z) ?6 k- _) Y F$ r
1. 使用本论坛 @孤影 的工具软件,配合按键精灵脚本,对图片自动划线,获取所有词头的坐标# S; A* I% {' E7 {7 ?- w! R% n8 h, g
2. 使用OCR自动切片导出,得到所有图片的所有词头的切片
7 E# R" H2 n" l' z5 {5 O& Q3. 新建一个图片(大小同切片),添加文字内容为“aaaaaaaaaaa”(或者类似,用作标识)
& I$ ~+ f. Q# S/ ~/ ?' l" i$ a4. CMD获取所有切片名称,Excel里添加列,标识每页的开始标识
2 E2 a2 _) b" Z- X5. 使用ImageMagick,在CMD里使用命令 convert -append 0.png 0001.png000.png 0.png 0001.png001.png 0.png 0001.png002.png ... _0001.png 得到最终的合并切片的总体图片
8 N% G$ q5 \. i9 w) C( M! T, N6. 使用FineReader打开这些合并了的切片总体图片,进行文字区域设置,识别,保存为txt4 n1 _0 x7 y3 U& w" S4 P G" g
7. 正则处理txt(标识为aaaaaaaaaaa)。。。# P4 R7 C/ k& e4 t. C5 X
8. 导入回到步骤①的词头,在高亮匹配提示下,继续进行人工核对
# c3 h k3 z, x4 X% c. D. N2 A/ [0 I" q( K4 X; }* S
4 T7 a. }! L! N$ }8 K% _5 K2 @8 ?1 e
$ X9 D. r1 l5 J5 m/ m4 O$ A! W5 E3 x1 T" ?/ d
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?免费注册
x
本帖被以下淘专辑推荐:
- · 图片版|主题: 37, 订阅: 41
- · 词典制作|主题: 111, 订阅: 24
- · 图片词典制作|主题: 41, 订阅: 7
|