掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 1546|回复: 10

[教程] 采用Vim+AHK快速处理图片版词典的词条索引

[复制链接]
  • TA的每日心情
    奋斗
    2019-10-13 07:34
  • 签到天数: 209 天

    [LV.7]常住居民III

    发表于 2019-2-6 12:00:04 | 显示全部楼层 |阅读模式
    本帖最后由 VimVim 于 2019-2-6 12:38 编辑 1 N" l0 U% X/ l7 m+ j% w
    / g2 Y& i1 e# V0 y) c

    & j' ]" G  b) u7 c. k2 O9 l% a. i" e  u8 e# Q2 x* {, O) o7 M  R, j! V
    图片版词典的要点是精确校准处理的高清词典图片和精确的词条索引。图片版词典,虽然/ y. ^, Z6 @* [2 v+ r
    词条内容可以不用文本化,可以直接用图片来代替,但是用于检索的词头是必须要是文本
    4 b. J# ]4 m. `( \( [) c格式的。目前 OCR 可以辅助自动化处理,但 OCR 精确度有限,还需要人工检查。文字版+ N7 o& t# j  B9 q3 D+ Z
    的要弄排版,图片版的要获取词头,各有各的难处。2 e1 f+ X& ~3 X- E

      J) Z2 k) v3 }) R# o* k这是我第一次制作图片词典《现代汉语词典》中关于词条索引制作的一点经验总结,供大
    - v  o& k  ]( S9 P6 K% o家参考:0 }) k  C$ {) ^& N& h9 G
    8 v! J9 |" ?( k/ T* y& _! T
    (一)在 vim 中将页码和字头整理成如下格式:" v  Q& o+ L" y
    一行一个页码或词条,页码下面可以有多个词条,如7 v6 K) I) |% q* }. J; J# K, F/ X
    " R0 L8 Z8 o& G2 Q( g- G
    1. 0001
      0 k2 j) f! w+ ?: s  {' g8 L9 x1 j
    2. 一  * z( G4 [* y) H9 B
    3. 已  2 x/ e+ G& H5 W( J: z9 ?
    4. 0002+ B. t0 H3 p$ v
    5. 亿  
        I: p6 @6 U0 U9 y5 A$ |3 C' L" q
    复制代码

    , \0 b! n3 C; B2 ]9 G这一步的难点是如何简洁、快速、准确地录入页码及对应的词条,便利地图片翻页处理。# G1 V: l9 @, A3 O0 ^1 q3 ]
    我应用Vim + AHK进行快速处理:Vim按左右栏目自动调整窗口位置,并自动调整对应页码* o# o: a% h$ K* i2 L2 B
    ,以及录入、校对等词条整理工作;AHK的用途有两个:一是置顶并透明化Vim窗口,二是- P$ p* M; n/ Z* h% n
    快速实现图片翻页。- a1 d% s- N* g6 V9 R  m
    % ^  D! n8 _6 P( Z0 ^
    为了让大家更好地观摩,我录制了一小段处理过程的视频样式:: Z8 ]2 |- N) K' a- H, A* o
    Video:采用Vim+AHK快速处理图片版词典的词条索引& X) d. A. G& n( O+ R3 ~9 ^1 a
    " ~: T: v/ R7 Q" z8 P0 V7 }, \) {
    % _3 E- d  ^8 j1 d% A+ G9 w
    (二)在 vim 中执行一个自定义命令将其转换为如下 mdx 源文件" a+ ~7 R7 A* D$ Y
    $ R* p  p) _( ^% p$ U* G
    1.     一: X4 M' n" e* X
    2.     @@@LINK=XDHYCDTOC00017 H( f  q# x  E0 S& q3 B+ N" X
    3.     </>. `: Y) D  z# f$ Y7 [' W- n$ ?
    4.     已. p: o* R/ m" {$ T; c  Q3 |
    5.     @@@LINK=XDHYCDTOC0001
      , ]$ j- D+ D6 X) w: d! P. ]
    6.     </>! l$ U* l" X3 d  m( R& P3 O
    7.     亿" }& r/ }( c: Z5 I' c4 ?' b
    8.     @@@LINK=XDHYCDTOC0002/ [7 p: a. t$ m5 V* A
    9.     </>
    复制代码
    - E. d& A; e2 u
    详见上面的demo演示$ \% E7 u, f. Q. ]7 u" L( F

    , W. B* \9 I, o$ e4 f. i" J相关帖子
    ! w9 u7 J: W1 L* u: K6 c2 w. K5 n7 C6 W9 U" R, l) Q; P( i
    采用Vim快速转换图片词典的页码为mdx源文件4 f  S( o* s. H' D- Z4 ?0 z  y
    https://www.pdawiki.com/forum/forum.php?mod=viewthread&tid=32971# c$ Q! G; r4 b
    (出处: 掌上百科 - PDAWIKI). O7 a# u/ r, g# U6 z

    , t2 x: e6 h' f( k
    & t- @1 q6 N! H: R3 m! ?- Y( G
    7 @" M- D5 C, H4 k% _+ z( E; t) O" ^
    " j2 P- [3 y6 J0 [: K' g! _/ K

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x

    评分

    1

    查看全部评分

    该用户从未签到

    发表于 2019-2-6 16:36:42 | 显示全部楼层
    非常感谢你的演示和解说!
    3 x" i) N6 M$ V0 S" N+ A我不知道该如何评价,总感觉效率还不够高...
    / r/ Q- Y' N. q& y* h在已经有第5版等的词条索引的基础上,增补去无, 本身就应该挺快了
  • TA的每日心情
    奋斗
    2019-10-13 07:34
  • 签到天数: 209 天

    [LV.7]常住居民III

     楼主| 发表于 2019-2-6 16:53:33 | 显示全部楼层
    本帖最后由 VimVim 于 2019-2-6 16:57 编辑
    / A1 w/ d4 O$ W* P: |5 z+ |5 o6 R0 Z
    chigre3 发表于 2019-2-6 16:36; N: n+ P1 ]. R# X0 m
    非常感谢你的演示和解说!
    , e& q+ z$ S& @我不知道该如何评价,总感觉效率还不够高...
    - t0 {( S: @( p% f5 \在已经有第5版等的词条索引的基础 ...

    , S  h$ C" v2 v/ ]) p/ O效率确实不是最高的,我的宗旨是,制作过程就是最好的学习过程。整个词典的效率瓶颈都在于词条的录入、校对,这个只能人工一条一条过才能保证质量。$ E2 C: y8 V9 z& e0 A" h2 G
    其他都是辅助手段,方法各异,我只是采用了自己熟悉的工具,做了适度的自动化封装,便于用在更多的字典制作上,但依然有很强的个性化,不具有推广性。
    3 X5 q4 S/ O/ m7 R
  • TA的每日心情
    无聊
    2022-9-25 21:09
  • 签到天数: 1136 天

    [LV.10]以坛为家III

    发表于 2019-2-6 19:41:30 | 显示全部楼层
    请问有那些步骤是需要用到 AHK,vim script 办不到的?
  • TA的每日心情
    奋斗
    2019-10-13 07:34
  • 签到天数: 209 天

    [LV.7]常住居民III

     楼主| 发表于 2019-2-7 00:00:00 | 显示全部楼层
    本帖最后由 VimVim 于 2019-2-7 00:03 编辑 1 `; g  J( B2 b. g
    oversky 发表于 2019-2-6 19:414 {, D. E. ]4 I5 w0 q0 L3 l
    请问有那些步骤是需要用到 AHK,vim script 办不到的?
    0 m- S% R4 |2 B. i4 y  m) X
    用一个快捷键实现如下所有操作(多个指令容易出错且降低效率),其中加粗处我只知道用ahk实现,此外让Vim置顶并半透明也是用AHK:
    4 ^: {' C, S: l5 X( C2 s: l+ ?% M, h) h( C  _7 q1 a& o- U
    若当前为左栏,则调用调用vimscript的命令,切换至左窗口,移动光标到下一行(也就是对应的词条都写到这个新一页之下),然后切换回右窗口,调整右窗口大小,并将当前行显示到顶部;
    7 o6 i+ ]# C: r8 X6 ]% N0 F! ?2 m9 m
    % _6 O5 V5 G- M1 v若当前为右栏,则从vim切换到xnview,按pagedown将图片翻至下一页,然后再切换回Vim,然后调用vimscript的命令,切换至左窗口,移动光标到下一行(也就是对应的词条都写到这个新一页之下),然后切换回右窗口,调整右窗口大小,并将当前行显示到顶部,最后保存所有文件。
    & o' I# j/ m4 W. }/ J5 v7 e! j
    " R+ Z* D3 C" y  g* G; l! v0 f3 H8 V' @
  • TA的每日心情
    无聊
    2022-9-25 21:09
  • 签到天数: 1136 天

    [LV.10]以坛为家III

    发表于 2019-2-7 00:04:10 | 显示全部楼层
    原来是还有用到 xnview,谢谢您的指导。
  • TA的每日心情
    奋斗
    2019-10-13 07:34
  • 签到天数: 209 天

    [LV.7]常住居民III

     楼主| 发表于 2019-2-7 00:07:36 | 显示全部楼层
    oversky 发表于 2019-2-7 00:046 w( r! g; E4 M3 }) F% w
    原来是还有用到 xnview,谢谢您的指导。
    4 h/ g5 v) N+ E8 u5 n
    看图软件,随便挑一个都行
  • TA的每日心情
    开心
    2018-8-8 03:13
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2019-2-26 14:15:25 | 显示全部楼层
    本帖最后由 喬治兄 于 2019-2-26 14:19 编辑 5 D0 Y$ x8 v) E* o$ g4 a5 R( |

    0 L: |: K, ~3 b* j0 a2 F8 j" Z: HVimVim 兄:
    & C8 d0 s: }+ @, b5 j" r( B2 b請教一個排版的問題
    4 n1 U5 Y8 u. {/ p4 b小弟想把辭典的每頁首字和尾字置於同一列的左右兩端
    ; v/ K/ v* l3 t4 _但因不熟 css 不知該如何達成此功能
    9 D! k: O  I4 P. \% B: L能否給小弟指導一下,謝謝您( m. ^, i/ L% c% v! A2 ^

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x
  • TA的每日心情
    奋斗
    2019-10-13 07:34
  • 签到天数: 209 天

    [LV.7]常住居民III

     楼主| 发表于 2019-2-26 21:19:31 | 显示全部楼层
    本帖最后由 VimVim 于 2019-2-26 21:39 编辑
    5 ?0 Z3 u/ _8 x3 @- L; F% ]& m; A
    喬治兄 发表于 2019-2-26 14:15
    6 ~# E5 G, a9 Z) V- oVimVim 兄:
    / m3 w! C# L) R% m) I請教一個排版的問題
    ( S0 g2 E, ]7 m9 j# p# K: o. e小弟想把辭典的每頁首字和尾字置於同一列的左右兩端
    . K. Q9 H1 Y" k" i
    要的是这个效果吗?
    * X3 ^" p$ |% R下面的border纯粹是为了显示效果,你完全可以在css中将border设置删除。* m9 c, g% j6 Z& M
    6 o; T, w  `; g1 I' D

      m" C3 V( l$ D1 U1 I# I- NHTML文件:
    1. <!DOCTYPE html>" X0 q$ Z# j& l$ N
    2. <html xmlns="http://www.w3.org/1999/xhtml">
      ) i8 T  G1 P8 \" `( g8 m
    3. <head>' s* W5 w/ c' n
    4.     <title></title>
      - A' u- o" @3 c4 [3 _0 }
    5. </head>( H: s# e2 h. g  `8 _5 C( [
    6. <body>
      . }7 d& I9 f; i
    7.     <link rel="stylesheet" type="text/css" href="test.css" />
      - o6 T) U% v; ^6 ~# n" E, \4 v
    8.     <div class="navtext">/ e2 T* n6 l& S* k4 ^
    9.         <span class="left">accident</span>  A; r. S# i% @6 L& t$ l- j
    10.         <span class="right">accumulate</span>
      ) q( o( F6 V0 H
    11.     </div>
      # w9 k# X) X" b. C! `' Z" q1 ?
    12.     <div class="mainbodyimg"><img src="test.png" /></div>4 U& J' J. G! V
    13. </body>
      - M8 T8 M7 @, c! M5 @; l
    14. </html>+ u- X: k6 D- @2 S( h4 I4 v; b' C4 f
    复制代码
    ' V9 E/ _* ^1 \; g6 _2 r6 J
    , L! k3 B0 e! [5 K* W
      G2 F1 R1 ?1 E! N# x& A
    CSS文件:4 o2 U& o5 O' Q
    原理:  M! {* z, n! ]1 X
    1、设置两个span,其宽度及padding合计为图片宽度,并设置每个span中的文本分别左右对齐;
    # ~5 m( |2 F- m; }1 I/ s) U2、将两个span都float left,这样左右两个span就会按顺序排列;0 f8 Q5 G# F) g7 c* J
    ( F- E, K8 f7 o! c  s+ K
    1. /*左对齐*/
      : ^9 x6 n+ S8 F. f, l$ g& A! X
    2. .navtext .left {  a% C0 c7 S! l8 g. E
    3.     float: left;
      % r  j9 b( l; B5 q: D
    4.     text-align: left;
      # o. _) F4 E: J5 g
    5.     padding: 0 0 0 2em;; I+ ]/ B4 g% m8 d# ~7 |
    6.     width: 18em;
      . d, ?# p7 o* [" r$ ~8 W
    7.     border: 1px dotted black;
      % |9 y$ h# O1 E5 a8 _* }% g
    8. }
      # l; j1 r! F# T2 S+ E
    9. /*右对齐*/; E2 ]. u. t1 o6 J0 d
    10. .navtext .right {
        U; R) `0 k, X+ H, d
    11.     float: left;) p* q" d" U% L( x
    12.     text-align: right;4 D3 x6 }" l1 [$ @. Z
    13.     padding: 0 2em 0 0;8 P2 e- p, N5 h4 ?0 F  N% W
    14.     width: 18em;( N' ^9 ?7 |+ x4 P
    15.     border: 1px dotted black;
      4 Y0 ], Z. |% ?1 Z8 i$ j0 r( a
    16. }
      + p+ I, d, ?* d' N3 O; w" F6 }  i' C
    17. /*图片*/' ?+ ]% k! }; c
    18. .mainbodyimg img {
      7 k* j7 Y% I+ p! }) `8 x
    19.     width: 40em;) C7 Q  _: {1 o
    20.     border: 2px dotted black;
      8 H' x9 C! v7 R3 x& s: k* e  J
    21. }$ x1 U; n/ p$ x$ `6 w) v
    复制代码
    , \& ]6 D% S) m8 n. S$ d2 p1 d+ Y! r4 p
    您可以用附件的测试文件多试试各种参数来满足个性化需求:
    . R7 ^6 Y" k$ o9 n0 A! k' Y( U) v- i! _6 A) O5 x3 z1 P
    % q9 i. f$ J: q* u
    ) a. C( ^$ ^2 M3 L2 z

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x
  • TA的每日心情
    开心
    2018-8-8 03:13
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2019-2-27 02:59:13 | 显示全部楼层
    VimVim 发表于 2019-2-26 21:19
    / b0 |# Q' ^, U" p, D# d要的是这个效果吗?
    4 O6 c8 ^& U6 l0 g- j. q  o+ [' E( I下面的border纯粹是为了显示效果,你完全可以在css中将border设置删除。
    ) v. F5 `; k( Y2 T
    VimVim 兄:: g- y7 S0 b0 I4 R% k* ~& X# e
    非常感謝您的指點迷津
    0 z" T; x2 w1 s# |! j您連文檔都附上了
    8 ?, B/ {+ x" s0 [6 [8 b太感謝您了
      O: r. U3 P0 R7 S! z1 t) \7 @真是太給力了) k& L+ K4 }% M6 K+ I
    Thanks again
    8 J/ A$ ^+ r2 N' N1 ^  z
    ' r# [& I6 l* Y$ Y3 ~
  • TA的每日心情
    奋斗
    2021-3-15 08:06
  • 签到天数: 585 天

    [LV.9]以坛为家II

    发表于 2019-8-12 14:25:43 | 显示全部楼层
    没太明白怎么用。
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2024-5-10 00:29 , Processed in 0.088955 second(s), 9 queries , MemCache On.

    Powered by Discuz! X3.4

    Copyright © 2001-2023, Tencent Cloud.

    快速回复 返回顶部 返回列表