TA的每日心情 | 奋斗 2019-10-13 07:34 |
---|
签到天数: 209 天 [LV.7]常住居民III
|
本帖最后由 VimVim 于 2020-6-28 16:01 编辑
' d- O t& \: z# o9 g
) @6 t8 j6 r7 m3 [! g## 背景8 X: U( t, l d- U }
) }, Y1 R* j2 x* ^
时常遇到好资料,怎奈只有PDF扫描版,辛苦制作好词条,但成品的导航却不够理想,梳理
t' w6 b7 ~* j- j一下现有获知的工具,提出图片词典应有的标准,希望各路高手能够借鉴打造理想的工 i+ L; `+ N6 s- v3 M$ U) o- q+ I! _" t
具,造福广大词典爱好者。
$ q, g7 Z% U' S+ C' |1 a6 H: F' r
1 Y6 k* B5 n/ G- b O. r
/ K% r" Q' Q8 q* v% [. j4 j0 m! d### 现有图片词典制作技术点评5 }! O7 o, m7 \) B/ H
! k! ^/ n8 s5 c/ K" e
* 图像版mdict字典制作方法 by tsiank. q$ d) A# B: Q$ r, o9 _ N
- src: https://www.pdawiki.com/forum/thread-13451-1-1.html
% v; p. e2 \' z# s1 D - 这是最优秀的原创教程了,入门必修5 T! b% V2 `7 J8 j! M7 k
- 优点:理解图片词典的基本原理9 ^# @2 [6 k& z [" s$ [
- 问题:导航简陋,难以在页面中定位具体词条: V. `' `; J' q$ f. I; X
* 图片版mdx源文件生成工具 by tsiank% v( A% Z* t Q3 |8 f+ _* o
- src: https://www.pdawiki.com/forum/thread-33574-1-1.html
8 i+ z( n/ d% D4 ~" t - 这是上述教程的升级版,带工具了!
' l+ i! [7 Q& `1 n M3 q - 优点:导航体验大大提升;技术门槛极低,小白都可以使用
+ J2 g$ t) x4 T$ A' t* c! X - 问题1:不能自动处理多部分构成的书籍,目前主要处理正文部分9 ]6 M+ k3 [% I0 h: K
- 问题2:生成的mdx源文件有很多细节问题需要进一步处理,如CSS缺文件名、多
4 A# p! q4 }2 m/ p' n 个标签属性之间缺空格、nobomb格式等( _: V( y# z$ Q" N2 B! T0 N( N8 e
- 问题3:鉴于使用Excel,无法与其他工具链结合,从修订原始词条文件到生成) R' ^5 b( U; q; o# ?
mdx源文件无法一步到位5 C+ a! @" G: s, E8 p, y% Y# }: Q
- 问题4:导航依然有改进空间,VBA不熟悉,改造困难1 k5 ]2 \ @9 `& g8 q+ L( i
* 以Picture Capture为代表的切图版词典制作软件 by chigre3 等
. G1 B3 S& i8 y - src: https://www.pdawiki.com/forum/thread-19040-1-1.html
+ z4 \) v! B% Z% _/ h - 这是对终端词典用户体验最好的工具7 Z7 h9 n7 h1 L) g7 I) r
- 优点:直接定位到具体词条、导航丰富
u$ Q1 R1 r' ~; ^ - 缺点1:工具非开源、偶尔开放下载、遇到问题没有反馈处理机制0 S) ~; ~6 B V' {( `% ]' [: X
- 缺点2:对于普通词典制作者来说极其复杂、体验糟糕
+ R0 o( r& `" O# g2 ?, \ * 使用CSS精确定位Visual词典 by 孤影 等
& a1 l/ v2 J8 ?! i7 E/ V - src: https://www.pdawiki.com/forum/thread-20350-1-1.html
) b9 y8 \- A/ e, L) T& m' e4 r8 D - 对于Visual Dictionary词典用户来说,体验很不错
" v. {3 p4 d4 m5 N" X# w - 优点:关键词加亮、可直接在图片上点击关键词链接8 {' x, E5 X) [, o9 \
- 缺点:具体技术细节不开放,仅可观摩案例Chinese-English Bilingual
. r& s* Y2 f7 q) c# W6 X5 q+ e Visual Dictionary (https://www.pdawiki.com/forum/thread-35929-1-1.html ),
! z: x+ V0 I( z( w4 q/ N 大致是先OCR图片,并通过类似Picture Capture工具切片获取每个关键词的相
: e" @: A8 b& V1 X% J' o 对定位,最后使用CSS隐藏文字层并定位关键词,太复杂了
. T$ T7 _; P' B& W2 ]1 R( Y
3 l: {0 a+ v: T### 优秀的图片词典工具链标准/ `2 @- Y2 N1 u4 h
+ P2 D; Q" u! p6 x# F; W! B * 词典成品的导航体验要足够好:核心是有助于快速定位具体词条位置6 Y- f4 I( _+ w" i1 ^! p
* 词典要能够适应不同尺寸的屏幕:阅读体验好,字体太大或太小都不可取4 M: X7 D- m; E k. f' ^+ y
* 图片处理要足够简单:使用扫描的整页图片即可,不要切片等复杂操作
- l* ?2 |& D/ u* f! K% ^9 J * 词条的录入、校对要足够简单:要一目了然,不容易出错,技术门槛降至最低
4 k4 Z- I* T: A1 O7 \) | * 词典修订要快捷:修订原始词头文件后,通过工具可一步到位生成最终的mdx源文件" b! ^1 Q' d: B+ E; V
: h) l7 \( ^0 Z1 V; j4 W为了实现上述目标,拟根据自己制作十来个图片词典的实践经验,提出如下制作规范,大
2 }' J E" q( A) Y- ]" ~家可将其看作是开发相应图片制作工具的用户需求文档。/ ?8 [# q0 J$ _0 P) c1 E& f
$ m5 _5 V- n, W* d# O; b## 成品图片词典的导航构想
) l: m5 W. d* W- N' W c2 \1 d. d; q/ Q8 |8 u1 D
* 在页面顶部显示Pages导航 和 Keywords导航(或有)* f. `3 I) t. r5 z2 B6 R- Q
- Pages:Previous Next Cover Preface Content Index etc.
Q6 y0 N: i9 n/ f# k' S& e3 U - Keywords:A B C D E F G8 s! _: U4 Z7 T6 S% p
* 在页面底部显示Pages导航, ^' Z- w {: ?/ n5 ~
- Pages:Previous Next Cover Preface Content Index etc.( P3 q( Z, d" W
3 T: a* h5 o7 O4 [( m1 I * 在Pages导航中:
& M# i9 s+ h# k: Z - 上下页,可自动处理first和last页面3 P$ z: {( K6 _4 V
- 上下页,可自动处理多个部分的页码体系为一个连续整体,如:0 _. L5 y: i" e i# a
- 正文前123(封面、目录等)、正文123、正文后123(索引、封底等)
& ^9 w3 J2 Q6 r( X8 z - 除了上下页外,可自定义添加封面、前言、目录、索引等固定链接。) ^1 o& R' x4 ^8 y6 q' ^- y
* 在Keywords导航中:
, t: b: `2 `& D( G - 若没有关键词,则不显示Keywords导航,适配封面、前言、目录、索引等页面3 ]2 b; M# V- J# M0 C0 _4 y
- 若某个关键词作为mdx的keywords,即使用Keywords导航中的某个关键词进行查
/ B# n P+ h5 }/ j$ z% c$ p$ M. L6 L 询,则在Keywords导航中加亮该关键词。4 H8 G9 E; e W
- 若页面作为mdx的keywords,即使用Pages导航中的页码等进行查询,则在& I; M, q t) [5 B1 X9 N' N; b/ X3 ~7 H
Keywords导航中的关键词不做加亮处理。3 g! a8 z/ y1 p/ P( U+ P* N
! Z( f! ^7 X7 K) ]" F5 A5 C
## 源文件格式规范
: K3 \/ t R% L0 c) X2 u
3 s& ]8 ~ p0 t6 K8 j * 图片文件命名格式:
) h2 d1 ]# ~) k6 U6 i* Z - 根据页码编排需要,可将书籍分为多个部分,如:正文前123(封面、目录
2 z& u s) r4 G4 y8 ^" `# O 等)、正文 123、正文后123(索引、封底等)+ D3 Y7 ^" h& F7 M" q9 W1 r2 E
- 对于不同部分的图片,相应文件名命名规范为“前缀名+页码+后缀名”:
, ~8 K; ?$ u5 {: _$ e - 前导名可自定义,中英文均可,建议采用书籍英文名或拼音缩写等个性化0 ]7 s7 z+ B1 y7 N
名称,避免多词典之间命名冲突
3 \' U" H7 {: u* D+ D - 页码位数可自定义,默认4位,可根据需要设为3位或5位等6 S6 Z& r1 b- S B4 j9 d
- 需要正确识别图片后缀名,如jpg、png等
* m5 c2 j8 D- N - 图片文件名案例:某书前0001.jpg…某书正文0001.jpg…某书后0001.jpg7 p3 x# H8 o) Q1 ?
. {# ~- l/ S3 M * Keywords源文件格式:
W: m4 n; x; c - 对应书籍的多个部分,将keywords源文件分为多个部分,如:正文前123.txt(封
9 ~9 a( ?2 i" a* [' P% f 面、目录等)、正文123.txt、正文后123.txt(索引、封底等)
0 e: J- ~ J' P# y3 K; e - 具体内容格式(极大化方便用户输入词头、校对和修订):- p, ^3 Q& S% F0 O& B V4 g
* 第1行页码:0001
5 V% N, t4 ?# U- U; Y * 第2行关键词:A
, z+ r5 {; \% k" u * 第3行关键词:B: F1 Y: O, K \/ u2 E/ |, ]
* 第n行关键词:N8 M: D6 A6 T, d
* 第n+1行页码:0002% Z7 M: s6 C" A
* 第n+2行关键词:X& H/ w$ n7 n" i2 i+ R
* 第n+3行关键词:Y
' @9 f" }2 N$ g' } * 第n+4行关键词:Z) X; D& C/ X% [9 ^$ l6 v9 S
* ……
& Y6 d9 y& H0 N5 t! g - 页码之后,可以没有关键词
; ~" s- c& ?/ v - 若有关键词,则同时生成相应的Pages导航和Keywords导航
: P! T" ~9 x- \% O K - 若没有关键词,则仅生成Pages导航,而没有Keywords导航
2 `! l7 k& Z+ ~, ]' D
, e j2 g5 w) c* T0 p, b## 处理程序及配置文件规范3 K9 R" A3 m e
/ t5 \' a, |; T, J; p. K) v
* 建议使用Python3,毕竟用户多,大家有能力按需改造$ o2 s2 s9 `- X W7 |, n: U# C
* 程序作适当配置后,应可一键生成最终的mdx源文件和css" |& R5 |' q& A& N. x$ X, q* Y
* 主要配置包括:
- r- ?" Z9 N+ t7 H* T1 C Y+ s - 书籍多个部分对应的Keywords源文件和图片文件0 B/ }; g& M% i
- Keywords源文件名称/ M- C a. e* s! z( B2 B9 Q7 \
- 对应的图片文件名:前缀名 + 页码位数 + 后缀名
. Q: F% A/ g! T' k- e - Pages导航中的自定义固定链接:
& ]7 i, \5 Y* l4 W w - 固定链接名称(如封面目录) + 对应图片文件名
! _9 o6 @8 W6 E - mdx目标文件名3 V1 H4 n) S) h: R5 f/ o( r
- CSS文件名
+ j/ e, E4 `9 V% c7 R - 导航的中英文0 A; A3 V, x& d& o w
- 简中:页面、上一页、下一页、关键词' y" ?- W3 @7 o2 _- @
- 繁中:頁面、上一頁、下一頁、關鍵詞
( Z& P8 ^" b1 C# D$ N- Y$ P - 英文:Pages、Previous、Next、Keywords- j! P2 i' `# X8 |6 ^
+ [8 `* i# _/ d6 n& c$ x$ l' G B M
## 目标文件格式规范
5 U' X6 Z7 }# [9 F# D: c. q# @* N+ W+ q6 W
* mdx源文件txt需要满足mdx源文件的格式标准:dos,nobomb,UTF-8
. r, V; ]% N5 `5 w: @$ G6 C * 生成的CSS可进一步配置:! R8 h1 }9 { e( N% P% m C' w
- Pages导航样式
# a6 ?' ~5 v7 t - Keywords导航样式
. ]+ `; c, [# y y) ~ - 加亮Keyword样式$ {) e* }0 I2 ?8 u$ I! S0 e# M
- 图片宽度:百分比(默认100%)或固定大小(px或em)
+ W/ Y" e. O( t/ M) q! p9 \
8 X( p& A3 Z% Y' U## 扩展1:整页版和多栏切片版二合一( c/ [' ~- }7 Y3 x I
3 x3 Y9 Q* E' @! j1 ]为适应手机等移动设备的查阅,需要将整页版适度分栏切片( e8 c/ w7 v" _: H U
9 u6 M9 w4 x0 k
* 词条需要分栏处理
+ A; p1 c1 p8 C2 @. `4 @( ?9 ]# i * 图片文件名需要分栏处理
0 v/ R' _: o I: [- s+ v9 R- c9 U * CSS要能够自适应不同屏幕尺寸的设备6 f) p4 H7 u8 s
2 b; q& Z" E+ O9 b( o, B具体改造略+ y% U( @) y$ B1 g$ K- C! x V4 i8 s
2 L' P( F+ A9 v/ a* P, B+ f( R# v5 w. k$ \( i
## 扩展2:多层次词头优化
+ z4 L a1 t4 I2 M3 D
. L# _1 H+ }$ N- t: }5 G( }3 d5 X9 D为优化类似Longman Language Activator、朗文多功能分类词典、现代汉语词典等词头有7 w1 e2 n* @6 O6 P% d/ ^4 }& Z
多个层次的词典,可在原有标准基础上,进一步将Keywords区分为多个层次,如字、词:+ s4 Y9 ~9 L6 q) M
& I' ^, T* |4 B: E0 B9 P4 l
* 在页面顶部显示Pages导航 和 字词导航(或有)
2 x! c6 W7 l6 H- V - 页面:Previous Next Cover Preface Content Index etc.
9 Z x2 n- {' M2 j# U5 L - 字:A B C D E F G
7 n1 M* G; u6 ?# r; h& D - 词: WordA1 WordA2 WordA3 WordA4# `6 p, }% |: o
* 在页面底部显示Pages导航; u1 b( `& b- p
- 页面:Previous Next Cover Preface Content Index etc.
e; x; Q8 y$ g2 Q& x0 P5 K" l3 H3 K% U! @: S! V3 O
* 当查询页码(并未查询具体的字或词)时,仅显示页列表4 |3 N1 C d' U
* 当查询某个字或某个词时,不仅显示字列表,还显示这个字所包含的词列表
" A+ w4 p7 `% f" k" w6 U
1 n g; j9 `+ z- z0 e2 i; b具体改造略
& h$ P1 S- Y6 V/ Y7 i- R3 P- z- T# G* q7 F0 j4 p0 y6 K
## 诚邀Python等高人打造开源的图片词典制作工具8 L' P. Q8 e2 L: r+ H) ]' Z
, a: B2 U3 h/ U! D. J若能够制作符合上述标准的工具(先有标准版的即可,扩展版再逐步优化),必将造福广
, X; q5 n6 d8 j( p7 h) D大词典爱好者,无论是字典制作者,还是字典使用者。
& w, e. I3 F3 S" ?- |/ X% j* z# A) l) ]% _. \/ u
若有需要,我可提供相关案例词典:包括完整的图片、词条等。! t0 [, ~9 j, d8 q& V7 v- X
; L+ `! L( e' r4 J |
|