TA的每日心情![](source/plugin/dsu_paulsign/img/emot/kx.gif) | 开心 2023-9-27 20:45 |
---|
签到天数: 847 天 [LV.10]以坛为家III
|
本帖最后由 nullname 于 2019-10-12 08:47 编辑
1 ^* `$ K/ A0 T: S& p
0 _8 J3 ?! z! ~( f4 i. |8 _00
! v0 m, l; a y0 r% n2 E相较于MDX词典的百花齐放、门类齐全(从学习型再到母语型再到俗语习语俚语等,不一而足。) Kindle用的MOBI词典就显得冷落多了,有意义的词典非常有限,也许是因为Kindle的使用人数很少吧.... 基本就是官方的英英、英汉和 skywind3000 大神的这本 简明英汉必应版 了。
+ p' e$ k6 M' ?, R其他的像书伴上的那些都很难用,主要问题就在于不具备 词形变化 的查询能力。比如书中出现了 looked, raised 这种单词,它们基本都不能直接查询到 look, raise。% U* I% g) _' w8 V. X
6 P7 O, O* V) P之前在知乎上看见孙缓之的一篇帖子(见此 Kindle OALD9 民间发布(仅限交流使用)),可以用 dsl2mobi 这个工具来将 dsl 词典转化为 mobi,且具备词形变化的查询能力。但貌似 dsl 词典不是太好找。: u' J' ]2 g! _( n
+ A. N; x/ x; l$ f6 ?因此,想试试能否将 MDX 转为 MOBI。教程不多,仅在书伴上找到了这几篇文章。(请见 《如何把 MDX 格式词典转换成 Kindle 字典》,《自制 Kindle 字典简明教程(入门篇)》,《自制 Kindle 字典简明教程(进阶篇)》)* F7 J* z$ w7 \( o2 B, Z3 f8 O; [) J
8 H, W6 e9 P5 h8 z: T: P, E
根据 《如何把 MDX 格式词典转换成 Kindle 字典》 这篇教程,转化出来的词典不具备查询 词形变化 的单词的能力。主要原因在于没有添加变化后的单词,如图红色矩形区域(更详细的请见 《自制 Kindle 字典简明教程(进阶篇)》)。
/ g& [2 L9 u3 g1 A
9 D9 ^% K& V0 z o以 COED11 举例,这是转换后的 HTML 中的词头部分:
) g( J1 |/ d( e. g) ^# [3 m: ~7 S3 L8 ^1 n v& W4 e+ W2 s1 r( g* x8 Z
若要具备 词形变化 能力,需要的区块(红色矩形部分):
# }! y; F& @5 p Q% u( }7 ?, ~
; V# y, ]- l( N) ~. e1 v3 m2 E
6 s; N; l$ l% A: D+ ]0 ~) ]! [5 O9 ^* i
我抓破脑袋都想不出怎么样才能自动添加这些进去,后来想起 dsl2mobi 有这个功能,就下载下来研究了一下。该工具是 ruby 写的,基本看不大懂,不过我在其目录下发现了包含十几万英文单词词形变化的 TXT:" W( y5 y7 R5 K1 M' Q8 f
3 K+ s! k% F# P4 n D! J) e
8 ~. O1 L+ D7 Y* n
1 z5 c E# p" u# Q+ z) ~& z/ h: Q: M排列比较有规律,格式为 单词原型:变化1,变化2,变化3...... 因此用 python 写了正则批量查询添加:
/ O: t; u. X! D M8 l3 ~
8 p) d" n/ v6 l4 m7 l5 S+ U" U# o% f0 j7 `
, _: o, v4 A2 V# H5 x
跑完之后:
. x9 V" x' |% \# _ U2 i+ A
% p% y- I2 ?. X& U
! ^/ ]- T, h# ~- g, ^- J1 B( M$ w
基本原理大概就是从词典中取出主词条单词后再在 forms-EN.txt 中查询匹配,若成功则返回所有的变化形式并添加区块代码。然后重新生成 mobi 。( w4 s2 e1 I! e, L7 c4 Z0 Z
6 h9 n$ ]0 f3 ~ {( ], E兴冲冲的试了试,/ g" c C2 K& v
0 u2 J- n) E% Q( W 两个看起来都没什么问题,和我们想想中一样。9 k' ~# Z( c; T2 a& X; v# Y: [0 i* c
2 l+ Z. e+ x% e; Y1 h$ q% g0 B再试试,( q$ j% g' V ?7 ?; u3 W3 k
0 h: | O" z% g
查询dealt的时候,按设想,应该是查询deal才对,结果并不是。
/ h# [& |7 e/ k# ~5 N% n) E7 |- T" i6 }
用官方的词典试试,: u% a% Q3 a1 Y1 {3 C. U
+ |/ P5 h7 f e
同样如此。6 ~( c) y+ g8 {( y7 r% Z& k
M, F$ Q, a6 G+ _0 K+ d- o1 z0 n
5 M1 z. j7 k. |) g4 d0 r
01
4 Y N* {0 E6 u; D+ L* x8 m7 v% o8 ?* m
后来经过反复试验,发现了 Kindle 的查词逻辑:选中单词后,查询主词条是否匹配成功,成功则返回对应的条目,同时不再继续查询变形词条。没有主词条的话则查询词形变化区块是否有匹配,若有则返回变化词条的原型主词条。3 d, {$ N `( T7 d D
# i+ f6 Y4 p) D0 E$ Ndeal 的词条部分已经添加了 dealt 作为变形词条,然而我手中的这版 COED11.mdx 和官方的Oxford Dictionary of English 都有了 dealt 这个主词条,词条内容如上图。因此不会返回 deal 词条的内容。
' K! ]. m- |1 ^- D4 h& p/ l
) p4 f1 N2 c, C8 p' L9 _0 G) z知道问题所在后,如何解决呢?想了想,很难,因为英语词义太丰富(Rich)了。比如flame,它的词形变化理应有flaming对吧。但是flaming本身可能自成一义(火爆的,讨厌的,该死的),如果查询flaming的时候跳转到了flame,从flame很难猜到flaming的一些专有词义。除非亚马逊更新固件,修改上述的查词逻辑,即不论查不查的到主词条,变形词条所在的原型主词条一并显示。不过目前看来希望渺茫。
6 N2 }: ]: k1 Z
' X6 u- x2 A% V/ K; c0 M. w) X% B7 u7 F$ {7 Z: Q7 R$ n
02
: |) p% v) z0 z' K: r. c5 R: @' X即使如此,还是有许多优秀的 MDX 词典值得页应该被转化为 mobi 以供大家使用的。个人认为kindle上不适合使用学习型词典这类词义较少的词典。比如你在看书的时候看到了square这个单词,假如你用牛津高阶,你翻到底都翻不到“步兵方阵”这个释义,最后陷入深深的自我怀疑...然后又去提问“为什么我每个单词的意思都看得懂但是就是读不懂句子的意思...”。
5 g2 K, A$ ]& N/ p& j& X7 q
6 V% [4 K, S1 `4 E4 @) H* X经过一段时间的试验,我发现 The World Book Dictionary 和 Microsoft Encarta Dictionary 这两本词典非常适合“高阶有余,母语不足”的英语水平者的使用,但把它们转成mobi难度略大......由于水墨屏的特性,kindle 上词典个人以为只需要1.粗体 2. 斜体 3.浅色 这几种样式即可,不要图片、音频。同时要求css内置在mdx中,不能外挂。在此也向各位请教如何将外挂的css内置进mdx中的方法,我尝试了在html中添加style标签然后将css全部复制进去,但似乎并没有效果?各位如果有较好的适合在kindle上使用的词典也可以发出来大家尝试转换。
7 B& l* G' F0 y9 A9 N% Q" _+ C7 s. G0 h& v+ W
写的比较乱,抱歉。也欢迎大家交流讨论和指点。
5 r, E8 p0 A2 [- ? `) k' g+ V# r/ J0 y
8 j" G6 X1 Y, y& R$ h& A5 s最后附上制作完成的COED11th.mobi
9 I: ?5 J2 g, U
- Z& l/ |9 V& j- r& r5 A& u* ?! }5 _# L% A: g( @4 h2 C
链接: https://pan.baidu.com/s/1TyMK4P1A6ltCEDr2Bt_rNg 提取码: zp3b Z/ G( S9 o* @. Y' |% ?. S
% }3 N% S! \! k# u9 O----------------------2019.10.12补链----------------------
( D0 L, P* {7 l$ ]链接: https://pan.baidu.com/s/1bSRfcScur482utaLmsxOgg 提取码: 4b5h
( J U& ] q) f4 r- i9 v% \3 B0 }4 }+ Q* ^: h6 R# x2 Y- u
! ]6 A6 }) K/ | I( W7 \
/ J2 x/ Z! m! A* u$ }& r' g
' w$ h, `# a, ?6 k/ [. P
7 t8 @$ e4 {: r; O- i" W6 A6 ^9 J8 D& ^( f4 r. I
# h7 j, c( K0 ?: q/ C8 u+ U4 W( e
' i9 I1 r5 G0 F8 b1 Z2 F$ V
+ {- |% t) G+ {7 s- u3 S
! \7 a% P) \% ~- R4 U3 S9 X# t" D4 I8 ^) X+ @
1 W* g& c! I5 P/ t/ j$ G) r2 A5 t |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?免费注册
x
评分
-
3
查看全部评分
-
本帖被以下淘专辑推荐:
- · 词典制作|主题: 217, 订阅: 40
- · 词典制作|主题: 111, 订阅: 24
- · 语言态度|主题: 150, 订阅: 19
|