TA的每日心情 | 奋斗 2019-10-11 13:52 |
---|
签到天数: 142 天 [LV.7]常住居民III
|
本帖最后由 Snowdax 于 2018-4-6 23:00 编辑 8 }; Q5 i: W Q3 I: N) r @( n/ t
$ F- A# U1 n" _8 Q已在 Github 上发布
1 f- x0 S( o- J s4 v: L: |https://github.com/Snowdax/customiseMdxFromList
1 B* J& i& ]7 f# K8 N
/ K a. e$ l; u; n- W5 f8 Areadme 链接复制到论坛已失效,烦请移步 Github 阅读。4 O3 B4 R4 g. l6 G
Z( T7 M% b3 V O) n5 n3 Q欢迎打赏! https://snowdax.github.io/buyMeACupOfSoyMilk/' k7 @4 j, c- M
* R0 M* f8 `$ P! l- |) M! i
customiseMdxFromList) A4 R" Y3 V) _$ h- ^! T5 a6 E
COCA5000.txt, a- J6 U- {6 ]: v1 a
COCA5000.txt 储存了 https://www.wordfrequency.info/free.asp?s=y 页面上的 COCA5000 词汇表,每个单词一行+ r8 V. Z. G B1 ~
: i2 J6 Y N8 h0 {. _( _COCA5000_list.py
" l& ^0 {% k' h; i4 gCOCA5000_list.py 将上面的 txt 文件转换为 Python 中的列表数据格式,并将其赋值给 wordList 变量,该 .py 文件可作为模块导入其他 Python 程序。这个文件是由 line2list.py 生成的。) X2 f$ O9 ~ b4 T/ r' a- e6 J
% B2 O" _3 M1 o5 u. Z2 l: x1 X; _line2list.py5 p! M( D% J% _( ~* L/ R
输入:文件名.txt
# c( o- a0 j% ^) t输出:文件名_list.txt# h0 H0 j, x% E% o8 z
功能:将每行的内容转换为 Python 中的列表数据格式,并将其赋值给 wordList 变量。; V9 y& L3 x8 ~& G$ t( h
5 t1 k# X1 s$ _( _3 C
customiseMdxFromList.py) y' ]7 p! G3 g2 H+ Z3 ^: C
首先将所需词库的 .mdx 文件在 GetDict.exe 中转换为 MDX 源文件,如下图所示:
) H0 B! j) c( N; r6 U
, m6 _& `( d7 S# B6 i! L& ?$ v: Z; Q R) e% J2 N
生成的 .txt 类型的MDX 源文件,应该是一行词头,一行释义,一行 </>,如下图所示:
5 q, D( J4 i! C" p1 D: \
1 u4 L- p0 X) n' ]% W, l2 a/ w) v( C7 b
接下来,就可以使用 customiseMdxFromList.py 了!
I! W! t: v- N( L2 {$ d0 ^输入:刚刚生成的 .txt 文件(文件名.txt)
6 i1 L$ @% q9 H输出:文件名_customised.txt
! G+ i G1 L9 c: V0 F$ a功能,仅保留 COCA5000_list.py 中 wordList 中的单词。如需修改单词列表,请使用 line2list.pt 生成列表并改变 customiseMdxFromList.py 中导入的 COCA5000_list 模块 w+ C% Z- E% E0 F G7 B, V
性能:约 2.5 秒/词,5000 词合共约 3.5 小时. Q0 P# |5 I8 a# \+ S) @5 s
4 p4 f8 ], G: U' s0 G2 j最后,使用 MdxBuilder.exe 将 文件名_customised.txt 打包为 .mdx 文件,用于 MDict 等词典软件
) _+ j8 R7 C$ [3 f& [$ o
|; M6 s# @1 I" v8 [& `# @6 AcustomiseMdxFromList.exe
) V/ k5 _ S& [5 _5 w由 customiseMdxFromList.py 封装。不用搭建 Python 环境,且程序里面集成了 COCA5000 的单词表,直接在 Windows 上就能使用。 |
评分
-
1
查看全部评分
-
|