TA的每日心情 | 奋斗 2019-10-11 13:52 |
---|
签到天数: 142 天 [LV.7]常住居民III
|
本帖最后由 Snowdax 于 2018-4-6 23:00 编辑 8 S" X9 a, w+ F; d. D
2 I- u2 O6 A" o2 ?7 n0 A! }
已在 Github 上发布
+ q: N( h5 D+ jhttps://github.com/Snowdax/customiseMdxFromList2 \' W6 t4 }: F* _5 f( t- G2 H( X
- Q4 q/ l% n) r [& ]+ B7 N$ @$ p7 @5 wreadme 链接复制到论坛已失效,烦请移步 Github 阅读。1 s% Z2 X, {+ h1 r- @, ^* }( r- ?
/ D8 {7 S/ \% _# V) p/ ?欢迎打赏! https://snowdax.github.io/buyMeACupOfSoyMilk/
6 B- m# Q7 j. D7 t8 ^$ v8 z7 _/ q( j+ e$ J( Z, p: J* P; t
customiseMdxFromList4 J+ a" y' O* ^4 {9 u: |6 d2 V& x
COCA5000.txt Z4 `8 V M9 } D1 w" K
COCA5000.txt 储存了 https://www.wordfrequency.info/free.asp?s=y 页面上的 COCA5000 词汇表,每个单词一行
& A0 l4 x8 a/ L; @2 d4 N4 ^+ I2 R
$ p2 i* T- I- YCOCA5000_list.py
& [! k M! k$ N7 X4 ?; YCOCA5000_list.py 将上面的 txt 文件转换为 Python 中的列表数据格式,并将其赋值给 wordList 变量,该 .py 文件可作为模块导入其他 Python 程序。这个文件是由 line2list.py 生成的。( Q' s# e$ ?2 W
5 B4 R* X. D9 n T; a
line2list.py6 _8 B# u: y: s& N
输入:文件名.txt
8 P5 t" g+ J# o( V输出:文件名_list.txt: e0 c" Q2 {) T& B- J! g+ j
功能:将每行的内容转换为 Python 中的列表数据格式,并将其赋值给 wordList 变量。
- Q ~/ g) w4 B" ~
) ?- Q! t) ~% qcustomiseMdxFromList.py
* C! s4 w$ ?/ m3 G( K首先将所需词库的 .mdx 文件在 GetDict.exe 中转换为 MDX 源文件,如下图所示:9 r' A& ~3 H7 a- `; T8 r5 l% A w
, i: D7 U% D* W2 ~6 e( s1 ~: E0 s" H6 K; }7 c* P6 p! p
生成的 .txt 类型的MDX 源文件,应该是一行词头,一行释义,一行 </>,如下图所示:' ^% d3 I# g4 F* X+ @) P
6 Q, _2 h4 {+ f, n1 ]
- S3 A" v" q% w( B接下来,就可以使用 customiseMdxFromList.py 了!, S+ p6 v7 g. z# [# A( K
输入:刚刚生成的 .txt 文件(文件名.txt)
0 ]) p; S& X$ G% h D9 c+ a输出:文件名_customised.txt
5 e" U7 J4 c- `3 T功能,仅保留 COCA5000_list.py 中 wordList 中的单词。如需修改单词列表,请使用 line2list.pt 生成列表并改变 customiseMdxFromList.py 中导入的 COCA5000_list 模块
% T: R- y3 i) b/ n9 ` b性能:约 2.5 秒/词,5000 词合共约 3.5 小时+ u. |* `- T8 n! i( X% R1 s2 ]
' C3 n% W+ @! u最后,使用 MdxBuilder.exe 将 文件名_customised.txt 打包为 .mdx 文件,用于 MDict 等词典软件) I3 t* v( H# m' d
/ I" p5 l% X3 p2 ocustomiseMdxFromList.exe
$ e3 W% u6 P& e7 E9 f* U7 R由 customiseMdxFromList.py 封装。不用搭建 Python 环境,且程序里面集成了 COCA5000 的单词表,直接在 Windows 上就能使用。 |
评分
-
1
查看全部评分
-
|