TA的每日心情 | 奋斗 2019-10-11 13:52 |
---|
签到天数: 142 天 [LV.7]常住居民III
|
本帖最后由 Snowdax 于 2018-4-6 23:00 编辑 4 H' ^: U6 x9 }3 I, w {
' E1 \4 h% q" H Y
已在 Github 上发布4 `/ G1 G! k# U5 ]
https://github.com/Snowdax/customiseMdxFromList' H" O2 ?8 }) P1 K2 b
/ Q$ q2 @5 G: a" `. i4 [
readme 链接复制到论坛已失效,烦请移步 Github 阅读。( N5 ~4 A$ G+ B0 B& _/ @
4 _! \. E& U D" f
欢迎打赏! https://snowdax.github.io/buyMeACupOfSoyMilk/7 d' w+ ~3 G f. ]! O
# x$ ~) ?! ]6 f( Y$ |! U
customiseMdxFromList
! S) `9 p1 |3 w' aCOCA5000.txt! L3 [0 l9 }, d& @+ w' i% {
COCA5000.txt 储存了 https://www.wordfrequency.info/free.asp?s=y 页面上的 COCA5000 词汇表,每个单词一行2 @1 v9 |: ^4 ?; [3 F7 o1 p
! ^5 {$ o0 i, B! ]# HCOCA5000_list.py
: L" I# _+ h' x% vCOCA5000_list.py 将上面的 txt 文件转换为 Python 中的列表数据格式,并将其赋值给 wordList 变量,该 .py 文件可作为模块导入其他 Python 程序。这个文件是由 line2list.py 生成的。9 i6 }- U, ?$ x9 F6 \
2 l+ w; e. W: v8 w5 S1 L5 m: Cline2list.py
, c e. ]# ~# s* l+ F! G5 y输入:文件名.txt
9 u: c4 h4 R* x9 I% ?, J5 q输出:文件名_list.txt _8 P6 J+ b5 [7 W
功能:将每行的内容转换为 Python 中的列表数据格式,并将其赋值给 wordList 变量。/ X" I* t) F* H9 H' m: ~ F
8 a4 N& |2 Z! x7 Y; W. W/ XcustomiseMdxFromList.py
8 J8 i6 T L9 [5 i; f( D: J d首先将所需词库的 .mdx 文件在 GetDict.exe 中转换为 MDX 源文件,如下图所示:
1 `( i6 ^ @2 u+ a( r" R$ i2 \- U
9 z9 e/ ^8 K4 {* G" K9 ?$ E" s0 [
生成的 .txt 类型的MDX 源文件,应该是一行词头,一行释义,一行 </>,如下图所示:
2 P7 ^* a9 T( m" V8 i
6 k) B4 \4 O/ `6 n
+ H8 w/ o* l3 Y3 j接下来,就可以使用 customiseMdxFromList.py 了!4 a# G1 u- C( D$ S+ v! u
输入:刚刚生成的 .txt 文件(文件名.txt)
. y' T+ \( @/ d$ y+ b输出:文件名_customised.txt
4 h: h7 n1 Z$ K A# H功能,仅保留 COCA5000_list.py 中 wordList 中的单词。如需修改单词列表,请使用 line2list.pt 生成列表并改变 customiseMdxFromList.py 中导入的 COCA5000_list 模块
/ [) B3 x* r& _, U: x0 [5 B" N性能:约 2.5 秒/词,5000 词合共约 3.5 小时
# z; d+ }; n& r3 u
/ k) A: z# ?1 I; r最后,使用 MdxBuilder.exe 将 文件名_customised.txt 打包为 .mdx 文件,用于 MDict 等词典软件
, E, B! g, Z& h( N: D; _
) K: h: E3 W0 x& [4 v9 i& vcustomiseMdxFromList.exe( _- x- W( ^$ }/ Z
由 customiseMdxFromList.py 封装。不用搭建 Python 环境,且程序里面集成了 COCA5000 的单词表,直接在 Windows 上就能使用。 |
评分
-
1
查看全部评分
-
|