TA的每日心情 | 奋斗 2020-11-15 11:37 |
---|
签到天数: 249 天 [LV.8]以坛为家I
|
本帖最后由 lgmcw 于 2020-11-19 22:31 编辑
* A0 g/ ^. h: _7 [& M9 |& K0 m8 p# ]6 r) N: A) U2 A' G% h
这帖target的是硬核玩家,希望对有需要的人有所帮助。代码比较乱,拖了好久都懒得整理,正好朋友又找我需要,趁着一鼓作气整理出来就正好也贴在论坛里吧。我这里不跟进你那边的环境调试了,如果有运行错误自己修一下(python3可参考楼下的修改经验);不过还是鼓励回帖反馈。对我以后做新人友好版有帮助。
; g+ z k2 i! z, K+ v: [以后我会做一款带GUI的,针对小白玩家。6 D( C* |+ g4 F
/ L" t% Q7 {; d7 e2 t) L6 F入口文件,运行genMDX_ox4.py即可开始打包,附了一个牛津4的txt源码,我已经调试好,确保在我这里能工作,下载后可以直接运行用来测试程序。我的所有字典都是用这个程序打包,暂时没什么大问题。词条数最多我试过的简明英汉400多万词头;体积最大的OED,txt源码就有2.4G;这些打包都毫无压力。不过我这边还在用老古董python2.7;python3应该也能用,如果报错,可能需要自己debug一下。
& p( q8 k) }: G' ~$ b) ~: BgenMDX_ox4.py is the entrance file you want to use in CMD/terminal. I've also enlcosed a OALD4_azure.txt for testing purpose.
: r" w; T5 s$ P( }& S: f: ~8 m; l1 K

+ N$ d, a8 d- | R4 v) I. Y4 y4 j# N( _# Q
Windows下运行举例(需安装python):- D& ?/ @3 i$ r3 F4 E

- n( K& b' V. u* z; U3 V( C4 Y6 F4 U; d& N+ x
相较于原版我主要改了两个地方:7 k/ G6 m/ X- Y
1. 在代码里,以前一个字典的key只能对应唯一个value。而MDict完全支持多个相同词头对应多个意思。所以我改了代码,让一个字典的key可以对应多个value。
. Q5 @0 }) c7 j5 D% Z1 h9 i7 D6 {! b2. 修改排序算法,原版是用的默认python排序,输出的文件在MDict简直不能查。GD勉强能查。9 c$ Z8 z- |- z! g/ {3 p
" a. W( |: x" f/ N! |1 q' t1 n
# p5 R6 @3 f% S7 _2 \; [
* l1 s" X6 x8 q' L0 O# y( @
Python实现的txt转MDX代码:0 F9 Y8 W) i! q' h( C
% e( K5 r/ [. m/ Q* c欢迎提建议. G: j0 {& j; Q) B# I0 R6 P( k& \7 ~- Q
⚜ 感兴趣可以看看我的其他字典,绝大部分都公开分享。
# C/ v% ]+ e7 v7 r
1 ^8 f1 ~' ~9 p& l8 M# c# g$ @' `4 C$ |1 P# H4 X6 D9 Y5 |0 C
9 Y9 `! c3 Y7 Z2 r0 B
6 o) O$ H1 X) j, x
+ n$ r: z0 B# h3 v5 B7 d) h8 r% E
5 Y% C: q# J% t3 h+ Q |
评分
-
5
查看全部评分
-
本帖被以下淘专辑推荐:
- · Top1|主题: 136, 订阅: 130
- · 超棒的词典!|主题: 44, 订阅: 45
- · 词典制作|主题: 217, 订阅: 40
- · lgmcw|主题: 13, 订阅: 35
- · 工具|主题: 61, 订阅: 27
- · 更多
|