TA的每日心情 | 奋斗 2020-11-15 11:37 |
---|
签到天数: 249 天 [LV.8]以坛为家I
|
本帖最后由 lgmcw 于 2020-11-19 22:31 编辑
) T! S) C8 h. y$ U( n$ Y1 Z, Y. ~0 Z% V$ s/ A
这帖target的是硬核玩家,希望对有需要的人有所帮助。代码比较乱,拖了好久都懒得整理,正好朋友又找我需要,趁着一鼓作气整理出来就正好也贴在论坛里吧。我这里不跟进你那边的环境调试了,如果有运行错误自己修一下(python3可参考楼下的修改经验);不过还是鼓励回帖反馈。对我以后做新人友好版有帮助。
6 M" y4 G* \) w# Q- v/ F( X以后我会做一款带GUI的,针对小白玩家。
0 F; `* i$ ~( V4 o& @# V- v0 C' C) O6 P& D* T- Z
入口文件,运行genMDX_ox4.py即可开始打包,附了一个牛津4的txt源码,我已经调试好,确保在我这里能工作,下载后可以直接运行用来测试程序。我的所有字典都是用这个程序打包,暂时没什么大问题。词条数最多我试过的简明英汉400多万词头;体积最大的OED,txt源码就有2.4G;这些打包都毫无压力。不过我这边还在用老古董python2.7;python3应该也能用,如果报错,可能需要自己debug一下。0 Q* q X* `0 L( C9 T
genMDX_ox4.py is the entrance file you want to use in CMD/terminal. I've also enlcosed a OALD4_azure.txt for testing purpose. Q; G; M: M: D$ H0 n, B+ f* B
. k' P; D# g$ f* g5 m: R3 o
" ^7 M" v2 ]" |5 E6 ]. V: o% L, e/ g$ z2 t
Windows下运行举例(需安装python):
" v. w( `7 h- k* Y$ B" n1 K4 \2 G: ~3 J6 o) E+ q3 w0 L
: G( n1 A7 O& M+ m
相较于原版我主要改了两个地方:
' m2 [6 t# m4 H1. 在代码里,以前一个字典的key只能对应唯一个value。而MDict完全支持多个相同词头对应多个意思。所以我改了代码,让一个字典的key可以对应多个value。. ?; I# k1 H Y/ N) ?' Y
2. 修改排序算法,原版是用的默认python排序,输出的文件在MDict简直不能查。GD勉强能查。
# n; A# w: x0 X5 y4 d/ ]
: I6 y" f7 \3 e* Z2 i. f1 r0 W9 z* D% v8 t' s* {" X! s9 M
L, `9 {& {' {" I$ L, b
Python实现的txt转MDX代码:
x' Q( U3 K2 R( a7 y9 n! E" }: v/ g0 z6 ~6 I
欢迎提建议" n" \" d" b! o: }
⚜ 感兴趣可以看看我的其他字典,绝大部分都公开分享。
" a3 J0 a7 B$ b9 O7 f+ l( Z$ J" F$ u
/ ^! ~$ m: B$ l
$ E+ }6 ], w' ~! u
2 L# V# N. d( E* O. g
9 i0 o8 g' W2 H8 y" F. c
% Q2 A' z4 @4 i0 r0 H8 ]
|
评分
-
5
查看全部评分
-
本帖被以下淘专辑推荐:
- · Top1|主题: 136, 订阅: 130
- · 超棒的词典!|主题: 44, 订阅: 45
- · 词典制作|主题: 217, 订阅: 40
- · lgmcw|主题: 13, 订阅: 35
- · 工具|主题: 61, 订阅: 28
- · 更多
|