TA的每日心情 | 奋斗 2020-11-15 11:37 |
---|
签到天数: 249 天 [LV.8]以坛为家I
|
本帖最后由 lgmcw 于 2020-11-19 22:31 编辑
* Y; q' e9 T" g, I% ^
m, K7 G8 j% ?: \这帖target的是硬核玩家,希望对有需要的人有所帮助。代码比较乱,拖了好久都懒得整理,正好朋友又找我需要,趁着一鼓作气整理出来就正好也贴在论坛里吧。我这里不跟进你那边的环境调试了,如果有运行错误自己修一下(python3可参考楼下的修改经验);不过还是鼓励回帖反馈。对我以后做新人友好版有帮助。$ V* S' S6 A/ @0 a% \! x# g3 H) ]
以后我会做一款带GUI的,针对小白玩家。
! a8 h4 S, {% A* ~2 ?& J! }
% B$ r% }4 W8 D' R( [/ r0 Q* W入口文件,运行genMDX_ox4.py即可开始打包,附了一个牛津4的txt源码,我已经调试好,确保在我这里能工作,下载后可以直接运行用来测试程序。我的所有字典都是用这个程序打包,暂时没什么大问题。词条数最多我试过的简明英汉400多万词头;体积最大的OED,txt源码就有2.4G;这些打包都毫无压力。不过我这边还在用老古董python2.7;python3应该也能用,如果报错,可能需要自己debug一下。
' \ y& o8 B8 L4 S9 hgenMDX_ox4.py is the entrance file you want to use in CMD/terminal. I've also enlcosed a OALD4_azure.txt for testing purpose. % P; g) ]7 |& _ k1 e
1 v, G; ~. p3 i5 D6 A5 R- X5 l
+ R5 z$ ?# g" I" W
) g, |9 w4 P9 b, e/ t# ~. bWindows下运行举例(需安装python):
. I) Z# \3 T( _6 e$ S/ L
; h0 U9 r* I4 A, _( L" N3 [; F& n. [0 q. L8 D$ P
相较于原版我主要改了两个地方:
* C5 O4 S, c }3 K2 v& h1. 在代码里,以前一个字典的key只能对应唯一个value。而MDict完全支持多个相同词头对应多个意思。所以我改了代码,让一个字典的key可以对应多个value。- X V0 K5 }3 n
2. 修改排序算法,原版是用的默认python排序,输出的文件在MDict简直不能查。GD勉强能查。
+ K E6 u& }! a/ t$ d( }' R: g
b9 Y, q2 R2 J; n& b, ` - V3 W& K) p. W% B2 B0 ^, u! i
* \7 _# g4 U' Y* p$ [! C" t
Python实现的txt转MDX代码:9 c6 s' W$ N4 M3 T+ w( Z( V1 a6 o
" m! e, f" F4 ?) T* \) R3 ^欢迎提建议% {7 d" }2 e+ G! s
⚜ 感兴趣可以看看我的其他字典,绝大部分都公开分享。
7 o% t8 n4 {# J
8 C( Z! p" E; x. ?( n _; t) B6 ?/ m/ Q% n8 G
4 f0 D/ J9 Q; `; |
! c+ i+ L! j$ ^. C- c; G. Z9 s# l1 |1 q0 s V
5 ^9 n* w3 P1 E* |" z) h o
|
评分
-
5
查看全部评分
-
本帖被以下淘专辑推荐:
- · Top1|主题: 136, 订阅: 130
- · 超棒的词典!|主题: 44, 订阅: 45
- · 词典制作|主题: 217, 订阅: 40
- · lgmcw|主题: 13, 订阅: 35
- · 工具|主题: 61, 订阅: 27
- · 更多
|