TA的每日心情 | 奋斗 2020-11-15 11:37 |
---|
签到天数: 249 天 [LV.8]以坛为家I
|
本帖最后由 lgmcw 于 2020-11-19 22:31 编辑 . v: k# G- O8 Z( \7 j6 }0 M
% Y m% v# D# m0 @) I3 X
这帖target的是硬核玩家,希望对有需要的人有所帮助。代码比较乱,拖了好久都懒得整理,正好朋友又找我需要,趁着一鼓作气整理出来就正好也贴在论坛里吧。我这里不跟进你那边的环境调试了,如果有运行错误自己修一下(python3可参考楼下的修改经验);不过还是鼓励回帖反馈。对我以后做新人友好版有帮助。
% b( }/ e" A1 e' i2 Q R- U. g以后我会做一款带GUI的,针对小白玩家。6 U* T& B$ X( f/ k5 S$ ~: L
, Z" i, Q2 w5 w
入口文件,运行genMDX_ox4.py即可开始打包,附了一个牛津4的txt源码,我已经调试好,确保在我这里能工作,下载后可以直接运行用来测试程序。我的所有字典都是用这个程序打包,暂时没什么大问题。词条数最多我试过的简明英汉400多万词头;体积最大的OED,txt源码就有2.4G;这些打包都毫无压力。不过我这边还在用老古董python2.7;python3应该也能用,如果报错,可能需要自己debug一下。/ ?8 V# e. P, b$ ^
genMDX_ox4.py is the entrance file you want to use in CMD/terminal. I've also enlcosed a OALD4_azure.txt for testing purpose.
6 v3 [. L: Y6 b
( `5 e; a( X3 d2 C* y 2 G4 _6 l7 s; @. |% l& B
" {4 V' W: Q2 k0 P- l& R# [
Windows下运行举例(需安装python):
) F% d* s/ L6 \' ? {5 Y 1 t! h% y* q# y
" ]/ @( w# ` m# M: h- @8 |相较于原版我主要改了两个地方:: p: ^: ~ d' ]& [' B
1. 在代码里,以前一个字典的key只能对应唯一个value。而MDict完全支持多个相同词头对应多个意思。所以我改了代码,让一个字典的key可以对应多个value。
! i+ ?- ` q% @0 ~8 u! } s5 Z2. 修改排序算法,原版是用的默认python排序,输出的文件在MDict简直不能查。GD勉强能查。$ q) Q" G+ Y$ p, l
/ ], d$ l$ {/ K

9 [/ @! l, O( N+ t- [8 p/ M: [4 }) v
Python实现的txt转MDX代码:
$ V" X4 Z+ \; D' d6 j8 B+ N$ @4 q) c- A m
欢迎提建议
1 ^+ Z- \6 B. v: u) ]9 W! y2 @8 P⚜ 感兴趣可以看看我的其他字典,绝大部分都公开分享。: C4 R% ?! \( g1 y6 s
1 a. Z8 C# W% X: F$ \% W q/ s k* ?1 f8 H( I
, z% ]; Z3 X1 Z5 g. P$ u1 Y0 t8 D* ]: [& T7 V* _% r
& y: ^7 s0 t. ?% N" b
5 \3 F" ]0 Q3 k3 w" V0 e/ N3 x+ K |
评分
-
5
查看全部评分
-
本帖被以下淘专辑推荐:
- · Top1|主题: 136, 订阅: 130
- · 超棒的词典!|主题: 44, 订阅: 45
- · 词典制作|主题: 217, 订阅: 40
- · lgmcw|主题: 13, 订阅: 35
- · 工具|主题: 61, 订阅: 27
- · 更多
|