|
本帖最后由 i-wiki 于 2013-4-9 08:59 编辑
7 j! b$ c& W4 i4 _, ? t5 C4 t6 ]" l' D. e6 O- j8 W9 T6 y5 D) a9 f. P
四月至今,发布了两个WJ百科词典,参见:7 C. r& a6 V% o) w
https://pdawiki.com/forum/thread-8946-1-6.html9 `2 x* a$ i$ B! h
https://pdawiki.com/forum/thread-9378-1-1.html
% x. |$ e: O/ W3 \8 _- m你还期待i-wiki继续发布新的吗?, s% U6 m# b' q2 \% j. N
谢谢大家的支持!可是,也许要让大家失望了,我不会再继续更新,除非有新的突破。6 F0 ?1 a5 V! M4 w
所以,今后大家要自己制作词典了。古语有云:“授人鱼,不如授人以渔”。虽然i-wiki不再发布新的词典,但是他自制的中文维基引擎就要和大家分享了,你也一样可以制作出精美的维基词典!
: r0 p1 A0 D7 N) v
6 h6 \9 F% X% r, \! G3 A2 w9 M之前也有坛友问到试用引擎的事,可是程序还不完善,不好意思拿出来和大家见面。经过这一段时间的修改,自我感觉基本可用了,加上现在程序编写也遇到了瓶颈,索性就放出来让大家一起来试用,在使用中逐步改进。+ A i" }; e6 [& i3 V
如果你能容忍6-13版的缺点,那么请接着往下看。0 a' B. [# M3 U* d8 g5 U# N- ]7 t
先上图,揭开新引擎的面纱。2 \; z" ]% w# O8 u: e! n9 W1 d
; e, W4 ` ~1 f0 F. Q4 h! \
! h3 n+ ?- [9 u1 o! y% m7 [. E& A; C y- S4 r5 K
$ d* K; {+ o, o/ T; J2 V一、硬件要求:
4 p! }# B- V& a# F# k2 E配置总之越高越好。我自己制作2012-6-13版时用的笔记本是几年前的ThinkPad X200,CPU是酷睿II双核P8200(2.2GHz),内存2GB。大家现在的配置应该比这更好。
& Z/ t: H5 A2 F# [* N; L1 T' w! e6 y
二、软件环境:
% h$ @( _( q5 F7 I在Windows XP中新引擎是绿色的,无需安装可直接运行。XP前的系统恐怕不行,之后的其他系统我没有测试,大家不妨试一试。
% a h1 |5 ?' v$ \+ u0 [
( X9 C) f& z- Y& N8 F7 ~三、操作步骤:8 S! H+ O% \" K3 ]/ Y( N
1、先下载中文维基文档,解压为XML;- p1 N% d! `0 ^ h4 Q | ]
2、将此大文档分解为若干个100M左右的小文档;3 `2 F- m U& J7 q' Q
3、复制本程序到xml文档所在目录,或生成与本程序同名的.ini文本文件:
3 c, [( }$ [+ p" P; f src=待处理的XML文件目录! v8 Q; l) J* {3 x
tar=输出目录: B% y0 }; j' ?- S& F! S
xml文件名列表- q5 N. Z6 A V- v1 G6 K# q4 Q! I
4、运行本程序,处理完毕后可执行生成的.bat批处理文件将输出文件合并# u) M( t4 l% j
5、将生成的cfg文件复制到MdxBuilder目录
# j' Y' X5 P- S1 V7 [6、运行MdxBuilder.exe,制作词典。+ l0 X# f5 C0 E
7 C# Z& B6 r N' o( \0 @; Z1 o: K0 V四、简要说明:
J7 S% B5 ]3 u/ ^! f- y/ F( w A.本程序主要用于解析维基百科的Dump数据文件,生成符合MDict格式的Html文本文件。) ~5 @" O. F9 [6 q+ q! A# C8 h* k. l
B.Dump数据文件必须分割为小于128MB的部分以便处理,超过128MB的文件会被忽略。/ A; R# d' g- V7 h
C.操作步骤是可选的,点击链接可执行相应的步骤,第6步包含了第5步的复制操作。( E6 b7 `" q7 X, z$ z+ ]/ ]$ a7 j
D.如直接点击处理按钮则相当于从第3步开始,即对程序所在目录下的XML文件转换。
p! H3 R2 n# i! p# C( x/ I- H E.本程序遵循Copyleft规范,详见维基百科中的相关条目。+ Q+ e& F p- g. G& j& ^& U' y
# n; n3 A. Q/ H! H! n新引擎在这里+ c& r4 N5 ]" Y! z, U/ Q8 b
& X3 Z: Y1 e/ y$ J
6 Z. W2 e& ?; s1 j9 x7 v) m6 g
五、文件说明:+ ~4 V/ [0 g: e9 V' ]( j0 { y
下载后只有1个主文件W2T.exe,Examples目录是给大家测试用的。运行后会在程序目录生成:
# G3 _: E9 l5 X5 Z9 s" h/ B8 tE2C.ini 英中对照表。想到好多坛友都是英语高手,所以放出来让大家帮忙修改,如果看到条目中信息框中翻译得不好的、没有翻译的,大家就在这个表中修改、添加。
/ X W$ q8 u. W; d( ?) F }W2T.ini 待处理XML文件列表。运行完毕会删除。
0 o Z- {) M3 s1 H+ s6 L8 ^, Z; J% |在源文件夹下,执行“分解”操作后会生成:(如Dumps解压文件为w.xml). u. R6 s" O) m: }( }' ~7 \* Z. a4 i8 B6 [
w01.xml <128MB的分块# ^- A9 v" H. s( X! T
w02.xml
$ I" }+ G `7 }' e [: e7 d8 n( Q* o…3 G) c- \7 o/ ~7 ~' O `3 G
w.idx 索引文件。没有它也可以的,就按article中的关键字生成超链接,但是有些链接(在线维基中的红色关键字)实际没有相应条目。
7 b: [% t0 K* P2 r9 }在目标文件夹下,运行后会生成:
% w. n# T3 B* z' F2 {2 bw01.xml.txt2 \7 o& g2 }. D a7 p- S6 U
w02.xml.txt" u D5 ~6 P0 h. C; Q% s$ r
…7 p7 h- f4 _4 [% l* i4 ^ u9 Q
wiki.bat 合并生成wiki.txt的批处理程序9 b# C$ P! I, M- `& n
mdxconfig.cfg
8 s) u( q2 g. ^* a4 d( c还有数据文件夹$ [$ G5 ~+ D. M( Z
data\
9 }8 |5 R( H0 d+ Z3 I3 o其中包含三个文件:* Z/ x% j- L9 g. x
wiki.css 层叠样式表,大家可以修改成你喜欢的格式。. I4 ^6 x" ?$ g9 f; o8 }/ C5 @
link.gif! R' S& L9 [1 [. S# M
wiki.png2 A+ R( G1 F, g' k2 i' T: u) h3 A
和很多两字母命名的文件夹,里面是公式图片( D- s8 L! r s" G7 z
/ X4 @* B% D0 ^2 v H
因为论坛里附件不能下载的原因,所以想尝试的朋友可以到网盘
3 L+ q/ T n0 v! [http://pan.baidu.com/share/link?shareid=253240&uk=19473610 |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?免费注册
x
评分
-
2
查看全部评分
-
|