|
本帖最后由 i-wiki 于 2013-4-9 08:59 编辑 $ H% g+ h9 l, F; \
+ h+ s! I3 h; w+ e# V四月至今,发布了两个WJ百科词典,参见:7 r! Y8 I( B' A
https://pdawiki.com/forum/thread-8946-1-6.html
. w) t* s- m4 C6 P) K! {1 Dhttps://pdawiki.com/forum/thread-9378-1-1.html+ }& m( Z0 q4 O! W7 B
你还期待i-wiki继续发布新的吗?/ r" J4 g1 K6 `' Y; N
谢谢大家的支持!可是,也许要让大家失望了,我不会再继续更新,除非有新的突破。
6 |8 H, ]$ B4 U, X所以,今后大家要自己制作词典了。古语有云:“授人鱼,不如授人以渔”。虽然i-wiki不再发布新的词典,但是他自制的中文维基引擎就要和大家分享了,你也一样可以制作出精美的维基词典!( q- h! s# y$ a) d& U; l+ _
# k5 |/ V" x* X2 T( {0 Y( d
之前也有坛友问到试用引擎的事,可是程序还不完善,不好意思拿出来和大家见面。经过这一段时间的修改,自我感觉基本可用了,加上现在程序编写也遇到了瓶颈,索性就放出来让大家一起来试用,在使用中逐步改进。 x1 x2 E5 J! J( Y4 K0 [
如果你能容忍6-13版的缺点,那么请接着往下看。
) a4 B/ v6 Y0 y0 }5 h) b先上图,揭开新引擎的面纱。
) j1 M. ?# ?6 p0 S% r% a& q; u0 B8 s( ?( y! b9 b
. `2 T1 u) i2 ] y5 y' t( u3 A+ Y9 Y8 \! ]3 p
. l: m2 C4 }$ U3 i9 N4 F一、硬件要求:' F% x9 E# g9 h0 G5 i: w
配置总之越高越好。我自己制作2012-6-13版时用的笔记本是几年前的ThinkPad X200,CPU是酷睿II双核P8200(2.2GHz),内存2GB。大家现在的配置应该比这更好。
4 G& c, |# r" F. Q( g; R5 J$ u$ {# P' R! |8 c4 {0 l
二、软件环境:
7 E+ W) N0 A# B1 _" [2 F7 M8 M8 r在Windows XP中新引擎是绿色的,无需安装可直接运行。XP前的系统恐怕不行,之后的其他系统我没有测试,大家不妨试一试。" q0 g8 l: F, e% }* Z9 h
) I* V$ Z/ A' A4 s+ V0 l三、操作步骤:
! c6 j( u/ g# k: _- y5 C1 f1、先下载中文维基文档,解压为XML;/ m/ k1 U. X/ e5 g
2、将此大文档分解为若干个100M左右的小文档;9 x+ `( J& d% M/ S( H/ J
3、复制本程序到xml文档所在目录,或生成与本程序同名的.ini文本文件:& F9 T* m& J# N8 \
src=待处理的XML文件目录
/ S$ X8 R; G- A" B8 B2 @0 q tar=输出目录3 B% g0 R* y7 { x, T; c
xml文件名列表
[6 \, k+ w8 l5 c5 b) M/ Z' L4、运行本程序,处理完毕后可执行生成的.bat批处理文件将输出文件合并
0 [2 b2 ^8 K B* M5、将生成的cfg文件复制到MdxBuilder目录
: i2 l% g: Z! [6、运行MdxBuilder.exe,制作词典。" X6 o' S3 P2 d: r" [( d" a! V
2 P& Y6 D3 Y- J9 H6 l: e
四、简要说明:
$ ` Z! h% L6 V3 y A.本程序主要用于解析维基百科的Dump数据文件,生成符合MDict格式的Html文本文件。
) I E9 J" `$ e5 F! F9 A7 x5 C B.Dump数据文件必须分割为小于128MB的部分以便处理,超过128MB的文件会被忽略。
- l3 }0 z% ?( H) Q5 U% d C.操作步骤是可选的,点击链接可执行相应的步骤,第6步包含了第5步的复制操作。$ K/ l! ^9 g, f6 `( Z( O9 M
D.如直接点击处理按钮则相当于从第3步开始,即对程序所在目录下的XML文件转换。
- ^! x% i* n3 {9 c E.本程序遵循Copyleft规范,详见维基百科中的相关条目。
7 {1 M- d* r; t0 O. y, i6 Y" T- v4 U$ N8 x# x
新引擎在这里
( M' ~- J, J8 D1 d1 t, M! O6 z- l4 f2 A- A* }" U
8 ^. K" D& h! @- m
# t3 S6 P* D; [+ S% {' M
五、文件说明:9 \. y2 |" X: u* J5 ]
下载后只有1个主文件W2T.exe,Examples目录是给大家测试用的。运行后会在程序目录生成:
& x7 }4 h$ M- {$ tE2C.ini 英中对照表。想到好多坛友都是英语高手,所以放出来让大家帮忙修改,如果看到条目中信息框中翻译得不好的、没有翻译的,大家就在这个表中修改、添加。% f; b; u' [5 X% ~! @; p
W2T.ini 待处理XML文件列表。运行完毕会删除。
2 v% i: O8 a; L" F$ E% S7 s1 T; h在源文件夹下,执行“分解”操作后会生成:(如Dumps解压文件为w.xml)/ d& y; v6 J. r2 ]
w01.xml <128MB的分块
9 [5 z' }7 K- J0 N5 s. M; B# ^$ uw02.xml) m8 Q% i: D) d$ t* M. [
…
% g" t) {0 u: y0 ?" Q) ?# z; h V2 m8 gw.idx 索引文件。没有它也可以的,就按article中的关键字生成超链接,但是有些链接(在线维基中的红色关键字)实际没有相应条目。
3 P5 a' x7 d% o% _/ Z* Z D在目标文件夹下,运行后会生成:% y h- h& {% C: X
w01.xml.txt
8 k3 U$ ^7 e, G4 [! U* i3 Cw02.xml.txt+ x! b3 r' ^9 R1 O) O3 Z. ], P
…
|2 r6 X7 S0 m) k8 I! {. Ywiki.bat 合并生成wiki.txt的批处理程序$ ~; [3 D |# f P* w7 P" B
mdxconfig.cfg
3 n; }6 z) r" P9 A9 W7 w还有数据文件夹! m! i% G0 U& ^, X1 V9 Z2 V3 [
data\# V0 g- X% e$ u. k A
其中包含三个文件:& b; j5 a/ m* g- f$ V! U% h# U3 W! @! c
wiki.css 层叠样式表,大家可以修改成你喜欢的格式。' x! c& s: D; E. t
link.gif. p; H/ P; P7 @0 L
wiki.png
) g# p' y- \, I; L" Z3 N和很多两字母命名的文件夹,里面是公式图片1 f, y) ~$ P8 N5 @
9 \ ?7 p* z! U. g, W* D {# `因为论坛里附件不能下载的原因,所以想尝试的朋友可以到网盘
# o* Z. F$ @& H3 |! _- `7 i: ~http://pan.baidu.com/share/link?shareid=253240&uk=19473610 |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?免费注册
x
评分
-
2
查看全部评分
-
|