|
本帖最后由 i-wiki 于 2013-4-9 08:59 编辑
; V3 J* x) D4 n2 E* C# {3 u
6 s& [, x8 {1 J9 M' \/ u四月至今,发布了两个WJ百科词典,参见:
# ~+ [1 _6 y1 L3 B/ Phttps://pdawiki.com/forum/thread-8946-1-6.html- x0 k5 Q% }- i" d
https://pdawiki.com/forum/thread-9378-1-1.html
' x% G: Y, e2 ]/ x8 r% \你还期待i-wiki继续发布新的吗?
7 ~5 x( \: N: Q J! }" R& O: m9 u谢谢大家的支持!可是,也许要让大家失望了,我不会再继续更新,除非有新的突破。 K( P3 I: c) `/ k
所以,今后大家要自己制作词典了。古语有云:“授人鱼,不如授人以渔”。虽然i-wiki不再发布新的词典,但是他自制的中文维基引擎就要和大家分享了,你也一样可以制作出精美的维基词典!
: h0 d0 b- @7 Z' l+ W5 b c+ q, L5 B8 M/ X$ H
之前也有坛友问到试用引擎的事,可是程序还不完善,不好意思拿出来和大家见面。经过这一段时间的修改,自我感觉基本可用了,加上现在程序编写也遇到了瓶颈,索性就放出来让大家一起来试用,在使用中逐步改进。
7 ~) T4 f( B6 r6 Z9 d" K( o4 m) t如果你能容忍6-13版的缺点,那么请接着往下看。
, l9 H! v" q U6 V1 @先上图,揭开新引擎的面纱。( t5 ^4 H+ C8 [4 w6 D3 w
) }7 H E% a' C/ r! V/ t- F
4 [' t2 `" W) `0 y) n9 t
" O% K# M) \% |+ b* J7 B7 K) S
8 r9 K1 o0 T8 j$ d一、硬件要求:" {' a7 _5 l+ I
配置总之越高越好。我自己制作2012-6-13版时用的笔记本是几年前的ThinkPad X200,CPU是酷睿II双核P8200(2.2GHz),内存2GB。大家现在的配置应该比这更好。
2 J2 a7 h) ]( K+ G1 }8 [& ~1 L
0 }: O, W3 J9 ~3 I二、软件环境:
' J7 x! |2 r6 y$ S4 p' v5 V在Windows XP中新引擎是绿色的,无需安装可直接运行。XP前的系统恐怕不行,之后的其他系统我没有测试,大家不妨试一试。" z! S) Y8 M/ v' A, f
# K, W" o0 Y% ?0 Q% J三、操作步骤:! }/ b! \- s/ J0 ?$ t* {! @; l3 m
1、先下载中文维基文档,解压为XML;. Y* a. F9 e% K" H: ~% z
2、将此大文档分解为若干个100M左右的小文档;, _, V+ Z! y7 h
3、复制本程序到xml文档所在目录,或生成与本程序同名的.ini文本文件:/ [( b8 J6 ]# F
src=待处理的XML文件目录
! t Y X- z$ y0 g n8 y. s @ tar=输出目录. [4 P8 f5 E% ]& ~
xml文件名列表
8 z; v) a- O$ @3 J) E* X4、运行本程序,处理完毕后可执行生成的.bat批处理文件将输出文件合并. l9 [8 C, V, O) e
5、将生成的cfg文件复制到MdxBuilder目录
; m# w3 L; u( j8 X6、运行MdxBuilder.exe,制作词典。% v2 Z6 J2 ]+ x7 p' L
* `; s$ a0 ], c4 _/ W0 I
四、简要说明:3 J O$ _% k3 v( d4 a
A.本程序主要用于解析维基百科的Dump数据文件,生成符合MDict格式的Html文本文件。; e T9 |! f( U- N8 u
B.Dump数据文件必须分割为小于128MB的部分以便处理,超过128MB的文件会被忽略。' n* Z6 }* F4 Q- `
C.操作步骤是可选的,点击链接可执行相应的步骤,第6步包含了第5步的复制操作。- j( ^4 {2 J: M; D
D.如直接点击处理按钮则相当于从第3步开始,即对程序所在目录下的XML文件转换。
" t. n5 @/ j7 b" ]1 y* H4 h E.本程序遵循Copyleft规范,详见维基百科中的相关条目。: g7 z, E/ Y3 F# y. u4 \% H3 l
2 y% `: a+ Y5 S2 Y0 j2 y! X* |新引擎在这里3 |/ w" @. r2 M T
" U( D3 a' _$ g( G6 c, p8 F. j# p$ Y4 B3 w9 b
6 W2 p9 S7 k4 r+ b五、文件说明:
7 c9 ` M" y3 l8 L3 h$ ?- T下载后只有1个主文件W2T.exe,Examples目录是给大家测试用的。运行后会在程序目录生成:
, L% N! T/ L. w5 ?E2C.ini 英中对照表。想到好多坛友都是英语高手,所以放出来让大家帮忙修改,如果看到条目中信息框中翻译得不好的、没有翻译的,大家就在这个表中修改、添加。! t- Q6 d$ f$ E2 R% d1 [ s$ Y
W2T.ini 待处理XML文件列表。运行完毕会删除。
# T! d/ H2 `2 A7 x& O, l ^在源文件夹下,执行“分解”操作后会生成:(如Dumps解压文件为w.xml)- v" I- B$ U; Y+ C0 S- k2 t1 v
w01.xml <128MB的分块" g5 g' w' L* G! @8 r. q
w02.xml
3 o7 l0 M' r' _7 L- Q! |…
; n, p, M( `0 F* C: p7 D# ~; Gw.idx 索引文件。没有它也可以的,就按article中的关键字生成超链接,但是有些链接(在线维基中的红色关键字)实际没有相应条目。$ P" F* {& o' n; F) i# h5 Q5 A
在目标文件夹下,运行后会生成:
0 _2 Y% w$ t* {) Bw01.xml.txt! d1 ~; W% h9 l- `, @
w02.xml.txt, C) M7 y- }4 J8 G& ?* X
…
8 A* z6 z# U3 V! O0 w( gwiki.bat 合并生成wiki.txt的批处理程序5 H7 r$ U$ a a
mdxconfig.cfg0 [! T2 e! i+ R* W* r; c% g
还有数据文件夹
7 G+ M$ ]8 ?0 Tdata\5 h5 \3 a) z9 t- y$ c1 w) L
其中包含三个文件:8 k9 o/ H9 m( B' x3 W
wiki.css 层叠样式表,大家可以修改成你喜欢的格式。- @8 Z4 l6 c5 v( N6 J* Q, g6 R
link.gif$ w: l% u' d- _; B5 M2 w7 S
wiki.png
1 z. E: }8 w3 m/ L0 d4 ~; O' w和很多两字母命名的文件夹,里面是公式图片+ {6 c8 a* O' j, K5 H
4 F8 c# u- Y7 n6 T因为论坛里附件不能下载的原因,所以想尝试的朋友可以到网盘 r. r+ L$ T) ~7 G6 G: d& q
http://pan.baidu.com/share/link?shareid=253240&uk=19473610 |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?免费注册
x
评分
-
2
查看全部评分
-
|