|
本帖最后由 i-wiki 于 2013-4-9 08:59 编辑 + O2 W7 X2 m. W; M) H
0 _5 J' _1 \$ P' Y, H3 D
四月至今,发布了两个WJ百科词典,参见:( E, C5 B' q& ~8 b2 u# [
https://pdawiki.com/forum/thread-8946-1-6.html
7 Q3 i0 z8 F) h; C, Q4 Ghttps://pdawiki.com/forum/thread-9378-1-1.html! I# I# M) Q, m5 x
你还期待i-wiki继续发布新的吗?
% Q% c) a. W, _: g# ?% [谢谢大家的支持!可是,也许要让大家失望了,我不会再继续更新,除非有新的突破。" g) Q3 w: t. | p, U' u
所以,今后大家要自己制作词典了。古语有云:“授人鱼,不如授人以渔”。虽然i-wiki不再发布新的词典,但是他自制的中文维基引擎就要和大家分享了,你也一样可以制作出精美的维基词典!8 X" u: C. O0 i! y5 I
0 C( N; ^* a* w. Z之前也有坛友问到试用引擎的事,可是程序还不完善,不好意思拿出来和大家见面。经过这一段时间的修改,自我感觉基本可用了,加上现在程序编写也遇到了瓶颈,索性就放出来让大家一起来试用,在使用中逐步改进。
3 @5 n+ l' p" n7 r0 o" q如果你能容忍6-13版的缺点,那么请接着往下看。. c- U, X3 P- `( u& q' h; ]
先上图,揭开新引擎的面纱。
# u4 O- R2 ^' p
5 c( k2 n, y% I5 p+ \( Y& C8 {
; k Q5 }+ m9 m, `3 W" E' a8 S
5 d4 s0 i( Y, e( i2 \一、硬件要求:
2 u6 B8 L; t7 [配置总之越高越好。我自己制作2012-6-13版时用的笔记本是几年前的ThinkPad X200,CPU是酷睿II双核P8200(2.2GHz),内存2GB。大家现在的配置应该比这更好。$ \: J# q& \1 c( A4 C* Y+ e1 Z
* E5 l: a" x) H# A( U
二、软件环境:% a, @8 R, S+ ~- W" O7 e
在Windows XP中新引擎是绿色的,无需安装可直接运行。XP前的系统恐怕不行,之后的其他系统我没有测试,大家不妨试一试。& ?- Q9 [9 _2 c+ {( r
+ r% ?- ?! s, j三、操作步骤:
* E/ X9 m* I, b. _+ {$ U1、先下载中文维基文档,解压为XML;+ |9 O, `0 K0 ^
2、将此大文档分解为若干个100M左右的小文档;
7 g" J+ m7 E9 {7 s c1 ^& ^0 A' G& s3、复制本程序到xml文档所在目录,或生成与本程序同名的.ini文本文件:
( T+ q6 I \4 _8 d2 c src=待处理的XML文件目录
4 {9 D8 L5 M, H% V8 X7 i! J tar=输出目录
. K+ m$ F) E' g5 _ xml文件名列表) `% V3 u g! `7 ^
4、运行本程序,处理完毕后可执行生成的.bat批处理文件将输出文件合并! U w# M" }& D' Z+ a7 u) J7 }
5、将生成的cfg文件复制到MdxBuilder目录( B* B: ~' h5 b$ D7 I' E' n8 s; R
6、运行MdxBuilder.exe,制作词典。
+ I) u' r3 {% `+ S) a0 f& U5 h8 D2 e8 L6 c" }% G
四、简要说明:
" ~, q2 _4 w; Z( k7 U A.本程序主要用于解析维基百科的Dump数据文件,生成符合MDict格式的Html文本文件。
& J `; ~3 F. ^4 a! @% W B.Dump数据文件必须分割为小于128MB的部分以便处理,超过128MB的文件会被忽略。! n$ j6 O! x. L( d% L
C.操作步骤是可选的,点击链接可执行相应的步骤,第6步包含了第5步的复制操作。
1 m' ?' h6 \; G: L4 l6 r D.如直接点击处理按钮则相当于从第3步开始,即对程序所在目录下的XML文件转换。$ } a* P: W0 {1 U3 o: n% }+ X
E.本程序遵循Copyleft规范,详见维基百科中的相关条目。
8 a8 G' M. m0 h d6 |) w. ~9 D0 L9 n W" e# v6 K
新引擎在这里5 D5 q4 r/ \5 g' O6 ~
1 N* ?: Z3 _% z
4 P% N; z7 i* @! K4 y8 J% J0 I3 ]. S4 O' ]1 X# O
五、文件说明:
3 l6 @; I" A+ n, h7 ]8 a" T, ^下载后只有1个主文件W2T.exe,Examples目录是给大家测试用的。运行后会在程序目录生成:
2 f, ~' d( [1 P) @' \E2C.ini 英中对照表。想到好多坛友都是英语高手,所以放出来让大家帮忙修改,如果看到条目中信息框中翻译得不好的、没有翻译的,大家就在这个表中修改、添加。
! p# g, R/ l" H. a3 T, D, GW2T.ini 待处理XML文件列表。运行完毕会删除。
$ q/ Y" [2 N- [ [% o; a# l1 z在源文件夹下,执行“分解”操作后会生成:(如Dumps解压文件为w.xml)
$ T" m/ r) j% V( r. c) h( _w01.xml <128MB的分块
( S; w9 V+ |5 x6 x8 a9 P; [w02.xml- r+ ~/ y! {; q+ I8 Q
…# G/ J, y* b- {0 m4 ]8 {" X
w.idx 索引文件。没有它也可以的,就按article中的关键字生成超链接,但是有些链接(在线维基中的红色关键字)实际没有相应条目。2 \4 K1 b% |. I/ a2 y& l& n8 N
在目标文件夹下,运行后会生成:3 ]0 F% S: y/ w" ^. K5 L; N
w01.xml.txt) |' D. ^- y$ {0 V+ k
w02.xml.txt* ^- J$ ~) K1 J, {3 Y* _
…9 Z, n1 \! T" L: }6 Q+ M& h
wiki.bat 合并生成wiki.txt的批处理程序
7 ^0 m* {2 B9 X! C' [mdxconfig.cfg
3 `/ x! |0 I; U: n' M5 ?: g$ Y还有数据文件夹. b# D5 ^" v/ T8 u: Z7 \
data\
& R0 B* D3 A$ |其中包含三个文件:# f7 `9 l3 q* I# ]' o0 G
wiki.css 层叠样式表,大家可以修改成你喜欢的格式。% H; E) r u$ f0 O# a$ N
link.gif x, o: _' z: X* [! h
wiki.png: i- h6 ~. c$ N
和很多两字母命名的文件夹,里面是公式图片4 N/ Y# X6 }4 I b+ r! q' }2 z6 `+ a# \
/ K5 [" r* M$ l- ?5 E, X
因为论坛里附件不能下载的原因,所以想尝试的朋友可以到网盘
' }; F0 G% q) r3 e3 c' Ohttp://pan.baidu.com/share/link?shareid=253240&uk=19473610 |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?免费注册
x
评分
-
2
查看全部评分
-
|