|
本帖最后由 i-wiki 于 2015-1-1 23:22 编辑
3 ]% G) A' [- M& C l" D/ R% e" L5 a! F0 I& {. v, d% d9 D9 D: ]
来一杯维基咖啡(http://pan.baidu.com/s/1sjNn917)吧!
/ F ]* n* _1 V: ?) O
5 v+ {' C9 ~0 M2 b3 z以后,不管是凛凛寒冬还是炎炎夏日,无论原料来自哪个国家或语言,你都可以简单地研磨,品尝一下它的风味。$ s/ u+ r# j; y Z8 [$ e8 a) N
& J5 M/ ]; q' [% ^8 |9 fWikiCafe是什么?这是一个快速的维基格式文件解析程序,工作在Windows平台,可以方便地将Wikipedia、WikiSource等数据文件转换为符合MDict要求的文本本件。
" J% E) ?" ?7 e为什么叫这样一个名字?因为咖啡是优雅的,正如Wiki,咖啡是苦中作乐的,也如Wiki。咖啡不是生活的必需,只是生活的点缀。/ }# F% A3 v7 y0 V# n4 Q( ^
4 \3 P) Z' \/ }# N8 j优点:
, }5 T; T" z/ L3 S# l8 {& N1、快速。“Wiki”本身就是“快点”的意思。WikiCafe的速度很快,下载的Wiki数据文件无需解压,直接就可以处理,并且采用了多个线程并行工作,较充分地利用了CPU的效能。
% s2 f; i8 b# d- O6 H( K2、美观。格式与之前的i-wiki引擎相似,外观接近于原Wiki页面。) l1 h$ p Z4 `3 p! _6 Y# W2 R1 A
3、可将数学公式处理为图片。
: e t$ G0 P" J0 A( l) y4、可生成图文并茂的页面。
$ s% S# [( q4 F' V6 i8 ]% [; A6 O( N缺点:8 |+ V; B8 _: X/ i8 C
1、未处理模板。所有的模板都保留下来了,不够好看,但保持了原有的风味。
* w* P$ f" C/ g" b& N: {& }2、因为是直接处理bz2压缩文件,所以页面中有些链接可能是无效的,就是Wiki网页中红色的链接。
0 ]+ O8 Z! \3 A3、数学公式是不完美的,有些会出错。1 F# T& ]0 i( o( l$ q, ~, V$ V
...7 Z7 K/ D1 p, B+ I
1 ~! x* r$ G) x/ }: J
可是不管怎样,以Simple English Wikipedia为例,WikiCafe处理接近100MB的Dump文件只需要几分钟。如果仅生成文字版中文Wiki的词典,那在1个多小时也能够全部完成,与以往的引擎相比,耗费的时间可谓是天壤之别了。% c: F- r/ K& X# ^4 g5 m
# G; i5 U3 z& K3 Q2 j/ e0 x8 t组成程序:
1 H( M# U {: q! }1 ZWikiCafe.exe 主程序
2 b/ m8 ~4 T/ e$ Y$ c2 \math.exe 根据Tex公式生成相应图片
" Q3 b4 T$ {7 K! tBin2Img.exe 图片集合文件处理程序1 B% O2 M2 Z$ t# n" I: y
Img2Bin.exe 将图片生成集合文件
$ f+ z( C. }% |3 T' x3 g可用其他程序如Wiki2Touch处理下载图片后,由Img2Bin汇聚为集合文件。* V- Z5 S% @* s c/ u
# \( M8 O( P. t6 T& x
使用方法: x' t7 M! Y" m5 }
1、首先要从dumps.wikimedia.com上下载相应的数据文件。中文以zh开头,可用ctrl+f搜索。
0 D* A. k; y: ^0 A: u% h5 u' z
/ Z b+ C+ V" @9 X' `2、如果要生成图文版,先用wiki2touch处理,也可下载经过i-wiki处理过的图片集合文件;运行Bin2Img.exe,得到图片索引文件pic.ini。如仅需生成文字版,可直接转下一步。
& _ ]5 @6 n# U& ]
0 {2 A3 `( g. s( U: x- d2 [( E0 c3、运行WikiCafe.exe,主要有以下参数:7 v& {) F, ^: \( m/ [$ f
.bz2文件 你所下载的Wiki数据文件,无需解压。# m @& z, _. T" s, W$ f
图片索引文件 如果想要生成图文版词典,你应该提供一个索引文件;如不提供,则不处理图片。
- A5 t& B J% S. g: ^+ y图片目录 图片等数据存放目录,也就是MdxBuilder中的mdd数据所在位置。公式图片就在此目录下,其他图片必须存放在该目录的pic文件夹中。如不指定或创建失败,则不处理包括公式在内的图片,公式以原Tex形式呈现。
' S! S: a+ `$ K2 x, h3 q' a' Z, q文本文件 生成的目标,即MdxBuilder中的Source文件。- Y: h, l: j' Q* e4 |/ n0 d
) K3 U* B& ^5 zWikiCafe运行后将在程序目录中生成:+ V" s8 K: o$ j2 ^" z
WikiCafe.cfg 内容如下例子) K8 i4 C! [9 ?! ?4 ^) Y
WikiBz2 = r:\simplewiki-20141222-pages-articles.xml.bz27 c9 B- q$ ]" c8 v, }0 O
PicIni = d:\pic.ini
6 q( k- Y8 F9 E, p/ i0 k$ R# J% SImgDir = r:\data\
0 g8 X6 D* S% ~4 rOutTxt = d:\s.txt
% M1 n$ k, K% B- b以后再运行WikiCafe,如发现程序目录中有该文件,会询问是否加载。加载可节省人机交互的时间。4 }+ J# n3 d2 E1 [! U
math.txt 数学公式,供math.exe使用( |5 Z" L! H& c1 q! _" T( l- r
images.txt 图片,供Bin2Img.exe使用
: Q3 c$ @: B9 R* q7 O& b
# d* K* K+ H* W% N: ^$ j4 D在图片目录中生成:
6 }) }* ^0 |. O5 f. {wiki.css+ n8 f2 f5 w7 G# N
wiki.png
\1 S8 S3 v1 l: |* H7 ^. ylink.png
- ]4 e% I# N w% V/ G8 [2 @
4 f2 S- X5 F& U0 M% d' {4、运行math.exe生成数学公式图片,主要参数:
n; D- r1 B+ Ymath.txt 公式文件,由WikiCafe处理后生成。
1 ~6 N+ j0 G4 i* r, b图片目录 可从WikiCafe.cfg中得到。+ u7 ^8 c( T7 C! c4 j
处理过程中会产生错误,无须理会屏幕中的错误信息,如出现异常中断运行,再次运行math.exe会从中断处继续进行处理。
. @, k: A+ Q; F. s9 R, u; G4 V
. d; z Z8 v4 R0 \5、图文版还需要运行Bin2Img得到词典中的图片,参数有:
& X1 n# y2 F6 j& j, F6 K图片集合文件 可下载经过i-wiki处理过的图片集合文件;
4 Q$ I0 ~* F7 Q( g8 V! h$ f. M% s+ pimages.txt 图片文件名,由WikiCafe处理后生成。# d5 o, A' J0 g- f0 `0 G7 m
图片目录 可从WikiCafe.cfg中得到。
( k' i# O2 ~3 C* F7 G% o! m; N8 u
6、运行MdxBuilder生成词典/ J7 J! n9 m& V4 x4 U& U
+ i2 P% A X: N% `8 ^6 y
|
评分
-
1
查看全部评分
-
|