|
本帖最后由 i-wiki 于 2015-1-1 23:22 编辑
3 ~$ @3 U! {9 p( ] |3 q( P% P9 G6 b' X4 a8 m9 \ e
来一杯维基咖啡(http://pan.baidu.com/s/1sjNn917)吧!
& r" O4 m: @' D* Q
1 ]- T, w" \; G r m; D, I. W8 }6 P以后,不管是凛凛寒冬还是炎炎夏日,无论原料来自哪个国家或语言,你都可以简单地研磨,品尝一下它的风味。
% a; @' t& X1 a/ f
0 r1 `# f- p& d# _3 aWikiCafe是什么?这是一个快速的维基格式文件解析程序,工作在Windows平台,可以方便地将Wikipedia、WikiSource等数据文件转换为符合MDict要求的文本本件。
9 a, `# g' V; m: n, }: g% b0 |为什么叫这样一个名字?因为咖啡是优雅的,正如Wiki,咖啡是苦中作乐的,也如Wiki。咖啡不是生活的必需,只是生活的点缀。" V: D: B6 K+ }0 j$ ~- j, K
8 ]* [/ p2 Z% I4 w$ C& C优点:
, U' m! t% A& X1 T1、快速。“Wiki”本身就是“快点”的意思。WikiCafe的速度很快,下载的Wiki数据文件无需解压,直接就可以处理,并且采用了多个线程并行工作,较充分地利用了CPU的效能。5 b- q. V, C1 a3 f* {! A
2、美观。格式与之前的i-wiki引擎相似,外观接近于原Wiki页面。 Z; K) ^. A& x# @" G, g
3、可将数学公式处理为图片。% u! q5 f; g, t
4、可生成图文并茂的页面。! R/ f! i8 R. `& Y' ]+ W4 t
缺点:4 k5 O1 ]; z$ s* {( R
1、未处理模板。所有的模板都保留下来了,不够好看,但保持了原有的风味。
! k- I: }# W) Z; Q: E6 N/ \2、因为是直接处理bz2压缩文件,所以页面中有些链接可能是无效的,就是Wiki网页中红色的链接。
; I/ E+ |8 x$ {/ u! O- |8 b; S3、数学公式是不完美的,有些会出错。
, N I$ G4 l; i& M+ S...' M8 }4 Q+ u8 V0 [7 m+ ~5 t
" i, Z$ U; Y, \6 n+ \) @0 N' r! ?
可是不管怎样,以Simple English Wikipedia为例,WikiCafe处理接近100MB的Dump文件只需要几分钟。如果仅生成文字版中文Wiki的词典,那在1个多小时也能够全部完成,与以往的引擎相比,耗费的时间可谓是天壤之别了。& k% V# M& W! P1 D" C3 {' _
- J& N7 V+ l( i0 d0 r( C+ k7 Z& [
组成程序:& ]$ B5 ?5 v% U6 u0 T
WikiCafe.exe 主程序, h6 ]. l6 H0 ]/ H/ Q% \: ~- D1 T
math.exe 根据Tex公式生成相应图片( l2 J" ^- F% l4 P) [7 b
Bin2Img.exe 图片集合文件处理程序% d8 l8 t! n: Y l
Img2Bin.exe 将图片生成集合文件& C& Q }# }- N! D/ ]5 b: n( \. g
可用其他程序如Wiki2Touch处理下载图片后,由Img2Bin汇聚为集合文件。, k! |7 B" f$ y7 P
U9 f# K5 T) |) B% |0 Q! e
使用方法:
7 w {9 a4 O8 E0 h$ y6 w" A' D1、首先要从dumps.wikimedia.com上下载相应的数据文件。中文以zh开头,可用ctrl+f搜索。
" O& ~- q$ `$ |8 d0 ~2 C* v. T4 S: M" @
2、如果要生成图文版,先用wiki2touch处理,也可下载经过i-wiki处理过的图片集合文件;运行Bin2Img.exe,得到图片索引文件pic.ini。如仅需生成文字版,可直接转下一步。
: D- I: I. W! R
/ E7 t, ^1 C5 O3、运行WikiCafe.exe,主要有以下参数:2 t5 Z/ n, R, e6 [
.bz2文件 你所下载的Wiki数据文件,无需解压。, I5 Q/ V7 ~5 {6 R* H' W
图片索引文件 如果想要生成图文版词典,你应该提供一个索引文件;如不提供,则不处理图片。
8 X @3 \ }# }+ J, b" U图片目录 图片等数据存放目录,也就是MdxBuilder中的mdd数据所在位置。公式图片就在此目录下,其他图片必须存放在该目录的pic文件夹中。如不指定或创建失败,则不处理包括公式在内的图片,公式以原Tex形式呈现。
8 L( c+ w$ @9 H+ \- r! K) s文本文件 生成的目标,即MdxBuilder中的Source文件。; i7 [( M+ t! P. l) U
5 S7 `2 G+ ~8 \: G% E$ B! TWikiCafe运行后将在程序目录中生成:
: A+ ^" K- D. f8 aWikiCafe.cfg 内容如下例子0 H& S7 ~1 A! a. p7 z- A
WikiBz2 = r:\simplewiki-20141222-pages-articles.xml.bz2
& H$ s, r0 J- K7 ^ S- RPicIni = d:\pic.ini
3 n2 ^' z# O& ~1 n' z" \% |ImgDir = r:\data\$ J( u) {, V" P& c# ?
OutTxt = d:\s.txt
/ N% T$ b# T2 m# x以后再运行WikiCafe,如发现程序目录中有该文件,会询问是否加载。加载可节省人机交互的时间。) C3 O |. ` f: S7 S p& w
math.txt 数学公式,供math.exe使用) V* ^2 z4 j ?8 L' ~
images.txt 图片,供Bin2Img.exe使用: U5 c8 k2 O) x4 D' V
+ Z- E6 J+ Z5 F% ?4 D
在图片目录中生成:' \, o+ Q8 Z \9 i+ w
wiki.css7 p! s1 m: G/ k% T
wiki.png( \* M3 g4 O: l L6 I
link.png( U" A. y. o k$ L
: W! s& ]6 G( g6 S3 k4、运行math.exe生成数学公式图片,主要参数:: a. }1 t! v9 Q" W
math.txt 公式文件,由WikiCafe处理后生成。
4 s& k2 }" o/ c5 Z图片目录 可从WikiCafe.cfg中得到。
+ M1 S) x/ ], U8 X" m处理过程中会产生错误,无须理会屏幕中的错误信息,如出现异常中断运行,再次运行math.exe会从中断处继续进行处理。
# o5 _) z Z! j( d
% ~) O8 q$ Q2 H" \5、图文版还需要运行Bin2Img得到词典中的图片,参数有:, r# g3 P! n$ Z
图片集合文件 可下载经过i-wiki处理过的图片集合文件;1 M; y9 H4 u3 ]
images.txt 图片文件名,由WikiCafe处理后生成。
/ }, g5 w0 p M) j: |图片目录 可从WikiCafe.cfg中得到。( n' h/ D9 f1 v/ Y" q4 b7 l' S
1 J/ x% K5 S2 k0 v6、运行MdxBuilder生成词典
* y. b0 e5 `( r( }( i9 u; ]0 N. ?
|
评分
-
1
查看全部评分
-
|