掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 5121|回复: 18

[工具] 维基咖啡

[复制链接]

该用户从未签到

发表于 2014-12-31 09:17:54 | 显示全部楼层 |阅读模式
本帖最后由 i-wiki 于 2015-1-1 23:22 编辑
5 u$ o0 C! O1 S: a# c
5 ~8 I3 z9 ~' ^' z* s* K- F来一杯维基咖啡(http://pan.baidu.com/s/1sjNn917)吧!
" a) _) [) D3 S1 T2 X0 a8 Z4 a& i4 d  b- [, r
以后,不管是凛凛寒冬还是炎炎夏日,无论原料来自哪个国家或语言,你都可以简单地研磨,品尝一下它的风味。
4 C8 e! y; I, b/ ~3 C* V5 b' r; K. L) m3 `. j
WikiCafe是什么?这是一个快速的维基格式文件解析程序,工作在Windows平台,可以方便地将Wikipedia、WikiSource等数据文件转换为符合MDict要求的文本本件。  A) o. |4 p7 U& h% x% f
为什么叫这样一个名字?因为咖啡是优雅的,正如Wiki,咖啡是苦中作乐的,也如Wiki。咖啡不是生活的必需,只是生活的点缀。
9 N& a( f1 r7 q0 i& I! l& J. i3 X( n/ F! \
优点:2 w$ R% C1 Z9 A& O
1、快速。“Wiki”本身就是“快点”的意思。WikiCafe的速度很快,下载的Wiki数据文件无需解压,直接就可以处理,并且采用了多个线程并行工作,较充分地利用了CPU的效能。
6 J: U, G& o- O1 U2、美观。格式与之前的i-wiki引擎相似,外观接近于原Wiki页面。7 C3 P  X. w; @
3、可将数学公式处理为图片。
' r; X: E9 N* K7 Y% P: o4、可生成图文并茂的页面。: J4 o" V! s6 r7 J! P0 Z$ i- n
缺点:
: E+ J9 L! n+ U" |. S0 {1、未处理模板。所有的模板都保留下来了,不够好看,但保持了原有的风味。
8 m0 E# J; X0 t( l3 x2、因为是直接处理bz2压缩文件,所以页面中有些链接可能是无效的,就是Wiki网页中红色的链接。
! ]6 q9 T: W/ ^/ F" e3、数学公式是不完美的,有些会出错。$ R" l4 D( L" v+ |1 G
...
% d7 F! _, [" R8 C: d* O5 x1 ], u) m, P2 F! Z* u3 R/ E
可是不管怎样,以Simple English Wikipedia为例,WikiCafe处理接近100MB的Dump文件只需要几分钟。如果仅生成文字版中文Wiki的词典,那在1个多小时也能够全部完成,与以往的引擎相比,耗费的时间可谓是天壤之别了。
1 T% u' {" x. U. T- J) Q5 N6 }; L# D* W. x1 P  R8 R& G% E& q
组成程序:
* {0 r9 G/ F7 m% v2 g: j6 u, T( h( CWikiCafe.exe 主程序
. ^9 ?2 `& L* D, _math.exe     根据Tex公式生成相应图片9 B& s. ]3 z3 j  S* m1 i
Bin2Img.exe  图片集合文件处理程序
0 H$ l5 P3 e  aImg2Bin.exe  将图片生成集合文件" @9 W( ?( S/ N2 N
可用其他程序如Wiki2Touch处理下载图片后,由Img2Bin汇聚为集合文件。0 \' Q7 H+ a2 k' y! z9 G

5 f7 G& Q) k' F) b" f1 }使用方法:
: ]2 \! F8 k+ C7 {0 y1、首先要从dumps.wikimedia.com上下载相应的数据文件。中文以zh开头,可用ctrl+f搜索。
1 P" A" y& }/ C! ?
$ H/ p' c+ \- C1 D2、如果要生成图文版,先用wiki2touch处理,也可下载经过i-wiki处理过的图片集合文件;运行Bin2Img.exe,得到图片索引文件pic.ini。如仅需生成文字版,可直接转下一步。
7 R' h& ^) w: B/ \  W$ ?, [6 D+ ~  r
3、运行WikiCafe.exe,主要有以下参数:
$ N# Q" I% e4 z' X, f.bz2文件    你所下载的Wiki数据文件,无需解压。
: A$ i% y% z" Y/ R图片索引文件 如果想要生成图文版词典,你应该提供一个索引文件;如不提供,则不处理图片。
, \' Z5 ^8 C* s* }: j: p' M图片目录    图片等数据存放目录,也就是MdxBuilder中的mdd数据所在位置。公式图片就在此目录下,其他图片必须存放在该目录的pic文件夹中。如不指定或创建失败,则不处理包括公式在内的图片,公式以原Tex形式呈现。
  X7 [. _( B. Z0 [. t& V3 Y文本文件    生成的目标,即MdxBuilder中的Source文件。
, q! h/ L8 T8 }; _% [6 C' i; p( _0 D# ?2 `4 V5 B  W
WikiCafe运行后将在程序目录中生成:
8 g7 I7 {. q' H$ d4 s. h( tWikiCafe.cfg  内容如下例子+ Y; m3 o" ]  T8 y8 Y& w
WikiBz2 = r:\simplewiki-20141222-pages-articles.xml.bz2
  y6 J# y4 F. C; X) k, u7 tPicIni = d:\pic.ini/ V4 B( N' q6 z) U: N- _+ Y5 l
ImgDir = r:\data\
3 d9 l& W. a3 T/ N) o& ]6 |) dOutTxt = d:\s.txt& q8 L1 P3 X- b, g4 ^0 O
以后再运行WikiCafe,如发现程序目录中有该文件,会询问是否加载。加载可节省人机交互的时间。
' I8 e2 H; q5 j, S: _8 |0 tmath.txt    数学公式,供math.exe使用9 A1 C. A& d6 |/ W9 V" v; N
images.txt  图片,供Bin2Img.exe使用
6 z# P- M; J; {4 O' {
6 Z' N$ g1 b4 Q: X! k2 C! r在图片目录中生成:9 W% |' ^) q# P! a
wiki.css& f% l" [6 H: {& p
wiki.png
% ^% b# I1 v' _: ^+ Slink.png
# ~2 w( L: S; y- J  v0 V
6 b+ j0 f8 D3 f' l3 t4、运行math.exe生成数学公式图片,主要参数:
( `# Y6 w2 n, {$ ^7 ~% {" ymath.txt    公式文件,由WikiCafe处理后生成。  X0 W& @8 |2 i: S7 j: X
图片目录    可从WikiCafe.cfg中得到。* L/ g$ w  b: k
处理过程中会产生错误,无须理会屏幕中的错误信息,如出现异常中断运行,再次运行math.exe会从中断处继续进行处理。/ H- `/ c5 t1 r, |% `

6 h( p- Q% N' ?1 e, k2 J5、图文版还需要运行Bin2Img得到词典中的图片,参数有:
8 y2 x4 p0 I: [# m图片集合文件 可下载经过i-wiki处理过的图片集合文件;
7 y6 e& {- J3 z8 d+ @images.txt  图片文件名,由WikiCafe处理后生成。
  i! g# r4 |* d* Q, T  }, M5 g& q图片目录    可从WikiCafe.cfg中得到。, F. d% t, |8 V' a

# i4 ?$ C5 E6 @/ E  e3 y0 @6、运行MdxBuilder生成词典0 x* O$ _  c) D6 T* s5 }
) l: {6 A2 l6 I- ]1 Z1 o6 B3 r; \

评分

1

查看全部评分

本帖被以下淘专辑推荐:

  • TA的每日心情
    开心
    2025-1-7 17:15
  • 签到天数: 773 天

    [LV.10]以坛为家III

    发表于 2020-4-26 18:30:39 | 显示全部楼层
    本帖最后由 孤影 于 2020-4-26 09:37 编辑 # [6 ]& p# h9 f! U- ?8 p7 t1 J
    : q/ g; O; ^  O* L

    ( A# f! f1 _" V* K( k6 O# G传个附件,以作备份" x9 S9 r) g7 Z! u, k
    # I2 n2 ]3 y. m$ k$ E
    2020-4-26
    4 j1 q# E* u! d1 N% z/ J6 z% fwin10下不能运行,win7下一切正常
    ; x8 y2 I" ~/ Z# ]4 y

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x
  • TA的每日心情
    奋斗
    2018-4-16 08:43
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2018-4-25 01:11:04 | 显示全部楼层
    都打不开了,有没有新制作wikipedia的工具?

    该用户从未签到

    发表于 2016-8-5 16:10:11 | 显示全部楼层
    加油,支持了

    该用户从未签到

    发表于 2016-8-4 13:57:27 | 显示全部楼层
    大侠,Wiki2Touch等等这些工具有分享吗?

    该用户从未签到

    发表于 2015-5-7 14:53:48 | 显示全部楼层
    个人感觉目前的wiki 制作工具做出来的效果都没有官方Android客户端 Wikipedia Beta[url]http://www.coolapk.com/apk/org.wikipedia.beta[/url] 呈现出的效果好,尤其是制作出的表格在手机端显示不够美观,页面也不像客户端自适应的效果好。
    8 n7 F" ]& K  G! B- c/ {& ~- }/ g; E7 {# X8 x% g) O
    我有几点想法:
    9 T; n* c" n4 r- f4 ~* _7 j4 O1.用Python或其他工具抓取wiki页面,可以得到有图的源文件;
    8 |0 X( z; x. U2.词典制作时,页面排版可参考“Wikipedia Beta”的处理效果(这一点可以从手机客户端保存的离线页面数据入手)。
    " r# d+ s3 v* W/ \: C  R
    1 J7 Z" X" |  v6 A# K
  • TA的每日心情
    开心
    2018-10-17 09:01
  • 签到天数: 18 天

    [LV.4]偶尔看看III

    发表于 2015-1-28 11:11:23 | 显示全部楼层
    希望做出一个图文版的

    该用户从未签到

    发表于 2015-1-25 13:06:02 | 显示全部楼层
    速度那是相当的块,不到400m的bz2只用了十几分钟就转完了,排版还算过的去,唯一的遗憾就是模板了。没有处理的模板会有很多冗余的符号{ } 。时隔两年,感谢楼主回归,终于还是用上了,希望能继续完善

    该用户从未签到

    发表于 2015-1-23 18:25:21 | 显示全部楼层
    你们还活跃着... 我已经沉寂1年了.6 {& G/ ~6 a; n, w0 O& o5 Q$ i* Z
    最近倒是打算把之前留的坑给填了.
    7 B1 g4 L' l( u可惜我不会c, 帮不了fastwiki了.4 ~/ E2 f8 m$ p( `& h: X8 E' I4 t
    我现在只会bash, lua, python.

    该用户从未签到

     楼主| 发表于 2015-1-11 21:09:29 | 显示全部楼层
    fastwiki 发表于 2015-1-6 11:210 x8 k4 o8 _- B# h* Z. d( ?
    还在搞 wiki 引擎啊?
    ( s$ s, B  d: F$ F( c1 ]. _有兴趣可以来维护 fastwiki , 提供了一堆工具, 可以转换维基百科, 和自制词典,  基本 ...

    & ~, c" ^: }8 {! \好久没搞了,引擎和以前的相似,只是去掉了模板的处理部分,不再局限于中文Wiki。这个只是想帮助大家提高Wiki词典的生产效率。
    1 D+ l1 Q( U+ u: G5 L老兄的Fastwiki很好,源码中有没有详细的注释?

    该用户从未签到

     楼主| 发表于 2015-1-11 20:58:37 | 显示全部楼层

    9 o( e: A/ W7 C360往往宁可错杀三千也不放过一个。因为维基咖啡是用PowerBASIC编写的,而很多木马、病毒也是使用这一编程语言来编写,所以很多特征相似。
  • TA的每日心情
    难过
    2018-3-28 11:32
  • 签到天数: 7 天

    [LV.3]偶尔看看II

    发表于 2014-12-31 09:41:13 | 显示全部楼层
    好东西,谢谢分享。

    该用户从未签到

    发表于 2015-1-6 09:14:27 | 显示全部楼层
    这是一个颠覆式的好东西

    该用户从未签到

    发表于 2015-1-6 09:15:31 | 显示全部楼层
    但是有木马

    该用户从未签到

    发表于 2015-1-6 11:21:34 | 显示全部楼层
    还在搞 wiki 引擎啊?: ]0 C" W! Q. k
    有兴趣可以来维护 fastwiki , 提供了一堆工具, 可以转换维基百科, 和自制词典,  基本由 C++ 写成." U. X+ ?& \7 C! l/ U/ A
    支持全文索引, 图片, 语音, 等等.
    6 D5 @; l% D' p8 c& t1 W- t' Q
    6 x( ]4 i8 @' A网页: https://fastwiki.me2 o9 _: R, L  n& J: N, B4 q
    代码: https://github.com/qianshanhai/fastwiki$ H) {# L/ n4 q

    该用户从未签到

     楼主| 发表于 2015-1-6 19:50:53 | 显示全部楼层
    sexboy2003 发表于 2015-1-6 09:15" W3 {$ J6 P  J, W
    但是有木马
    : P. p4 r% ]$ S. l) \5 j# a
    有压缩,但保证没有木马、病毒。

    该用户从未签到

    发表于 2015-1-11 13:20:47 | 显示全部楼层
    我一下载回来就报毒

    该用户从未签到

    发表于 2015-1-11 13:26:10 | 显示全部楼层

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2025-4-28 20:30 , Processed in 0.025536 second(s), 27 queries .

    Powered by Discuz! X3.4

    © 2001-2023 Discuz! Team.

    快速回复 返回顶部 返回列表