掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 4447|回复: 18

[工具] 维基咖啡

[复制链接]

该用户从未签到

发表于 2014-12-31 09:17:54 | 显示全部楼层 |阅读模式
本帖最后由 i-wiki 于 2015-1-1 23:22 编辑 4 t3 E7 ~+ ~8 u

3 W- e* |/ `) F6 L来一杯维基咖啡(http://pan.baidu.com/s/1sjNn917)吧!
, C7 {! H4 i% a# w
8 v& t/ }! P# B& [以后,不管是凛凛寒冬还是炎炎夏日,无论原料来自哪个国家或语言,你都可以简单地研磨,品尝一下它的风味。1 F$ K' i% B' a

4 f( j; q3 B$ e' W% kWikiCafe是什么?这是一个快速的维基格式文件解析程序,工作在Windows平台,可以方便地将Wikipedia、WikiSource等数据文件转换为符合MDict要求的文本本件。
4 W; O! ]7 @* V+ I' b为什么叫这样一个名字?因为咖啡是优雅的,正如Wiki,咖啡是苦中作乐的,也如Wiki。咖啡不是生活的必需,只是生活的点缀。8 I6 Z5 f1 q; G1 t

1 G6 D* B8 _1 Z5 N2 l# G优点:
. O- s: r/ G8 f6 D1、快速。“Wiki”本身就是“快点”的意思。WikiCafe的速度很快,下载的Wiki数据文件无需解压,直接就可以处理,并且采用了多个线程并行工作,较充分地利用了CPU的效能。
6 Y' P8 r  R: l8 H: G" `3 C2、美观。格式与之前的i-wiki引擎相似,外观接近于原Wiki页面。& i! }& r4 P0 Z2 j9 r& ~, {3 X
3、可将数学公式处理为图片。
/ Q. E1 ?3 H% o/ {! i3 E4、可生成图文并茂的页面。( u; c/ J5 D4 s1 {* l/ Y
缺点:) i! x, h& h1 m( M# s0 T) f
1、未处理模板。所有的模板都保留下来了,不够好看,但保持了原有的风味。
( s% p) v& B! d  x* P2、因为是直接处理bz2压缩文件,所以页面中有些链接可能是无效的,就是Wiki网页中红色的链接。* Z8 M: J) `9 v
3、数学公式是不完美的,有些会出错。
7 `7 E- @& H: v# i3 b4 _...) J# s7 T' r7 C) g/ J
% {% L7 s) k% l  R1 {. _+ v
可是不管怎样,以Simple English Wikipedia为例,WikiCafe处理接近100MB的Dump文件只需要几分钟。如果仅生成文字版中文Wiki的词典,那在1个多小时也能够全部完成,与以往的引擎相比,耗费的时间可谓是天壤之别了。/ h! ~; u& I6 [7 B9 p- u0 `
4 _% I2 L0 G4 k
组成程序:3 G- y; F6 I4 \% [: \3 u
WikiCafe.exe 主程序* o: P/ j& `5 \. ?/ j& O
math.exe     根据Tex公式生成相应图片3 z( B. h; Z& |( C- f+ n2 o& X
Bin2Img.exe  图片集合文件处理程序
1 D- X* p, m# d; R! L5 u# h+ ^* eImg2Bin.exe  将图片生成集合文件" q. x4 O% y# ~6 A7 F7 g' v
可用其他程序如Wiki2Touch处理下载图片后,由Img2Bin汇聚为集合文件。6 r$ ^  w% A& c) W3 U' M

! J/ K- }9 `  X6 Y+ _' R使用方法:
. b# Z5 L5 \% |* A1、首先要从dumps.wikimedia.com上下载相应的数据文件。中文以zh开头,可用ctrl+f搜索。' w) X# s( q2 B+ `( f% e# ?8 a/ E3 C4 M
2 U' b7 E- C& T; N) ^# V
2、如果要生成图文版,先用wiki2touch处理,也可下载经过i-wiki处理过的图片集合文件;运行Bin2Img.exe,得到图片索引文件pic.ini。如仅需生成文字版,可直接转下一步。
. J6 h6 B; |* g8 i3 `7 Y9 M- S+ c  V; c$ y+ E$ l1 }# a
3、运行WikiCafe.exe,主要有以下参数:9 O3 p% V( t2 [* [- H: j2 @
.bz2文件    你所下载的Wiki数据文件,无需解压。+ V1 L8 X4 v; Y/ }
图片索引文件 如果想要生成图文版词典,你应该提供一个索引文件;如不提供,则不处理图片。
4 n! T* J. `2 o图片目录    图片等数据存放目录,也就是MdxBuilder中的mdd数据所在位置。公式图片就在此目录下,其他图片必须存放在该目录的pic文件夹中。如不指定或创建失败,则不处理包括公式在内的图片,公式以原Tex形式呈现。3 l/ F+ Y5 P' a- `+ o! _
文本文件    生成的目标,即MdxBuilder中的Source文件。
8 A; C- Q, a$ b. g% @7 S  L! y0 u4 ]9 @1 C
WikiCafe运行后将在程序目录中生成:
: z$ S7 Q2 i( z' X  g/ X/ i, ]WikiCafe.cfg  内容如下例子
- J2 h, ^( k, }; g2 {- kWikiBz2 = r:\simplewiki-20141222-pages-articles.xml.bz2
; c! I/ w, o$ b1 F4 M  h8 ~/ VPicIni = d:\pic.ini
- v8 A0 e. ~# MImgDir = r:\data\
' O% @* j/ U$ u& X0 k" @1 s- _6 X: KOutTxt = d:\s.txt
. B" v! K5 j) m以后再运行WikiCafe,如发现程序目录中有该文件,会询问是否加载。加载可节省人机交互的时间。1 K7 S, n4 ^4 B+ u% W
math.txt    数学公式,供math.exe使用6 I2 l5 Q" m5 p8 U/ A  j- g
images.txt  图片,供Bin2Img.exe使用
3 c& j1 C- W9 G+ w, d2 d' q# }3 n# A3 N8 q2 A. Z- r( q
在图片目录中生成:! }5 R, O, G! s" G8 c; w( S" U
wiki.css, @  e, t: b. X% n1 v
wiki.png7 [- T& k) n4 {4 T+ u& A* @
link.png
3 v: |5 g8 j$ w% L" @4 s& x
9 J* ?0 H$ Z( G- ], D4、运行math.exe生成数学公式图片,主要参数:8 \! a. ]  Z7 [! Z5 l( H0 q: d
math.txt    公式文件,由WikiCafe处理后生成。; h% Z( _  j* s. H6 E
图片目录    可从WikiCafe.cfg中得到。5 \$ ~) f) S* |" J$ M% D$ S
处理过程中会产生错误,无须理会屏幕中的错误信息,如出现异常中断运行,再次运行math.exe会从中断处继续进行处理。5 ~2 x: M# y2 [+ H/ }! x

7 b. f  Q: }) P5、图文版还需要运行Bin2Img得到词典中的图片,参数有:8 ^& n4 F- n% M2 _' s( n/ H& }
图片集合文件 可下载经过i-wiki处理过的图片集合文件;
& M! d, h4 n5 `2 Q& O1 m! Fimages.txt  图片文件名,由WikiCafe处理后生成。/ Z( W6 j) i! f8 N" n; k" u) j
图片目录    可从WikiCafe.cfg中得到。
* W3 K+ B+ A" ^, R
: |0 c7 U( k# x3 i6、运行MdxBuilder生成词典
( y/ q* M4 [% ^' t3 @1 G9 k# n% E$ ^" o* ~

评分

1

查看全部评分

本帖被以下淘专辑推荐:

  • TA的每日心情
    开心
    昨天 22:32
  • 签到天数: 760 天

    [LV.10]以坛为家III

    发表于 2020-4-26 18:30:39 | 显示全部楼层
    本帖最后由 孤影 于 2020-4-26 09:37 编辑 2 O$ o0 {$ t4 m- x5 e1 j2 |* @
    7 ^2 o1 |* e5 t, F0 t3 U

    1 W; f) S# H( [6 g: \传个附件,以作备份4 b* ~) Y7 h! c/ {2 F6 ?" T9 W

    0 f* e, |- g( d; g2020-4-26, Z2 j- J7 z  U
    win10下不能运行,win7下一切正常3 f. K! [# P, q  Q& g

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x
  • TA的每日心情
    奋斗
    2018-4-16 08:43
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2018-4-25 01:11:04 | 显示全部楼层
    都打不开了,有没有新制作wikipedia的工具?

    该用户从未签到

    发表于 2016-8-5 16:10:11 | 显示全部楼层
    加油,支持了

    该用户从未签到

    发表于 2016-8-4 13:57:27 | 显示全部楼层
    大侠,Wiki2Touch等等这些工具有分享吗?

    该用户从未签到

    发表于 2015-5-7 14:53:48 | 显示全部楼层
    个人感觉目前的wiki 制作工具做出来的效果都没有官方Android客户端 Wikipedia Beta[url]http://www.coolapk.com/apk/org.wikipedia.beta[/url] 呈现出的效果好,尤其是制作出的表格在手机端显示不够美观,页面也不像客户端自适应的效果好。4 j: u) J/ l# d
    0 ~4 O9 y6 x2 \; B' R7 y
    我有几点想法:" k( |, I- P* R9 v: A, t
    1.用Python或其他工具抓取wiki页面,可以得到有图的源文件;
    0 u6 r4 Z/ ~1 b/ l+ M- v' u- R2.词典制作时,页面排版可参考“Wikipedia Beta”的处理效果(这一点可以从手机客户端保存的离线页面数据入手)。
    + s$ ], f" ~3 X: P
    6 p* G* I+ b( \
  • TA的每日心情
    开心
    2018-10-17 09:01
  • 签到天数: 18 天

    [LV.4]偶尔看看III

    发表于 2015-1-28 11:11:23 | 显示全部楼层
    希望做出一个图文版的

    该用户从未签到

    发表于 2015-1-25 13:06:02 | 显示全部楼层
    速度那是相当的块,不到400m的bz2只用了十几分钟就转完了,排版还算过的去,唯一的遗憾就是模板了。没有处理的模板会有很多冗余的符号{ } 。时隔两年,感谢楼主回归,终于还是用上了,希望能继续完善

    该用户从未签到

    发表于 2015-1-23 18:25:21 | 显示全部楼层
    你们还活跃着... 我已经沉寂1年了.
    # Z. R8 c5 _; C1 I/ b最近倒是打算把之前留的坑给填了./ m: c6 U7 g$ g& k7 T$ x" a
    可惜我不会c, 帮不了fastwiki了.2 q3 [) B9 C+ b; p5 s+ k+ V! T
    我现在只会bash, lua, python.

    该用户从未签到

     楼主| 发表于 2015-1-11 21:09:29 | 显示全部楼层
    fastwiki 发表于 2015-1-6 11:21) k* ?4 b) [1 E5 e$ G1 Y" m
    还在搞 wiki 引擎啊?  u" H! }6 H# \3 p
    有兴趣可以来维护 fastwiki , 提供了一堆工具, 可以转换维基百科, 和自制词典,  基本 ...

    & \/ y3 w: t1 n5 D$ T4 T6 \) {5 j. ^, A' ^好久没搞了,引擎和以前的相似,只是去掉了模板的处理部分,不再局限于中文Wiki。这个只是想帮助大家提高Wiki词典的生产效率。3 I. @( S+ N! z& ^  k: q
    老兄的Fastwiki很好,源码中有没有详细的注释?

    该用户从未签到

     楼主| 发表于 2015-1-11 20:58:37 | 显示全部楼层

    & W8 s; l# S/ `360往往宁可错杀三千也不放过一个。因为维基咖啡是用PowerBASIC编写的,而很多木马、病毒也是使用这一编程语言来编写,所以很多特征相似。
  • TA的每日心情
    难过
    2018-3-28 11:32
  • 签到天数: 7 天

    [LV.3]偶尔看看II

    发表于 2014-12-31 09:41:13 | 显示全部楼层
    好东西,谢谢分享。

    该用户从未签到

    发表于 2015-1-6 09:14:27 | 显示全部楼层
    这是一个颠覆式的好东西

    该用户从未签到

    发表于 2015-1-6 09:15:31 | 显示全部楼层
    但是有木马

    该用户从未签到

    发表于 2015-1-6 11:21:34 | 显示全部楼层
    还在搞 wiki 引擎啊?
    ( q0 i! e% v3 W- g" T+ p有兴趣可以来维护 fastwiki , 提供了一堆工具, 可以转换维基百科, 和自制词典,  基本由 C++ 写成.$ s2 D; Q. @4 e# E' Y: @
    支持全文索引, 图片, 语音, 等等.
    ( z9 E0 U; G) J( p8 i- e# r  B
    ( p9 o3 Y3 p0 Q3 l" Z网页: https://fastwiki.me
    * `& u, L" ?9 \& p; K代码: https://github.com/qianshanhai/fastwiki
    ! N4 @+ I+ c0 |" y* s; k

    该用户从未签到

     楼主| 发表于 2015-1-6 19:50:53 | 显示全部楼层
    sexboy2003 发表于 2015-1-6 09:159 a6 s( U( ~1 \
    但是有木马
    ; B7 t0 n. P0 _% M  Q3 w
    有压缩,但保证没有木马、病毒。

    该用户从未签到

    发表于 2015-1-11 13:20:47 | 显示全部楼层
    我一下载回来就报毒

    该用户从未签到

    发表于 2015-1-11 13:26:10 | 显示全部楼层

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2024-5-6 16:17 , Processed in 0.066931 second(s), 13 queries , MemCache On.

    Powered by Discuz! X3.4

    Copyright © 2001-2023, Tencent Cloud.

    快速回复 返回顶部 返回列表