|
本帖最后由 惟吾无为 于 2014-1-4 15:25 编辑 5 Y) H; V: }- ?* B+ _+ Q7 ~
$ e& y" o- J6 v9 p, |% K3 |开源, GPLv2协议. 不会用git. 临时传到百度盘.
( _& L, o) T1 I9 `3 b$ a8 Z9 ~下载链接: http://pan.baidu.com/s/1nt7CIRR#dir/path=%2Fqlvwp%2Fqlvwp
9 E; d5 o! _% ]. w$ K重大更新, 2013年12月30日18:24之前下载的请重新下载. 现在windows上使用自带的lua可以直接打开2G大文件了.+ m2 M6 ?4 T# G$ p4 {9 ~5 x( _
+ t+ K' Q6 r q/ {6 B; G本人于1月5日回家, 之后一个半月内没有网络, 期间回复将在元宵后统一处理. (如果过年走亲戚可能提前处理回复下)0 @2 H6 ~/ x5 Z! T
2 R, g$ N$ ]) i0 N% v6 }7 V-- zip包有份使用说明, 下面都是废话, 可以不看的 --1 r/ o: F' j7 q Y! T
7 ~ X* l( }4 a& ^* H' `
在linux上使用wine运行mdxbuilder很慢。所以今后我很会少转mdx。但尽力提供数学公式的更新(过年后会尝试加入zhwiki图片更新), g2 ^0 q( K1 P4 A) q
Y, [- y' ]2 d灰色文字于2013年12月30日18:24失效 |
4 m4 \/ X# p9 ?& E
4 s. x8 }7 _: W& a: z7 Q9 ?现在发帖是写注意事项的,我怕明天忘了(话说我一直试图让解析器能直接在windows上运行,结果刚才才发现好几个lua解释器都只能处理2G内的文件。); E$ F0 _$ b0 k! c
0. 所有脚本都在linux下编写测试, 理论上windows能用, 但不做保证. 编辑脚本时请使用utf8编码, unix换行符.
$ a* [; H _ ^- L1. 有能力的网友可自行编译支持大文件的lua解释器。否则参考第二条处理。5 X' q9 H$ ^' B3 ], [" j
2. lua解释器只能打开2G内的文件时,请先使用xml分割工具分割,然后拼接。(别用qlvwp自带的分割拼接脚本,依赖lua, 同样不起作用的)
& t2 Y1 d B& I7 A
. p8 j6 k" T3 S7 j3 ] | ; @0 s- d2 Y. @' g
, B! U# {* E' z, x8 v预期的解析器(lvwp)速度太慢,随着我对维基的了解越来越深,才终于发现这是个多么庞大的系统了,3年前的想法如今还是实现不了,所以出现了这个版本。
# @+ m$ T' M9 `) H, p, H1 u本版本不再试图实现维基的环境,而是保证速度,尽量针对性地人工实现一部分功能(到时模板就是直接运行对应函数,而非处理Template空间的对应页面了)。
: D' I& {) {' S# l+ nqlvwp包括解析器(quick_wiki_parser.lua)和数学公式转换器(convformula.lua)。并额外提供了wiki xml的分割工具和文本合并工具以及xml索引工具及单个词条提取工具。
" c- X1 Z$ C ?' Y9 B. d4 h. ?3 ]
# g; o! @5 s4 c转换策略如下:
/ a8 f0 a3 F s3 C5 K6 }' ~1. 先用数学公式转换器生成数学公式对照文件。(到时可使用我提供的对照文件可跳过此步. 记住附上对应的图片mdd)
( i/ x# l9 b3 }0 w8 k; [; a2. 用解析器处理维基标记文本。(读取数学公式对照文件来确定数学公式的图片名)
% y* P$ E u7 [2 h*** 提示: 解析器限于lua, 只能使用单核, 如果你是多核电脑又很赶时间, 可先分割成多个小文件, 然后开多个进程来处理它们.
( r5 l8 S9 t3 v q0 b z! U* L* F0 Y( m* H6 P0 ~% A5 w8 p
功能对比. 图例:√实现 ×未实现 ○小部分实现 ◎大部分实现
$ K2 ]. K4 p9 \. B" O) u ]功能 | 关键字 | qlvwp | mediawiki0 v d( s B- Q# d
| 粗体/斜体 | '''/'' | √ | √+ K. n' C- {9 ^& D
| 链接 | [...]/[[...]] | ○1 | √
. [0 N! t5 U8 e: W | 表格 | {|...|} | √ | √
6 E; ^ e$ ?+ `$ N4 v5 b' \ | 公式 | <math> | √ | √5 J* B6 ~) ]5 f0 K
| 模板 | {{...}} | ×2 | √8 m. r$ Y6 G* m( p7 f
| 列表 | (空格)*#;:- | √ | √
* P0 p+ b7 T+ j | 标题 | =...= | ◎3 | √
% {6 C8 }/ s5 N5 c | 图片 | [[File:]] | ○4 | √
; H; l, { Z2 ? | nowiki | <nowiki>/<pre> | √ | √
$ i$ T8 C& U) d5 O x- C | 引用 | <ref> | × | √# q8 [4 }3 V! S# U8 h! [
| 相册 | <gallary> | × | √) M0 B2 W$ V. I# ~" ^" x* w/ o
| 字词转换 | -{...}- | ×5 | √ Z+ @1 d' Z& s& ]1 Z9 y$ v" {
| 更多特性未支持... | 2 B( k: o, ?" H* v6 z" b
注释:
$ g" u+ U' v5 `+ s. F1. 基础的web外接, 站内链接实现了. 图片链接直接返回原始文件名. 跨站链接未处理(转储文件从0.7版好像都没了), 姊妹项目未处理. 分类链接未处理. 就记得这些了...
1 y* ?/ P% {4 w* F+ p% t9 X2. 暂时显示出模板名和所有参数. 可用css屏蔽整个模板块, 或仅屏蔽参数块.
3 e/ k; m4 i" z5 e8 W3. 给标题们加id锚点了, 非url字符使用维基的.XX格式. 但没有生成索引. 需要的话我下次写.; m6 @5 ^9 y1 ]3 l( | E. F. h, f
4. 图片链接只返回文件名, 其他的都丢弃了.6 _2 Q8 O a0 T# }2 U9 U4 f1 T
5. 暂时没有字词转换. 今后可能实现, 可能不. 同胞們學習下正體中文唄.
/ \1 \2 e4 | q9 V, K0 E
! i8 I$ z/ e+ G/ H* }% m0 z) a界面都是命令行。理论上cmd下亦可运行,未测试。
9 H+ K- z: `1 V+ y! [% C# o: S9 Z9 |使用说明见usage.txt |
评分
-
1
查看全部评分
-
|