|
本帖最后由 cdyg 于 2009-12-18 10:38 编辑 6 m& N# \' R C7 q8 R' x+ R# f( m
; Y7 I2 @1 F; F. c) f转换程序支持格式:
& v& w8 e' z0 p1) 扩展的SugarDict格式:
5 d3 s: I3 ^+ p+ M: r! a1 X- v# B每个项目(词条)一行,缺省最大为32K. 格式为: 关键字7 X, n8 i* y( r6 d8 X( K% I6 |
解释(就是关键字和解释之间用空格分开)' p2 B: v% o$ X$ h, Q4 ]
关键字: 可以是大小写的组合, 每个单词的最大长度是255个字符。
9 n9 j0 x1 B" P$ c) x) g关键字和解释中的'_', '^'在转换后会被替换成空格和回车- o" |- k$ u9 X% q9 D9 Z4 s( P
例子:3 L* J1 Z: Z+ l2 T) w8 D" h
break_through /'bri:k_MQru:/ ^v. 突破^n. 突破
- m5 |7 o* \1 v. h$ o- i7 d1 \good ^adj.好^adj.贼好^adj.好得不得了
% n9 T3 t$ B1 Y/ h; R' }* _8 R2) KDict解码后的tab格式: K8 a4 @$ k% Y
每个条目一行,关键字和解释之间用"tab"分隔. 其中的"\n"会被转换成换行
2 Y$ V7 V" C/ ~% n0 b+ r例如:
; j/ m% _9 H' c" H, {good adj.好\nadj.贼好\nadj.好得不得了/ e9 _' h. S, @; x/ Q6 T# y
9 `2 e& [* q# f- L' A2 [
3) MDict的html格式) [9 J4 P5 G1 f9 X8 U& h3 y. m1 S
每个项目两行; j- A# c% e8 e
第一行是关键字8 f" G% g( p0 d+ u3 j% J3 i
第二行开始是正文, 这里的正文应该包括关键字。可以使用html的标记(不要包含<html>
0 Y! \7 O3 D8 D<body></body></html>, 这个程序会自动加上, 另注意在转换时要指明源数据为html). : V! A' j6 `7 r" E# A
如果需要显示音标的话,可以利用html指定字体就可以显示了。(参见下面的例子)
$ ^0 H4 L# h8 U j1 }0 F# [正文结束后必须用一行</>表示结束
2 m7 r. M/ F$ _5 C例子:9 N* u8 `' f: r3 ], }/ G
Whole. d4 t) w% f; d$ ^, D% E
<font size=5>whole</font>) S( G: r6 u4 d$ E0 x" Z6 |
<br>
9 E; Q% V7 g& W* ~ J<font face="Kingsoft Phonetic Plain, Tahoma">(hol,hJl; houl)</font>
+ P' v7 ]" j* E7 f$ |</>
% _* W/ P9 U1 K1 e. G' C(注意"</>"和下一个记录间不要有任何其他空行,请参考example.txt中的例子)) \$ c5 \8 ~- ^1 W2 H1 b, \
在html中连接到其它关键字的方法:
8 t1 d4 Z) o& T% {+ `7 H<a href="entry://key#section">key</a>
" c# W+ ?5 q2 H其中key是关键字,section是对应关键字页面中的section名称.
) o3 L; ~+ z. r3 h' d$ b在html中嵌入图片的方法:(PC版的MDict不支持图片)
9 v- ^; h: V2 n: w<img src="file://abc.gif"> 或者 <img src="/abc.gif"> 其中src指向的文件名大小写不敏感
' J! q6 @! b% D2 l; N: {" ~+ u+ K并将所有图片文件放在一个单独的目录中(不要与词典源文件放在同一目录中). 数据目录中可以2 j' @- _- D! I2 d- A) r
带有子目录。在使用MdxBuilder制作词库时,将Data路径指向上面存放数据的目录,该目录中的
; \1 P2 N+ g: G所有文件都会被压缩到后缀名为.mdd文件中,使用时该.mdd文件应当与.mdx文件在同一目录下。- |* e7 B) W8 [% R) s7 Y% W
在html中嵌入声音的方法:(PC版不支持该功能)
3 H) I) h, q: P+ J$ pa)使用<bgsound src="/audio.wav"> 这样的形式,文件名的写法和保存方法和使用图片一样。! j5 P6 }+ H) D
b)使用链接<a href="sound://keyword.spx">keyword</a> 这样的形式,点击该链接的时候可以进行发音% g$ l z. \( U* I f
发音仅支持.wav和.spx格式的音频文件。8 x' J. M* \5 ]
4) MDict的紧凑型html格式(Compat Html)" o( w2 ]$ o2 i( {1 J
这个格式由两个文件组成,正文文件格式基本和2)一样,但在正文里可以使用记号。另外
) N) n. F2 r* B' T7 G4 ?8 x$ r0 c一个是记号文件。
5 H# b* a3 i; c u ?3 O记号文件的格式:, {$ L5 \! h2 L
由多个记号定义组成,每个记号定义有3行, U5 Y* n4 X9 `
第一行: 记号的名称(只能用数字,必须大于0,最大不超过255)
+ g& @) O" k5 V3 d- J第二行: 开始字符串(可以为空)+ ?: I. S! S4 W- F
第三行: 结束字符串(可以为空)
5 ]" ]1 m6 Y6 Z+ J- |% x使用时在正文里使用`记号`(键盘左上角的那个符号)就会将后续的文字直到下一个记号前的文! u6 V7 K1 u! U0 w x5 L4 c5 K; C% a
字用记号定义的开始字符串和结束字符串括起来。正文里如果需要显示` 则用"`"表示。内
1 ]; B. l) F! Z码应该和正文的一样(例如正文如果是用Unicode的话,记号文件也应该用Unicode)
% j+ W& ~1 O: ]" p! K, J例如:, d" ~) }; ?$ }' t$ H3 q/ G% Y
记号文件:
: @ c r# s2 F! I, }! M( r15 T, P6 @" q. ~8 x E+ n" B
<font size=5> g2 U+ y& f, Y- T; }4 I
</font>) [$ _5 W$ r V" z0 ~6 y
2
) O9 M& z3 L3 z- g<br>1 h ?( M% P. c
33 [- p9 a8 A x
<font face="Kingsoft Phonetic Plain, Tahoma">, Z9 T1 ^5 [2 ~+ M- X( ~1 ?
</font>
7 M( P' j$ j% z1 r
* L( m+ l; X2 D- e) ]正文文件:
$ f0 t' _2 X2 G5 nwhole; F3 x5 s5 e) s" j* o
`1`whole`s`2`<p>`3`(hol,hJl; houl)3 R8 {7 X- j4 N! V0 v& K; M
</>
( w" V" |* Q M" \最后在显示的时候就会被替换成
, p- C3 ^* C, V( `& t! S; K4 I<font size=5>whole&#%96;s</font><br><p><font face="Kingsoft Phonetic Plain, Tahoma">(hol,hJl; houl)</font>. T' q/ b/ X2 ^4 g8 y
备注:, U# R. z( }3 Z
如果你的数据里含有国际音标,建议使用Unicode格式
) g G. z3 ?0 {! F$ U8 n8 _5 Y! ^(请参考http://www.phon.ucl.ac.uk/home/wells/ipa-unicode.htm)
# q$ \ b0 j6 ], _; | V将音标用对应的Unicode进行表示。这样只要用户装有支持IPA的字体文件就能够显示音标。; T1 c# X$ x6 p8 v
(Windows里的Lucida Console就包含有IPA对应的字体) |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?免费注册
x
评分
-
1
查看全部评分
-
|