|
本帖最后由 cdyg 于 2009-12-18 10:38 编辑 . u/ A3 `4 _# C2 ~- L3 o) T
8 j& }/ G d" o9 \+ j
转换程序支持格式:
$ h2 s. i% \$ M4 Q, s" L1 y1) 扩展的SugarDict格式:# Q1 I5 i3 s. Y {5 T
每个项目(词条)一行,缺省最大为32K. 格式为: 关键字
4 |6 _7 n* r9 N9 ?; ~: ]/ B解释(就是关键字和解释之间用空格分开)
7 `1 M6 ~0 h8 u9 a4 P关键字: 可以是大小写的组合, 每个单词的最大长度是255个字符。
/ z& c4 x- i+ C% ~! A关键字和解释中的'_', '^'在转换后会被替换成空格和回车5 Y7 I3 w. O# j \- |
例子:
/ [2 n$ b7 O/ @4 N* l0 U; lbreak_through /'bri:k_MQru:/ ^v. 突破^n. 突破
. ~. I: [& g" x: Y5 J8 h, tgood ^adj.好^adj.贼好^adj.好得不得了5 Q+ I" C% L0 w% T0 m# t
2) KDict解码后的tab格式
S% \$ Y/ h) z6 N每个条目一行,关键字和解释之间用"tab"分隔. 其中的"\n"会被转换成换行
! C6 P6 [/ T% B; Y例如:( U0 ? o3 d$ h9 O
good adj.好\nadj.贼好\nadj.好得不得了 R u( ?' j; d* i. T- D/ t
4 B# n; i1 R6 ^% X* I3) MDict的html格式0 F$ s: H0 Q" M' E/ \
每个项目两行4 ~( Y' U4 N$ V T/ B& U
第一行是关键字
7 }! R0 s& _; X7 w4 [% l第二行开始是正文, 这里的正文应该包括关键字。可以使用html的标记(不要包含<html>
; f! ^) v( v3 N2 J# q<body></body></html>, 这个程序会自动加上, 另注意在转换时要指明源数据为html). ! n- M$ _2 N8 \2 m3 @, v: e
如果需要显示音标的话,可以利用html指定字体就可以显示了。(参见下面的例子)0 Z! n! A! D# u* P
正文结束后必须用一行</>表示结束
: ~) C2 F8 H7 \& {# P# r& g: @/ A例子:; M; W( L& d0 [6 A
Whole& q x* ^) ?: k& |: l2 Y
<font size=5>whole</font># r: Q* L, _/ |$ r
<br>; D/ b5 E' [1 Z# V- t9 T( P/ E6 P
<font face="Kingsoft Phonetic Plain, Tahoma">(hol,hJl; houl)</font>
, i' M+ ?9 H W( Z: w, S</>
7 [2 C3 x* ?! L8 D3 j. g(注意"</>"和下一个记录间不要有任何其他空行,请参考example.txt中的例子); n1 X) ^5 V" L" |. o
在html中连接到其它关键字的方法:
+ K. J% z5 i6 J/ Z `! S<a href="entry://key#section">key</a>
2 q* u9 A+ G4 K' O7 a- E其中key是关键字,section是对应关键字页面中的section名称./ P; ~( B4 o+ ]9 Z' q
在html中嵌入图片的方法:(PC版的MDict不支持图片)
/ m3 i$ @# [2 o<img src="file://abc.gif"> 或者 <img src="/abc.gif"> 其中src指向的文件名大小写不敏感
W3 r) H! m4 {) P/ N' k: W. c& O. t7 H并将所有图片文件放在一个单独的目录中(不要与词典源文件放在同一目录中). 数据目录中可以
5 B2 G7 M' \0 i( @) u带有子目录。在使用MdxBuilder制作词库时,将Data路径指向上面存放数据的目录,该目录中的. L3 L( G# h3 {7 ~0 {
所有文件都会被压缩到后缀名为.mdd文件中,使用时该.mdd文件应当与.mdx文件在同一目录下。
5 |7 h3 P$ t% U- I8 a在html中嵌入声音的方法:(PC版不支持该功能)
# c, ?/ ]6 Q' }4 B" \; ga)使用<bgsound src="/audio.wav"> 这样的形式,文件名的写法和保存方法和使用图片一样。
3 z! Z! |# h, T7 Zb)使用链接<a href="sound://keyword.spx">keyword</a> 这样的形式,点击该链接的时候可以进行发音
/ K( N) k1 w/ ?+ }$ E发音仅支持.wav和.spx格式的音频文件。
0 k" T7 e/ _( f5 E; {- z0 F4) MDict的紧凑型html格式(Compat Html)
* |/ H/ E" X: k! }# b这个格式由两个文件组成,正文文件格式基本和2)一样,但在正文里可以使用记号。另外2 P/ D! d. W0 E: q4 U9 h3 }5 [) o3 d
一个是记号文件。+ L6 Y! R- ~ G8 |: @
记号文件的格式:
2 p7 {& n; X5 L' U# x% }% a由多个记号定义组成,每个记号定义有3行
; Q, K6 S% j: s5 `3 \" E6 X第一行: 记号的名称(只能用数字,必须大于0,最大不超过255)7 t7 a Y8 ~- P$ [2 X
第二行: 开始字符串(可以为空)
/ x, ^! `2 ]* Y4 X第三行: 结束字符串(可以为空)
5 f, G, g# w+ T) [2 Q9 ]9 v使用时在正文里使用`记号`(键盘左上角的那个符号)就会将后续的文字直到下一个记号前的文9 D! A) S& e( V4 m
字用记号定义的开始字符串和结束字符串括起来。正文里如果需要显示` 则用"`"表示。内" ]% r6 @7 |, g' D7 G3 u/ j
码应该和正文的一样(例如正文如果是用Unicode的话,记号文件也应该用Unicode), d5 o8 |% B1 w& d7 }
例如:4 V& z7 ]2 c U0 b
记号文件:4 L) B: H3 O! x. T5 a4 t1 ?/ h
12 {/ R; v% T' Q
<font size=5>
7 `# h% l9 I! X) b</font>! |- e" H# L4 c6 ^1 {9 |7 M
2* N5 P% ]3 d7 [# v+ y& `8 l+ Y
<br>
+ m, @( B4 ~1 b0 r8 K( [3 W3+ H6 ?" P( o- G! b ^/ L" ^9 b: d
<font face="Kingsoft Phonetic Plain, Tahoma">
+ P# ~( ?1 O+ S/ S y</font>
/ [7 y/ v. g' r% Q% h8 l6 B F( n( E& L3 H# E" w0 E
正文文件:$ S2 D; T$ G; j- Y
whole
0 Y* D2 m3 T5 j4 ?* @" K0 X5 ^`1`whole`s`2`<p>`3`(hol,hJl; houl)' e5 {" r3 D/ i/ y _
</>, o' i# c2 c. s3 Z- L
最后在显示的时候就会被替换成& {% k8 I# Z! o: p7 g4 X
<font size=5>whole&#%96;s</font><br><p><font face="Kingsoft Phonetic Plain, Tahoma">(hol,hJl; houl)</font>
6 H4 [2 N' n5 z" u备注:- }# g4 y3 `6 J0 d
如果你的数据里含有国际音标,建议使用Unicode格式& Q" C9 Y1 M# {6 _+ `
(请参考http://www.phon.ucl.ac.uk/home/wells/ipa-unicode.htm)
% P: ^8 {* w* M+ `* F- F将音标用对应的Unicode进行表示。这样只要用户装有支持IPA的字体文件就能够显示音标。) u$ e N/ k$ i) Z2 ?
(Windows里的Lucida Console就包含有IPA对应的字体) |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?免费注册
x
评分
-
1
查看全部评分
-
|