|
本帖最后由 cdyg 于 2009-12-18 10:38 编辑
& R5 y) j0 R( |8 W: m : r2 S' w7 A" Q2 T: J
转换程序支持格式:
9 Q& A6 u" g* I( Y1) 扩展的SugarDict格式:7 ^+ T7 ~& J6 s3 U" a+ K' e* \. ?. {
每个项目(词条)一行,缺省最大为32K. 格式为: 关键字. ]6 J$ e+ p& z6 Q& |5 x, d& b. d% \( ~
解释(就是关键字和解释之间用空格分开)
# i5 N. U! g! a关键字: 可以是大小写的组合, 每个单词的最大长度是255个字符。
3 {$ y' ~" o. H8 S关键字和解释中的'_', '^'在转换后会被替换成空格和回车
6 J! o! o5 Q0 R. q9 n6 Y例子:
' Q: d P' ~5 V9 w% Ubreak_through /'bri:k_MQru:/ ^v. 突破^n. 突破
0 R; W2 t6 p1 Q' F8 r6 Vgood ^adj.好^adj.贼好^adj.好得不得了3 U6 U1 w% v, T( K
2) KDict解码后的tab格式
, i, D# g$ A) x$ F; D [2 ]: R6 J. z* t0 r$ k每个条目一行,关键字和解释之间用"tab"分隔. 其中的"\n"会被转换成换行9 M; b4 o: y* E) Z( q5 U/ f3 F
例如:; r2 F% w# W; N
good adj.好\nadj.贼好\nadj.好得不得了$ r2 J8 \8 \" u' U) F% r+ E/ c- l
5 C, h' M: h& d/ H3) MDict的html格式
. {& o3 r5 n" L每个项目两行
) t6 w$ v' d. F1 M5 C第一行是关键字
! }1 W( l3 e2 k第二行开始是正文, 这里的正文应该包括关键字。可以使用html的标记(不要包含<html>
1 h8 M, ~ Y8 Q$ R: T3 F7 R2 p/ G) }- \<body></body></html>, 这个程序会自动加上, 另注意在转换时要指明源数据为html). ) L. x- L8 X! _$ R) x
如果需要显示音标的话,可以利用html指定字体就可以显示了。(参见下面的例子)% c( H; B! Y' Y" P3 @7 r, r
正文结束后必须用一行</>表示结束2 F5 L3 w5 Q* ]9 g
例子:8 r9 x5 m! L/ C G" O- {
Whole
6 [* W2 B3 Q. A2 L$ W9 X<font size=5>whole</font>/ w. ^9 t, b, h: m
<br>
- a" y& ?) c+ Y+ F" J) I<font face="Kingsoft Phonetic Plain, Tahoma">(hol,hJl; houl)</font>6 l( l1 b9 H0 Z* c
</>
% J7 e' _. y* K5 V+ p(注意"</>"和下一个记录间不要有任何其他空行,请参考example.txt中的例子)
% c1 }8 o4 ~' G6 `& M {& b4 F, p& X3 @在html中连接到其它关键字的方法:, `3 H6 b6 X) w, R* G
<a href="entry://key#section">key</a>
! h4 S$ }2 I0 \5 c" ^( C5 f* A其中key是关键字,section是对应关键字页面中的section名称.% d! D; |, a+ R! C6 B
在html中嵌入图片的方法:(PC版的MDict不支持图片)- |# Z7 F7 {0 _ {+ c1 G6 s5 r7 m9 C
<img src="file://abc.gif"> 或者 <img src="/abc.gif"> 其中src指向的文件名大小写不敏感 e- B6 q9 E: Y, T5 |; Y
并将所有图片文件放在一个单独的目录中(不要与词典源文件放在同一目录中). 数据目录中可以
/ G3 J4 i Q. P$ U$ D带有子目录。在使用MdxBuilder制作词库时,将Data路径指向上面存放数据的目录,该目录中的
* z+ ?# f- H6 R所有文件都会被压缩到后缀名为.mdd文件中,使用时该.mdd文件应当与.mdx文件在同一目录下。/ k; [$ J- t5 a- ~& D8 x |
在html中嵌入声音的方法:(PC版不支持该功能)
9 J& G2 B2 T s+ J+ ^1 F4 v+ s @a)使用<bgsound src="/audio.wav"> 这样的形式,文件名的写法和保存方法和使用图片一样。
f$ W* a; e3 X" N/ Jb)使用链接<a href="sound://keyword.spx">keyword</a> 这样的形式,点击该链接的时候可以进行发音/ I7 K+ Y8 ^; n; W# N+ U. `
发音仅支持.wav和.spx格式的音频文件。8 V& \. m v1 v' L
4) MDict的紧凑型html格式(Compat Html)
( @. ~, A+ G* N) Q1 Y这个格式由两个文件组成,正文文件格式基本和2)一样,但在正文里可以使用记号。另外
6 c4 N# Y0 P$ L: x- M一个是记号文件。
9 Z% H* S* B9 _; p. `% {记号文件的格式:! x$ g r: Z% q+ v4 g
由多个记号定义组成,每个记号定义有3行
. K" b8 u9 j3 Y( I. o5 y第一行: 记号的名称(只能用数字,必须大于0,最大不超过255)
* C) [" _9 t; Q1 y$ l- q第二行: 开始字符串(可以为空): U; ^& b0 x$ G5 [1 |2 o
第三行: 结束字符串(可以为空)7 [+ [; b ?8 s$ W8 r, T5 a
使用时在正文里使用`记号`(键盘左上角的那个符号)就会将后续的文字直到下一个记号前的文
" e$ W9 H. w9 F" v! _. R7 ^字用记号定义的开始字符串和结束字符串括起来。正文里如果需要显示` 则用"`"表示。内& ~* C- { | H2 ~/ Q4 R
码应该和正文的一样(例如正文如果是用Unicode的话,记号文件也应该用Unicode)
, a V- M9 t2 n- X2 p1 z例如: h2 S) z, g% U8 H. z
记号文件:
$ v8 D9 {: U) X% L' O9 T1
, L5 n# b% y7 V0 T& d6 ~<font size=5>
9 ^1 f2 G1 F1 h4 \' g% `</font>
0 b: M0 Z6 _8 C24 r: i9 G) [/ S6 C Z( E s8 b6 n
<br>9 o8 P# Y& @4 w
3
, p ~5 \% t, ^<font face="Kingsoft Phonetic Plain, Tahoma"> t! r& n1 h0 l0 }* \
</font>5 w T1 D& a; V
- f! t2 i) n' E0 D. w正文文件:
9 L9 y; s; X \" Vwhole
2 n! \% r3 S! V. o( g0 S4 _& i`1`whole`s`2`<p>`3`(hol,hJl; houl)$ Z+ h: w2 O0 {# a8 M. U
</>8 {2 H. t: W8 i" t
最后在显示的时候就会被替换成
- V) j) P% |# ^4 b _<font size=5>whole&#%96;s</font><br><p><font face="Kingsoft Phonetic Plain, Tahoma">(hol,hJl; houl)</font>
* t! U# J" V. J1 c7 J$ [* ^8 U J备注:. K, t- H1 w. S/ y5 D
如果你的数据里含有国际音标,建议使用Unicode格式
0 r. q Y- G7 r, L6 b6 T" H, N(请参考http://www.phon.ucl.ac.uk/home/wells/ipa-unicode.htm)
5 t' q8 v: i/ A- \- |( ~) ~# @将音标用对应的Unicode进行表示。这样只要用户装有支持IPA的字体文件就能够显示音标。0 |6 f- w; |0 ?/ R3 T
(Windows里的Lucida Console就包含有IPA对应的字体) |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?免费注册
x
评分
-
1
查看全部评分
-
|