掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 4796|回复: 17

[经验交流] “小满字典”词库制作初级教程

[复制链接]

该用户从未签到

发表于 2008-12-27 13:25:42 | 显示全部楼层 |阅读模式
    “小满字典”词库资源(以下简称“词典”)要靠使用者共同开发制作才能不断地丰富,同时,制作适合每个用户自己的“词典”也才能让“小满字典”的功用发挥到极致。故此,我不揣浅陋,把自己制作“词典”的一些粗浅经验总结成这篇“‘小满字典’词库制作初级教程”。希望能给初步接触“小满字典”的朋友们,特别是那些刚刚萌生制作“词典”想法而又没有更多计算机语言知识的业余爱好者一些帮助。

- N) R- Y! Y( @' k    一定格式的TXTEXCELACCESS文件都能通过词库转换软件“makexmdict.exe”转换为小满字典词库。下面以绝大多数坛友十分熟悉的TXT(记事本)和Excel文件转换“小满字典”词库为例:
    1. 准备各种适合做“词典”的TXT和Excel文件。
7 ]) \5 k) H# N5 @# I9 _" `
    其他格式的文本文件(如DOCPDF等)也可以把内容复制粘贴到TXT文件中。

4 n0 ?/ G( K% U3 M' X       2. 本“初级教程”所需软件:
; d3 ^1 m" l; G) z" u$ L  E
       2.1. “小满字典”制作工具makexmdict.exe(下载地址是http://www.luan8.com/makexmdict.rar【必备】' Y) H- @4 M. @; o, j
       2.2. 电脑系统自带的(程序-附件-)“记事本”程序和MS Office Excel【必备】
- r, J, O+ B- F3 {6 _7 J+ r       2.3. MS Office Word、UltraEdit-32等文本编辑软件【可选】

/ L4 l0 d! ?5 W" ], ~" C       3. 词库制作过程:
    3.1. 以“搞笑翻译.txt”转换为“搞笑翻译”小满词库为例,说明TXT文件的转换。
   

0 G* b* I9 S6 R9 L! ]* a
    关键问题是让TXT文档的格式符合“小满字典”制作要求。
    “小满字典”格式上要求以“</>”分隔词条,以“<br>”标示换行,用“<hr>”划分隔线,并接受HTML语言中字体颜色、大小等的设置。
       3.1.1. 编辑TXT文件搞笑翻译.txt”,使其格式适合转换要求:
0 T  ]. X5 {: b' ^/ ~$ G3 C' E
       UltraEdit-32打开,或者把TXT文档中的内容复制到一个新建的MS Office Word文档(DOC文件)【以此为例】。# C, L; ?, j8 o% I& p6 f0 A

5 D" ~5 G  \# O4 y
       寻找文档格式方面的规律性(不同文档规律性是不同的)。“编辑”“替换”两个连续的段落标识^p^p^p</>^p,或者替换^p“</>^p“
5 [' b- [% N( B

* `2 w3 [8 [3 O& A
       “替换”的结果就划分了词条,或者说给文档做了词条划分标识。如下图所示:
4 f0 C4 s  h" \, f9 i6 {5 e/ a% |9 V
       再替换^p<br>^p,来实现词条内的换行。词条内第一个<br>前的内容就是词条的“标题”(单词),第一个<br>后的内容就是词条的“内容”(解释)。如下图所示

: r8 c5 g) l! Y, [; |: r8 W  b7 G' z  f3 ]

) f, V9 M3 n* }4 P) a9 p( }       当然,我们也完全可以再“替换”“ <br>^p</><br>”为“^p</>”,并直接删除最后一个没用的<br>,以使文本更精简。但在精简化之前的文件格式上已经符合转换的要求了。% C* v; _2 p  ?! H0 z  v

5 f$ Y  V, h% o       接下来我们就可以Ctrl+A全选,Ctrl+C复制,然后以复制的内容替换“搞笑翻译.txt”的原内容,或者Ctrl+V粘贴内容到新建TXT文件中并保存,从而得到适用于转换词典的TXT文件。# e8 M1 S* x0 E$ D/ q' t% [
$ `) ^/ f% v+ ^# h; X: [) G& y( {$ O
       3.1.2. 转换格式合适的TXT文件为“词典”
7 Y2 t! B7 T( G5 f: P+ n. ^: Q4 r6 {8 E1 e, c6 ?4 v3 k
       用“小满字典”制作工具makexmdict.exe,“选择文件”打开我们刚才编辑好格式的“搞笑翻译.txt”,进行“属性设定”后就可以点击“创建”来生成“词典”了。( I' s! g4 `" m* |7 ]# A$ a
2 Q7 Q, o5 G$ [  F1 V
8 K$ b  |0 G. j

4 k0 {5 P3 n: ~+ N+ i       我们制作出的“词典”现在是这个样子(如下图所示)的:
( T8 J) n8 U2 C1 [9 F
" i; ^6 _  O# t# \, T3 d9 ?
& t0 o9 k8 G1 @# a; U; u
       这已经可以用了。但如果你觉得词条“标题”(单词)和“内容”(解释)都用默认的颜色不够理想。你还可以设定颜色。
) G+ R* a8 d  {2 S: S; e! \( ]  x* a
     3.1.3. 设定“词典”中“词条”(单词)和“内容”(解释)的颜色。6 c4 a  i6 O  {! z

& Z/ R' `/ b5 e% F. f* k# B
       3.1.3.1. “词典”颜色设置最简方式(软件作者dreamtotrue提供)是双击进入已生成的词库文件夹,比如我们刚做好的“词典”“搞笑翻译”文件夹,然后用“记事本”或“UltraEdit-32”等软件打开config.xml”这个文件,找到下图的位置。
9 ]" b# J9 K$ V7 I! z0 r
6 }. B3 Z9 K# `/ h
( |3 u) N, B/ u6 ~! V& j5 r9 ^1 h
) G& Y( n0 \" c
       通过更改xhytitle”的“color”和“xhycontent”的“color代码就可以设置字体颜色了。比如把“xhytitle”“color”中的“#0066CC”替换为“#FF0000”就可以使“标题”(单词)以红色显示,替换xhycontent”“color
( V0 [$ b+ L9 k6 ~/ N# M4 n/ }中的“#0066CC为“#009100”就可以使“内容”(解释)以绿色显示了。
( W; u, |8 x5 Q       编辑字体颜色并保存后的显示效果如下图所示:( |1 o2 B7 v* \% Z. J7 ?
6 J  a9 Q9 U' ?; m  a) W- k
9 [7 o9 l$ ?; o) U3 \
    具体其他颜色代码请参考附件一“颜色代码表”。
, U# x; v2 O' F4 T7 f0 `
       3.1.3.2. 分别设置词条内容中不同部分颜色的方法:
. x! C; ^# u# q  S/ s& k/ y+ H1 V       比如我们有一个TXT名为“翻译.txt”,我们可以如下来设置字体颜色:$ G; v2 r- s" E) V4 a/ Y! W/ V3 L
: w' n1 c, u, D6 R4 p% K
       其中<font color=“#EA0000”>表示其后文字直到</font>截止的颜色为代码#EA0000所代表的颜色。# P; w- s, X- g! Q3 a5 A8 r" T) n: B! J
       用这个带有颜色设置的“翻译.txt”转换成的词典内容颜色就是多样的了。
" ]. r* ~6 V% @3 ^! i* `
- B& \4 K1 d3 H7 ~1 c8 U  o( K
       当然,如果要使PPC上也显示出自己设定的颜色,有时需要把下面一段代码(为醒目我标注为红色)
# }" Y# E! [8 K4 M- z+ s3 ~6 Z
<if $var.TitleColor!=''>
! ~7 D% [) z  w6 A  _<font color="[$var.TitleColor]">[$var.Title]</font>
! ^+ p4 H( _. G$ p+ [0 r, ~: V% o<else>
( R" I/ G, x) V8 o5 w[$var.Title]: x* q# n2 s* |3 Y/ _

; d1 P# Y  Y3 h* u8 X2 t</if>

( H. Z  k6 `! [$ N5 }' Y8 [       复制上述(红色)代码并粘贴到字典文件——即“翻译”文件夹config.xml文件内“xhytitle”和“xhycontent”的“color”设置之前并保存。最后,看看下面的PPC显示效果图吧!

* n. x9 }! |9 H6 F* L) U9 x
& V1 K3 l" m/ p1 @( j* ?) c) {
       3.2. 转换Excel文件为“小满字典”词库的方法(以多字段的藏书目录为例):
        3.2.1. 准备好要转换的Excel文件。
        主要是去掉冗余的行与列,并注意数据所在的sheet名称,也可自己改一下sheet名称。
2 ]8 i! S  R- f2 d

+ u% I* M) {& v  X- T5 \
        3.2.2. 打开小满词库制作工具(MakeXMDict.exe)并选择数据源。
        数据来源选择“Excel文件”。然后,通过“选择文件”找到要转换文件并“打开”。接着选定数据所在的sheet。
4 J! E& D4 {8 `- }& a
. _. P& O" y) p% c4 c9 a5 q# T
       3.2.3. 然后就可以具体改动“系统”和“字段属性”中的具体设置,使之符合自己的要求。
       设置后,点击“创建”按钮就可以自动生成词库文件了。所需时间依数据量而有所不同,小的词库文件制作一般只需要几秒钟即可完成。
/ _: l6 ^" |! f' y* [4 D/ O
. h5 R$ M8 w; p+ n* q
        3.2.4. “词库文件”显示效果的优化。
       “创建”后的“词库文件”已经可以使用了。但如果想要使各字段内容以不同颜色醒目显示,则需要用记事本或UE打开config.xml文件,在下图所示的位置进行编辑,增加高亮部分所示的字体颜色代码并保存。
3 F) ~+ z* l: V6 G( A% n8 g

+ S' R9 V& y$ q( ^  S
       3.2.5. 现在,制作已经完成了。可以点击“词库”左侧的某个字段,然后进行相应的快速搜索。
; C; ~4 ]1 V; A% y' i6 i6 N+ a; g4 H+ ^

1 p/ N: _% P5 y* S$ m- m5 L
       3.2.6. 搜索结果如下
4 ~2 `4 y' i+ N+ j/ r9 P

% M# A& h3 `+ m% Q3 c
       制作这类数据词库是不是很容易?!我相信,初次接触“小满字典”的朋友也能够较轻松地制作出自己的“小满字典”词库文件。欢迎大家共享可以公开的“小满字典”资源!
-------------------------------------------------------------------------------------------------------------------------------------
2009年3月28日增加了Excel制作“小满字典”词库的内容,并对全文标题等做统一调整。

" {+ W& C& {; ]4 r2 x; Z; ~9 N4 Q; m6 R2 m5 T+ w
[ 本帖最后由 philostone 于 2009-3-28 11:24 编辑 ]

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?免费注册

x

评分

1

查看全部评分

该用户从未签到

发表于 2008-12-27 18:11:38 | 显示全部楼层
好东东:loveliness:
  • TA的每日心情
    开心
    2018-7-19 02:16
  • 签到天数: 20 天

    [LV.4]偶尔看看III

    发表于 2008-12-27 23:54:36 | 显示全部楼层
    老虎不发喵,你当我是病危啊。。:lol
    : _8 k/ d$ ?+ k& ^话说这种格式的小满字典和mdict 的html格式一样。

    该用户从未签到

    发表于 2009-2-23 18:25:06 | 显示全部楼层
    下載學習,
    . ^  C# G4 T' a" \謝謝!!
  • TA的每日心情

    2021-9-13 00:01
  • 签到天数: 268 天

    [LV.8]以坛为家I

    发表于 2009-2-27 10:17:38 | 显示全部楼层
    在vga上显示字体太小了,请问如何改大点呢?

    该用户从未签到

     楼主| 发表于 2009-2-27 12:28:56 | 显示全部楼层

    回复 5楼 dragonyuan 的帖子

    可以通过修改“config.xml”文件来更改“小满字典”词库显示时的文字大小、颜色等!下面红色字体部分是我加进《康熙字典》的“config.xml”文件相应位置的字体设置项,其中“size=6”和“size=7”就是设定字体大小的,“color="#CE0000"”是设定字体颜色的。如果想让字段名称(比如“字典字头”字段)也和其后的文字同样大小和颜色,只要把<font size=7 color="#CE0000">放在它前面即可。
    7 n5 f' ]3 i! I" Y# Y* `% S下面“【”与“】”之间的内容是从修改后的“小满字典”版《康熙字典》的“config.xml”文件(见)相应位置复制过来的,效果如附图所示。
    9 c" ?& I$ s, n7 {【 <rhtml><![CDATA[<span class='no'><%=num%>:</span>
    % |/ b# j: l2 {2 C2 H<span class='xhytitle'>汉字字头:<font size=6 color="#6F00D2"><%=5A418E6BBF3C4EDC1AE9D7C24661ABAF%></font></span> <br />& f* J1 g' H  u) r3 W7 U
    <span class='xhycontent'>所属集部:<font color="#007979"><%=137834425E8D1ED4D25A675184B98F80%></font></span> <br />3 d3 v$ m5 |- V0 W7 ]
    <span class='xhycontent'>字典字头:<font size=7 color="#CE0000"><%=137834425E8D1ED4670F24E3C72A9845%> </font></span> <br />/ |0 L8 I; g3 w' |; f. y5 R. h( w
    <span class='xhycontent'>字典内容:<font color="#004B97"><%=137834425E8D1ED4A1D23B1A641BC486%></font></span><hr /> ]]></rhtml>; Y6 j& n; A1 y9 ~: `. Q4 W  P
      <rstyle><![CDATA[ 】
    - j8 \5 ?0 F# ^4 g$ n至于“color=”后面的颜色代码表示什么颜色,请参看1楼附件中的“颜色代码表”!
    * D! _: s/ _6 f# t2 P% B+ z- [' n: }; X9 X
    [ 本帖最后由 philostone 于 2009-2-27 12:45 编辑 ]

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x

    该用户从未签到

    发表于 2009-3-21 22:54:39 | 显示全部楼层
    好教程!学习了!

    该用户从未签到

    发表于 2009-7-8 17:12:46 | 显示全部楼层
    顶嗲再看

    该用户从未签到

    发表于 2009-7-9 10:09:33 | 显示全部楼层
    博学,除了MDICT,此“小满”亦应好好学之

    该用户从未签到

    发表于 2009-8-6 23:49:16 | 显示全部楼层
    小满字典字典支持多大的词典??这么好的工具才是索引百度百科的最佳伴侣嘛...
    # ?! @# Q+ T& y, \行的话我来搞搞~~:P

    该用户从未签到

    发表于 2009-8-22 01:39:34 | 显示全部楼层
    先顶下版主先,谢谢版主无私的奉献,使我们又学到了东西。

    该用户从未签到

    发表于 2010-6-28 18:41:34 | 显示全部楼层
    bu cuo o hehehe

    该用户从未签到

    发表于 2010-10-31 20:16:28 | 显示全部楼层
    <span class='no'><%=num%>:</span><span class='hztitle'><%=name%></span> <br/>繁体 <font color='red'><%=oldname%></font>
      Q3 Q3 C% s5 Z, c        <br /> 笔画 <font color='red'><%=strokes%></font> , 部首 <font color='red'><%=part%></font>,部首笔画  <font color='red'><%=partstrokes%></font>
    " W  M2 o" ~5 m$ J        <br /> 拼音 <span class='cypy'><%=spell%></span> <br /> <%=content%><br /><hr />
    * K6 D  Y0 \0 d7 f4 v上面是汉字字典里头的。想把字体变小要如何操作啊。改了<font color='red'><%=strokes%></font>这行反而变得程序不能用了,请lz指导一下啊。

    该用户从未签到

    发表于 2010-11-1 13:37:18 | 显示全部楼层
    还有个就是左边跟下边并没有见到拉条了。
    ' I! o* z( a# g2 K显示出一部分也不能用拉条移动

    该用户从未签到

    发表于 2011-6-23 13:16:13 | 显示全部楼层
    这么好的工具
  • TA的每日心情
    难过
    2020-2-27 01:04
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2011-10-4 22:01:43 | 显示全部楼层
    wm不根据屏的分辨率自动调整字体大小很麻烦啊。

    该用户从未签到

    发表于 2013-1-16 20:17:52 | 显示全部楼层
    感谢辛苦努力与无私奉献

    该用户从未签到

    发表于 2014-4-18 07:36:30 | 显示全部楼层
    不错不错,楼主是个绝对高手
    ' W+ M7 p9 ~1 {  @8 w1 u+ T$ I  C, M% l5 h5 w

    + X- F/ ~* q& {% S% p! P
    9 {7 }; G7 p7 C9 \9 \
    ' _1 U2 y& c$ m3 y' u" H: ^+ k& i3 \, I. z- e- o
    7 l, j! l0 D: k" L. h8 H6 A; u

    $ s& R& T& o( i  e0 e. k# b* B8 @; P. o: B0 G; M( r8 `
    + u$ D6 T$ N# p7 j2 H4 [& F- n- O

    5 y. U( b: Y2 e2 d( Q) l, V: V6 h  x0 h& b5 @% {
    9 z8 M" W. m6 R4 g5 p; ~% Q* T% T
    {随机链接}{随机链接}{随机链接}{
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2025-5-10 17:36 , Processed in 0.035475 second(s), 31 queries .

    Powered by Discuz! X3.4

    © 2001-2023 Discuz! Team.

    快速回复 返回顶部 返回列表