掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 4753|回复: 17

[经验交流] “小满字典”词库制作初级教程

[复制链接]

该用户从未签到

发表于 2008-12-27 13:25:42 | 显示全部楼层 |阅读模式
    “小满字典”词库资源(以下简称“词典”)要靠使用者共同开发制作才能不断地丰富,同时,制作适合每个用户自己的“词典”也才能让“小满字典”的功用发挥到极致。故此,我不揣浅陋,把自己制作“词典”的一些粗浅经验总结成这篇“‘小满字典’词库制作初级教程”。希望能给初步接触“小满字典”的朋友们,特别是那些刚刚萌生制作“词典”想法而又没有更多计算机语言知识的业余爱好者一些帮助。
; h2 h: I4 @6 G0 Y" a
    一定格式的TXTEXCELACCESS文件都能通过词库转换软件“makexmdict.exe”转换为小满字典词库。下面以绝大多数坛友十分熟悉的TXT(记事本)和Excel文件转换“小满字典”词库为例:
    1. 准备各种适合做“词典”的TXT和Excel文件。
0 ^: o& N5 w9 K5 b" }7 c/ v! z6 p0 M
    其他格式的文本文件(如DOCPDF等)也可以把内容复制粘贴到TXT文件中。
  }+ D+ ~* r4 ]' s; U6 f6 Q! |
       2. 本“初级教程”所需软件:
+ F% f8 u0 U  Q# \% z6 d
       2.1. “小满字典”制作工具makexmdict.exe(下载地址是http://www.luan8.com/makexmdict.rar【必备】0 K6 ?7 U* }8 i  J8 e/ {* h8 a3 o
       2.2. 电脑系统自带的(程序-附件-)“记事本”程序和MS Office Excel【必备】
1 u4 F  X2 B: Y& @0 h2 t" V       2.3. MS Office Word、UltraEdit-32等文本编辑软件【可选】
3 O. F* h" F& Q2 u; B8 r7 Z
       3. 词库制作过程:
    3.1. 以“搞笑翻译.txt”转换为“搞笑翻译”小满词库为例,说明TXT文件的转换。
   
+ m; R6 }, k: r0 A
    关键问题是让TXT文档的格式符合“小满字典”制作要求。
    “小满字典”格式上要求以“</>”分隔词条,以“<br>”标示换行,用“<hr>”划分隔线,并接受HTML语言中字体颜色、大小等的设置。
       3.1.1. 编辑TXT文件搞笑翻译.txt”,使其格式适合转换要求:

, y( c0 Q3 {" D  \% {0 @5 i5 A
       UltraEdit-32打开,或者把TXT文档中的内容复制到一个新建的MS Office Word文档(DOC文件)【以此为例】。
8 L( o$ \9 z6 ^) N
. r, R2 ?7 u. T5 A& [
       寻找文档格式方面的规律性(不同文档规律性是不同的)。“编辑”“替换”两个连续的段落标识^p^p^p</>^p,或者替换^p“</>^p“
8 J- m3 V+ G: o, c9 j

% u( O4 F8 ^; V3 N8 h7 k
       “替换”的结果就划分了词条,或者说给文档做了词条划分标识。如下图所示:
9 H, X/ [% V  z) ^
       再替换^p<br>^p,来实现词条内的换行。词条内第一个<br>前的内容就是词条的“标题”(单词),第一个<br>后的内容就是词条的“内容”(解释)。如下图所示

) A3 m  W9 U+ Z9 f9 l
& c8 p- }( w8 l5 r( Y
       当然,我们也完全可以再“替换”“ <br>^p</><br>”为“^p</>”,并直接删除最后一个没用的<br>,以使文本更精简。但在精简化之前的文件格式上已经符合转换的要求了。& }$ q' B7 ^" _2 R/ B9 q/ p
# n% C5 P- }3 H* g# \+ W
       接下来我们就可以Ctrl+A全选,Ctrl+C复制,然后以复制的内容替换“搞笑翻译.txt”的原内容,或者Ctrl+V粘贴内容到新建TXT文件中并保存,从而得到适用于转换词典的TXT文件。7 g6 ~% ~5 d6 q( b! W2 V0 ~
; y$ ]0 e- K! m/ B' c+ ?
       3.1.2. 转换格式合适的TXT文件为“词典”/ b3 \( U) c  L( Y1 R7 }" c7 y
- g6 _. B7 P7 }! D. ~0 a9 d+ ?1 e
       用“小满字典”制作工具makexmdict.exe,“选择文件”打开我们刚才编辑好格式的“搞笑翻译.txt”,进行“属性设定”后就可以点击“创建”来生成“词典”了。
0 l! A$ V! |  x8 w( Q) _& g
- v( |8 R- U9 L6 ~6 u' w9 i
7 e2 x- r. s$ Z
6 F4 O( j% z5 @% O, ]
       我们制作出的“词典”现在是这个样子(如下图所示)的:9 Y2 }6 n# j- C" B

  z) X2 c! |) ?: Z" K/ |

: B/ g8 d, a( V5 C3 d6 T! A       这已经可以用了。但如果你觉得词条“标题”(单词)和“内容”(解释)都用默认的颜色不够理想。你还可以设定颜色。
3 ?/ |" D0 M' {1 Y! T9 c& l! z$ c+ W0 n( ]2 ]: l
     3.1.3. 设定“词典”中“词条”(单词)和“内容”(解释)的颜色。
; y; _7 p* x5 W# j" L0 o  h
7 G% I9 l" U1 o4 n; I/ |% [
       3.1.3.1. “词典”颜色设置最简方式(软件作者dreamtotrue提供)是双击进入已生成的词库文件夹,比如我们刚做好的“词典”“搞笑翻译”文件夹,然后用“记事本”或“UltraEdit-32”等软件打开config.xml”这个文件,找到下图的位置。
/ K. u/ x, U# Y2 j% N$ l  l  H+ w0 o" ]" [8 V( X
& T# _, H6 O5 l" y

6 f/ A% B6 V+ b# m2 \0 U$ f3 P       通过更改xhytitle”的“color”和“xhycontent”的“color代码就可以设置字体颜色了。比如把“xhytitle”“color”中的“#0066CC”替换为“#FF0000”就可以使“标题”(单词)以红色显示,替换xhycontent”“color
7 K- G, \  U5 [4 E2 t中的“#0066CC为“#009100”就可以使“内容”(解释)以绿色显示了。
8 S0 l. y9 C' w2 z       编辑字体颜色并保存后的显示效果如下图所示:
0 K0 u" A0 D3 t- M
' [9 v: A! M7 Z' J# U  H" \  Y( E
0 q% A* g" q/ n/ p
    具体其他颜色代码请参考附件一“颜色代码表”。

8 u1 C9 H" G- t. J9 _       3.1.3.2. 分别设置词条内容中不同部分颜色的方法:
( K6 P6 W. r9 u' w" ^3 o( @) y6 ^       比如我们有一个TXT名为“翻译.txt”,我们可以如下来设置字体颜色:4 C/ y& ?- b, c8 l3 r+ H8 ?

9 Q: C8 B1 o5 M
       其中<font color=“#EA0000”>表示其后文字直到</font>截止的颜色为代码#EA0000所代表的颜色。- G! k, }( y; b  P1 [
       用这个带有颜色设置的“翻译.txt”转换成的词典内容颜色就是多样的了。9 K; h, V! D1 p- p

) Y/ n2 b  j/ r6 z
       当然,如果要使PPC上也显示出自己设定的颜色,有时需要把下面一段代码(为醒目我标注为红色)
' e" Y6 G7 m, k8 J. q
<if $var.TitleColor!=''>
1 w+ B7 ^) m. c9 ~1 O( T4 e, ~<font color="[$var.TitleColor]">[$var.Title]</font>
2 S( Y6 Q9 G8 u7 G' M<else>
2 {1 n7 t! I% B2 g5 }4 G[$var.Title]0 A  q: ]7 z# }& c, o

- b; q- V( [0 G% z* t) @1 ?</if>
# Z; ?4 H4 V4 y
       复制上述(红色)代码并粘贴到字典文件——即“翻译”文件夹config.xml文件内“xhytitle”和“xhycontent”的“color”设置之前并保存。最后,看看下面的PPC显示效果图吧!
" }) P; P: ?8 i5 f
1 i( M) J8 \  t. a
       3.2. 转换Excel文件为“小满字典”词库的方法(以多字段的藏书目录为例):
        3.2.1. 准备好要转换的Excel文件。
        主要是去掉冗余的行与列,并注意数据所在的sheet名称,也可自己改一下sheet名称。
  k0 T, X3 s# y

" [0 K' ~' x1 V( C
        3.2.2. 打开小满词库制作工具(MakeXMDict.exe)并选择数据源。
        数据来源选择“Excel文件”。然后,通过“选择文件”找到要转换文件并“打开”。接着选定数据所在的sheet。

) O0 r+ y( z3 {

- L- x) c/ ?- _# O7 e
       3.2.3. 然后就可以具体改动“系统”和“字段属性”中的具体设置,使之符合自己的要求。
       设置后,点击“创建”按钮就可以自动生成词库文件了。所需时间依数据量而有所不同,小的词库文件制作一般只需要几秒钟即可完成。

) k8 r4 f# d# X5 a
3 }2 u2 g1 }1 E6 g5 E
        3.2.4. “词库文件”显示效果的优化。
       “创建”后的“词库文件”已经可以使用了。但如果想要使各字段内容以不同颜色醒目显示,则需要用记事本或UE打开config.xml文件,在下图所示的位置进行编辑,增加高亮部分所示的字体颜色代码并保存。

$ [. d% ~8 C. r' `3 k3 c2 u, W
" m* u. {4 D1 p, O' ~
       3.2.5. 现在,制作已经完成了。可以点击“词库”左侧的某个字段,然后进行相应的快速搜索。

2 K2 C1 s3 @6 C4 Y9 |  @6 u; x

5 L, d7 ~" F, h8 L6 X  H" y/ G
       3.2.6. 搜索结果如下
& s( @9 t: a" [% U
6 q% @3 d# b( o5 x: a' g( S# o
       制作这类数据词库是不是很容易?!我相信,初次接触“小满字典”的朋友也能够较轻松地制作出自己的“小满字典”词库文件。欢迎大家共享可以公开的“小满字典”资源!
-------------------------------------------------------------------------------------------------------------------------------------
2009年3月28日增加了Excel制作“小满字典”词库的内容,并对全文标题等做统一调整。

5 \& R2 g, ~9 I% I3 q
* u" @- ]- a* e[ 本帖最后由 philostone 于 2009-3-28 11:24 编辑 ]

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?免费注册

x

评分

1

查看全部评分

该用户从未签到

发表于 2008-12-27 18:11:38 | 显示全部楼层
好东东:loveliness:
  • TA的每日心情
    开心
    2018-7-19 02:16
  • 签到天数: 20 天

    [LV.4]偶尔看看III

    发表于 2008-12-27 23:54:36 | 显示全部楼层
    老虎不发喵,你当我是病危啊。。:lol , H9 R' ^/ ?9 [7 p2 d  c6 b7 w
    话说这种格式的小满字典和mdict 的html格式一样。

    该用户从未签到

    发表于 2009-2-23 18:25:06 | 显示全部楼层
    下載學習,9 P1 Q( ~; Y( G8 H1 n
    謝謝!!
  • TA的每日心情

    2021-9-13 00:01
  • 签到天数: 268 天

    [LV.8]以坛为家I

    发表于 2009-2-27 10:17:38 | 显示全部楼层
    在vga上显示字体太小了,请问如何改大点呢?

    该用户从未签到

     楼主| 发表于 2009-2-27 12:28:56 | 显示全部楼层

    回复 5楼 dragonyuan 的帖子

    可以通过修改“config.xml”文件来更改“小满字典”词库显示时的文字大小、颜色等!下面红色字体部分是我加进《康熙字典》的“config.xml”文件相应位置的字体设置项,其中“size=6”和“size=7”就是设定字体大小的,“color="#CE0000"”是设定字体颜色的。如果想让字段名称(比如“字典字头”字段)也和其后的文字同样大小和颜色,只要把<font size=7 color="#CE0000">放在它前面即可。
    - B2 h7 v" n3 m" |2 ?2 S% `  {下面“【”与“】”之间的内容是从修改后的“小满字典”版《康熙字典》的“config.xml”文件(见)相应位置复制过来的,效果如附图所示。
    . x8 O7 }% w  E; N【 <rhtml><![CDATA[<span class='no'><%=num%>:</span>
    1 I8 e/ D/ x, p. p- ^$ ?<span class='xhytitle'>汉字字头:<font size=6 color="#6F00D2"><%=5A418E6BBF3C4EDC1AE9D7C24661ABAF%></font></span> <br />4 I5 ]3 Q. I7 j$ H: h
    <span class='xhycontent'>所属集部:<font color="#007979"><%=137834425E8D1ED4D25A675184B98F80%></font></span> <br />. U' b2 ?/ u) A/ Z3 d
    <span class='xhycontent'>字典字头:<font size=7 color="#CE0000"><%=137834425E8D1ED4670F24E3C72A9845%> </font></span> <br />6 s9 W, G# ?+ ?. @- u1 a
    <span class='xhycontent'>字典内容:<font color="#004B97"><%=137834425E8D1ED4A1D23B1A641BC486%></font></span><hr /> ]]></rhtml>
    ) L& k6 J5 Q. U4 j, V( e0 F3 a- Z5 ^: o  <rstyle><![CDATA[ 】, F! {( Y8 Y5 g: v! V# `( g5 \- `% |
    至于“color=”后面的颜色代码表示什么颜色,请参看1楼附件中的“颜色代码表”!0 K) S2 ~- V  [' m3 G

    # `/ c6 n. c3 |! t[ 本帖最后由 philostone 于 2009-2-27 12:45 编辑 ]

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x

    该用户从未签到

    发表于 2009-3-21 22:54:39 | 显示全部楼层
    好教程!学习了!

    该用户从未签到

    发表于 2009-7-8 17:12:46 | 显示全部楼层
    顶嗲再看

    该用户从未签到

    发表于 2009-7-9 10:09:33 | 显示全部楼层
    博学,除了MDICT,此“小满”亦应好好学之

    该用户从未签到

    发表于 2009-8-6 23:49:16 | 显示全部楼层
    小满字典字典支持多大的词典??这么好的工具才是索引百度百科的最佳伴侣嘛...2 d  w' `0 Z3 B: k" E  q, z+ j4 u8 h
    行的话我来搞搞~~:P

    该用户从未签到

    发表于 2009-8-22 01:39:34 | 显示全部楼层
    先顶下版主先,谢谢版主无私的奉献,使我们又学到了东西。

    该用户从未签到

    发表于 2010-6-28 18:41:34 | 显示全部楼层
    bu cuo o hehehe

    该用户从未签到

    发表于 2010-10-31 20:16:28 | 显示全部楼层
    <span class='no'><%=num%>:</span><span class='hztitle'><%=name%></span> <br/>繁体 <font color='red'><%=oldname%></font>
    # E7 S. @, K8 o- \. A, X& E        <br /> 笔画 <font color='red'><%=strokes%></font> , 部首 <font color='red'><%=part%></font>,部首笔画  <font color='red'><%=partstrokes%></font>) v" D# r- i1 M. x" ]
            <br /> 拼音 <span class='cypy'><%=spell%></span> <br /> <%=content%><br /><hr />
      H# C9 f$ l0 f7 A上面是汉字字典里头的。想把字体变小要如何操作啊。改了<font color='red'><%=strokes%></font>这行反而变得程序不能用了,请lz指导一下啊。

    该用户从未签到

    发表于 2010-11-1 13:37:18 | 显示全部楼层
    还有个就是左边跟下边并没有见到拉条了。
    , E9 `& c) {! ~) k) X' y显示出一部分也不能用拉条移动

    该用户从未签到

    发表于 2011-6-23 13:16:13 | 显示全部楼层
    这么好的工具
  • TA的每日心情
    难过
    2020-2-27 01:04
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2011-10-4 22:01:43 | 显示全部楼层
    wm不根据屏的分辨率自动调整字体大小很麻烦啊。

    该用户从未签到

    发表于 2013-1-16 20:17:52 | 显示全部楼层
    感谢辛苦努力与无私奉献

    该用户从未签到

    发表于 2014-4-18 07:36:30 | 显示全部楼层
    不错不错,楼主是个绝对高手
    4 ?! [0 q8 }( [
    : Q* V$ A0 G, f4 \# F( R' d8 E- [5 H+ K' h" q
    , P' M9 }7 }  n7 U' }1 ^9 C' I
      k4 Y$ S" x0 Z/ Y# w3 G

    " x2 s5 R* A* \7 o7 k
    9 X" W1 s5 r* a& w' g/ D& h
    , [- `+ [: \$ }; ]! p) q4 G% {
    : t) I: y1 [% C1 e+ c) D; @9 n
    1 ^+ `+ F9 f5 J; }7 x$ ]( z. Y* a- ?1 o1 }! {

    3 V2 H; l- \5 Q5 b0 u) w9 M7 j0 J
    ! I- U6 c% }1 h0 k2 t- q{随机链接}{随机链接}{随机链接}{
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2025-4-20 04:15 , Processed in 0.035193 second(s), 31 queries .

    Powered by Discuz! X3.4

    © 2001-2023 Discuz! Team.

    快速回复 返回顶部 返回列表