掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 1573|回复: 3

[讨论] 合并懒虫简明词典和一本“简明英汉汉英”的体验

[复制链接]

该用户从未签到

发表于 2014-10-4 15:24:35 | 显示全部楼层 |阅读模式
原本的体积  懒虫 13m 另一本简明(superfan)的 30m (两本都是我自己删除了大量标签,仅保留加粗的)。然后我分别把两本的</>结尾改成“<br>懒虫简明\n</>"和<br>简明英汉汉英\n</>” 然后用cat合并,确认合并开始的地方没有错后然后就自然交给mdxbuilder了。! ?. }% c7 i! s; ?& \+ ]

  G9 l1 R$ R& W# e惊喜之旅开始了
$ u/ t# B0 f- N6 T) B2 \3 x9 \" Y( j7 n7 f/ V
一、在导入文本和sorting dict时,我1g的内存快爆了,让我看住任务管理器准备着kill掉mdxbuilder。幸好顺利编译,词条数1723707,也不是很多啊,而且每条的内容也不多。回想起之前编译精简版的金山快译词库,词条数很多(忘记有多少了),mdxbuilder花了很长时间。应该3.0 beta2也是大文件特别版吧?, s, f' n" V  L- q
6 n: v6 L8 ]* l3 r$ r
二、mdict的隐藏功能(高手无视)
8 [! R2 \+ w# `! s; h我不太相信那个相同词头的词条合并,但是上述的混合物放到mdict 的PC和 安卓端都不能同时显示两个词典的解释,也就是说,在单词典模式下,那个mdict 神奇的iframe(或者是框架什么的,?)不会跳出来。
2 H4 I5 q" w. [) X) ?4 Y" o怎么办呢! v. t. J; s- I/ Q. c' E; ], v

3 o; D  p1 a! _2 X9 B3 f& D6 ~3 L在pc端,新建一个空分组,只放进那个混合物,然后把分组标记为联合模式,马上显示了同一个mdx内的不同词条$ L( t; F: g9 L7 r
在安卓端,大同小异,在多词典模式下只选择那个混合物,也马上显示了同一个mdx内的不同词条。
( n5 G/ W" e1 c, K0 D" ~5 E# w! m+ U9 D8 e+ n4 ?& w
不管怎样,我还是第一次发现这个功能啊,如果那个regex dotx不是很会用的话,也可以走这个路
1 n7 G/ S) U8 ~
7 g) v( E3 y- u' U) ]1 |0 G  S' g三、那个混合物的mdx是33.5mb,也就是说,我觉得尽可能把一些相似的词典做成像我说的那个混合物或者直接词条合并...mdx的压缩仅比7z格式大15%~30%,对于有索引的数据库应该压缩效率挺不错吧。
3 T4 x( T" R7 B  _
" b( Z; A# m  d) r/ F% `#### x. r% S: Y* j( }4 m) g* f
其实我这样做是因为mdict下多词典模式的来来回回勾选各本词典很麻烦,比如查中文时和查英文时,有些中文词典有英文词条,却又占了一大片屏幕。seederdict有自由分组功能,如果rayman有时间可以改进一下。而且单个mdx复制和搬来搬去也方便一点^-^
  • TA的每日心情

    2018-6-16 00:08
  • 签到天数: 197 天

    [LV.7]常住居民III

    发表于 2014-10-10 12:46:35 | 显示全部楼层
    坛友,分享一个才是王道哈。
  • TA的每日心情
    奋斗
    2020-8-24 01:04
  • 签到天数: 153 天

    [LV.7]常住居民III

    发表于 2019-12-25 13:36:52 | 显示全部楼层
    分享一下呗
  • TA的每日心情
    开心
    2021-9-18 15:22
  • 签到天数: 272 天

    [LV.8]以坛为家I

    发表于 2020-1-18 07:50:55 | 显示全部楼层
    0 l# J* x; x& F9 L
    谢谢l大,准备考研结束后就折腾折腾
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2024-5-18 17:55 , Processed in 0.044443 second(s), 9 queries , MemCache On.

    Powered by Discuz! X3.4

    Copyright © 2001-2023, Tencent Cloud.

    快速回复 返回顶部 返回列表