掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 18471|回复: 54

[教程] mdb格式转成的纯文本mdx(手机内存小的有福了)

[复制链接]
  • TA的每日心情
    擦汗
    2021-3-8 17:59
  • 签到天数: 2 天

    [LV.1]初来乍到

    发表于 2014-2-6 12:31:49 | 显示全部楼层 |阅读模式
    本帖最后由 lixun305 于 2014-8-22 11:03 编辑
    ; L* F  \; H0 K0 S- s
    , `, i+ W% Q) f: `3 Y' `将mdb格式的数据库词典转换成mdx格式的词库,不含任何格式( 即,不含<font....></font> <img.... 之类的),就是纯文本形式,这样,mdx尺寸很小。
    7 F9 ^, e) i* I7 R7 u/ U
    & @4 u% {' R( `- v由于mdb数据库文件是多个字段的,所以转成的mdx目前只是将第0个字段作为索引,其余的通过一定的格式连接在一起,构成mdx文件一个条目的内容。乍看没啥,但是有时候检索很不方便,例如:中华诗词总汇,有作者,题目,内容,体裁。。。字段,如果将作者作为索引,那么,例如,李白的诗,有984首,在mdcit下检索的时候就有984个 “李白”,很缭乱。 但又想不出更好的办法,实在是mdx的格式、检索方式所固有的缺陷(姑且这么说)。
    5 S8 B5 V3 y0 D" O- W1 N+ C" q& O6 z" |8 T& P7 Q
    目前已包括:
    ! w/ A0 W0 y$ A! a7 ~& I, u
    & q& t! q$ C! u1 W! e" S1. 汉语字典  
    6 o! W8 T0 c) O1 t( H1 U2 A; B8 l- G2. 成语词典  非常全。有重复词条,但可作为补充解释。) h5 X9 w6 {( ~8 T% S! i
    3. 中华诗词总汇  这个应该是相当全面的诗词总汇了。大家可以和 掌上百科的 詩詞總匯.mdx  对比一下。1 w$ D8 Z! A% a5 B3 r
         已加入诗词总汇作者简介,索引已改成 作者_题目,例如,查李白的望庐山瀑布,索引为 李白_望庐山瀑布 或  李白  望庐山瀑布  R7 o5 @% i! z' h6 K( W- ?

    ( X9 j& s  n& v6 X5 m. O4. 现代汉语词典
    ( C, }% Z3 u3 G  Y* y8 ~    制作过程见 13 楼。
    6 Y" `8 q9 c  |- K+ h; G
    + F( O; Y1 R! D& \) h% }- t5. 微词典_英汉汉英 词典
    + m! D! w+ X; y0 n: j) E* O   包含226344个条目,尺寸仅4.2M,极限制作。
    % P' e9 O. e; P; y8 B4 M8 D+ P+ B* ?( b
    6. 中华诗词总汇.mdx   李白诗集.mdx
    : B+ ^. Y6 B- Q( I) z% a3 U  R8 j
    已经在 手机(小米2, android V5)和pc上都测试过。
    6 S9 Y  _8 H4 `. y. W/ {0 E( f# ^- P' @$ M% F/ m6 X' p

    评分

    1

    查看全部评分

  • TA的每日心情
    擦汗
    2021-3-8 17:59
  • 签到天数: 2 天

    [LV.1]初来乍到

     楼主| 发表于 2014-2-11 18:15:25 | 显示全部楼层
    本帖最后由 lixun305 于 2014-2-13 11:59 编辑 1 @; V9 A# f5 ~* q0 U6 w6 @' U' ^
    3 N/ p/ f$ h2 w1 |3 U
    粗略程序已经上传: SqLite2MDB.exe  ,有啥bug请交流或告知,千万别骂娘。
    - @8 {4 I$ F4 X9 ~# ?, c1 Z. v" z  l2 c7 @3 w2 T  a
    现代汉语词典第六版.mdx制作过程:
      V% z! Z+ u) y2 J网上有好几个 “现代汉语词典.apk",重名,也没具体研究过,但都号称支持第六版,这就够了,咱就从这个抓起(版权问题归原作者,这里纯研究,不过好像他们的词库都几乎一样,这个版权怎么说呢?)。5 o( D% x- U7 V) c9 F: z# p  P/ ^& Q
    简言之
    ( {/ c' Y, I, u/ A) b, v' R/ K2 h1. 网上下载apk文件4 ^1 O9 X5 _! U. ], z9 l6 Y
    2. 从其中提取出词库
    9 i# I( c5 u. J4 \, P( P3. 进行整理& Y/ n1 Q; J4 g9 ?
    4. 转换成 mdx 文本6 N2 n; y% j4 w: n
    5. 用mdxbuilder生成。
    4 l0 n- D4 b/ r6 a/ |2 l3 }# a- }' O5 V
    详细制作过程待续。。。  6 y2 K9 Q2 e' A2 H, ]( c
    ' p& G  Q7 B9 Q1 Q$ C
    不一定有通用性,不喜勿喷。。。
    7 c* K  ~& e- h9 @( {/ D3 n7 }6 q  U/ U. g7 C
    1. 网上下载apk文件( t4 h) ~/ A% ^- ]; g% a
    apk文件就是android的标准可执行文件,点击就可以安装到手机上,类似于pc下的.exe文件。究其根本,android源于开放系统linux(我不怎么懂,姑且这么说,勿喷)。所以,apk文件本质上就是一个zip压缩包。 下载到 现代汉语词典.apk后,更名为 *.zip,解压到某一个文件夹下,看到一堆目录和文件,有一个文件夹  assets ,里面是 apk程序的一些数据文件, 在资源管理器下用 详细信息 方式查看,然后按照大小降序排列,一般情况下最大的前几个文件就是词库文件,例如 我看到的:
    * P: w6 x) o- s+ P. ?; V) W    apk1:
    0 i9 y8 [6 D. z, c            xingkai.ttf
    5 a! T" N2 V6 B! E        story.dll
    ) G4 @) T1 N# _1 L3 [# A4 {        apk2:2 c( T1 q) [5 }4 I, ?# _8 K2 k
                dictionary.dll2 g( y5 `" R! I  _4 \2 a
    当然,都是穿着马甲的。; B4 D  r' D: k+ _; k
        用ultraedit打开,可以看到:
      ~6 E/ Q8 T; B4 k! b$ {        伪装成 字体文件的 xingkai.ttf 实际打头的字节是 PK,那么,他就是一个zip文件,把他更名为 xingkai.zip,解压缩,得到 8 d% T" s4 g$ O* J- v: ]3 a9 ?
            bushou,dat  nxbzdxh.apk, nxbxd.apk nxbchina.dat ,这几个文件是用扩展名穿的马甲,用ultraedit一一查看,好了,均是SQLite format打头,那么,这四个文件都是 SQLite格式的数据库文件,将他们均改名为 *.db文件,用SQLiteDev.exe查看,成功打开,分别是 部首词库,新华字典, 汉语词典 成语词典。 5 N6 E4 t! ^5 j  T' K* o/ Z
        伪装成系统文件的 story.dll 文件用emeditor打开,发现就是一个文本文件,当然,是unicode格式的,用一般的文本查看,是乱码。
    6 m" K. q9 \0 y8 M5 }# V    伪装成系统文件的dictionary.dll用ultraedit打开,也是pk打头,更名为zip文件,解压,看到xinhua.db xiandai.db,用ultraedit查看,都是        SQLite format,这个倒是干脆,懒得二次伪装了,那就不客气了,收下! 用SQLiteDev.exe查看,分别是新华字典词库,汉语词组库(包括成语,词组,故事)., H# Z; B: P0 j3 q
            这就是通过两个apk文件,得到两个几乎一样的现代汉语词典第六版词库的方法。5 _8 n, r2 j$ o/ Q% l# j3 W* ]
    2.
    0 w6 T7 P3 D  p得到 SQLite格式的词库,虽然可以用SQLiteDev.exe查看,编辑等,但毕竟很不方便,我也没有认真研究SQLiteDev的心思。毕竟做不少特殊的工作,用通用程序SQLiteDev是无法满足要求的,因此,还是自己着手编程来的灵活。 这就是SqLite2MDB.exe(下面简称sq)编制的初衷。
    $ y& c' E& \0 f. K通过sq,将sqlite格式转成我熟悉的mdb格式,就可以用以前的积累,灵活处理了。sqlite数据库的处理源代码可到 www.codeproject.com中搜索。
    4 Z+ g  F/ ~# }( K通过sq, 可选择sqlite数据库中的一个或多个表格,转化成的mdb文件也将以同样的名称创建这些表格。此时得到的mdb词库和原来的sqlite格式是一样的,并没有做什么处理。 相当多的字段都是乱码或者无法识别的16进制数字。
    2 _6 s0 d5 n! K- a. U3. 5 g9 u, h, o3 b* W; Y  d
    通过sq,可以将2中转换出来的mdb数据库加载,在列表中可以看到10条或者更多的记录。一般情况下,有很多字段都是乱码或者无法识别的16进制数字,分两种情况:& @. P3 g$ m4 Y& E
    乱码字段:这些一般是unicode编码,此时可以点击unicode ->ansi,就会将每一个记录对应的该字段转化成可以识别的字符。注意,转换之前备份一下mdb文件,这个不可逆转啊。转换前请选择要转换的一个或者多个字段。. ?) _! z# U. D/ s) k0 s4 f; ^" R
    无法识别的16进制数字字段:这些一般是utf8编码,此时可以点击UTF8 ->ANSI,就会将每一个记录对应的该字段转化成可以识别的字符。1 i4 w  r6 _0 Z( ]! F
    可能有些软件将这些词库做成加密的或者通过什么算法处理过了,对不起,只能放弃了。: ]( ?2 E7 m6 t& s! P; }* X! ?+ \
    可能得到了几个数据库文件,可以都转换成mdb文件,然后用microsofit access打开并合并,这个多个数据库的合并我就没有做到程序中,很繁杂,我也觉得没必要。1 O0 n, Y2 s0 G" W
    得到的词库,大多表格名称或者表格的某些字段名称不合意,可以在access中更改,删除等,整到自己满意为止。
    7 y9 o; @, V# y/ ~3 u4. 转换成mdx词库文本文件.
    : q2 b: m) G1 ~: N, q" W这个应该是大家最关注的。( Z3 |- W$ e/ l# z& F; ?
    转换前要明确一些任务:(当然,直接ok, ok下去,也会得到一个缺省的mdx文本).6 z" A2 r& M  q# E8 e1 C
        (1) 要将mdb文件中的哪些表格转到mdx中。 例如,mdb中新华字典,成语词典,现代汉语词典等,可以选择一个或者多个。
    # Q% p$ |" T3 I+ |3 O5 f  (2) 针对某一个表格,要将哪些字段的内容转到mdx中。 例如新华字典有 _id  汉字 拼音 解释等字段,_id是为了排序需要加的,没有必要出现在mdx中,可以勾掉。 如果不处理,就是选择所有字段。! T  Z# ~0 Q) R9 U0 M
      (3)针对某一个表格,要将哪些字段的内容作为索引。 例如新华字典,希望做成的mdx文件,以 汉字 字段为索引,没人愿意以 1  2 3 4 .....为索引,mdict 搜索的时候,左列如果一堆数字除了挠头有啥用。  索引字段也要勾选,不勾选默认是第0个字段。- D0 q5 a( [2 H1 W
    操作步骤:
      E' }, b  S0 t  B  a. 打开一个mdb文件,将(2) (3)中的工作做好,注意是对每一个表格都要做,程序中会记住你的选择。6 v( l' q  i+ _
      b. 选择表格。
    ; I2 N$ @7 J0 ]7 W* R% D- F4 [  c. 点击 mdb转换成mdx文本 按钮即可。4 Y) B- }+ |  I0 A2 Q
    注意:生成两个文件(例如选择了表格 xhzd),xhzd.txt     xhzd_info.txt。前者为mdx文本文件,后者是mdx文件的“关于词典”时出现的内容,里面是一些信息,包含,文本从哪些表格转换而来,有多少记录,转换的时间,转换作者(用过mdcit的都知道把,就是:about后出现的)。  xhzd.txt 是纯文本方式,如果原来的词库含有声音、图片等复杂格式,此程序概莫能助。
    1 q0 w. @% x. d. d( X5 @! q, {
    $ I$ w4 m* `' l( ?: E- i6 u" y7 E1 U5. 有了mdx文本,用mdxbuilder即可转换成mdx文件,可将xhzd_info.txt的内容粘帖到mdxbuilder 的 Description 后的编辑框中,当然可以贴上自己的内容。4 F5 P3 ~: \8 p

    该用户从未签到

    发表于 2016-4-21 18:12:37 | 显示全部楼层
    The best. I missed this post.
  • TA的每日心情
    开心
    2020-1-5 08:04
  • 签到天数: 50 天

    [LV.5]常住居民I

    发表于 2019-9-24 20:02:37 | 显示全部楼层
    好资源!谢谢楼主的分享
  • TA的每日心情
    擦汗
    2021-3-8 17:59
  • 签到天数: 2 天

    [LV.1]初来乍到

     楼主| 发表于 2014-2-6 12:32:29 | 显示全部楼层
    本帖最后由 lixun305 于 2014-8-22 11:03 编辑 1 a7 x8 v8 Y9 J0 H/ q% l4 Z, e
    8 W$ o: S9 n5 g
    二楼等着传连接。。。5 O2 {! p8 V& H$ n$ C

    0 L7 K/ S, y/ x6 n4 g; B: Ghttp://pan.baidu.com/s/1dDBw44D) y/ m0 F4 C" U! [( D$ w4 e* C
    9 Y3 y2 b% W# ?
  • TA的每日心情
    开心
    2019-8-11 07:55
  • 签到天数: 606 天

    [LV.9]以坛为家II

    发表于 2014-2-6 13:26:25 | 显示全部楼层
    楼主辛苦了。

    该用户从未签到

    发表于 2014-2-6 19:09:59 来自手机 | 显示全部楼层
    本帖最后由 bbkbbk 于 2014-2-6 19:27 编辑
    7 C6 q2 V0 z3 O7 b3 j5 _3 P' |! u5 E" t2 A
    楼主一片热心,值得称道。然而说到mdx“固有缺陷”,让人感到茫然。
    , E" M+ ~. K/ R/ P; F电子词典,就是数字化的纸质词典,尽管格式繁多,如mdx、bgl、dsl、lsd、dict……但区别不过是排版标签,如mdx直接使用html标签、dsl使用另一套标签……无论哪种格式,其检索方式都是一样的,都是延续了传统纸质词典的检索方式。这个“固有缺陷”看来生命力挺顽强。6 W# K& z) {1 @9 |1 i) s' L
    电子词典存储格式,与数据库相比,简单得多,可以看成一张只有两个字段(词头为主键,词条内容)的表,而且只能按词头来检索,所以一些电子词典干脆直接存储在sqlite数据库里(我们用的一些mdx词库就是从那里提取的)。. G/ I/ Y9 y5 d6 R: j- C# {2 \
    楼主要是想将诗集这种主键≥2个字段的数据库做成词库,就得遵守词库的规则嘛,你要是把作者和题目两个字段放在一起作为词头,保准能直接检索到某位作者的某一首诗。
    4 G! f2 k: ]0 v8 w, q5 Y# U0 D, \再者,对于这些不太适合做成词典格式的数据,生搬硬套难免驴唇不对马嘴,不妨做成sqlite数据库,在android上写个简单的shell就可以实现各种高级的检索了,不会占用太大的手机资源吧。
  • TA的每日心情
    开心
    2022-11-10 09:48
  • 签到天数: 466 天

    [LV.9]以坛为家II

    发表于 2014-2-6 19:47:47 | 显示全部楼层
    谢谢提供,不错的做法。
  • TA的每日心情
    擦汗
    2021-3-8 17:59
  • 签到天数: 2 天

    [LV.1]初来乍到

     楼主| 发表于 2014-2-7 09:49:13 | 显示全部楼层
    本帖最后由 lixun305 于 2014-2-7 09:56 编辑
    . W, a/ I! J. P9 `( o
    bbkbbk 发表于 2014-2-6 19:09 ; _2 J# _+ @% `$ D9 X( {
    楼主一片热心,值得称道。然而说到mdx“固有缺陷”,让人感到茫然。
    0 f+ h- u5 A$ S1 W; e, M; b电子词典,就是数字化的纸质词典,尽管 ...
    3 y/ O8 ^+ P2 b9 o. K3 ?0 ~' \
    ' o% S( a; F2 M7 O, e1 {: v  @
    对不起,前面发言唐突了。 我实在是对mdx文件格式没有什么了解,所以都是瞎说,请勿见怪。 我的意思是要实现高级查找,做一个查找方便的shell,也要数据库文件本身支持才行。 例如:我要查诗词总汇,查李白所做的题目中含有庐山的诗词,如何查。 层主用 作者 + 题目作为索引,似乎是能解决一些问题,但很有限。 例如,我提的这个似乎无法实现,因为,对题目中含有庐山这一查找,是要实现非 从头匹配,例如:望庐山瀑布可以,庐山谣寄卢侍御虚舟 也可以,赠王判官时余归隐居庐山屏风叠 也可以,凡10余首。 mdx将其它除了索引字段揉在一起,构成内容,有时就非常庞大,如果按照内容查找,将很耗时。 再有: 诗词总汇中 作者苏轼 ,题目为菩萨蛮的就有21首,mdx将作者+题目作为索引也力有未逮,似乎将作者+题目+第一句作为索引可以做到,但这样的索引就很难受了。   5 Y& G# U7 ~; n& a$ O( G* X- D
        再次强调,我对mdx格式没有啥了解,错误之处,请谅解,绝无贬低mdx or mdict之意。
    $ [- b7 S: n& g# R( J+ g5 Y   ) H: m2 m! g/ C# b% r
        sqlite 正在研究,也从一些apk文件中析出一些sqlite格式的词库,想将其转成mdb或者mdx,正在做,目前了解还很肤浅,似乎sqlite也是多字段的,关系数据库模式,一些shell, 例如网上的 现代汉语词典.apk,查找检索还是很方便的,虽然有广告。
    匿名  发表于 2014-2-7 10:22:16
    诗词文件12M多,应该比较小。
  • TA的每日心情
    擦汗
    2021-3-8 17:59
  • 签到天数: 2 天

    [LV.1]初来乍到

     楼主| 发表于 2014-2-7 11:26:19 | 显示全部楼层
    游客 60.191.116.x 发表于 2014-2-7 10:22 2 Y( q2 g, s( b9 Y3 P! F2 e% f9 y
    诗词文件12M多,应该比较小。
    ! t4 H9 T' @% m( F
    % {7 t, O7 P  d0 R( H; A& R
    确实。 我将掌上百科的 诗词总汇(繁体).mdx 转换成mdb之后,达到120多M,里面大量的是html的脚本文本,就是 <   > 之间的东西。 即便如此,mdx也是相当优秀的,含有这么多格式,mdx硬是才50多M,同chm格式有得一拼,真的是压缩比率很高啊。 我把所有格式抠掉之后,再转成mdx,就非常客观了,内容真是没有减损,请大家相信。

    该用户从未签到

    发表于 2014-2-7 17:16:02 来自手机 | 显示全部楼层
    本帖最后由 bbkbbk 于 2014-2-7 17:21 编辑 9 E& }0 ~! i$ d) H9 ?. B" h

    2 p  V6 I) c+ @" H5 ?( d$ ~1.模糊查询、正则查询更多靠的是软件吧,数据格式都是差不多的,全文检索都能实现,这就要看程序设计的能力了,应该在代码上下功夫(当然还要在充分了解数据格式的基础上来做,否则任何努力都毫无意义)。看看这位高人的杰作:
    $ U7 {( \- ^1 [5 c0 @https://pdawiki.com/forum/forum.php?mod=viewthread&tid=11381&mobile=yes
    + d) P/ A* t0 Y7 Q2 \* k1 [2.词条合并,将同一作者、同题目作品合并到一个词条。
    1 ]1 Z1 E9 n& r: V3.sqlite数据库很优秀了,跨平台,可以内嵌到多种语言中,可以取代mdb了。mdx作为词典数据格式已经十分完美,想要实现高级检索功能,要在软件上下功夫了。
  • TA的每日心情
    擦汗
    2021-3-8 17:59
  • 签到天数: 2 天

    [LV.1]初来乍到

     楼主| 发表于 2014-2-7 19:00:38 | 显示全部楼层
    本帖最后由 lixun305 于 2014-2-7 19:03 编辑
    # V3 b8 X1 C% Y/ W/ ]& T
    bbkbbk 发表于 2014-2-7 17:16 8 c0 e$ }. t" x
    1.模糊查询、正则查询更多靠的是软件吧,数据格式都是差不多的,全文检索都能实现,这就要看程序设计的能力 ...

    : g6 j$ {$ P/ J' k3 }- C; C7 C, `3 o) z7 m, M
    好的,领教了。 我感兴趣的是各个格式的转换及pc下shell的编制,一直在做。
    5 E- Z: w8 ^+ k: I) A+ G9 a  \; G) V
    https://pdawiki.com/forum/forum. ... 1381&mobile=yes  打开怎么是论坛首页?

    该用户从未签到

    发表于 2014-2-7 19:15:45 来自手机 | 显示全部楼层
    本帖最后由 bbkbbk 于 2014-2-7 19:22 编辑
    , @9 ]# G0 d0 N' q% p
    lixun305 发表于 2014-2-7 19:00
    0 @" @. L% s+ I% x: J好的,领教了。 我感兴趣的是各个格式的转换及pc下shell的编制,一直在做。
    4 z! a9 w+ w' r% j1 }4 c
    , E" v- g6 @7 H$ g- \( M1 j; v1 Bhttps://pdawiki.com/for ...
    ) b  E9 h. T6 D3 Z
    ' Q7 F% i- O0 u) U
    汗……我是用手机上网……+ c: Y0 D# Q9 h0 g) d
    你把链接最后mobile=yes去掉就可以吧。或者去安卓学习小园地版块,spoony1971的帖子,你也许看过。
  • TA的每日心情
    擦汗
    2021-3-8 17:59
  • 签到天数: 2 天

    [LV.1]初来乍到

     楼主| 发表于 2014-2-7 23:37:03 | 显示全部楼层
    bbkbbk 发表于 2014-2-7 19:15
    ( \; K. i3 i. E# K' m3 j$ a汗……我是用手机上网……
    1 ?: ~9 h8 q) C+ l; Z* I你把链接最后mobile=yes去掉就可以吧。或者去安卓学习小园地版块,spoony1 ...
    8 P( e# D8 a% Z
    我是pc端的shell,负责格式(mdb xls mdx dict txt)转mdb格式,进而也可以转成mdx,手机上应该可用。我也不懂android下编程,也没兴趣搞。
  • TA的每日心情
    开心
    2021-4-30 05:36
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2014-2-11 19:15:57 | 显示全部楼层
    如听天书 除了汗颜 更有尊敬 多谢几位
  • TA的每日心情

    2018-2-21 14:06
  • 签到天数: 3 天

    [LV.2]偶尔看看I

    发表于 2014-2-11 19:53:17 来自手机 | 显示全部楼层
    感谢分享,不过我核对了一下,应该不是第六版的,百度下第六版的新词没有出现在词典内。
    : z+ o, o3 N6 t5 ^. t不过词典还是很好用,谢谢了

    该用户从未签到

    发表于 2014-2-11 20:54:48 | 显示全部楼层
    好资源一定要大力支持,谢谢
  • TA的每日心情
    擦汗
    2021-3-8 17:59
  • 签到天数: 2 天

    [LV.1]初来乍到

     楼主| 发表于 2014-2-11 22:03:43 | 显示全部楼层
    回复  cnzj999:  Y* p6 m9 P1 g) c# H0 A7 k; A
    感谢分享,不过我核对了一下,应该不是第六版的,百度下第六版的新词没有出现在词典内。; a7 T. i( a0 v; o1 U
    不过词典还是很好用,谢谢了* U5 P0 M  j0 g% L1 R) ~% }+ U
      D- w0 q9 g: n- E
    这个问题我也一直很困惑,得到词库之后,我认真核实过,确实比第五版有了很大的改动,收词也很多,例如我印象深刻的 “燃油”,这个词组第五版是没有的,并且很多的词典都没有,但这里有,所以,我就认为是第六版的,并且也确实是从号称 第六版 的手机词典软件中提取出来的。 粗略收词(包括 单字,词组,成语,成语故事)10多万条,虽然有不少重复,但是这些重复有些是补充解释,有些确实重复,但扣除重复,也不会少,应和 现代汉语词典第六版不相上下,况且,里面的解释,特别是单字的详细解释,很全面,这也是得益于不劳而获,:p...   # d5 x/ @  r& e6 E! u/ }
       4 V, Z: @! n# n3 O6 W* k# i
  • TA的每日心情
    开心
    2018-1-27 00:16
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2014-2-11 23:46:43 | 显示全部楼层
    非常不错的词典!
    . b% q( X  _1 T6 X; {8 D- Q- B! F$ g' J1 `' ?# \6 B( S- H( N) P
    支持并感谢楼主!- S, g+ T, V/ A) a

    7 `( B6 R% k$ \6 V不知道楼主的方法能否用于转换ipa格式的词库呢?
    5 l0 `9 y: ?/ D) ?4 G; ?0 y7 Q" n1 \+ \: O% Z2 O: B6 o
    期待楼主出一个详细的教程,造福大家O(∩_∩)O多谢多谢!
      H; c( |3 o& C% O9 c9 I
  • TA的每日心情
    慵懒
    2023-3-25 13:33
  • 签到天数: 7 天

    [LV.3]偶尔看看II

    发表于 2014-2-12 09:10:45 | 显示全部楼层
    第六版的扫描版网上好像还没见到过。不知道那些软件从何处弄的
  • TA的每日心情
    擦汗
    2021-3-8 17:59
  • 签到天数: 2 天

    [LV.1]初来乍到

     楼主| 发表于 2014-2-12 10:48:05 | 显示全部楼层
    本帖最后由 lixun305 于 2014-2-12 11:10 编辑 - y  w$ I& a7 p( Y. b: z4 E
    4 G' j6 P; E7 d, T/ H% M9 g& f
    对不起楼上各位。做的时候,成语词典的 英文 字段,有些字符是乱码,因为,在原数据库中,英文和这些字符都是unicode编码,而英文是直接可认的,不是乱码,所以,我只看了前面几个,就没有将该字段转成ansi。  我已经重新制作,请重新下载,抱歉~
  • TA的每日心情
    擦汗
    2021-3-8 17:59
  • 签到天数: 2 天

    [LV.1]初来乍到

     楼主| 发表于 2014-2-12 10:53:09 | 显示全部楼层
    本帖最后由 lixun305 于 2014-2-12 11:12 编辑
    8 K1 t: r. C0 n& I  d6 b8 E
    liuyunrushui 发表于 2014-2-11 23:46 4 }- t8 u) D; Y3 L3 f
    非常不错的词典!
    $ Q+ k/ U/ l5 O9 a& b" ^
    " Z; z- |% J1 \+ {9 p4 V7 v支持并感谢楼主!

    ; a+ R, C2 N" D- n& l4 I( K4 e) O' r- j. o, N$ Q5 D  B5 |
    对不起,回复晚了,昨天怎么点击回复都没反应,今天才发现原来是sogou浏览器的原因,用IE没事了,真....。1 a6 c3 x; T; N/ [9 }  n6 D

    # @  d% ~! |- _详细制作过程陆续上传中,会看到的。13楼。
    $ _- e' b" ?9 e& c6 g& \0 G( f
    ipa格式我还是第一次听说,不知如何读写,你有解码代码吗(c源代码之类的),或者有什么软件能将它转换成mdb格式也可以。 如果是源码,我可以将他潜入到我的程序中。
  • TA的每日心情
    擦汗
    2021-3-8 17:59
  • 签到天数: 2 天

    [LV.1]初来乍到

     楼主| 发表于 2014-2-12 11:09:36 | 显示全部楼层
    heda106 发表于 2014-2-12 09:10
    ! _8 `( F' k; x- U! i4 V2 t/ n  }第六版的扫描版网上好像还没见到过。不知道那些软件从何处弄的
    9 b, R/ c/ {  @: [/ G
    这个到百度移动搜索(搜索应用)上,输入现代汉语词典,列出很多,其中尺寸越大的越好(例如19M, 20多M)。 下载apk文件(不要下载到手机),用我13楼的方法就可以得到。不一定通用。
    3 _- g5 ]) ^0 V$ a7 j  H我觉得这个是手机软件厂家自己录入或者通过什么渠道得到的。这些词库和纸质的现代汉语词典6还是有些区别,不过,更多的是扩充的,更详尽。
  • TA的每日心情
    开心
    2018-1-27 00:16
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2014-2-12 11:54:07 来自手机 | 显示全部楼层
    lixun305 发表于 2014-2-12 10:53, `9 I5 {) N/ ?. f9 z
    对不起,回复晚了,昨天怎么点击回复都没反应,今天才发现原来是sogou浏览器的原因,用IE没事了,真... ...

    7 d) m( b. ?6 L5 }楼主您好!感谢您的回复。! p; l7 p: ~: p; Z

    ' P' W5 J& n6 P% j, Qipa是ipad/iphone等苹果设备上安装程序的扩展名,也可以用7-zip解压,得到相关数据文件。我下载了几个ipa格式的日语相关词典,有一个解压后得到扩展名为.db文件,用EmEditor打开后打头提示为SQLite format3格式,后续我就不知道该如何操作啦!直接用EmEditor打开.db的话是一堆乱码,无从编辑-_-||。
    ) t2 P  h$ b$ C4 [" d/ S# p: F6 \3 d4 M( R3 |1 a
    期待楼主的教程。
    5 n8 w( I% e' Z- X' d
    ' ^$ _7 M! u8 u% B, Cps:网上还是有蛮多ipa的词典的,想必其中也有不少是.db数据库格式的,如果可以提取数据的话,mdict大家族就又有很多新成员啦!期待期待!
    . }: a, V7 `4 m. y. k  Y2 m5 H( X
    + `# [+ Y# z5 |* r对啦,我的ipa是从以下网站下载的:http://www.51ipa.com/plus/search.php?q=%B4%CA%B5%E4&searchtype=title
  • TA的每日心情
    擦汗
    2021-3-8 17:59
  • 签到天数: 2 天

    [LV.1]初来乍到

     楼主| 发表于 2014-2-12 12:40:05 | 显示全部楼层
    liuyunrushui 发表于 2014-2-12 11:54
    & n( y4 t0 J  Y$ M+ R楼主您好!感谢您的回复。) u" A/ C& T2 c2 \
    0 T6 {* F$ k$ A. r3 L/ q
    ipa是ipad/iphone等苹果设备上安装程序的扩展名,也可以用7-zip解压,得到相 ...
    6 Z% H5 a) {% W: t0 G- a. t7 Z
    sqlite格式我已经搞明白了,只不过没有做很多的测试。我这个词典就是从sqlite格式转换而来,等程序完善了,我上传到网上(程序主要功能:打开sqlite数据库,可转换成mdb;打开mdb格式,可转换成mdx文本)。 你说的这些词库,到时候自己转吧,有啥新颖的不妨上传上来。  程序名:SqLite2MDB

    该用户从未签到

    发表于 2014-2-12 15:28:56 | 显示全部楼层
    非常感谢楼主的分享!支持...
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2024-5-20 19:45 , Processed in 0.061474 second(s), 12 queries , MemCache On.

    Powered by Discuz! X3.4

    Copyright © 2001-2023, Tencent Cloud.

    快速回复 返回顶部 返回列表