掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 18563|回复: 30

[资料] mdict mdx mdd 格式全公开,及开源代码

[复制链接]
  • TA的每日心情
    擦汗
    2023-9-2 09:16
  • 签到天数: 1103 天

    [LV.10]以坛为家III

    发表于 2013-4-24 14:38:15 | 显示全部楼层 |阅读模式
    本帖最后由 spoony1971 于 2013-4-24 14:56 编辑 $ X# X$ F8 L$ D  w
    1 w6 @- E) j! R  g3 ~4 h
    看到楼上提到goldendict支持mdict了,就去看了一下goldendict的源码,最终发现Xiaoqiang Wang对mdx,mdd格式的最终分析及开源python代码:
    . m3 |; K6 N5 Hhttps://bitbucket.org/xwang/mdict-analysis
    9 f1 F/ F/ H* ~) t7 Z3 \' X% m喜欢C++代码的可查看goldendict源码。(mdictparser.hh/.cc mdx.cc): b& T$ X. V. e" \" l6 p: h
    看来一直期待的开源mdx=>stardict转换程序也不远了。: W4 q( Z5 q" E+ A! |

    ) _$ q# \% t, x; m( ^) ^一直以来寻求一款快速小巧可自由组合的字典工具,现在终于如愿以偿了。我用的是sdcv, vim命令行工具,可组合真人发音(sdcv, aplay功能),TTS组合音及全文朗读(mplayer功能),缩放功能(urxvt功能), 多TAB连环查询(vim功能),
    - q0 r8 c+ ^3 D2 g- H并且基本上可以与所有应用程序相组合。实在是太完美了!
    ( T+ a: K' q$ r/ s+ G  J( z0 u+ e3 M! [& T3 D
    下次抽空上视频。
  • TA的每日心情
    擦汗
    2023-9-2 09:16
  • 签到天数: 1103 天

    [LV.10]以坛为家III

     楼主| 发表于 2013-4-24 14:47:54 | 显示全部楼层
    本帖最后由 spoony1971 于 2013-4-24 14:51 编辑
    1 x- P$ a, [) c/ R, n0 X; @" r/ a5 Y3 O' \. F
    下面是我的简化版命令行shell script- Y, |% A0 x1 z$ w) r, T  H  e8 C
    $cat td7 `0 ~4 h5 t: S3 n; l2 b
    #!/bin/sh- h$ \) z6 }& n8 Q' E7 R. e9 x. H1 j
    sdcv $1 | w3m -T text/html
    0 R% i3 G7 e' ?. z$ f0 P4 f/ M9 u$ F, u+ R5 ~" L2 \, {. w3 j
    可运行于所有平台,linux, macos, windows 及平板手机平台(需安裝shell)。

    该用户从未签到

    发表于 2013-4-24 16:26:45 | 显示全部楼层
    完全看不懂你说的。。。
    ; F2 K/ q) T- W/ K" O$ s& V# v+ x我太菜鸟了。。。7 w2 q6 X- Q$ d& L
    不过你很开心就对了
  • TA的每日心情
    擦汗
    2023-9-2 09:16
  • 签到天数: 1103 天

    [LV.10]以坛为家III

     楼主| 发表于 2013-4-24 17:02:13 | 显示全部楼层
    3# chigre
    7 e; y' C* E2 v# w8 r8 R0 s2 J) ?+ G; L. x
    上面提到的urxvt是命令行终端,aplay, mplayer是声音播放工具,vim是编辑工具, sdcv是字典软件(相当于mdict)- o- o; f9 W$ q0 y8 h
    w3m是浏览器。
    ; d  Z# k) z# h把这些程序组合起来使用就变得功能非常强大,几乎没有限制。

    该用户从未签到

    发表于 2013-4-24 19:40:58 | 显示全部楼层
    要是楼主能开发一个MDD提取软件就好了
  • TA的每日心情
    擦汗
    2023-9-2 09:16
  • 签到天数: 1103 天

    [LV.10]以坛为家III

     楼主| 发表于 2013-4-24 20:58:49 | 显示全部楼层
    5# heshunyihugh . E) n* N5 W0 ]
    2 l, k$ h9 u2 X$ @; F
    网页 https://bitbucket.org/xwang/mdict-analysis% F' @( S4 S/ o% C
    上面提供的工具就可以提取所有的mdx,mdd数据, 命令
    3 m% V( v/ X0 I$readmdict.py -x oald8.mdx. x! c4 A, n5 E0 L& T
    会提取oald8.txt及所有的图像,声音文件。
    % u. R+ ?: s! ~5 H3 V# N/ _" i5 ~2 {6 Z$ M
    只是上面的方法恐怕会得到很多重复的相同文件,譬如很多汉字发音相同,声音文件应该只有一个,但用上面命令的话每个同音汉字会重复得到一个相同的声音文件。/ Q) f! Z$ }) g! k" }) ?' D
    理想的方法是将声音文件转成stardict字典文件(不是资源文件), 譬如sound.dict.dz, 发音就可通过命令 "sdcv word | aplay"完成。如果需要格式转换的话也可通过makedict来做了。

    该用户从未签到

    发表于 2013-4-25 00:22:18 | 显示全部楼层
    linux不懂哈哈
  • TA的每日心情
    擦汗
    2023-9-2 09:16
  • 签到天数: 1103 天

    [LV.10]以坛为家III

     楼主| 发表于 2013-4-25 01:04:22 | 显示全部楼层
    7# chigre
    0 ~4 J5 Y1 I2 {. l  w+ C
    0 r- M) j  c! G. H! v所有上面提到的工具都是跨平台的,不仅可以在linux,苹果机上用,微软的平台上一样没问题。 平板手机上要先装个shell.

    该用户从未签到

    发表于 2013-4-25 01:07:00 | 显示全部楼层
    8# spoony1971 & Y+ ~3 \0 i4 |5 g

    ; ]& k% p$ M: f5 f; K6 H7 h0 G( G
    7 J  F2 F1 r- S6 ^7 E$ L尽管如此,我还是没有入门,用着Goldendict就很好了。
  • TA的每日心情
    开心
    2020-3-8 09:14
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2013-4-25 15:17:54 | 显示全部楼层
    太高深了,连围观的基础都没有!

    该用户从未签到

    发表于 2013-4-28 10:13:45 | 显示全部楼层
    5# heshunyihugh   ]& @- L5 ~* a/ W% L
    % @) U! x3 `& Z3 n7 ?/ p! P  ]  H
    网页 https://bitbucket.org/xwang/mdict-analysis
    6 Y  t9 L1 \  _/ q5 A上面提供的工具就可以提取所有的mdx,mdd数据, 命令
    8 s5 R; H4 ]4 |: K. d$readmdict.py -x oald8.mdx/ s0 l' Y! A/ U
    会提取oald8.txt及所有的图像,声音文件。2 z, k: m9 m* p+ }  @, H

    & [  E. n# _$ I0 s% v. \只是上面的 ...( ]* A$ v; ]$ @& M
    spoony1971 发表于 2013-4-24 20:58

    * r; j/ V- x) B3 ichigre刚教了我更傻瓜的办法!

    该用户从未签到

    发表于 2013-5-19 11:58:42 | 显示全部楼层
    windows上怎么用?

    该用户从未签到

    发表于 2013-5-19 12:03:14 | 显示全部楼层
    楼主是写给大神看的。菜鸟也想学点用用,可惜连shell是什么都不知道。脚本怎么运行根本不知道。
    tianxia1 该用户已被删除
    发表于 2013-6-19 09:54:10 | 显示全部楼层
    mark ,,yong deshang

    该用户从未签到

    发表于 2013-8-4 13:27:57 | 显示全部楼层
    {:soso_e179:}向高手学习,但几乎没有基础,还请高手进一步详细解释或者干脆做个解压释放程序,期待中

    该用户从未签到

    发表于 2013-8-4 13:29:03 | 显示全部楼层
    现在缺乏一个MDD加压释放程序。
  • TA的每日心情
    慵懒
    2020-12-11 08:19
  • 签到天数: 104 天

    [LV.6]常住居民II

    发表于 2013-8-4 13:37:19 | 显示全部楼层
    膜拜。
  • TA的每日心情
    擦汗
    2023-9-2 09:16
  • 签到天数: 1103 天

    [LV.10]以坛为家III

     楼主| 发表于 2013-8-4 20:39:39 | 显示全部楼层
    现在缺乏一个MDD加压释放程序。
    , b# b2 n* f9 Q% X8 B9 G: _tjzzw 发表于 2013-8-4 13:29

    * J- I# b2 W* _+ H' V3 ?; Wreadmdict.py 已经支持mdd转换。而且经测试解压后不会有重复文件出现。

    该用户从未签到

    发表于 2013-8-5 14:46:28 | 显示全部楼层
    18# spoony1971
    ( p+ F2 ~' _- C+ ^6 v& g$ @0 @4 W" F, q0 K, g# e! Z% c( r/ x" r
    哪里下载readmdict.py,如何使用,shell哪里下载安装,我想学习一下,希望多指教!尽量详细说明一下,不胜感激。

    该用户从未签到

    发表于 2013-8-6 23:50:17 | 显示全部楼层
    readmdict.py 已经支持mdd转换。而且经测试解压后不会有重复文件出现。
    2 @( ?( G& p3 y; K% \8 b7 f" Kspoony1971 发表于 2013-8-4 20:39

      D6 [8 @( \" B9 \7 s4 v9 p5 Z& p: K5 e* x; [. h) {
    老兄,我给您发了站内消息,恭候您的答复。

    该用户从未签到

    发表于 2013-12-26 21:42:09 | 显示全部楼层
    louislaolu 发表于 2013-4-25 15:17
    $ Y" H$ R0 A6 g6 ~9 V' L% ~( ^( \太高深了,连围观的基础都没有!
    1 E7 X* G6 `7 l$ a2 t6 W
    确实啊

    该用户从未签到

    发表于 2013-12-26 21:43:06 | 显示全部楼层
    louislaolu 发表于 2013-4-25 15:17 % p+ m+ W$ D9 L* v% R7 K
    太高深了,连围观的基础都没有!

    7 f0 e! u  X2 o/ ]确实啊

    该用户从未签到

    发表于 2013-12-29 17:38:03 | 显示全部楼层
    这个很有前途!
    * K4 P( G1 b& x+ p. N不过我发现目前 Goldendict 还不能正确显示 LDOCE4 等词典的音标
    1 M+ w. M2 `  s5 S6 p另外有没有办法让 Goldendict 使用 Mdict 的语音库?
  • TA的每日心情
    郁闷
    2017-10-30 08:42
  • 签到天数: 16 天

    [LV.4]偶尔看看III

    发表于 2014-2-7 14:06:35 | 显示全部楼层
    膜拜LZ~~实在看不懂~~

    该用户从未签到

    发表于 2014-4-23 19:32:02 | 显示全部楼层
    期待你的视频,有个截图也好
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2025-4-29 02:42 , Processed in 0.027706 second(s), 27 queries .

    Powered by Discuz! X3.4

    © 2001-2023 Discuz! Team.

    快速回复 返回顶部 返回列表