掌上百科 - PDAWIKI

用户名  找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 1271|回复: 9

[求助] 有谁能帮忙写一个制作反查mdx的教程呢?

[复制链接]
匿名
匿名  发表于 2021-3-24 20:22:56 |阅读模式
MDict 词库资源区 基本上没有几个反查mdx的公开分享,反查mdx基本上全部跑到 资源自助服务区 了,授人以鱼不如授人以渔,希望有人能够帮忙写一个教程,让更多的人掌握制作反查mdx的方法,不胜感激!

本帖被以下淘专辑推荐:

  • · 制作|主题: 3, 订阅: 0
  • · CSS|主题: 4, 订阅: 0
  • TA的每日心情
    开心
    2023-4-1 01:10
  • 签到天数: 1992 天

    [LV.Master]伴坛终老

    发表于 2021-3-24 21:02:38 | 显示全部楼层
    其它网站上有人教过,咱智商有限学不会。
    匿名
    匿名  发表于 2021-3-24 22:20:23
    言叶之庭 发表于 2021-3-24 21:02
    1 E, f/ G! h0 s2 [0 ]其它网站上有人教过,咱智商有限学不会。
    & L" Y2 R' [6 E2 ~" }% _
    哪个网站?我网上搜遍了都没有找到介绍如何制作反查mdx的教程
  • TA的每日心情
    开心
    2023-4-1 01:10
  • 签到天数: 1992 天

    [LV.Master]伴坛终老

    发表于 2021-3-24 22:57:11 | 显示全部楼层
    本帖最后由 言叶之庭 于 2021-3-25 13:22 编辑 / R8 {, ~0 Q' d( Q/ w
    匿名者 发表于 2021-3-24 22:203 E* `4 O8 V( F0 O2 Y: X7 \
    哪个网站?我网上搜遍了都没有找到介绍如何制作反查mdx的教程

    ! V4 H+ B# O  D2 I; g. `; T# `+ V/ O- \8 K/ L3 }( Q2 y$ N6 W. y; b
    你不在其它网站?没写教程,只是用ZOOM直播教过。制作词典,爬取词典网站数据,英译匹配中译,提取词组,反查词典等等这些都授过课,可以看代码自行研究。反查词典也就那样吧,最好是能够全文搜索。
  • TA的每日心情
    慵懒
    2021-8-25 10:07
  • 签到天数: 1227 天

    [LV.10]以坛为家III

    发表于 2021-3-25 08:45:23 | 显示全部楼层
    本站很多都是收费的,别的网站有分享“免费 mdict”的,你搜搜看
  • TA的每日心情
    擦汗
    2020-7-3 13:51
  • 签到天数: 19 天

    [LV.4]偶尔看看III

    发表于 2021-3-25 10:52:54 | 显示全部楼层
    本帖最后由 starmars 于 2021-3-25 10:57 编辑 6 A# o5 G+ v& @/ {3 |3 P
    0 p0 J. d7 J) Z. H+ _7 L- j' _
    反查词典制作的一个关键点在于需要通过某特定标签内容和其他某标签内容进行比对,而每一部MDX词库的HTML的标签结构都不相同,不可能有通用的方法。; f3 p! P% c, t
    6 }; O6 L0 J5 Y( U. ]& Q+ p
    不通过编程,仅仅通过在文本编辑器中进行正则替换处理来完成难度是非常大的。而绝大部分人都不是程序员,所以,期待有给非专业人员看的通用的制作教程发布可能您只有失望了。
    - [& V  u( Q, O+ t: a: B
    & }. g* _! I9 X9 P4 x7 e" l而从专业角度上说,反查MDX制作技术和任何其他MDX制作一样,没有什么技术含量。只要你会编程,无论python还是java,c#,会一点该语言基本的正则库API调用,会集合类库中的常见数据结构,则非常简单,基本上无需他人发布什么教程,只要愿意花时间,我相信任何专业人员都能轻易做出来。7 ^- l! z  }( e* A# ^$ X

    . W& b5 A: h0 k  `  t' v7 S9 e% q玩MDX,如果正则表达式水平不够精通,写不出复杂的满足自己需求的正则表达式,则也可以简单地利用编程来弥补。并非精通的正则表达式水平加上一般的入门编程水平,可以基本满足任何MDX制作的要求。

    评分

    1

    查看全部评分

  • TA的每日心情
    无聊
    2022-7-21 15:56
  • 签到天数: 216 天

    [LV.7]常住居民III

    发表于 2021-3-25 12:49:58 | 显示全部楼层
    不上这个网站之前,从来没听说过反查词典,说实话正查词典下载后使用频率都很低,反查感觉也不是必不可少的那种
    匿名
    匿名  发表于 2021-3-25 14:41:05
    wjl 发表于 2021-3-25 12:49- L# g: b5 A/ @' q
    不上这个网站之前,从来没听说过反查词典,说实话正查词典下载后使用频率都很低,反查感觉也不是必不可少的 ...
    5 g0 O! n) w# s& S3 r4 D) J
    英汉mdx词典或者英英mdx词典,需要把每个单词里面的词组短语单独提取出来,才能提高该mdx词典的使用频率
  • TA的每日心情
    奋斗
    2019-10-13 07:34
  • 签到天数: 209 天

    [LV.7]常住居民III

    发表于 2021-3-27 05:40:12 | 显示全部楼层
    1、分析现有词典的源文件结构,使用 Python 的 BS 等 Library 分别提取出释义、例句等你希望进行反查的内容。
    5 S( r8 J$ O7 k7 K# \2、使用Python的分词器jieba等,将第1步的释义、例句的主要词条提取出来,即形成反查词典的词头。# m9 ]( N+ X5 C$ O- v$ I4 q
    3、使用“倒排索引”的编程技巧,将提取出的词条与原始mdx的keyword对应起来,并存储为python的dict数据结构。
    * b. e- ]) E, i; e' l1 [4、即将上述带有反查数据的 python dict 输出为 mdx 标准的源格式,完成。

    评分

    1

    查看全部评分

  • TA的每日心情
    擦汗
    2020-7-3 13:51
  • 签到天数: 19 天

    [LV.4]偶尔看看III

    发表于 2021-3-27 12:02:13 | 显示全部楼层
    VimVim 发表于 2021-3-27 05:400 }% P: p( N. a9 Y
    1、分析现有词典的源文件结构,使用 Python 的 BS 等 Library 分别提取出释义、例句等你希望进行反查的内容 ...
    $ G* q' R- Z5 H+ \9 j6 q  X2 w! }8 h
    Python 的 BS 等 Library 分别提取出释义、例句。Python的分词器jieba。—— 这一切看起来非常好哪。可能Python编程比其他语言制作MDX更方便点,因为有强大的库可用。
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2025-5-6 11:51 , Processed in 0.021833 second(s), 24 queries .

    Powered by Discuz! X3.4

    © 2001-2023 Discuz! Team.

    快速回复 返回顶部 返回列表