掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 16219|回复: 269

[工具] 【2016.08.11 优化】Mdict词典DIY工具系列之一:词条内容提取利器,极速提取

  [复制链接]

该用户从未签到

发表于 2016-7-10 16:12:09 | 显示全部楼层 |阅读模式
本帖最后由 qiuhao1112 于 2016-8-11 20:15 编辑 + r4 z3 |8 Y5 ?. I0 m

0 |: v( I: Y- l1 w" N) d0 GMdict词典DIY工具系列之一:词条内容提取利器,极速提取6 C7 y; s! W6 w7 A9 s

9 K3 r3 Y3 W: q2 ^. k! X==============9 Q) A6 @. _( A; H7 O; t1 @* `
2016.08.11 优化:

, y1 B5 C, J4 |修改了程序,若原文本有多个相同的词条,则不再覆盖,保留对应文本。3 M0 G7 b# w: b% P! g( H  @) X
3 ]$ f; `* O* N: _, S: ?
改为百度云分享,便于更新。, W" f' c' ~6 i+ w5 b0 n/ Q

. U4 |5 P( e, m! b! q==============
, ^; j( L0 O8 B7 S
: L0 T" q4 `( {+ Z
/ w3 y! l5 E+ `" Q  q6 M$ {2 l& t9 v5 f7 L' z& v
Mdict词典DIY工具系列:
% G2 H7 [# C. }' U/ A
! ^9 Z) T0 S. y  w3 yMdict词典DIY工具系列之一:词条内容提取利器
" h7 w8 V! A3 K( S) j% FMdict词典DIY工具系列之二:词条合并工具,二合一
- @% ^) a, i5 v2 O; i2 qMdict词典DIY工具系列之三:MDX文本内容提取解析工具5 [, Y- c. h" v- p6 d9 |9 ^
Mdict词典DIY工具系列之四:词条合并工具,N合一! ^$ O% T: C6 j" P4 U+ O* C
Mdict词典DIY工具系列之五:MDX文本内容 & 词条 去重工具
0 W+ _+ S3 o( f; q
6 S, `+ h* O# B& ^
0 I  Y2 s5 r) G# I. ^3 R- W

' H4 R/ M& N* _  d之前的程序报有病毒,已重新打包上传。# i1 u* Y$ w/ A5 A0 o3 h- i
0 t* l0 x8 [, F- p; R
% ~) M0 P! R6 C4 R

2 ~& K) G1 c  G
9 a9 T, K5 y- ?& O' l, iExtractor from MDX by Wordlist v 2.0:) i' x; M/ [) C# ?7 \

- [0 u' ^( _: }
/ `. K" Q! `% L, Q
/ n; \. e( g" ]( h4 X        使用方法:
' h' [4 ?: W3 y% t1 l' f5 n; \; O* G! K! I; l1 s. V, ^
       
& S( j/ z2 m8 |* m" U. `" q  z        提取词典内容的源码文件应为Mdict词典格式的文本(.txt)文件。! V6 g! \7 o% S) Z+ T

% g2 E. q% ?+ g9 J% R  L, n% w        该程序无图形化界面,为方便使用,请把文本文件名改为阿拉伯数字或字母,方便文件名输入。; M% Z- n+ u: a7 D. H0 {

" f7 L4 b6 b. E" \  G        Input wordlist file name:  输入单词列表名,无需添加 .txt后缀;
8 n% g! U8 Z  Q% f        Input source file name: 输入MDX格式的源码文件名,无需添加 .txt后缀;  C- ]* \) A$ |. r/ A9 S! p) d
        1 FOR include, 0 FOR exclude:  选择1 include 模式,选择0 exclude 模式。' ~. ^6 b. L* O( V& z% ?
2 _8 C5 w" x& v4 G" c# o7 v+ L
                                模式1: 提取包括该单词列表的内容
# h( ^4 ]- w$ i4 l+ b5 J                                模式2: 提取非包括该单词列表的内容5 l$ L1 F: @% E4 R. u( f

! b  U4 N) w* i: Y" [1 `0 n+ t===============================
" s3 W( t4 H0 E$ V' u1 ?5 {& _  V) R, r
! t- D5 o) U& ^3 t  P
链接:http://pan.baidu.com/s/1bpbYkwB 密码:55po
2 d  L& w# ^- \# E- t

评分

1

查看全部评分

本帖被以下淘专辑推荐:

  • · 工具|主题: 8, 订阅: 5
  • TA的每日心情
    奋斗
    2022-11-19 13:01
  • 签到天数: 21 天

    [LV.4]偶尔看看III

    发表于 2016-11-28 12:14:05 | 显示全部楼层
    谢谢楼主分享,下载看下

    该用户从未签到

     楼主| 发表于 2016-7-12 11:02:38 来自手机 | 显示全部楼层
    Snowdax 发表于 2016-7-12 08:58
    5 C( J: C0 \6 d4 f  r其实是可以的,用custom 添加reference list即可,但该软件好像没有开源,不知道是怎么实现的

    ) w# p7 M, L  L- F( |应该是我以前没发现这个功能吧   而且sunsmile大的那个速度很快  应该是用Java或者C写的  这两个我都我不会    我的脚本思路也有问题
  • TA的每日心情
    奋斗
    2019-10-11 13:52
  • 签到天数: 142 天

    [LV.7]常住居民III

    发表于 2016-7-12 12:45:20 | 显示全部楼层
    qiuhao1112 发表于 2016-7-12 11:02
    % z3 T5 V4 r8 x( [+ k9 z: C应该是我以前没发现这个功能吧   而且sunsmile大的那个速度很快  应该是用Java或者C写的  这两个我都我不 ...
    ! t) o( ]5 m4 w- e' o* k
    因为我之前做词典用过这个功能,所有隐约有一些印象
    % |: C. J  w' I( \) rpython代码比较简洁,但运行速度确实不快
    , I5 s! B, H( s6 w(其实我也是门外汉的

    该用户从未签到

     楼主| 发表于 2016-7-10 16:26:03 | 显示全部楼层
    本帖最后由 qiuhao1112 于 2016-8-7 15:09 编辑
    - V" M3 p& Y6 U2 ]' y( B4 }
    ) a, u8 c2 ]8 B8 C: Y4 X. v3 t打开大文件无压力。。

    该用户从未签到

    发表于 2016-7-10 16:33:17 | 显示全部楼层
    巨巨请教一下,读取mdx用的什么python库啊?  q( l+ w7 N$ U0 K
    还有写mdx只有MDX Builder,有没有支持命令行的工具啊?

    该用户从未签到

    发表于 2016-7-10 16:51:40 | 显示全部楼层
    路过帮顶辛苦了

    该用户从未签到

    发表于 2016-7-10 18:51:50 | 显示全部楼层
    这不是很多人需要的工具吗?!

    该用户从未签到

    发表于 2016-7-10 21:47:30 来自手机 | 显示全部楼层
    真是雪中送炭呀
  • TA的每日心情
    奋斗
    2019-10-11 13:52
  • 签到天数: 142 天

    [LV.7]常住居民III

    发表于 2016-7-10 22:53:15 | 显示全部楼层
    咦 我记得Source Editor有类似功能
  • TA的每日心情
    开心
    2018-1-27 00:16
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2016-7-11 08:01:41 来自手机 | 显示全部楼层
    太好了!可以自己折腾词库啦!
  • TA的每日心情

    2019-2-16 21:57
  • 签到天数: 9 天

    [LV.3]偶尔看看II

    发表于 2016-7-11 08:43:48 来自手机 | 显示全部楼层
    楼主,我是linux用户。求原始Python脚本

    该用户从未签到

     楼主| 发表于 2016-7-11 08:49:00 | 显示全部楼层
    本帖最后由 qiuhao1112 于 2016-7-11 16:44 编辑
    7 W0 D' e+ [' h, L
    lmjiao 发表于 2016-7-11 08:43
    1 j; _) m1 k! Z+ k2 E楼主,我是linux用户。求原始Python脚本

    " n# g! O5 F2 l% a# C3 J/ H& {3 \  S+ t  o; W
    脚本还需要修复

    点评

    感觉可以用的dict先存一下数据,然后再提取。还有Python的thread在gil的条件下是针对IO阻塞的情况用的,这里好像没有必要。。。  发表于 2016-7-11 14:45
  • TA的每日心情
    无聊
    2020-11-6 22:08
  • 签到天数: 26 天

    [LV.4]偶尔看看III

    发表于 2016-7-11 10:08:34 | 显示全部楼层
    perfect exe~

    该用户从未签到

    发表于 2016-7-11 12:49:56 | 显示全部楼层
    fnaviwwo1 发表于 2016-7-10 16:33
    7 k/ Z) T2 T" ~. @7 ]7 p巨巨请教一下,读取mdx用的什么python库啊?
    & u- P' l" d9 M* h& f2 a; o还有写mdx只有MDX Builder,有没有支持命令行的工具啊?
    : u5 d2 V5 Q4 z9 X
    如何用 readmdict.py 提取 mdx/mdd 中的数据
    9 X: O, M( [, A* c1 ]4 x! vhttp://jingyan.baidu.com/article/95c9d20d47583bec4e756132.html

    点评

    I really appreciate it!  发表于 2016-7-11 14:22
  • TA的每日心情
    开心
    2018-4-7 21:39
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2016-7-11 16:22:53 | 显示全部楼层
    谢谢楼主无私分享
    * f& k' [: i+ A开心!

    该用户从未签到

     楼主| 发表于 2016-7-11 17:05:01 | 显示全部楼层
    Snowdax 发表于 2016-7-10 22:532 _/ I$ v  B; z' A
    咦 我记得Source Editor有类似功能

    4 D# e' j" K9 @( MSource Editor  确实没有这个功能
  • TA的每日心情

    2019-2-16 21:57
  • 签到天数: 9 天

    [LV.3]偶尔看看II

    发表于 2016-7-11 18:07:34 来自手机 | 显示全部楼层
    qiuhao1112 发表于 2016-7-11 08:49
    8 O' E. ~9 b0 }! z$ z4 ?脚本还需要修复
    2 _6 s) G5 p- B/ M# l8 V' `
    非常感谢!热切期待!
  • TA的每日心情

    2019-2-16 21:57
  • 签到天数: 9 天

    [LV.3]偶尔看看II

    发表于 2016-7-11 18:09:29 来自手机 | 显示全部楼层
    vbnet 发表于 2016-7-11 12:49# H- U# m1 i  C% s
    如何用 readmdict.py 提取 mdx/mdd 中的数据
    $ u! I$ c) C) K+ x( Whttp://jingyan.baidu.com/article/95c9d20d47583bec4e7561 ...
    : {; b% X" e' {. K9 B7 l3 X) r
    楼主的可以根据单词表提取所需内容。你给的链接中只能提取全部内容。
    9 U* t1 w5 E* w9 J2 d' B& u" o+ j2 p& [! }" _" ]
    对于部分人来说,楼主的按需提取功能还是很方便的。

    点评

    vb大所提供的链接只是在回应fnaviwwo1在3楼所提问的问题,并非要跟LZ的功能做比较  发表于 2016-7-12 10:07
  • TA的每日心情
    开心
    2019-6-27 08:03
  • 签到天数: 8 天

    [LV.3]偶尔看看II

    发表于 2016-7-11 18:50:36 | 显示全部楼层
    windows 10 不能用
  • TA的每日心情
    奋斗
    2019-10-11 13:52
  • 签到天数: 142 天

    [LV.7]常住居民III

    发表于 2016-7-12 08:58:15 | 显示全部楼层
    qiuhao1112 发表于 2016-7-11 17:05
    7 T. s, `' I8 p& f/ l) L) lSource Editor  确实没有这个功能

    * Q# T! f" g7 r7 X  h8 `; K其实是可以的,用custom 添加reference list即可,但该软件好像没有开源,不知道是怎么实现的0 g, g0 B/ X" c7 [+ @8 v

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x
  • TA的每日心情
    开心
    2018-4-7 21:39
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2016-7-12 10:21:44 | 显示全部楼层
    请问楼主没操作指南之类的,对我这样的傻鸟的挑战可不是一般小啊
    ' @9 K* h/ R& Z谢谢
  • TA的每日心情
    开心
    2018-4-7 21:39
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2016-7-12 10:24:43 | 显示全部楼层
    按Readme去操作了,但好像没得到什么东东。
  • TA的每日心情
    开心
    2018-4-7 21:39
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2016-7-12 11:29:20 | 显示全部楼层
    menglongma 发表于 2016-7-11 18:50
    " M" N0 x2 }0 }, zwindows 10 不能用

    . o- `' Z' v! o; C2 E* P这就难怪了
    ) E' R( J. u" U* Z3 t谢谢分享
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2024-5-9 13:23 , Processed in 0.104166 second(s), 19 queries , MemCache On.

    Powered by Discuz! X3.4

    Copyright © 2001-2023, Tencent Cloud.

    快速回复 返回顶部 返回列表