掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 16223|回复: 269

[工具] 【2016.08.11 优化】Mdict词典DIY工具系列之一:词条内容提取利器,极速提取

  [复制链接]

该用户从未签到

发表于 2016-7-10 16:12:09 | 显示全部楼层 |阅读模式
本帖最后由 qiuhao1112 于 2016-8-11 20:15 编辑 2 Z+ @1 P" ^5 x3 y* f

* i* l/ y% W' ?2 x. C7 dMdict词典DIY工具系列之一:词条内容提取利器,极速提取! x* O" g; c9 ^$ d, Y6 Z9 P4 m$ h
6 d( H7 ]. L1 x4 a7 x$ g
==============+ D. U: s" P: B
2016.08.11 优化:
* I% j. @+ i: j
修改了程序,若原文本有多个相同的词条,则不再覆盖,保留对应文本。- a- x% Y& K$ b; f2 S4 `9 K! c* J
% d, _+ Y% H) z$ z
改为百度云分享,便于更新。
, R; r9 L) T, T+ |4 `! ^; C! H, P# J, O! V4 `* d! s
==============
) V) J1 `/ X# |. `+ J2 U( C3 d. U: l7 X; t

* z9 ~7 ^; d5 C( w3 l0 |7 o+ ]  {3 h% N+ n: M* Z1 ~' Q8 _
Mdict词典DIY工具系列:
  ?3 I1 L8 a3 L  w1 [
7 q) L1 K3 U( |# U5 mMdict词典DIY工具系列之一:词条内容提取利器
; p6 y5 j0 B. n& p' }) PMdict词典DIY工具系列之二:词条合并工具,二合一 ! S4 V4 {4 x1 q# y" r* U& j2 `
Mdict词典DIY工具系列之三:MDX文本内容提取解析工具! j+ R4 c1 M. ^# A, C3 G
Mdict词典DIY工具系列之四:词条合并工具,N合一) S. @6 t3 p) j2 P
Mdict词典DIY工具系列之五:MDX文本内容 & 词条 去重工具 $ u( q  y/ P% R& x; O

+ k3 K. J& n5 W7 N% p2 F

- ~3 d. e$ Q3 X  Z9 ^, K. I8 D
7 V, }' D3 m9 [) i之前的程序报有病毒,已重新打包上传。
4 i" W" T3 V# A+ G4 t# R8 c
% r; s6 f6 Q8 Q0 v8 G
) g( D; W: A( e: |3 M* h( J3 Z& G( {0 {/ p; S

  Y+ b6 }" R3 RExtractor from MDX by Wordlist v 2.0:" n5 R) Y# u4 \* |- y

+ P; C/ L1 r: C; b8 n( u$ m
; x' n7 ]$ {& _& r2 Q1 u+ Z( H; v. Y; F- X2 ^0 I
        使用方法:
0 Z9 p2 w6 G, O6 c/ w4 q1 I! p3 ^. w; S+ M- P+ l& n% W
        & {. s7 Q7 x9 I" I( ~& A
        提取词典内容的源码文件应为Mdict词典格式的文本(.txt)文件。1 h+ g' {7 |! r0 S

$ g6 j" u: v! k        该程序无图形化界面,为方便使用,请把文本文件名改为阿拉伯数字或字母,方便文件名输入。. D6 e$ l' E3 E. P% h
/ \2 n+ j% X( O9 x: S2 w7 m
        Input wordlist file name:  输入单词列表名,无需添加 .txt后缀;
$ E& G# o: ^! r$ b+ I        Input source file name: 输入MDX格式的源码文件名,无需添加 .txt后缀;
+ c- A/ I  A" ^7 A: I' _/ K& C        1 FOR include, 0 FOR exclude:  选择1 include 模式,选择0 exclude 模式。
& t; ]; Z( w+ m* A; L* j" y3 T+ c# K0 d- L" T1 {* r" g8 c9 _4 \
                                模式1: 提取包括该单词列表的内容8 t0 p% F( I, P& ]2 r
                                模式2: 提取非包括该单词列表的内容
1 w+ [; y) g8 X3 x+ e9 s) Q# Z9 W9 a8 n, b( E, ?
===============================. L5 x# s* ^0 _5 _5 P

: P2 f; p" x' \+ [
0 @( K; o" }5 ]( L2 u, m9 ~: ^+ ^5 D链接:http://pan.baidu.com/s/1bpbYkwB 密码:55po
" O/ _) C6 p* a3 V

评分

1

查看全部评分

本帖被以下淘专辑推荐:

  • · 工具|主题: 8, 订阅: 5
  • TA的每日心情
    奋斗
    2022-11-19 13:01
  • 签到天数: 21 天

    [LV.4]偶尔看看III

    发表于 2016-11-28 12:14:05 | 显示全部楼层
    谢谢楼主分享,下载看下

    该用户从未签到

     楼主| 发表于 2016-7-12 11:02:38 来自手机 | 显示全部楼层
    Snowdax 发表于 2016-7-12 08:58& V: [' b. m- r; G8 C! ~0 X
    其实是可以的,用custom 添加reference list即可,但该软件好像没有开源,不知道是怎么实现的
    / R/ F0 s$ F4 z) c6 t
    应该是我以前没发现这个功能吧   而且sunsmile大的那个速度很快  应该是用Java或者C写的  这两个我都我不会    我的脚本思路也有问题
  • TA的每日心情
    奋斗
    2019-10-11 13:52
  • 签到天数: 142 天

    [LV.7]常住居民III

    发表于 2016-7-12 12:45:20 | 显示全部楼层
    qiuhao1112 发表于 2016-7-12 11:02
    - _* o5 m# Z  v应该是我以前没发现这个功能吧   而且sunsmile大的那个速度很快  应该是用Java或者C写的  这两个我都我不 ...
    / K* u  V: o+ ?, ?' @
    因为我之前做词典用过这个功能,所有隐约有一些印象
    9 L( m/ j4 x# P+ g/ Y% x: U/ Vpython代码比较简洁,但运行速度确实不快" W  y3 y6 Y. g1 J3 c
    (其实我也是门外汉的

    该用户从未签到

     楼主| 发表于 2016-7-10 16:26:03 | 显示全部楼层
    本帖最后由 qiuhao1112 于 2016-8-7 15:09 编辑
      Q7 L+ M, b! w* K/ x' ]  W
    / M1 n; W+ y- v+ F& E4 l& V打开大文件无压力。。

    该用户从未签到

    发表于 2016-7-10 16:33:17 | 显示全部楼层
    巨巨请教一下,读取mdx用的什么python库啊?
    * D8 |8 n' u# E! i还有写mdx只有MDX Builder,有没有支持命令行的工具啊?

    该用户从未签到

    发表于 2016-7-10 16:51:40 | 显示全部楼层
    路过帮顶辛苦了

    该用户从未签到

    发表于 2016-7-10 18:51:50 | 显示全部楼层
    这不是很多人需要的工具吗?!

    该用户从未签到

    发表于 2016-7-10 21:47:30 来自手机 | 显示全部楼层
    真是雪中送炭呀
  • TA的每日心情
    奋斗
    2019-10-11 13:52
  • 签到天数: 142 天

    [LV.7]常住居民III

    发表于 2016-7-10 22:53:15 | 显示全部楼层
    咦 我记得Source Editor有类似功能
  • TA的每日心情
    开心
    2018-1-27 00:16
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2016-7-11 08:01:41 来自手机 | 显示全部楼层
    太好了!可以自己折腾词库啦!
  • TA的每日心情

    2019-2-16 21:57
  • 签到天数: 9 天

    [LV.3]偶尔看看II

    发表于 2016-7-11 08:43:48 来自手机 | 显示全部楼层
    楼主,我是linux用户。求原始Python脚本

    该用户从未签到

     楼主| 发表于 2016-7-11 08:49:00 | 显示全部楼层
    本帖最后由 qiuhao1112 于 2016-7-11 16:44 编辑 4 [" l9 x* E: a# l- q
    lmjiao 发表于 2016-7-11 08:43
    & j) S+ R. T0 }: r, T8 v  h$ K楼主,我是linux用户。求原始Python脚本
    ! ?2 e" X6 e" [3 r$ c' v: Y, G

    2 p7 v/ C% |$ y# G2 L9 r脚本还需要修复

    点评

    感觉可以用的dict先存一下数据,然后再提取。还有Python的thread在gil的条件下是针对IO阻塞的情况用的,这里好像没有必要。。。  发表于 2016-7-11 14:45
  • TA的每日心情
    无聊
    2020-11-6 22:08
  • 签到天数: 26 天

    [LV.4]偶尔看看III

    发表于 2016-7-11 10:08:34 | 显示全部楼层
    perfect exe~

    该用户从未签到

    发表于 2016-7-11 12:49:56 | 显示全部楼层
    fnaviwwo1 发表于 2016-7-10 16:33  H+ S, E6 j9 U' c. `* }
    巨巨请教一下,读取mdx用的什么python库啊?
    7 f( ~8 ?$ e' u, [1 ~2 z3 A, i还有写mdx只有MDX Builder,有没有支持命令行的工具啊?

    9 Z9 t, s5 b+ N5 Z# b6 T/ k如何用 readmdict.py 提取 mdx/mdd 中的数据
    $ g" m. F3 u* Q* ^http://jingyan.baidu.com/article/95c9d20d47583bec4e756132.html

    点评

    I really appreciate it!  发表于 2016-7-11 14:22
  • TA的每日心情
    开心
    2018-4-7 21:39
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2016-7-11 16:22:53 | 显示全部楼层
    谢谢楼主无私分享9 r3 Z7 g+ I, ~8 o
    开心!

    该用户从未签到

     楼主| 发表于 2016-7-11 17:05:01 | 显示全部楼层
    Snowdax 发表于 2016-7-10 22:53
    7 h5 {: Y! W, F咦 我记得Source Editor有类似功能
    , J( g' _# s5 X2 o) s# {
    Source Editor  确实没有这个功能
  • TA的每日心情

    2019-2-16 21:57
  • 签到天数: 9 天

    [LV.3]偶尔看看II

    发表于 2016-7-11 18:07:34 来自手机 | 显示全部楼层
    qiuhao1112 发表于 2016-7-11 08:49( O9 v  |  i2 Q6 E* |
    脚本还需要修复
    9 G$ ?5 D' u7 k' ?
    非常感谢!热切期待!
  • TA的每日心情

    2019-2-16 21:57
  • 签到天数: 9 天

    [LV.3]偶尔看看II

    发表于 2016-7-11 18:09:29 来自手机 | 显示全部楼层
    vbnet 发表于 2016-7-11 12:49
    & ^8 ^. G' l2 P* |如何用 readmdict.py 提取 mdx/mdd 中的数据
    , D2 A4 G1 s% @) whttp://jingyan.baidu.com/article/95c9d20d47583bec4e7561 ...

    0 b8 M6 X8 \: D4 T( p; K+ `楼主的可以根据单词表提取所需内容。你给的链接中只能提取全部内容。
    / }3 S  ^  }, L% O  i
    , }- b; s/ T$ `' `( e' F对于部分人来说,楼主的按需提取功能还是很方便的。

    点评

    vb大所提供的链接只是在回应fnaviwwo1在3楼所提问的问题,并非要跟LZ的功能做比较  发表于 2016-7-12 10:07
  • TA的每日心情
    开心
    2019-6-27 08:03
  • 签到天数: 8 天

    [LV.3]偶尔看看II

    发表于 2016-7-11 18:50:36 | 显示全部楼层
    windows 10 不能用
  • TA的每日心情
    奋斗
    2019-10-11 13:52
  • 签到天数: 142 天

    [LV.7]常住居民III

    发表于 2016-7-12 08:58:15 | 显示全部楼层
    qiuhao1112 发表于 2016-7-11 17:05/ H8 P) ]; K$ y8 g* j
    Source Editor  确实没有这个功能
    $ z' ~: J% n% I; a
    其实是可以的,用custom 添加reference list即可,但该软件好像没有开源,不知道是怎么实现的! H/ Q. [0 q+ @0 p+ f

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x
  • TA的每日心情
    开心
    2018-4-7 21:39
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2016-7-12 10:21:44 | 显示全部楼层
    请问楼主没操作指南之类的,对我这样的傻鸟的挑战可不是一般小啊0 B/ p% N* J* |- X3 Q
    谢谢
  • TA的每日心情
    开心
    2018-4-7 21:39
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2016-7-12 10:24:43 | 显示全部楼层
    按Readme去操作了,但好像没得到什么东东。
  • TA的每日心情
    开心
    2018-4-7 21:39
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2016-7-12 11:29:20 | 显示全部楼层
    menglongma 发表于 2016-7-11 18:509 k) g0 H6 F% ^5 W. L+ Y7 w' D6 h
    windows 10 不能用

    9 Q' _% h* n! m7 P8 K6 C) Y这就难怪了
      j/ k# O, @# g; F4 [6 t谢谢分享
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2024-5-10 03:38 , Processed in 0.078169 second(s), 14 queries , MemCache On.

    Powered by Discuz! X3.4

    Copyright © 2001-2023, Tencent Cloud.

    快速回复 返回顶部 返回列表