掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 1261|回复: 11

[求助] 怎么合并词典,作死的节奏

[复制链接]

该用户从未签到

发表于 2017-2-4 16:12:21 | 显示全部楼层 |阅读模式
本帖最后由 pda1533 于 2017-2-5 09:59 编辑
9 A* j% @4 ~$ F/ @
' c: x# C* \! |; o; j# O# }2 U之前下的词典,太多了。。。英英的就用其他大神的现成的就可以了,担心的是汉英这块,自己下的汉英字典更多,也比较全面,' U  I$ y/ p  p2 e+ x5 _7 d: y6 g

& e" s, U' k* M) ?. S3 h; F: u/ d( M大概内容包括以下:  看着都吓死了 。。。。
9 ?! Z8 ~# W/ {9 P

7 P$ c7 w5 \2 r- F6 L! o本人没有收藏癖,下载的字典这一辈子都不可能把所有词查一遍,但只因工作关系要接触到很多行业,离线状态下输入中文出不来英文就没安全感" {) X1 M, t. r  s/ q+ }1 R" Y

1 u0 j0 b6 B# f5 ~
- h/ w2 ?7 O' N% C$ j! w  _# C
4 a# n2 n" G, L! v7 R但是搜索起来字典太多,太麻烦,为什么不能在一个字典里面完成呢?平时当伸手党当惯了,想要自己合并一个,包含所有下载的英汉、汉英的。。。所以本贴记录一下,
7 M% v  V& x; J# _- F+ R, y8 d
- A( b* \3 Q2 a) q
+ R; m4 b) B3 m3 x( g2 T! h2 X, X本人完全零经验,不知道怎么弄,随便弄弄吧,不知道会不会成功。。。慢慢弄。。。(请各位大神注意:借用各位的工具时未能完全搞明白怎么用就放弃了,是我不会用,不是工具不好, y( s. G) A* F: n' G$ a+ W

9 M1 ]% ^7 q3 p8 C4 o& _- @/ r9 ]2 {  H: c& n6 v
1、先是用MDX export 3.3  把需要的mdx全部解压了2 A2 [, v3 z1 Q& U: l* z8 O
5 i$ H4 C; e4 J+ G4 a
2、了解了一下CSS这东东,知道是设置格式的。自己不会,所以mdd、CSS就算了,不需要,把style.css这些东西全部删除,因为本字典的功能只是需要输入中文有对应英文出来就行了。。。
$ ?& {' z! r8 k% G  Q

+ X6 L3 T1 v  f0 N+ ]2 |3 q3、解压完了,用Mdict Editor Tool v1.45_exs 合并字典,失败!!!!
. M: F0 s; X2 u% D! \
& [0 u8 d7 P8 Z4 v4 \3 {1 A! U7 C  s; \- F- w7 \
4、好吧,Mdict-edit v0.08也用了,不知道怎么用,失败!!!6 w; g1 }. G' q/ `  I' Q
/ [4 N% Q. e/ X* V) Y
2 K( H1 T6 |# B# K: Q3 F5 ~

) _& A. f0 O  P" I5、好吧,到论坛找其他工具:如下,累. R* B4 U% n8 D* k1 J* o3 y5 W# q
* [5 w4 i9 M, ^' z0 }

; U5 W, d" A& x  F
, {" T. o, |* F% ]) r. Z( k$ n6、不管了,不会弄,直接把第1步的txt合并在一起吧,开始有4.08G,9000多万行,没想到ultraedit居然打开了,这软件太神了(之前用Notepad++居然打不开500多M的txt),删除了一些乱码,现在要小一些了。。。3 W  K0 P" K8 A

- j2 N% M; W% W) W" t0 h7 O, y" w+ o. W& p8 }

4 L7 i& V7 M: y+ o  F7、现在关心的是去重的问题,合并了那么多字典,肯定有无数的重复的单词,需要保留释义最多的一项,要是批量去重,程序上应该没有方法自动判断。。。怎么去重呢?
5 |" |1 s. n- ?) X7.1 用了第3步的Mdict Editor Tool v1.45_exs 词条去重,提示内存不足,那也就是失败了。
4 U0 \- V. U6 j% L7.2 用ultraedit,不会,失败;
' @0 U$ g' J; d7 `$ X! J$ @: Z5 H7.3 拷到excel里面,提示未加载完全,一看,excel到底也只有100多万行;
" X* b7 ]5 i3 n! u6 |# H7.4 先继续删除合并文件里面的<link***>以及乱码,去重的问题再想想。。。( p- W/ c, w4 v3 @) f% s2 T
7.5 2017.2.4下午把各个解压的txt打开看了,没有乱码,所以合并txt文件出问题了,方法不对,郁闷中。。。) ^. y) m* x+ k" ]
7.6 2017.02.04 郁闷中。。。估计花了几天时间弄的东西又回到开始了。。。。8 \+ J/ V* u  [( j. X8 B  R
7.7 2017.02.05 因为这些字典本身就包含好几个分类,电力,法律,会计,医学,所以想先按这些分类合并、去重再说。。。这样做至少还是会减少几本字典。。。今天没空,过两天再忙吧。。。
; J' b0 l6 X- [' ^- O( i( b
5 |* y. }" y, E

6 E/ u; @; B% S! V5 ~* v2 Q, c' C

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?免费注册

x

该用户从未签到

 楼主| 发表于 2017-2-5 10:12:44 | 显示全部楼层
rayman 发表于 2017-2-5 09:58
+ |) z- p5 `3 u) K2 ~1. txt文件合并可以用Command 窗口命令做,非常简单:
0 `, o! A+ q; C7 n# c) F- ~6 Kcopy /b a.txt+b.txt+...+z.txt all.txt

* {* i0 e* u/ A# [8 [7 ^; _1、合并txt用的下面这个方法:
! n0 z$ y& C) J" w, B在txt当前目录用“type *.txt >>f:\111.txt”,该命令将把当前目录下的所有txt文件的内容输出到f:\111.txt。! d. A  \& U# D: k" `0 r1 `
http://jingyan.baidu.com/article/d3b74d64a7cf671f77e609b5.html; B- `* B/ Q8 ~  s9 M
( U3 z' q( ?  x
2、可以词典联合查询,只是自己想做一个更全面的,加载起来也快,方便,每次查出结果后也不用显示:什么字典什么意思(字典太多,重复太多),所以只需要合并一个最完整的就可以了。

该用户从未签到

发表于 2017-2-5 09:58:34 | 显示全部楼层
1. txt文件合并可以用Command 窗口命令做,非常简单:
; Q- c7 G' j6 y: y3 jcopy /b a.txt+b.txt+...+z.txt all.txt
9 |+ J6 v+ ~2 e( j$ b+ h' }2 y" D0 A2 n1 B; Q/ Q% C" ?* j
可以google "windows copy 合并" 看教程
1 p$ B7 w' w9 ]% c* U) j5 p/ a- w, c) k8 n' g; n
2. 为啥不用多词典联合查询模式而要自己合并?

该用户从未签到

发表于 2017-2-5 01:21:39 来自手机 | 显示全部楼层
使用Mdict Editor Tool v1.45操作失败时报什么错没有?
# j4 ]4 @8 ]6 l. Z0 `( a3 q1 c
0 S5 }; }# O( ?% n1 ~/ b另外楼主要合并这么多词典,没有谁这么干过呀,况且就算是合并了,词典数过多,导致词条的内容越长,使用起来也就我越不好用

该用户从未签到

发表于 2017-2-5 01:22:11 来自手机 | 显示全部楼层
使用Mdict Editor Tool v1.45操作失败时报什么错没有?
, ?) A/ ], x& p/ F/ |( \. X1 v/ J0 P$ s! X: w, y; p4 t$ t- ], i
另外楼主要合并这么多词典,没有谁这么干过呀,况且就算是合并了,词典数过多,导致词条的内容越长,使用起来也就越不好用
  • TA的每日心情
    开心
    2018-3-19 02:23
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2017-2-5 01:29:18 | 显示全部楼层
    哪里几天就能学会所有的东西?着急没有用,要慢慢来
  • TA的每日心情
    开心
    2022-3-11 16:40
  • 签到天数: 10 天

    [LV.3]偶尔看看II

    发表于 2017-2-5 04:46:36 | 显示全部楼层
    本帖最后由 mingqing007 于 2017-2-5 16:49 编辑
    9 P3 _: P# P) `, ]
    - s/ y! |6 \9 S8 k5 ]  C9 V: H楼主你是干翻译的么。。。  G) P& _6 `  q

    # T$ g9 V9 G0 f加油加油, 好好学学, 合并起来到是很简单的事儿, 就是拆拆合合花点时间而已.
    # m+ s6 L. M3 L
    3 g+ P7 c  o2 n2 y! J你遇到的问题,论坛里的帖子都能解决,好好搜索, 多看看帖就可以了.
  • TA的每日心情
    开心
    2023-2-24 18:44
  • 签到天数: 339 天

    [LV.8]以坛为家I

    发表于 2017-2-5 12:49:11 | 显示全部楼层
    1 你删掉所有CSS 那根本没法看的 换行都没有 就几个空格 颜色也全是黑色 怎么高效率查。。
    + F' v4 }  B# }2 R当然也不能简单的合并 同名的CSS选择器后面的会覆盖掉前面的( E. b5 y  n1 l; o( M9 |4 j' e# n
    2 就算合并了查词效率低下 如果不是某专业领域的翻译 大量需要的话 只需要最常见的 剑桥牛津科伦斯麦克米伦朗文高阶词典 里面随便选一本都行 如果是专业的 你自然知道需要什么专业的词典 你整理完也不一定全用得上
  • TA的每日心情
    开心
    14 小时前
  • 签到天数: 1799 天

    [LV.Master]伴坛终老

    发表于 2017-2-9 21:31:10 | 显示全部楼层
    我想说楼主,这么多的词典,肯定有5本以内的大词典,包含了其他小词典的绝大部分的词意,找出来合并他们就可以啦,全合并了,就算成功了,你也得看词意看到吐,一个词的词义就要有上百行了,楼主可以自己想想,这样会有效率嘛?
  • TA的每日心情
    开心
    2018-6-6 00:13
  • 签到天数: 4 天

    [LV.2]偶尔看看I

    发表于 2017-3-15 12:26:30 | 显示全部楼层
    工具无好坏,关键怎么用。合并去重《木头字典》
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2024-5-9 20:31 , Processed in 0.107916 second(s), 10 queries , MemCache On.

    Powered by Discuz! X3.4

    Copyright © 2001-2023, Tencent Cloud.

    快速回复 返回顶部 返回列表