掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 7759|回复: 23

[索引] [已完成] 简繁转换

[复制链接]

该用户从未签到

发表于 2015-10-19 23:47:34 | 显示全部楼层 |阅读模式
本帖最后由 cracode 于 2015-10-27 13:15 编辑 9 y7 t4 @# a: n) x* ~

0 d! f2 C9 a8 E1 i) R先看下效果:2 y* |* Q; G! p. P
& O2 N% D2 f+ s+ @4 t7 \- h

' J7 \0 n- h% [+ |; E上图是在 Linux 系统,但 Windows 和 OS X 上需要包含第三方依赖(OpenCC)进 GoldenDict,我没有这些环境来测试。% ]& T7 ^* [% I) c0 {* e0 A
已提交了PR,欢迎有精力的朋友跟进,帮忙添加 Windows 和 OS X 支持,和测试更多的字典。

: R0 C. @3 P$ D. O3 E# h( G( f( |5 o; w+ W
2015.10.27
3 P1 \. ~$ I$ g; ?* D0 o. V功能已合并进代码库,已添加Windows支持,不过作者尚未发布Early Access Builds.
" K& a! I" k' S" Q6 B  m2 n

该用户从未签到

发表于 2015-10-20 00:18:48 | 显示全部楼层
感谢楼主的努力, 我可以协助测试Windows 的部分~3 I# H  I/ M# ]  u

$ R4 Y. X" K2 R如有需要, 我自己有整理超过上千笔简转繁的资料..
1 Y% g1 I2 q' b" x: ^类似opencc里”TWPhrasesName.txt”
5 q' H! \7 W0 S7 R4 b7 S1 F

该用户从未签到

 楼主| 发表于 2015-10-20 00:27:23 | 显示全部楼层
sky66 发表于 2015-10-20 00:18
+ n2 y* X1 v8 J感谢楼主的努力, 我可以协助测试Windows 的部分~$ `4 x1 ^+ |8 ^3 G9 T7 J  e
; \+ h( ]8 [# {- @3 y
如有需要, 我自己有整理超过上千笔简转繁的资料..
9 I* a* e& i! O5 ]& ]4 G
谢谢,不过需要先添加 OpenCC 的 DLL 及 data、config 数据进 GoldenDict 代码库,这样才能在 Windows 上编译使用。

该用户从未签到

发表于 2015-10-20 01:10:23 | 显示全部楼层
cracode 发表于 2015-10-20 00:272 k: K7 o5 N" A/ W
谢谢,不过需要先添加 OpenCC 的 DLL 及 data、config 数据进 GoldenDict 代码库,这样才能在 Windows 上 ...

8 P9 n4 c0 m& U4 g; Z3 U2 A) P6 C这就抱歉了, 对于编程不太了解,
2 A+ A8 S1 \4 n1 c$ z: j我只能协助测试给予建议, 顶多照抄然后进行小幅度的修改..
, N  W! i4 j0 I: K- m7 P7 z+ a1 h; ^0 r. Q- y0 T* T* L
在网站有看到您写的源码, 如果后续有机会的话,
7 A9 B) s. r7 _) C6 |2 @建议能将简转繁, Simplified to traditional Chinese conversion
+ X  x: e) \) b& i; ?改为TW / HK两组, s2tw.json & s2hk.json
/ @* @2 E- F- Q$ ]0 K3 J因为原始的 s2t.json 参数我有试用过, 会转出一些罕用的繁体字,
+ {0 i) E9 T% D2 u有些字我想一般人(包含我)都看不懂..如: 糉 覈 竈5 w2 q, ~# Z1 t2 D

该用户从未签到

发表于 2015-10-20 09:40:38 | 显示全部楼层
sky66 发表于 2015-10-20 01:10
# C- u# ?- M/ \6 Q! d这就抱歉了, 对于编程不太了解,
, t$ s- u4 ]2 S3 P8 H6 I6 e我只能协助测试给予建议, 顶多照抄然后进行小幅度的修改..

+ j3 y9 m; m  M3 x+ X这些繁体一点都不罕用啊,
, k  E. N5 d! f- i
1 C4 P5 L: \) X+ I* f糉,粽子的粽" y; W, ]' f& f4 e6 {. B+ x: |
覈,考核的核
" i. a* r! D. M. ~竈,灶台的灶
! n) z8 |3 g- H# Q; @; x4 a
( E4 [# G! q& T; z# u: I我觉得利用OpenCC 挺好的,不过没必要弄那么多模式,它的简体转台湾习惯繁体(不转换语词)是我最常用的。其他的真心可有可无。* D! q" {1 l9 ~- j7 I& v6 B
: b& ~- f1 [3 A% s) r
像鼠标-滑鼠这样的对应,我觉得还不如留给《两岸词典》这样的辞书解决,不要混在繁简转换里,会干扰,而且效果也没有《两岸词典》好。2 W# `' X# L- b! A: v  @* D

3 _3 K' _: n+ ~2 k现在mdict 下面已经有不少大型词典了,繁简转换带来方便的同时,也会对结果产生干扰。所以它的开关最好明显一点,别藏在选项里面,最好能快速切换。

该用户从未签到

发表于 2015-10-20 09:43:16 | 显示全部楼层
或者做成类似“拼写检查”一样的外挂,搜索简体/繁体的时候提示可能的对应,这样即便不准确也没关系,也不会干扰词典检索结果( p5 ^4 }- s. z# Y. |
& {& i( f+ H+ j+ {$ i7 ]

. h3 I% j$ W4 s2 Q6 Q' z1 ]5 i; R如果全文搜索也能繁简同时匹配就更好了

该用户从未签到

发表于 2015-10-20 09:54:14 | 显示全部楼层
本帖最后由 sky66 于 2015-10-20 10:03 编辑 8 f" N9 u6 c" `
klwo2 发表于 2015-10-20 09:40, R( k; A0 g0 G) W- v& D
这些繁体一点都不罕用啊,, E5 Y% }9 Q# J/ {; Q- A

5 l# U0 V9 V' Q( q糉,粽子的粽

& {. R9 S: L4 ]/ G5 t+ P, g% Z& D# N' g8 ^' \" t5 ^4 L( J
"简体转台湾习惯繁体(不转换语词)"  就是"s2tw.json",   也是我主要在用的.5 E6 r2 x6 B: \4 T& Q, ^
6 H8 P, [; }( z
至於Opencc的转换语词”s2twp.json”, 的确不就不推荐了, 经测试, 会有一些奇怪的转换..
6 a( z: I' U. b! H& [3 K& z
' k' A1 D, {$ e  J; H! z***************
/ l4 [4 w0 ^' e5 a% {3 i
5 U3 s  O, ^" q5 O3 m在此顺便介绍一下, 我在进行简繁转换时, 有部分会参考采用的google词频:
' h& W3 o* ?0 k- Z$ p
5 i/ z7 \% L5 {" o/ T因为翻译一般是”从众”,  但从众的确有时会有误译, 这时就要看是否要拨乱反正, 还是就积非成是, 约定俗成..
2 e5 T0 _* k9 ?% B) A& \. t$ Y( J; b( `# ~& X/ A, ^0 u  r
"粽子" site:tw約有 574,000 項結果 # I4 S9 D3 x8 q& J* `
"糉子" site:tw約有 2,540 項結果
" u. r1 U# M& |" W9 d
& P! g/ W+ U. ["考核" site:tw約有 681,000 項結果+ j# u- s$ P, h& }$ I
"考覈" site:tw約有 7,560 項結果
( K0 S! x5 [& R; R
) i! o' ?# c- Q2 b+ E, I& h2 \"灶" site:tw約有 434,000 項結果/ Y) G' k9 h/ s5 {
"竈" site:tw約有 24,800 項結果
: \" F( k1 m& H# d" ~, \/ L

该用户从未签到

 楼主| 发表于 2015-10-20 10:26:48 | 显示全部楼层
本帖最后由 cracode 于 2015-10-20 10:28 编辑 / k" P) T! n" i$ P

: s. `' x: b% D4 g' S* w我觉得简繁转换还是只简单地转换字吧,软件 - 软体 这种区分,还是交给词典,毕竟 GD 对英语也没有自动转换不同的拼写,比如 color - colour。5 }2 Q9 J3 T% i! _0 Z1 ^
对于香港和台湾用字不同的情况,我会加上对多个alternative的支持。
: C: S: v" A- u' y" m# T; I" b# O/ F
上两张图:6 j. D+ E1 A8 [( \7 p

$ I6 z7 q' n: L6 G6 d' h+ n有选项可以控制是否开启。
$ f' W9 t5 Y3 ?( n; v% r% R6 H7 h# O2 j; N6 ?8 R
3 v9 J: ]5 w7 A7 z- B' q5 \
启用后,可以在 dictionary pane 随时点击这两个字典图标来开关。
. j; T6 C/ y/ @9 v3 w# ^4 G
& d% M  u( n: G( C3 y2 X2 S1 w# ]啊,这里Icon好像不合适,应该换掉。

该用户从未签到

发表于 2015-10-20 11:30:06 | 显示全部楼层
sky66 发表于 2015-10-20 09:542 E) k/ t" y1 T; u' g
"简体转台湾习惯繁体(不转换语词)"  就是"s2tw.json",   也是我主要在用的.
/ c. ?: _% Z5 A- e/ o6 B" o/ b
( T- I. `0 d) N: v) p0 D+ p至於Opencc的转换语词 ...

1 w" R: f3 C  O, n1 t7 h除了google,还有别的资源:, `( V. p$ Z/ }/ m; T

$ R; K) i9 r7 N( w  {7 m3 whttp://cloudtranslation.cc/corpus_tc.htm. c: k3 \5 j  p
1 d4 A2 a  W$ Q' `. ~
https://www.moedict.tw/考覈' V* ^2 t; ^* k0 V/ R9 Q0 N/ }

, I; p* b; ~( i比如国语辞典就有考覈
/ {7 s0 y0 T% @4 b' m& Z  c+ G) u, _1 Y6 X! c3 d
网上“考核”更多有可能只是新注音输入法考核在前面而已。辞典都说考覈没错,港台不像内地,不通用的“正确”词语词典有,放心用着就是了。

该用户从未签到

 楼主| 发表于 2015-10-20 11:56:48 | 显示全部楼层
港台繁体区分,已经加上了。

该用户从未签到

发表于 2015-10-20 12:18:57 | 显示全部楼层
cracode 发表于 2015-10-20 11:567 n8 i( b0 u+ d" y7 k
港台繁体区分,已经加上了。
4 e" C2 q& O6 U
太好了, 谢谢楼主..
4 |% ~9 S, U: k$ l8 s! d" ?只是不知道如何才能有windows 版本…
9 N2 n% J' ]; I, G; A3 z3 ?7 T

该用户从未签到

发表于 2015-10-21 08:44:14 | 显示全部楼层
本帖最后由 klwo2 于 2015-10-21 08:46 编辑
) h0 n  [0 y& z7 C! A/ A  H% N; v$ ~% v$ @) \
我又想起了一个新问题,不知道能不能实现。# [5 H3 u0 p/ f' {

4 G% E9 x( o4 Q( y% Q) a可以考虑添加“只转换词语,不转换单字”,OpenCC设计的时候就是转换文本的,而查字典有的时候只要看一个字的解释。
( T7 F# x6 h& F* o$ n$ m( B' O: [  R
在现有的模式下,“转换繁到简”会让“隻”的搜索结果里出现“只”,简化字字典还好说,反正简体合并了,汉语大字典会因此两个字都出来,平添疑惑;“转换简到繁”会让“听”的搜索结果里面出现“聽”,原本的古字听yin3和“聽”混在一起了。+ M' G9 I( o/ z4 y$ d7 x

  B6 B* F+ \, z1 O- D8 q而转换词语不受影响,形单影只、听力这样的词语不管哪种形式都不会造成太大困难。" S0 m' h7 b% a. Q

4 Q7 s3 k& d- C  x当然了不同的人需求不同,有的人可能就需要简繁一起出来,但我想mdict 平台下现在这么多原生繁体的字典,有我刚说的这种“准确对应,不要乱掉”的需求的人也是有的。) H7 ]+ L) [# o; x+ {$ _

$ B; ^! D, P9 j/ t* ^, z另外,tsiank 制作的汉语大字典,自带异体罗列,在下制作的两岸词典繁简对照(https://www.pdawiki.com/forum/fo ... id=13879&extra=),也能实现通用字单字繁简快速跳转,可以不必依赖OpenCC来做

该用户从未签到

发表于 2015-10-27 13:38:48 | 显示全部楼层
本帖最后由 klwo2 于 2015-10-27 14:04 编辑
; L  {. Z$ l/ q; U4 U6 m* H' g8 c3 k
cracode 发表于 2015-10-27 13:17; K3 E; b6 J  Q! C8 c; X+ n) U% c
已完成
8 W' n/ R# Z, a: S

- A2 ]4 x. C; U2 Q多谢!等Early Access Builds出来就能用了,不过我还是好奇,我在12楼说的有办法实现嘛?3 R) L: h% g: x# u8 r6 k0 t0 o! y
0 l8 y3 J8 i7 c% g. `; N
我在想,或者换一个思路,能不能实现“对特定词典不应用繁简转换”?

该用户从未签到

发表于 2015-10-27 14:16:25 | 显示全部楼层
cracode 发表于 2015-10-27 13:179 s- O8 f  g/ M* U2 _6 J& C
已完成
0 P  Y0 j1 S! W8 W6 v: v
真是太好了, 就等Early Access Builds了! 再次感谢楼主的辛劳.

该用户从未签到

 楼主| 发表于 2015-10-27 14:21:19 | 显示全部楼层
本帖最后由 cracode 于 2015-10-27 14:32 编辑 ; G7 [  D  O% e3 E
klwo2 发表于 2015-10-21 08:44
& D: F0 n( c; \我又想起了一个新问题,不知道能不能实现。
! `% |" _# r; ^( O/ [) e# U* v) R# v' H- S. x" l5 g
可以考虑添加“只转换词语,不转换单字”,OpenCC设计的时候 ...
/ g' ^/ q* ^' n( M" H% F
" }) o; Q- ?+ M' ?" Y
简繁转换非一一对应是语言本身的complexity,其他语言也有不规则变形等程序不方便handle的问题。异体字等的区分,词典内容可以解决。
# D: v7 Z# t, E7 Q8 H) ^( J% O$ S4 V$ D2 ?
当然这只是我个人的观点,有不同意见可以进一步改进,or just maintain your own fork.

该用户从未签到

 楼主| 发表于 2015-10-27 14:22:36 | 显示全部楼层
klwo2 发表于 2015-10-27 13:38& u  L0 H( B! L
多谢!等Early Access Builds出来就能用了,不过我还是好奇,我在12楼说的有办法实现嘛?; k' ^' x/ j* F, C

+ s% `1 [; z" h1 v$ v6 P我在想, ...

  f" B: j. l1 u* T/ {6 P0 o分组。打开简繁转换会增加几个虚拟的词典,放到哪个分组,哪个组就会自动转换。

该用户从未签到

发表于 2015-10-27 15:25:13 | 显示全部楼层
本帖最后由 klwo2 于 2015-10-27 15:28 编辑 $ Y9 h: i% K3 D1 a  r0 B" b+ C
cracode 发表于 2015-10-27 14:22
' i: v! t- F& ]4 J分组。打开简繁转换会增加几个虚拟的词典,放到哪个分组,哪个组就会自动转换。
5 E# g1 _  r% Z3 r; W% p

# ^$ Q) L! _0 H. ~哈!我明白了。原先没怎么用过transliteration,没经验。这下明白啦
* x7 [9 M* p) ?; S0 a
! _7 H5 r+ @1 r* r2 b再次感谢!

该用户从未签到

发表于 2015-10-27 16:50:30 | 显示全部楼层
楼主有Goldendict的编译环境,不妨试试在加载词典的时候替换一下css里的url('...')路径,这样就可以用css动态加载mdd里的字体文件和图片了
, d  @2 R4 W8 g- ~$ B, m: H@font-face { font-family: 'MyFont'; src: url('myfont.ttf'); 。。。
& |. o. G* L7 x( Y+ L以及3 [) z4 a+ J) Z4 x3 F! q* k
background-image: url(foo.gif);
4 _: k, U+ _% Q3 z6 m1 N: J+ g
8 v1 z0 O# L% i. l在路径前面拼上Goldendict的那一串随机字符应该就可以了1 c1 j0 `4 X$ S' _: ~. V2 A7 F
foo.gif => bres://49dc2f7b70d4b3ea5f2df26d47cb379b/foo.gif
9 y  X' J! t) [4 W: o1 ~
3 H. Y4 M1 |7 f可以参考https://github.com/goldendict/goldendict/blob/master/mdx.cc里替换link等的方法来实现

点评

我抽空试试看  发表于 2015-10-27 17:03

该用户从未签到

发表于 2015-10-28 14:04:35 | 显示全部楼层
啥时候能发出来啊
  • TA的每日心情
    开心
    2021-1-27 11:36
  • 签到天数: 2 天

    [LV.1]初来乍到

    发表于 2016-7-6 08:28:18 | 显示全部楼层
    我下了windows最新的goldendict 1.5.0-RC2-21-gdb6f369,將要簡繁轉換的字典放在同一組裡也加了簡轉繁虛擬詞典,但是沒有效果。

    该用户从未签到

    发表于 2016-7-6 15:35:32 | 显示全部楼层
    fthukp 发表于 2016-7-6 08:28
    ( S6 G" Q+ P# j4 i$ `我下了windows最新的goldendict 1.5.0-RC2-21-gdb6f369,將要簡繁轉換的字典放在同一組裡也加了簡轉繁虛擬 ...
      V% `% L" H$ h) t& c& Q
    這個功能目前 GD 只有在詞頭有轉換效果, 內文還不能轉換..
    & g# @# T+ e! {8 a0 T# R8 x' J也就是輸入繁體詞頭可以找簡體詞頭, 反之輸入簡體也可以查到繁體詞頭的內容..+ M* ]0 L9 Y4 ^  z# C' H: o
    無須另外製作一個簡繁索引的mdx.
    ; @3 c7 U" v0 l" y  l
  • TA的每日心情
    开心
    2021-1-27 11:36
  • 签到天数: 2 天

    [LV.1]初来乍到

    发表于 2016-7-7 13:48:47 | 显示全部楼层
    sky66 发表于 2016-7-6 15:35% K" B. q4 v) i8 a/ N
    這個功能目前 GD 只有在詞頭有轉換效果, 內文還不能轉換..
    ! \( Q/ r. [% I+ R! \! O也就是輸入繁體詞頭可以找簡體詞頭, 反之輸入 ...
    , j( ^& q" g, O0 w' j7 O
    多謝解答
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2025-5-9 17:17 , Processed in 0.024789 second(s), 23 queries .

    Powered by Discuz! X3.4

    © 2001-2023 Discuz! Team.

    快速回复 返回顶部 返回列表