|
本帖最后由 ebdic 于 2016-8-3 17:32 编辑 6 P' i- o; ^9 B/ @, J
! h2 A D2 { P' Z1 T
对于epwing的字条,EBDic会根据字典作分析。
2 h5 a4 Q: g5 E+ d0 K/ ?! S1 n8 d$ D' W& D
3 j7 l2 x$ X1 w r+ Z7 p例如:+ M9 P0 r$ c8 {$ M
小学館「中日/日中辞典」統合版 :
1 V3 n' l# u6 V! A, ~0 p8 ]6 {1 X+ eはな【花・華】
8 P2 Q+ J6 s0 f/ ^# B( o5 {
* D; l7 m6 m7 O! v広辞苑第六版:
0 S# W1 l8 p& y+ }はな【花・華】; m4 q- n) a3 ?6 ~+ y
( X. C7 l- C! h" Q
三省堂 スーパー大辞林 :
) ]7 m8 e: j ?$ `- Eはな【花・華】
; ^* B" }: W' h. _7 z" m& M+ U% s
+ `7 j4 n$ U# S新明解国語辞典 第五版:
& J4 M5 |: h0 h9 l, e; W5 H' @はな【花】[2]/ P y: l4 X6 v2 [1 \0 R1 k; [
1 I0 v9 y. D" P2 L! |$ f% Q# L% Y
学研国語大辞典 : }" H6 d. ~- d/ X
はな【花・華】; F$ L7 n4 I: N7 x& n) j. R" p
: O. W9 ]4 r& g* `5 `講談社日中:
# i- w+ I- G# q* b- a4 x【花・華】 はな
7 n8 O% s. [% v, T
. w2 K( A, }1 H0 n" Q$ F: r( X! {* L( |! G( e
会分析成: \" _+ w2 z2 [+ w( j2 z6 I
汉字:花
9 j: }+ B, O3 p" w3 Q. ?# D仮名:はな. Y# ]5 o8 ]5 b8 S4 o- ?7 u
-----------------------------------------
' ~5 ]8 A! G( h; d9 @0 `小学館「中日/日中辞典」統合版 :* P1 P' U. q. @ B% X0 k/ U" {4 s
はな【端】. c: ]& l; Z; k5 [: C
. A" d$ z/ m+ z3 m3 y4 w
広辞苑第六版:
! S- J9 J& I3 y8 S; iはな【端】
6 D3 R" n7 f; M! e- u @" G E
4 _6 r1 e* [& [: G8 M9 Z6 n& H/ i新明解国語辞典 第五版:
" X5 p: a$ Z8 {2 Z8 q1 pはな【端】[1]
( m1 k" X/ W1 N/ E# j6 H; Z- u6 H; r
# x- s9 Y5 W8 B3 c9 W( H, a学研国語大辞典 :. l4 \/ E8 Q3 t5 u
はな【〓端】: G5 T- c' j& G( M, C
0 S, S/ [, \% Z7 r# b; w講談社日中:! y# y4 R% X! t1 f1 z s
【端】 はな) C/ L9 H8 S0 \. L+ v2 W3 ]: s
- H/ R3 O- A$ I5 ?( ~" P `会分析成:3 \+ z9 `+ m' i0 i# L
汉字:端; `: k) C/ R/ [1 \
仮名:はな0 W( g2 u4 Q3 H; h4 `3 L; {1 l% |
4 Z) ?% P9 M+ w% v& i, D3 h4 ~6 C- ~-----------------------------------------
: k% t) r+ ^: A5 ^4 y7 G然后,发音的顺序是:
2 c/ k) N0 h+ p1 ^) ?1. 如果有Sound_ja.mdd+ _" ] F. `* E L! g/ k1 i& t
先用汉字寻找,假如找不到,则以仮名寻找。1 L- W9 @# D% \; x9 c" k) t* H
5 ]7 ]# B7 n& f0 P
2. 如果没有Sound_ja.mdd或找不到,且如果有"NHK 日本语発音アックセント辞典"
# E8 ^8 t! w" t( x  a. 假如只有仮名,则使用仮名寻找,以仮名寻找到的第一个字条为主。
; ~, b) d6 K# Z! A6 r8 O  b. 假如有汉字及仮名,则会同时以汉字及仮名在"NHK"字典寻找,& ]% O; k4 q4 b- Q4 }; P9 J7 ^
     然后比对两个寻找的结果,如果有同一字条,则使用此字条。& w6 N4 r/ `9 x) N; V! Q5 r
     如果只有汉字有字条,则使用汉字结果的第一个字条。4 u$ k! R! ^* X- d
     如果汉字没有字条而仮名有字条,为了正确的发音,这边不会使用仮名的字条。# y5 k& d% L- b* h( u
+ n/ m( o/ K! p! N/ w
     如果找到了字条,则以字条本文的第一个声音档做发音。. y8 v1 s& x4 q
* N& E7 {0 T; m2 l
5 C& V9 Q G( x6 ?
3. 如果都找不到,则会使用TTS做发音(要设定TTS为日语)0 D7 ^. l2 l" E8 L
3 W. ]$ E3 K1 {6 e: Z2 E( C-----------------------------------------
& F( @/ @2 w. ]& s0 {$ |- Z A- [ R# I2 X
感觉是使用"NHK 日本语発音アックセント辞典",会较精准。
4 W ^$ s \: Z/ y6 Z4 y) A但不能确定,因为我没有实际去做比较。 (有可能Sound_ja.mdd收录的汉字或仮名字条较多)
1 e; Y( C4 \: R$ u如果有"NHK"字典,可以移除Sound_ja.mdd,则会以"NHK"字典为主做发音。. ]" W/ H; F \; Y% A
, b9 A& U' K4 O7 M7 A
4 h$ v. p8 Q5 m4 V& w( X: `' P
但有时候有些汉字的字条,有很多不同的发音,可能在"NHK"字典里本文的第二个或第三个声音档。
8 E7 a; R' B0 E所以当发出不是认为的发音,可以去"NHK"字典做确认。
4 r6 j7 E& l% z# ]$ m7 ]# o1 D7 b
7 @( x# X E$ _' Q$ @例如:3 e: j6 ]! n3 V
紅葉 こうよう% J. H; e& l# ]& C7 w3 D
紅葉 もみじ
0 l6 [9 `* u/ F& q! U4 L-----------------------------------------% R$ A+ ^$ S) J+ ^
5 {$ P; g) M- x' B, J6 d2 d
因为EBDic会根据字典作分析,所以是写在code里, ~8 j, C0 J0 U/ r K1 @* s y
目前已分析的字典有:8 V1 s2 v% b" P- l& s2 R: @/ V- w
, S' ]: g# `# |; ~/ [- g6 W" l) R小学館「中日/日中辞典」統合版
$ T, k& C( s* h9 p$ K/ Z広辞苑第六版; Z, p) B2 A& F
三省堂 スーパー大辞林
1 N3 f# Z4 e% L/ N7 w+ t新明解国語辞典 第五版
, g4 [( ~, h5 F/ B9 b* v% ~0 T学研国語大辞典7 m9 A. H* b! u9 z
学研漢和大辞典1 N0 W9 b; q0 u( O) q9 V z
講談社日中* M. B4 J' _: w; n9 t. ^/ i' o
大辞泉% q) N" l7 Z4 I( h m/ t0 l" [
国語大辞典
( J0 @9 s! i5 N3 c# n明鏡国語辞典
; n3 g4 ?3 Q2 @+ Z0 q/ f) \
3 ~% j8 E" P1 H其实,目前的分析只做了一部份。. V5 @) V5 {; S( `9 d9 c
有些汉字的表示法,可以有不同方式:
5 l" H3 W! f5 e5 ?例如:
; Q0 ]0 X; ?1 a- |, A掛かる,掛(か)る- z1 [; }. F$ U# h$ b
如果是"掛(か)る",则会去掉(),汉字的部份变成"掛る",在"NHK"是会找不到结果。0 H' L9 k* [; F+ d
5 O" A9 ]: |8 @# E. cEBDic目前也只以第一个汉字为主:
5 h3 k* a h, R8 ~) @7 X. }例如:
- g' s% G( m& C9 a8 e; rはな【花・華】' ]2 @9 _( G+ m' b
+ G7 A$ r# s; {( t# G3 ^% d' G- G
会以"花"为作为汉字。
3 q0 L3 H" ^0 |* R3 t$ @6 k3 u( ~6 `6 W5 y) d% p% p
, f4 |# a. h- o% O, Q
另外如Wiki字典,比较像是百科字典,所以也没有考虑做为分析的字典。. b* J, v( H; @! |) y. Z8 V+ ~
EBDic的汉字分析,也应用在手势的Exact Search或查询语的search,以及切换字典时的"跳至相同字条"上。
+ I& @: Q: Q `& T0 Z! _+ O----------------------------------------
- a/ T: [ @' C- i# A2 x$ I) o K5 t
如果有发现字典的字条,没有正确的发音,% l2 @, X" o4 l
如不是因为汉字的表示法不同,- V" T1 K9 J( c2 T
可以告诉我,字典的ID及字条的格式。
/ @1 c/ N8 H6 U+ H4 z(有些字典,真的会加一些自订的符号。目前主要是以NHK字典查询的方法) |
|