|
发表于 2015-9-14 15:07:11
|
显示全部楼层
本帖最后由 meigen 于 2018-3-7 17:26 编辑
9 d7 }2 a; A5 { _! ]' h) zbt4baidu 发表于 2015-9-13 12:40
6 B/ g1 k7 d0 Z- @' |何出此言?
: m. j& _- U( e* {% F' F6 p2 E: B* I作为一个词典格式,肯定是参与的人越多,质量越来越好的
5 A+ ?' c. ?& D* ~9 F: @# W根据现代复杂系统理论, ...
# U0 K6 m5 p. u# y1 B: ~, M' N7 |8 f5 k/ P& F9 T$ n' W$ d, `
重新编辑下帖子,mdx在2.0之前词条顺序是打乱的,为了检索嘛要进行排序,然后正文也跟着乱了,也就是说从文本到mdx这一步是不可逆操作8 A7 ~2 k, f% m0 ?/ N% m; N; u
之前有dalao说mdict可以像读词典一样,从第一个词头读到最后一个词头,但是……你可能读到的是假的辞书顺序
' P3 H) @. @9 V3 l% E: g9 |7 t3.0的顺序不清楚,毕竟还没人解出格式结构+ N$ F' R9 L* B6 e- a" b5 S% U
o' G' @4 ]. N% \
说完正文再来说索引机制,不知道各位在编译mdx的时候有没有注意到词条的排序方式,没错,只是把英语字母忽略大小写就完事了,其他字符仍按照Unicode顺序排列,. v: \) y4 x8 t% O! l& {1 q$ W; i3 J
也就是说希腊字母俄文字母霓虹假名汉语汉字等等全部都不能看,法语德语西班牙语只要带有修饰符的拉丁字母一律排到z的后面,! W N6 w& v3 \3 c! l( E7 g+ Y6 G
3.0看起来好一点,对于字母词条是排序正确了,但是汉字还是不行,霓虹语一个汉字十几个读音,这个没办法排正确& Y) u' A( H& R
4 F! A( l V+ j2 B T; S8 Bepwing的特点在于索引机制和按照辞书条目顺序显示,比如输入“ある”或者“有る”,它都会跳出一个词条“ある【有る】”,做到假名与汉字同显,GoldenDict对于mdx索引做的也比较好,只需一个词条即可查到假名或者汉字。但还是有bug,有个别汉字词条查不到,只能另建索引。
! w. k5 R" V! l/ o& Y4 N2 e% w- z6 O+ D- [& c' c( `- K
关于上面几个问题,我想软件能解决的就是词条搜索方面,比如最近GoldenDict出的转写功能,而对于辞书原始顺序等问题还是无解。软件质量越来越好是没有错,就好像那个转写功能可以使平假名片假名都能通搜了,只要不是词典格式本身的硬伤其他都好解决 |
|