|
发表于 2015-9-14 15:07:11
|
显示全部楼层
本帖最后由 meigen 于 2018-3-7 17:26 编辑
, l) Q0 E! ?6 dbt4baidu 发表于 2015-9-13 12:40
n( A# B3 r$ p4 N5 u5 _/ w1 T8 H何出此言?* x b8 `$ _+ u, ]* G* l! \" z
作为一个词典格式,肯定是参与的人越多,质量越来越好的
! V' T! S5 W& l1 p2 g根据现代复杂系统理论, ...
! A2 D# n5 k6 ]
; X, q3 k3 m, S/ |3 D' [3 p S重新编辑下帖子,mdx在2.0之前词条顺序是打乱的,为了检索嘛要进行排序,然后正文也跟着乱了,也就是说从文本到mdx这一步是不可逆操作
- Z. I% K; Z' N. z0 J3 B: t) A之前有dalao说mdict可以像读词典一样,从第一个词头读到最后一个词头,但是……你可能读到的是假的辞书顺序) t3 \8 B- C) M0 u% |
3.0的顺序不清楚,毕竟还没人解出格式结构
y$ d* V4 ~: T4 S* ~0 |% H. Y, `! b: O* [) z. O3 S3 o
说完正文再来说索引机制,不知道各位在编译mdx的时候有没有注意到词条的排序方式,没错,只是把英语字母忽略大小写就完事了,其他字符仍按照Unicode顺序排列,
( U( q) j! @) c也就是说希腊字母俄文字母霓虹假名汉语汉字等等全部都不能看,法语德语西班牙语只要带有修饰符的拉丁字母一律排到z的后面,
7 a3 w* h+ W) h B. y- C% k' X3.0看起来好一点,对于字母词条是排序正确了,但是汉字还是不行,霓虹语一个汉字十几个读音,这个没办法排正确
9 t3 v5 O: R6 R1 d+ ^/ o2 \" z, L7 ]6 N3 q# Q; G3 u
epwing的特点在于索引机制和按照辞书条目顺序显示,比如输入“ある”或者“有る”,它都会跳出一个词条“ある【有る】”,做到假名与汉字同显,GoldenDict对于mdx索引做的也比较好,只需一个词条即可查到假名或者汉字。但还是有bug,有个别汉字词条查不到,只能另建索引。; y. w! c# V( o" \
+ j2 I/ q# x x关于上面几个问题,我想软件能解决的就是词条搜索方面,比如最近GoldenDict出的转写功能,而对于辞书原始顺序等问题还是无解。软件质量越来越好是没有错,就好像那个转写功能可以使平假名片假名都能通搜了,只要不是词典格式本身的硬伤其他都好解决 |
|