|
发表于 2015-9-14 15:07:11
|
显示全部楼层
本帖最后由 meigen 于 2018-3-7 17:26 编辑 9 J0 ?/ h& B* y; t u! p
bt4baidu 发表于 2015-9-13 12:40- W2 q0 s# T1 v. B {. w/ x) w2 O6 H
何出此言?
3 y, r4 o* M: X {* w2 a7 y# N3 R作为一个词典格式,肯定是参与的人越多,质量越来越好的% E2 E" m! ^& ^% t5 W
根据现代复杂系统理论, ... $ A9 H6 m, {& F; z
* \ I1 U6 N0 \* b. y1 N重新编辑下帖子,mdx在2.0之前词条顺序是打乱的,为了检索嘛要进行排序,然后正文也跟着乱了,也就是说从文本到mdx这一步是不可逆操作
Z+ @/ v( N4 z& ?. U之前有dalao说mdict可以像读词典一样,从第一个词头读到最后一个词头,但是……你可能读到的是假的辞书顺序" V( _* f7 ~9 z% F, h) W
3.0的顺序不清楚,毕竟还没人解出格式结构
; {- e, k6 M; m1 O# P
7 Z# w& P. I7 Y* j& u* ]" c6 ^说完正文再来说索引机制,不知道各位在编译mdx的时候有没有注意到词条的排序方式,没错,只是把英语字母忽略大小写就完事了,其他字符仍按照Unicode顺序排列," ]0 p" ]0 m$ |6 U8 [
也就是说希腊字母俄文字母霓虹假名汉语汉字等等全部都不能看,法语德语西班牙语只要带有修饰符的拉丁字母一律排到z的后面,2 Y, E( q, k2 ?2 h) o2 ?
3.0看起来好一点,对于字母词条是排序正确了,但是汉字还是不行,霓虹语一个汉字十几个读音,这个没办法排正确% A, e# c" S6 {- f1 R/ u4 ~2 c/ ]
^2 U, @8 X0 _epwing的特点在于索引机制和按照辞书条目顺序显示,比如输入“ある”或者“有る”,它都会跳出一个词条“ある【有る】”,做到假名与汉字同显,GoldenDict对于mdx索引做的也比较好,只需一个词条即可查到假名或者汉字。但还是有bug,有个别汉字词条查不到,只能另建索引。: ~4 ]* [( g/ J! @
2 _3 ~' ~) @9 h; B3 X
关于上面几个问题,我想软件能解决的就是词条搜索方面,比如最近GoldenDict出的转写功能,而对于辞书原始顺序等问题还是无解。软件质量越来越好是没有错,就好像那个转写功能可以使平假名片假名都能通搜了,只要不是词典格式本身的硬伤其他都好解决 |
|