|
发表于 2015-9-14 15:07:11
|
显示全部楼层
本帖最后由 meigen 于 2018-3-7 17:26 编辑
/ v) C" a. g( hbt4baidu 发表于 2015-9-13 12:40. C$ W! \: F, s# W f @
何出此言?. h2 l/ @! b, O. _
作为一个词典格式,肯定是参与的人越多,质量越来越好的9 `3 J6 r: g( o: ?/ ^, v
根据现代复杂系统理论, ... " y& R' z6 O. k+ S
' x. E- }/ x5 n- O! x$ u重新编辑下帖子,mdx在2.0之前词条顺序是打乱的,为了检索嘛要进行排序,然后正文也跟着乱了,也就是说从文本到mdx这一步是不可逆操作
5 z4 ^# x/ }# m. Z# d之前有dalao说mdict可以像读词典一样,从第一个词头读到最后一个词头,但是……你可能读到的是假的辞书顺序) b6 q5 M. Z2 ]1 r* R T
3.0的顺序不清楚,毕竟还没人解出格式结构
, d1 Y3 T, v& Y$ T) C2 h5 Z& Y3 m
3 F. s! z$ j- |3 s说完正文再来说索引机制,不知道各位在编译mdx的时候有没有注意到词条的排序方式,没错,只是把英语字母忽略大小写就完事了,其他字符仍按照Unicode顺序排列,
* Q( w) y4 o- X5 T- |0 S8 U( }也就是说希腊字母俄文字母霓虹假名汉语汉字等等全部都不能看,法语德语西班牙语只要带有修饰符的拉丁字母一律排到z的后面,) K" y: H/ b! c& \$ i2 _" q4 i
3.0看起来好一点,对于字母词条是排序正确了,但是汉字还是不行,霓虹语一个汉字十几个读音,这个没办法排正确
2 J0 A, Q2 P$ ^0 J! g
8 E' `6 V+ r8 d/ N0 ~epwing的特点在于索引机制和按照辞书条目顺序显示,比如输入“ある”或者“有る”,它都会跳出一个词条“ある【有る】”,做到假名与汉字同显,GoldenDict对于mdx索引做的也比较好,只需一个词条即可查到假名或者汉字。但还是有bug,有个别汉字词条查不到,只能另建索引。7 `* x& T1 C& Q$ M8 x
/ f. l% ~$ A7 k) p9 ^6 Q8 w4 i; |8 }
关于上面几个问题,我想软件能解决的就是词条搜索方面,比如最近GoldenDict出的转写功能,而对于辞书原始顺序等问题还是无解。软件质量越来越好是没有错,就好像那个转写功能可以使平假名片假名都能通搜了,只要不是词典格式本身的硬伤其他都好解决 |
|