掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 1377|回复: 11

[经验交流] 还是特殊字符的查询的问题

[复制链接]

该用户从未签到

发表于 2008-12-9 22:50:45 | 显示全部楼层 |阅读模式
法语维基转换好了的mdx文件在查询时无法跳转到以大写É、Œ、Ç等特殊字符开头的单词。但是,如果我把TXT文件中这些单词中大写开头的É、Œ、Ç换成小写的é、œ、ç,则可以正常跳转与查询。
: M: k  q# I2 I
7 b3 f6 W1 P6 {' {. N: H原始mdx,没有替换成小写——结果无法查询。- I/ [7 B- f+ [( x* d' U& K

$ x" `; u5 X) C, V
* B0 ^6 l- m6 C( i: H1 W6 P3 y& b1 w4 z/ A
换成小写之后,可以查询,但是不够美观。# Z* P/ @% x, C  p0 ?2 R6 l

& D* D% C7 C  B3 Y3 @7 Y2 S+ z6 W8 w+ k4 S7 V* P4 C
如何解决这个问题呢?

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?免费注册

x

该用户从未签到

发表于 2008-12-9 23:11:58 | 显示全部楼层
你好,能不能把相关的几个词条单独抽出来做成txt文件发给我?

该用户从未签到

发表于 2008-12-10 17:19:06 | 显示全部楼层
楼主用utf16就OK了。
4 {! I9 G- h4 w* g8 @我处理越南文也碰上同样的情况,非英文26字母开头的词条无法跳转与查询,小写的正常。后来用UE把UTF8文本另存为UTF16就没事了。法文跟越南文一样有几个特殊字母。
3 ], \: M" {3 R; eNote:法文维基太大,先在Ue的配置里关掉备份才能打开。
2 x, o& k, h7 M
0 ^/ _0 B1 ]2 s5 _9 K) U搭车请教一下rayman,UTF8跟16有何不同?是不是因为UTF16把每个字母固定为2个字节更适合MDict?/ H7 w$ c3 d6 n! C! S! V
另:如果用UTF16,MDict alpha 3或4 的全文搜索就no work了,alpha2正常。
4 x& D' m6 K& k0 t$ S+ p! G6 \% v6 H5 U/ }" p. O* a
[ 本帖最后由 lenguyendu 于 2008-12-10 17:33 编辑 ]

该用户从未签到

 楼主| 发表于 2008-12-10 20:51:45 | 显示全部楼层
回LS,用UTF-16的话,在转换时,总提示Invalid style format file。6 G3 J5 U8 }1 c# t- y

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?免费注册

x

该用户从未签到

 楼主| 发表于 2008-12-10 21:10:04 | 显示全部楼层
回rayman,附件里面的TXT文件列举出了所有可能的例子。
$ F  x1 H, _9 C; g; O7 x+ `

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?免费注册

x

该用户从未签到

 楼主| 发表于 2008-12-10 21:15:43 | 显示全部楼层
顺便问一下,UE的配置我也改了,为什么还是会照例生产源文件2倍大小的临时文件?
9 u' g: H: G, R
1 f0 K$ k5 s) v$ w' f1 O8 K& e, @( p* R) q" M

4 H9 r. S6 `: O. k3 g! B9 K" Z2 z难道设置错了?

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?免费注册

x

该用户从未签到

发表于 2008-12-10 23:51:31 | 显示全部楼层
1."Invalid style format file" 大概就是说:那个example_style.txt 仍然不是UTF16的呀,同样要用UE把它也换成UTF16,以便跟主文本统一阵线。( U. R% N5 e% O3 e, i. D, e
2.你要转的是frwiki吧,根本就不用填Style这项的哦。Original format 选MDict(Html).2 e7 E% E' _7 }8 _6 i( }8 I
3.UE这样设置没错,先删掉原来的临时文件*.bak,配置--->...加载--->不加载上次打开的文件。$ u* G6 @9 d  s! {

7 h* ^$ X5 q6 P. y; m$ m% Z# n, i[ 本帖最后由 lenguyendu 于 2008-12-11 00:09 编辑 ]

该用户从未签到

 楼主| 发表于 2008-12-11 09:45:03 | 显示全部楼层
用UTF-16转出来的全都是乱码啊,LS可否用我在5楼提供的TXT文件试一试?

该用户从未签到

发表于 2008-12-11 15:34:39 | 显示全部楼层
原帖由 zcm1019 于 2008-12-11 09:45 发表 ; D5 D  C8 X/ y. m
用UTF-16转出来的全都是乱码啊,LS可否用我在5楼提供的TXT文件试一试?
4 [# R) j4 r- M$ F- V( D" ]
不会吧,utf8不乱的话utf16就更不会乱了。你上张乱码的图看看。
rjohnr 该用户已被删除
发表于 2008-12-11 18:32:51 | 显示全部楼层
UTF-8的话,进行大小写转换的时候是按英文字母来处理的。但UTF-16的话,是按国际化语言的大小写转换。估计就是这里造成了大写无法查询吧?

该用户从未签到

 楼主| 发表于 2008-12-11 22:39:47 | 显示全部楼层
1,我把example_style.txt 设置为UTF-16,仍然会显示Invalid style format file;- k3 U4 [% F- c  Y0 z5 W( E/ y' b" S& U
2,如果把Style那一栏留空,则转换为UTF-16的时候总是出现乱码。(TXT文件已经改为UTF-16了)/ X9 z6 U" [$ d( x0 }1 [" K
2 I. p8 O/ M+ u5 z2 x( M) K

5 V( k( a& e  v2 g0 V# ^- b; G4 l$ I+ A% J* K, B9 \1 o
TXT文件的样本在5楼提供了,不知是否有好心人能根据这个TXT指点我一下。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?免费注册

x

该用户从未签到

发表于 2008-12-11 23:34:18 | 显示全部楼层
你提供的那个文件并不是UTF-16编码。可以在UltraEdit里面将文件转换成UTF-16的。附件里是转换成UTF-16后的txt文件和转换好的.mdx文件
, n0 G& d2 z' H
6 n, G4 F! [4 b  j. z' s2 _2 L[ 本帖最后由 rayman 于 2008-12-11 23:37 编辑 ]

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?免费注册

x
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

小黑屋|手机版|Archiver|PDAWIKI |网站地图

GMT+8, 2025-4-23 02:21 , Processed in 0.022909 second(s), 27 queries .

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表