lwx228 发表于 2020-11-14 09:08:31

请教怎样写正则代码才能用配特殊的汉字?

例如
㑌、㓦、㘥、䀇……
等特殊的汉字不能用[一-龥]、或 [一-﨩]这样的正则代码匹配到
请教怎样写正则代码才能用配特殊的汉字?谢谢!

Mandolin 发表于 2020-11-14 12:56:58

本帖最后由 Mandolin 于 2020-11-14 13:16 编辑

lwx228 发表于 2020-11-14 11:57
CJK扩展A的6582个汉字(Unicode码0x3400-0x4db5)
怎样才能变为正则?
我在EmEditor试了多次不行。谢谢! ...

EmEditor中的正则写法是:
[\x{3400}-\x{4db5}]

可以参考下面这张表,想要匹配哪个范围的字自己组合就好了:

https://img.litles.site/images/2020/11/14/vivaldi_fiJQn3qL4hc8b1be5c897dd78c.png

比如按你的情况写这个应该就够了(包含了中文符号和部首):

[\x{2E80}-\x{FAFF}]

wjl 发表于 2020-11-14 09:15:16

你这些特殊的汉字有何规律呀?

lwx228 发表于 2020-11-14 09:32:33

具体的我不懂、是mdx中转来的
可能是不常用的繁体字?

baodi 发表于 2020-11-14 10:20:09

\u0000-\u002C
类似这样的,又或者这样的
\x{4e00}-\x{9fa5}

这得看你用正则支持哪个写法

klwo2 发表于 2020-11-14 10:22:08

这些字在扩充A区,把扩充A区带上就行

lwx228 发表于 2020-11-14 11:47:13

baodi 发表于 2020-11-14 10:20
%u0000-%u002C
类似这样的,又或者这样的
\x{4e00}-\x{9fa5}


谢谢!
试了、
这个范围还不如 ([一-﨩])

lwx228 发表于 2020-11-14 11:49:26

本帖最后由 lwx228 于 2020-11-14 11:52 编辑

klwo2 发表于 2020-11-14 10:22
这些字在扩充A区,把扩充A区带上就行

谢谢!
但要具体怎样写、我不懂。

lwx228 发表于 2020-11-14 11:53:17

图中的标题没有答案

lwx228 发表于 2020-11-14 11:57:06

CJK扩展A的6582个汉字(Unicode码0x3400-0x4db5)
怎样才能变为正则?
我在EmEditor试了多次不行。谢谢!

wjl 发表于 2020-11-14 14:33:46

Mandolin 发表于 2020-11-14 12:56
EmEditor中的正则写法是:




多谢大神普及汉字unicode编码指示,又学到一招
https://s3.ax1x.com/2020/11/14/DCwmYn.png

lwx228 发表于 2020-11-14 17:14:05

Mandolin 发表于 2020-11-14 12:56
EmEditor中的正则写法是:




非常感谢!
页: [1]
查看完整版本: 请教怎样写正则代码才能用配特殊的汉字?