请教怎样写正则代码才能用配特殊的汉字?
例如㑌、㓦、㘥、䀇……
等特殊的汉字不能用[一-龥]、或 [一-﨩]这样的正则代码匹配到
请教怎样写正则代码才能用配特殊的汉字?谢谢! 本帖最后由 Mandolin 于 2020-11-14 13:16 编辑
lwx228 发表于 2020-11-14 11:57
CJK扩展A的6582个汉字(Unicode码0x3400-0x4db5)
怎样才能变为正则?
我在EmEditor试了多次不行。谢谢! ...
EmEditor中的正则写法是:
[\x{3400}-\x{4db5}]
可以参考下面这张表,想要匹配哪个范围的字自己组合就好了:
https://img.litles.site/images/2020/11/14/vivaldi_fiJQn3qL4hc8b1be5c897dd78c.png
比如按你的情况写这个应该就够了(包含了中文符号和部首):
[\x{2E80}-\x{FAFF}] 你这些特殊的汉字有何规律呀? 具体的我不懂、是mdx中转来的
可能是不常用的繁体字?
\u0000-\u002C
类似这样的,又或者这样的
\x{4e00}-\x{9fa5}
这得看你用正则支持哪个写法 这些字在扩充A区,把扩充A区带上就行 baodi 发表于 2020-11-14 10:20
%u0000-%u002C
类似这样的,又或者这样的
\x{4e00}-\x{9fa5}
谢谢!
试了、
这个范围还不如 ([一-﨩]) 本帖最后由 lwx228 于 2020-11-14 11:52 编辑
klwo2 发表于 2020-11-14 10:22
这些字在扩充A区,把扩充A区带上就行
谢谢!
但要具体怎样写、我不懂。 图中的标题没有答案 CJK扩展A的6582个汉字(Unicode码0x3400-0x4db5)
怎样才能变为正则?
我在EmEditor试了多次不行。谢谢! Mandolin 发表于 2020-11-14 12:56
EmEditor中的正则写法是:
多谢大神普及汉字unicode编码指示,又学到一招
https://s3.ax1x.com/2020/11/14/DCwmYn.png Mandolin 发表于 2020-11-14 12:56
EmEditor中的正则写法是:
非常感谢!
页:
[1]