|

楼主 |
发表于 2015-11-9 20:33:50
|
显示全部楼层
把UNICODE字符转为HTML实体字符,用于处理外来语字母,几行python代码搞定 4 i, H3 W7 H# [: D" O5 J
& u3 h6 B$ I/ J5 J. o* F
- def uc_to_hc(text):+ y% ~% Q- S7 \( E+ i$ F g3 h; n
- rst = []
, _) ?; r. }8 D- ^) |; W+ A/ l' ^! g - for ch in text:& u6 R" S$ b x' Y( g
- val = ord(ch)
% g. v7 y6 ]' F - if val<=0x7F:
% t5 j' }8 c, s2 Y( B' d - rst.append(ch)
4 F5 g( ]; `4 V; ?4 _; \; N - else:
/ L& E3 o8 V2 V7 D7 \: _+ i# r - rst.append('{0}{1:0>4X}{2}'.format('&#x', val, ';'))0 s$ F4 O9 g( m
- return ''.join(rst)/ G7 m8 r: Y( e1 u. O
复制代码 |
|