|
本帖最后由 wubis 于 2014-9-11 09:18 编辑 & D# |1 M! n0 O
/ A. K7 `0 P. @* G
问一下:3 |( q. O+ c2 l1 S$ r) k6 Z; t( P0 D
% S) }% @' k/ `# N' P7 ]& K比如有一万个网页连接,分别是<br><div><a href="http://x.cn/z____.html">____</a></div></p>,下划线里面是26个字母和数字的任意组合,我是个完美主义的。如果想删除这些内容,有什么办法呢?
* x8 H, t" u* v" d以前用正则表达式(npp的),我丢失过数据,比如
) Z9 j/ c5 @- B, c% m& d<div>vanl</div>saa<div>bsdb</div>& N4 T0 i0 B9 w/ w3 |2 g, D
选择\<div\>.*\</div\>替换成空,有时候它会把上述全部删除,在同一行也是如此。* f8 p4 ?1 t- Q! G
' z0 q/ o( y3 C& k
对于那一万个连接,我是先注释掉,:<br><div><a href="http://x.cn/z 替换成 <!--
* Y7 \5 e' `5 O% p.html"> 替换成 --><!--
" Y. J2 [) `% [% l6 h: C注:这个中继连接个人认为是绝杀7 S% _4 L P% K9 X! a# G
</a></div></p> 替换成 -->
: a# [, P8 A! J- u$ B2 x4 \; u并假设这三组标签全部只在网页连接用过,先抽样检查
% n5 f) w1 l. f; t* F( ]9 W9 x然后把<!--? 替换成<!-- ; D& a" E) g! I) l* O/ d( n$ W& w
?代指26字母和数字,这样一般2小时就可以把任意组合搞定,最后把<!---->替换成空就可以了; a4 s9 z: X6 L" `4 u v
8 j; H# h9 I* L3 r7 c I% X8 \7 H
具体替换操作
( v3 j) `7 O+ J0 y1 r6 }; r. Q1.为加快类似aaabbb的替换,把<!--a替换成<!--时重复替换,这样子变相加快速度 |
|