昨天在《VBS創(chuàng)建正則表達(dá)式對(duì)象的兩種方法》中提到了 VBScript 正則表達(dá)式對(duì)象的 MultiLine 屬性,在 shirne 的提醒下,我才想起參考手冊(cè)中是出現(xiàn)過(guò) MultiLine 屬性的
代碼如下:
'使用上面所示的正則表達(dá)式,下面的 JScript 代碼可以使用子匹配信息,在一個(gè)文字字符串中將連續(xù)出現(xiàn)兩次的相同單詞替換為一個(gè)相同的單詞:
var ss = "Is is the cost of of gasoline going up up?.\n";
var re = /\b([a-z]+) \1\b/gim; //創(chuàng)建正則表達(dá)式樣式。
var rv = ss.replace(re,"$1"); //用一個(gè)單詞替代兩個(gè)單詞。最接近的等價(jià) VBScript 代碼如下:
Dim ss, re, rv
ss = "Is is the cost of of gasoline going up up?." & vbNewLine
Set re = New RegExp
re.Pattern = "\b([a-z]+) \1\b"
re.Global = True
re.IgnoreCase = True
re.MultiLine = True
rv = re.Replace(ss,"$1")請(qǐng)注意在 VBScript 代碼中,全局、大小寫敏感性以及多行標(biāo)記都是使用 RegExp 對(duì)象的適當(dāng)屬性來(lái)設(shè)置的。
需要注意的是 VBScript 中多行標(biāo)記和 Perl 兼容的正則表達(dá)式中的多行標(biāo)記并不完全一樣:
如果 multiline 為 false,那么 "^" 匹配字符串的開始位置,而 "$" 匹配字符串的結(jié)束位置。如果 multline 為 true,那么 "^" 匹配字符串開始位置以及 "\n" 或 "\r" 之后的位置,而 "$" 匹配字符串結(jié)束位置以及 "\n" 或 "\r" 之前的位置。
而在 Perl 中,如果設(shè)置了多行標(biāo)記,"^" 匹配字符串開始位置以及 "\n" 之后的位置,而 "$" 匹配字符串結(jié)束位置以及 "\n" 之前的位置。也就是 Perl 兼容的正則表達(dá)式并不匹配 "\r",這跟 Linux 系統(tǒng)中文本的換行符與 Windows 系統(tǒng)中不一樣有關(guān)。Linux 系統(tǒng)中文本的換行符為 "\n",而 Windows 系統(tǒng)中為 "\r\n",這就導(dǎo)致了正則表達(dá)式的不同。
VBS 正則表達(dá)式 MultiLine 屬性的這個(gè)特性可能會(huì)導(dǎo)致某些問(wèn)題,所以在用 VBS 正則表達(dá)式處理文本時(shí)我一般會(huì)先把 "\r\n" 替換成 "\n":
代碼如下:
Dim fso, str
Set fso = CreateObject("scripting.filesystemobject")
str = fso.OpenTextFile("demon.txt")
str = Replace(str, vbCrLf, vbLf)