摘要:匹配模式JDK提供三種匹配模式,分別是:貪婪模式(greedy),勉強(qiáng)模式(reluctant)和占有模式(possessive),分別對(duì)應(yīng)三種占有量詞,其中貪婪模式是默認(rèn)的模式,勉強(qiáng)模式通過(guò)在表達(dá)式后面加一個(gè)?來(lái)表示。占有模式通過(guò)在表達(dá)式后面加一個(gè)+來(lái)表示。三種模式的含義是什么呢?貪婪模式的含義是:盡可能多的匹配,同時(shí)也盡量滿足整體匹配。勉強(qiáng)模式的含義是:盡可能少的匹配,同時(shí)也盡量滿足整體匹配。
匹配模式
JDK提供三種匹配模式,分別是:貪婪模式(greedy),勉強(qiáng)模式(reluctant)和占有模式(possessive),分別對(duì)應(yīng)三種占有量詞,其中貪婪模式是默認(rèn)的模式,勉強(qiáng)模式通過(guò)在表達(dá)式后面加一個(gè)?來(lái)表示。占有模式通過(guò)在表達(dá)式后面加一個(gè)+來(lái)表示。
三種模式的含義是什么呢?
貪婪模式的含義是:盡可能多的匹配,同時(shí)也盡量滿足整體匹配。
勉強(qiáng)模式的含義是:盡可能少的匹配,同時(shí)也盡量滿足整體匹配。
占有模式的含義是:盡可能多的匹配,如果因?yàn)槠ヅ涠嗔藢?dǎo)致整理無(wú)法匹配,那么也不會(huì)回溯。
比如有個(gè)字符串如下:
/m/t/wd/nl/n/p/m/wd/nl/n/p/m/wd/nl/n/p/m/v/n
貪婪模式的表達(dá)式匹配:
/m/t.*/nl/n/p/m
此時(shí)匹配結(jié)果為 /m/t/wd/nl/n/p/m/wd/nl/n/p/m/wd/nl/n/p/m
勉強(qiáng)模式的表達(dá)式匹配:
/m/t/.*?/nl/n/p/m
此時(shí)匹配結(jié)果為 /m/t/wd/nl/n/p/m
/m/t/wdx+?/nl/n/p/m
如果是這樣,那么就匹配不上了,因?yàn)?表示至少要匹配一個(gè),勉強(qiáng)模式,至少也要匹配一個(gè),所以匹配失敗了。
占有模式的表達(dá)式匹配:
/m/t.*+/nl/n/p/m 此時(shí)無(wú)法匹配,因?yàn)?*匹配了過(guò)多的字符,導(dǎo)致后面無(wú)法匹配是上了。
注意:只能對(duì)可變的匹配規(guī)則使用勉強(qiáng)量詞或者占有量詞。比如X??表示盡量少匹配字符X,而X?卻是默認(rèn)的貪婪模式,此時(shí)是盡量多匹配的含義。再如:X{n}的含義是必須準(zhǔn)備匹配n個(gè)X ,則此時(shí)加上其他量詞均不起作用
環(huán)視(預(yù)測(cè))
環(huán)視是一個(gè)比較高級(jí)的主題,但是用起來(lái)卻是那么自然。
環(huán)視適用于這樣的場(chǎng)景:做正則匹配時(shí),需要了解被匹配部分的前面或者后面,有或者沒(méi)有,特定的表達(dá)式,而又不因此捕獲(消耗)這些特定的表達(dá)式。
如果不使用環(huán)視,而是直接使用表達(dá)式來(lái)判斷,那么必然會(huì)導(dǎo)致這些被匹配的表達(dá)式被消耗掉。
舉個(gè)例子:假設(shè)我要給ILoveYou這句話斷句,原則是出現(xiàn)大寫(xiě)字母則認(rèn)為是一個(gè)新的單詞。
如果使用這個(gè)匹配規(guī)則:
\p{Upper}\p{Lower}*[\p{Upper}]?
的話,那么會(huì)消耗掉被匹配的大寫(xiě)字母。匹配結(jié)果會(huì)是:
IL
You
這并不符合要求。
解決辦法是使用環(huán)視,正則表達(dá)式為:
\p{Upper}?\p{Lower}*(?=[\p{Upper}]?)
輸出結(jié)果為:
I
Love
You
環(huán)視有四種:
(?=X) 表示后面跟著的是正則表達(dá)式X,匹配前面的部分時(shí),不會(huì)消耗X這一部分,同時(shí)也不會(huì)捕獲。零寬度正向肯定預(yù)測(cè)。
(?<=X) 表示前面的是正則表達(dá)式X,匹配后面的部分時(shí),不會(huì)消耗X這一部分,同時(shí)也不會(huì)捕獲。 零寬度反向肯定預(yù)測(cè)。
(?!X) 表示后面跟著的不是正則表達(dá)式X,匹配前面的部分時(shí),不會(huì)消耗X這一部分,同時(shí)也不會(huì)捕獲。零寬度正向否定預(yù)測(cè)。
(?!=X) 表示前面的不是正則表達(dá)式X,匹配后面的部分時(shí),不會(huì)消耗X這一部分,同時(shí)也不會(huì)捕獲。 零寬度反向否定預(yù)測(cè)。
非捕獲占有型匹配
(?>X) 這個(gè)尚未研究清楚。